Linux Kernel Term Project 名詞解釋 === ## 名詞解釋 :::spoiler 模型格式與壓縮技術(Model Format & Compression) | 名詞 | 說明 | | -------------------- | ---------------------------------------------------- | | GGUF | GGML Unified Format,`llama.cpp` 使用的模型格式,支援多種壓縮與結構優化。 | | BitNet | 基於位元級操作的模型結構,強調極端低位元推論。 | | LUT(Lookup Table) | 查表法,用來替代複雜運算,常用於量化推論中。 | | LUT Compression | 利用查表縮減模型權重大小的壓縮技術。 | | table quantization | 透過查表量化技術(如 2-bit 量化)減少模型參數。 | | mirror consolidation | 對稱參數共享以減少權重量(BitNet 中常見)。 | | axis reordering | 重排 tensor 維度以配合 cache/locality 或 SIMD。 | | interleaving | 插入交錯資料模式,提升資料佈局與並行性。 | | zstd | 壓縮演算法,`gguf` 可使用其壓縮 metadata 或模型參數。 | ::: :::spoiler 推論內核與加速技術(Inference Kernels & Acceleration) | 名詞 | 說明 | | ----------------------- | --------------------------------------------------------- | | llama.cpp | 基於 GGML 的 LLM 推論框架,支援 CPU/GPU 推論。 | | ggml | 基礎 tensor 計算後端,提供簡潔、高效的模型執行引擎。 | | I2\_S Kernel | llama.cpp 中精簡但效能佳的內核實作(用於 2-bit 模型)。 | | TL1 Kernel / TL2 Kernel | 優化過的低位元量化內核,用於 T-MAC、BitNet 等。 | | T-MAC | Table-based Mixed-Precision Acceleration Core,支援高效混合精度推論。 | | Lossless Inference | 在不損失精度的情況下壓縮/量化模型進行推論。 | | dot product | 向量內積,是 transformer 運算的核心操作之一。 | ::: ::: spoiler 作業系統與記憶體管理(OS, Memory & File I/O) | 名詞 | 說明 | | --------------------------- | ---------------------------------------- | | Huge Page | 大頁記憶體(2MB/1GB),減少 TLB miss。 | | Transparent Huge Page (THP) | Linux 自動合併頁面為 Huge Page。 | | mmap | 將檔案映射至記憶體,減少 I/O 開銷。 | | mlock | 將資料鎖定在 RAM,避免被 swap。 | | io\_uring | 高效非同步 I/O 機制,支援批次與非阻塞操作。 | | 非同步、平行 I/O | 不阻塞主執行緒的資料存取方式。 | | 批次、全非同步 I/O | 多筆任務同時提交給作業系統處理的方式。 | | page fault | 存取未在記憶體的頁面時觸發的中斷。 | | TLB miss | Translation Lookaside Buffer 未命中,導致重新查表。 | | iTLB-load-misses | 指令位址翻譯時的 TLB miss,影響執行緒效能。 | | minor-faults / major-faults | 分頁錯誤類型,minor 可即時修復;major 涉及磁碟 I/O。 | ::: :::spoiler 效能分析與工具(Performance Analysis Tools) | 名詞 | 說明 | | --------------------------- | ----------------------------------- | | perf | Linux 中的效能分析工具,可分析 cache、TLB、指令等指標。 | | 火焰圖 | 將程式的函式呼叫時間視覺化的圖表,顯示瓶頸所在。 | | uftrace | 精細追蹤函式呼叫與時間的工具,比 perf 更具可讀性。 | | IPC(Instructions Per Cycle) | 每時脈執行的指令數,越高表示 CPU 使用效率越好。 | | cache-misses | 快取未命中次數,高表示資料存取效能差。 | ::: ::: spoiler 多執行緒與排程(Threads & Scheduling) | 名詞 | 說明 | | ----------------------- | -------------------------------------- | | FIFO | First-In-First-Out 排程策略。 | | CFS | Completely Fair Scheduler,Linux 預設排程器。 | | chrt | Linux 命令,用於設定程序的即時排程類型(如 FIFO、RR)。 | | OpenMP | 用於共享記憶體多核心平行處理的 API。 | | thread pool | 執行緒池,一次建立多個執行緒重複使用。 | | cooperative thread pool | 協作式排程,執行緒主動讓出控制權(無搶佔)。 | | pthread | POSIX Threads,常見的多執行緒 API。 | | semaphore | 訊號量,用於控制多執行緒的同步。 | | context-switching | CPU 從一個執行緒切換到另一個的過程。 | | spin barrier | 一種忙等(spinlock)同步方式。 | | yield barrier | 主動讓出 CPU 控制權的同步技術,用於提升公平性。 | | throttled Counter | 被系統限制 CPU 使用率的指標,會降低效能。 | | tasklet | 在 kernel 中執行的輕量背景任務,常見於驅動開發。 | ::: ::: spoiler 密碼學與挖礦相關(Security / Crypto) | 名詞 | 說明 | | ----- | --------------------------------------- | | XMRig | 開源的 Monero(XMR)加密貨幣挖礦軟體,強調 CPU/GPU 利用率。 | ::: ::: spoiler 編譯工具與建構系統(Compiler & Build) | 名詞 | 說明 | | ------------ | -------------------------------- | | clang / llvm | LLVM 編譯器家族,支援 C/C++ 編譯並具高度最佳化能力。 | | cmake | 跨平台建構系統,用於管理原始碼編譯與依賴關係。 | :::