Linux Kernel Term Project 名詞解釋

Linux Kernel Term Project 名詞解釋 === ## 名詞解釋 :::spoiler 模型格式與壓縮技術（Model Format & Compression） | 名詞 | 說明 | | -------------------- | ---------------------------------------------------- | | GGUF | GGML Unified Format，`llama.cpp` 使用的模型格式，支援多種壓縮與結構優化。 | | BitNet | 基於位元級操作的模型結構，強調極端低位元推論。 | | LUT（Lookup Table） | 查表法，用來替代複雜運算，常用於量化推論中。 | | LUT Compression | 利用查表縮減模型權重大小的壓縮技術。 | | table quantization | 透過查表量化技術（如 2-bit 量化）減少模型參數。 | | mirror consolidation | 對稱參數共享以減少權重量（BitNet 中常見）。 | | axis reordering | 重排 tensor 維度以配合 cache/locality 或 SIMD。 | | interleaving | 插入交錯資料模式，提升資料佈局與並行性。 | | zstd | 壓縮演算法，`gguf` 可使用其壓縮 metadata 或模型參數。 | ::: :::spoiler 推論內核與加速技術（Inference Kernels & Acceleration） | 名詞 | 說明 | | ----------------------- | --------------------------------------------------------- | | llama.cpp | 基於 GGML 的 LLM 推論框架，支援 CPU/GPU 推論。 | | ggml | 基礎 tensor 計算後端，提供簡潔、高效的模型執行引擎。 | | I2\_S Kernel | llama.cpp 中精簡但效能佳的內核實作（用於 2-bit 模型）。 | | TL1 Kernel / TL2 Kernel | 優化過的低位元量化內核，用於 T-MAC、BitNet 等。 | | T-MAC | Table-based Mixed-Precision Acceleration Core，支援高效混合精度推論。 | | Lossless Inference | 在不損失精度的情況下壓縮/量化模型進行推論。 | | dot product | 向量內積，是 transformer 運算的核心操作之一。 | ::: ::: spoiler 作業系統與記憶體管理（OS, Memory & File I/O） | 名詞 | 說明 | | --------------------------- | ---------------------------------------- | | Huge Page | 大頁記憶體（2MB/1GB），減少 TLB miss。 | | Transparent Huge Page (THP) | Linux 自動合併頁面為 Huge Page。 | | mmap | 將檔案映射至記憶體，減少 I/O 開銷。 | | mlock | 將資料鎖定在 RAM，避免被 swap。 | | io\_uring | 高效非同步 I/O 機制，支援批次與非阻塞操作。 | | 非同步、平行 I/O | 不阻塞主執行緒的資料存取方式。 | | 批次、全非同步 I/O | 多筆任務同時提交給作業系統處理的方式。 | | page fault | 存取未在記憶體的頁面時觸發的中斷。 | | TLB miss | Translation Lookaside Buffer 未命中，導致重新查表。 | | iTLB-load-misses | 指令位址翻譯時的 TLB miss，影響執行緒效能。 | | minor-faults / major-faults | 分頁錯誤類型，minor 可即時修復；major 涉及磁碟 I/O。 | ::: :::spoiler 效能分析與工具（Performance Analysis Tools） | 名詞 | 說明 | | --------------------------- | ----------------------------------- | | perf | Linux 中的效能分析工具，可分析 cache、TLB、指令等指標。 | | 火焰圖 | 將程式的函式呼叫時間視覺化的圖表，顯示瓶頸所在。 | | uftrace | 精細追蹤函式呼叫與時間的工具，比 perf 更具可讀性。 | | IPC（Instructions Per Cycle） | 每時脈執行的指令數，越高表示 CPU 使用效率越好。 | | cache-misses | 快取未命中次數，高表示資料存取效能差。 | ::: ::: spoiler 多執行緒與排程（Threads & Scheduling） | 名詞 | 說明 | | ----------------------- | -------------------------------------- | | FIFO | First-In-First-Out 排程策略。 | | CFS | Completely Fair Scheduler，Linux 預設排程器。 | | chrt | Linux 命令，用於設定程序的即時排程類型（如 FIFO、RR）。 | | OpenMP | 用於共享記憶體多核心平行處理的 API。 | | thread pool | 執行緒池，一次建立多個執行緒重複使用。 | | cooperative thread pool | 協作式排程，執行緒主動讓出控制權（無搶佔）。 | | pthread | POSIX Threads，常見的多執行緒 API。 | | semaphore | 訊號量，用於控制多執行緒的同步。 | | context-switching | CPU 從一個執行緒切換到另一個的過程。 | | spin barrier | 一種忙等（spinlock）同步方式。 | | yield barrier | 主動讓出 CPU 控制權的同步技術，用於提升公平性。 | | throttled Counter | 被系統限制 CPU 使用率的指標，會降低效能。 | | tasklet | 在 kernel 中執行的輕量背景任務，常見於驅動開發。 | ::: ::: spoiler 密碼學與挖礦相關（Security / Crypto） | 名詞 | 說明 | | ----- | --------------------------------------- | | XMRig | 開源的 Monero（XMR）加密貨幣挖礦軟體，強調 CPU/GPU 利用率。 | ::: ::: spoiler 編譯工具與建構系統（Compiler & Build） | 名詞 | 說明 | | ------------ | -------------------------------- | | clang / llvm | LLVM 編譯器家族，支援 C/C++ 編譯並具高度最佳化能力。 | | cmake | 跨平台建構系統，用於管理原始碼編譯與依賴關係。 | :::