Meta Llama 2 7B 架設 ( Windows )

最後編輯日：2024.
硬體：
軟體：

第一步下載 llama.cpp

打開新的終端機
切換至桌面

cd desktop

下載 llama.cpp

git clone https://github.com/ggerganov/llama.cpp

切換到llama.cpp

cd llama.cpp

建立環境

LLAMA_METAL=1 make

安裝附加套件

python3 -m pip install -r requirements.txt
python3 -m pip install torch numpy sentencepiece

下載 git 套件：

winget install --id Git.Git -e --source winget

重啟終端機

第二步下載 Llama 本體

打開新的終端機
去 Meta官網填寫個人資料
從 Meta 寄送的郵件獲取 URL
切換至桌面

cd desktop

下載llama

git clone https://github.com/facebookresearch/llama

切換至llama

cd llama

運行download.sh

./download.sh

依次輸入 URL（一段網址）與欲下載的版本

Image Not Showing Possible Reasons
The image was uploaded to a note which you don't have access to
The note which the image was originally uploaded to has been deleted
Learn More →

Image Not Showing Possible Reasons
The image was uploaded to a note which you don't have access to
The note which the image was originally uploaded to has been deleted
Learn More →

關閉終端機
將llama新出現的檔案/資料夾移入desktop/llama.cpp/models

通常包含tokenizer_checklist.chk tokenizer.model llama-2-7b

第三步量化模型

切到第一步開啟的終端機
運行convert.py把模型轉換為 f16.gguf，以減少記憶體使用和算力需求

python3 convert.py models/llama-2-7b

原貌：python3 convert.py folder_path_to_model

量化成 q4_0 or q8_0

差別在 q4_0 速度較快，但損耗較多； q8_0 速度較慢，但損耗較少，也較吃記憶體（ M1 8G 會顯示 status 5 記憶體不足）

./quantize ./models/llama-2-7b/ggml-model-f16.gguf ./models/llama-2-7b/ggml-model-q4_0.gguf q4_0

原貌：./quantize model_path new_model_path q4_0

運行模型

./main -m models/llama-2-7b/ggml-model-q4_0.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

原貌：./main -m path_to_model -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt

大功告成
Image Not Showing Possible Reasons
- The image was uploaded to a note which you don't have access to
- The note which the image was originally uploaded to has been deleted
Learn More →

備註

再次開啟步驟：
1. cd desktop
2. cd llama.cpp
3. ./main -m models/llama-2-7b/ggml-model-q4_0.gguf -n 256 --repeat_penalty 1.0 --color -i -r "User:" -f prompts/chat-with-bob.txt
其他模組安裝（例如：llama-7b-chatorCodeLlama-7b ）僅需將llama-7b全替換成llama-7b-chatorCodeLlama-7b

延伸

加入 Taiwan-LLM

Meta Llama 2 7B 架設 ( Windows )

第一步 下載 llama.cpp

第二步 下載 Llama 本體

第三步 量化模型

備註

延伸

Read more

容器結構

參考答案

課程規劃

輸出與輸入結構

第一步下載 llama.cpp

第二步下載 Llama 本體

第三步量化模型