# TWLM Demo
如何試用 `tw-pythia-6.9b-chat-v0_2`:
<!-- [TOC] -->
## 1. Demo 網站(不定期開啟)
因為雲端 GPU 每小時成本 US$ 0.6 起跳,因此不會一直開著,或者說大部分的時間都不會開著。如果點進去看到 Error 1033,就代表現在沒開。
### ➡️ https://twlm-demo.dev-server.work
🔴 目前關著。
<!-- **🟢 目前開著,如果看到錯誤訊息可能是因為剛好正在重開,可以再試幾次。** -->
## 2. Colab
只要有 Google 帳號都可以隨時在免費版 Colab 上跑: <a href="https://colab.research.google.com/github/zetavg/twlm/blob/main/Demo.ipynb"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>
但有以下缺點:
* 需要大概八分鐘的時間來下載模型並載入。
* 免費版 Colab (使用 T4 GPU) 只能容納 8bit 壓縮後的模型,模型的推理與生成文字能力會受到些許影響。
* 產生文字的速度較慢,大概比四月時的 GPT-4 稍慢一點。
* 切換模型也要花上許多時間,不易同時拿兩個模型來比較。
## 3. Lambda Cloud Demo <small>:money_with_wings: US$ 0.6 / hr</small>
進階選項,用自己的 Lambda Cloud 來 host demo。Host 的人付錢,GPU 用 A10 就可以了。如果已經有人 host,其他進來的人就可以蹭免費。
網址:https://cloud.lambdalabs.com/demos/twlm/twlm-demo
如果打開看到這個畫面代表現在沒人 host,可以點 Click here to host 並完成後續步驟啟動一個 GPU instance 來 host:
<img src="https://hackmd.io/_uploads/HkXluGJU3.png" style="max-width: 400px; border: 1px solid black;" /><br />
GPU instance 啟動後,會在自己的 GPU Instances 列表中看到使用中的機器,大概五分鐘後回到原網址就會出現畫面可以使用了。
<img src="https://hackmd.io/_uploads/rk7eYzkU3.png" style="max-width: 600px; border: 1px solid black;" /><br />
**用完記得 terminate** 否則會持續扣 :money_with_wings: (如上圖)。
## 4. SkyPilot <small>:money_with_wings:</small>
[SkyPilot](https://github.com/skypilot-org/skypilot) is a framework for easily running machine learning workloads on any cloud through a unified interface.
更進階,見此: https://github.com/zetavg/twlm-demo#skypilot 。
# 其他連結
* GitHub 專案: https://github.com/zetavg/twlm
* Model on Hugging Face Hub: https://huggingface.co/twlm/tw-pythia-6.9b-chat-v0_2