# 大型語言模型實作讀書會
## 【主辦單位】[台灣人工智慧協會進修交流委員會](https://docs.google.com/presentation/d/13HtB5t-xaWUwxpNIv6LMJngSkrZ1vzJa/edit?usp=sharing&ouid=112780088374728819219&rtpof=true&sd=true), H.I.T. 生醫創新實作社群
### 連絡方式:twaiastudy@gmail.com
## [成果](https://hackmd.io/Ci6y9bQRQRa5uJll3sFbNQ)
[各組期初簡報](https://padlet.com/ccwu0918/padlet-j65fbjt9hdwefjhx)
[各組期末簡報](https://padlet.com/twaiastudy/padlet-o1fiyeg9fs52ge4b)
[開源講義](https://drive.google.com/drive/folders/1P8mFvwPFRDXLzfTpFTnjFC2wJEQsGfFU?usp=sharing)
---
## 讀書會簡介
本讀書會旨在讓學員了解大型語言模型的基礎知識和原理,並培養學員運用大型語言模型進行實作的能力。讀書會將涵蓋大型語言模型的概念、特點、訓練、應用等方面,並提供實作案例和教學資源。
讀書會適合具備任何以下條件( **Python 程式能力、專案管理,領域專家**)。
讀書會將採分組討論和報告的方式進行。學員將分組選定主題進行研究,並在線上會議上分享成果。
結語:本讀書會將為學員提供一個學習大型語言模型實作技能的機會,並幫助學員提升在該領域的專業能力
---
## 讀書會目標
讓學員了解大型語言模型的基礎知識和原理
培養學員運用大型語言模型進行實作的能力
提升學員在大型語言模型應用領域的專業能力
培訓學員可能成為大型語言模型**講師**
---
## 準備事項
1. 申請google 及chatgpt帳號,
2. open ai api, 儲值5美金以上 [申請的連結](https://openai.com/blog/openai-api), [如何儲值簡單說明](https://docs.google.com/presentation/d/11JJz92lagzo3pd1tt_1TW6A9edhMr7Kuwi-RFQFPkaM/edit?usp=sharing)
3. 於課前將主辦單位精選的教學影片看完及研讀範例程式
4. 自備專案所需雲端資源(colab,repl.it 都有免費版,AWS,google,azure也有免費額度)
---
## 運作方式:
所有成員都要閱讀8門課,協助製作簡報,上課前一週所有人要閱讀完成,並填寫學習紀錄,報告組要二週前完成閱讀,報告內容不得有商業廣告
---
### 分組報告:
1. 課程討論
2. 搜集資料(相關paper,github,youtube影片,專案或應用)
3. 分組報告,線上會議形式分享並由參與者給與報告者意見回饋
---
### 專題實作:
專題預備: 113/01/01-113/1/31
1. 即日起可以開始構思題目,
2. 徵題期間:113/01/01-113/1/31
3. 審題期間:113/01/11-113/1/31
4. 選題組隊:113/01/16-113/1/31
5. 認領或自行提出相關LLM專題,每週review 進度,期末競賽並安排發表
6. 建議每組PM,SA,前端,後端,領域專家及資料工程師,原則上限10個人
7. [專題報名情形](https://padlet.com/ccwu0918/padlet-j65fbjt9hdwefjhx)
---
## 專案著作權說明
1. [Mit license](https://noob.tw/open-source-licenses/)(開源授權公開商業教學用途),盡量避免引用有智財權爭議的程式
2. 要有可公開資料集
3. idea 可公開
4. 必須放github可公開檢驗程式碼
---
## 專案審核原則
1. 與課程相關性50%
2. 技術複雜度與技術成熟度 30%
3. 可行性 10%
4. 創新性 10%
5. 主辦單位將組成評審小組進行評選
---
## 講師著作權說明
[CC by SA](https://creativecommons.org/licenses/by-sa/3.0/tw/deed.zh-hant)
---
### 講師認證:
製作教材並通過試講後取得認證
---
## 適合對象:
1. 對大型語言模型實作有經驗或興趣者。
2. 可以於課前將主辦單位精選的教學影片看完及研讀範例程式
---
## 完課證明:
80% 出席並完成專題實作,無署名,發證人數不限。
---
## 協會證明:
80% 出席並完成專題實作,台灣人工智慧協會進修交流委員會選擇專案佳作,將發給證明您完成課程與專
題實作的實質成就,發證人數上限50名(台灣人工智慧協會25名,HIT 15名,其他10名)。
請於2024/1/15前完成入會申請及付費,
---
## LLM學員台灣人工智慧協會入會程序
1. 找推薦人:
若有認識台灣人工智慧協會會員,請洽會員擔任推薦人,
若沒有認識相關人,請寫一封信到進修交流委員會,twaiastudy@gmail.com,
主旨:擬請貴會擔任台灣人工智慧協會推薦人,附上個人簡介,經初步審核後,email通知請進修交流委員會任推薦人
2. 申請入會
經推薦人同意會後請填寫相關入會申請
## [台灣人工智慧協會入會申請](https://www.aiatw.org/apply)
---
## 此次LLM讀書會授課證明:
1. 準備教材,通過試講,獲得台灣人工智慧協會進修交流委員會LLM讀書會授課證明
2. 未來也有機會推薦參加台灣人工智慧協會講師認證評選。
---
## 參與條件:
對大型語言模型充滿興趣,並渴望在 AI 領域不斷進步。
名額有限50名,經審核通過就歡迎加入我們的學習行列!
## 報名方式:
請填下以下報名表,依所填資料書審通知 不另面試
112/12/10 報名截止
112/12/17 分組完成
---
## 時間時段 : 每周二 21:00-23:00
## 課程日期 : 2023 年 12月19日 - 2024年 2 月 20日
請於上完課30分鐘內填寫
[課後簽到及調查表](https://forms.gle/jpjSVzLdppnstTFL8)
---
## 專案競賽階段 : 2024 年 2 月 27 日 - 2024年 3 月 19 日
在最後一個階段,準備好迎接一個刺激的、為期一個月的團隊專案實施之旅。你將與其他團隊一較高下,展示在大型語言模型的技能和創造力。每個團隊將呈現他們的專案,由一個優秀的評審團進行評估並提供反饋。最傑出的團隊將獲得獎項和認可,以慶祝他們在這個令人興奮的大型語言模型實作探索之旅中的成就。
---
## 成果發表日: 2024 年 3 月 26 日
在Demo Day 上,展現您的學習成果。
## [學習紀錄](https://docs.google.com/spreadsheets/d/1s1E5I_CgYgIF343VGNCscZy10_fSikVnn6C4baiEzek/edit?usp=sharing)
---
### 12/19 分組討論
1. 選1位組長,2-8副組長
2. 確認加入個別line群組,fb
3. 非報告組別除了週二課程討論外,每週至少開會30分鐘,確認交付給報告組的內容,遇到什麼問題,想聽到什麼,想補充什麼
4. 報告組別:除收集各組意見外,預演排練,至少一天前確認報告人
5. 辦理不定期會議,聚餐等軟性活動,做team building
---
## 讀書會大綱
0.12/19
讀書會運作說明及目的
說明讀書會的目標、流程、以及適合對象 Q&A
分組介紹說明
---
1.12/26 [快速了解大型語言模型](https://youtu.be/wG8-IUtqu-s?si=PE3Uhk96y6EOpgow)
[Intro to Large Language Models](https://www.youtube.com/watch?v=zjkBMFhNj_g)
* 認識大型語言模型的概念和特點
* 了解大型語言模型的訓練和應用
* PM:johnson,jeff
* [第一組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/r1bj7HKL6)
---
2.01/02 [ChatGPT Prompt Engineering for Developers](https://learn.deeplearning.ai/chatgpt-prompt-eng/lesson/1/introduction)
* 學習如何使用ChatGPT的Prompt Engineering技術
* 提升ChatGPT的創意和生成能力
* PM:eric,joyce
* [第二組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/B14AkjAL6)
---
## 01/01開放出題報名
3.01/09 [Building Systems with the ChatGPT API](https://learn.deeplearning.ai/chatgpt-building-system/lesson/1/introduction)
* 學習如何使用ChatGPT API進行開發
* 使用大型語言模型高效建構多步驟系統。
* 學習使用多階段提示將複雜任務拆分為一系列子任務。
* 評估您的 LLM 輸入和輸出的安全性、準確性和相關性。
PM:麗如
[第三組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/rkpOlo0La)
---
4. 01/16 [LangChain for LLM Application Development](https://learn.deeplearning.ai/langchain/lesson/1/introduction)
* 構建ChatGPT應用系統
* 直接向框架創建者 Harrison Chase 學習 LangChain
* 將LLM應用於專有數據以建立個人助理和專業聊天機器人
* 使用代理、鍊式呼叫和記憶體來擴展您對 LLM 的使用
[第四組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/B1W6y20L6)
---
5.01/23 [LangChain: Chat with Your Data](https://learn.deeplearning.ai/langchain-chat-with-your-data/lesson/1/introduction)
* 學習使用LangChain框架進行大型語言模型應用開發
* 向 LangChain 創辦人 Harrison Chase 學習
* 在LangChain中使用80多個載入器來處理不同的資料來源
* 創建一個聊天機器人來與您自己的文件和數據進行交互
PM:吳淑玲,
[第五組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/ryjmxnALa)
---
6.01/30 [Building Generative AI Applications with Gradio](https://learn.deeplearning.ai/huggingface-gradio/lesson/1/introduction)
* 學習使用Gradio工具構建生成式AI應用
* 快速開發 ML 應用程式
* 建立圖像生成、字幕和文字摘要應用程式
* 在 Hugging Face Spaces 上與隊友和 Beta 測試人員分享您的應用
PM:Herman
[第六組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/rJadenRUa)
---
7.02/06 [Quality and Safety for LLM Applications](https://learn.deeplearning.ai/quality-safety-llm-applications)
* 使用 SelfCheckGPT 等方法辨識幻覺
* 使用情緒分析和隱式毒性檢測模型檢測越獄(嘗試操縱 LLM 反應的提示)。
* 使用實體識別和向量相似性分析來識別資料外洩。
* 建立您自己的監控系統來評估應用程式的安全性和安全性
PM:顏珮帆
[第七組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/SygZbhC86)
---
8.02/20 [Finetuning Large Language Models](https://learn.deeplearning.ai/finetuning-large-language-models/)
* 掌握 LLM 微調基礎知識
* 區分微調和即時工程,並知道何時使用兩者
* 獲得專案真實資料集的實務經驗
PM:彭鈐浩
[第八組共筆](https://hackmd.io/@Jj51EQCDSsS0C4aNUQtCtQ/HJfHZnRUa)
---
## 案例
1.[用少量資料建立客服機器人 ](https://github.com/seiching/gradioGPT)
2.[建立自己的chatgpt portal ](https://github.com/Yidadaa/ChatGPT-Next-Web)
3.[自己大量資料建立QA系統](https://github.com/hwchase17/chat-your-data)
---
## 參考資料
1. [deep ai](https://www.deeplearning.ai/short-courses/)
2. [李宏毅生成式AI](https://www.youtube.com/playlist?list=PLJV_el3uVTsOePyfmkfivYZ7Rqr2nMk3W)
3. [code_your_own_AI](https://www.youtube.com/watch?v=cs1TDTOby58&list=PLgy71-0-2-F3gD9gHydQENMWduSpVzpZB)
4. [Information Extraction with LangChain & Kor](https://www.youtube.com/watch?v=SW1ZdqH0rRQ)
5. [open ai 工程師 AndrejKarpathy](https://www.youtube.com/@AndrejKarpathy/featured)
---
## 範例
1. [腦中風客服機器人](https://youtu.be/sYLx200WpiA)
2. [上完第二課就可以完成的, 腦中風客服機器人,浮動油價,保險推薦](https://github.com/seiching/gradioGPT)
---
## [timer 工具](https://tw.piliapp.com/timer/countdown/)
[第一組](https://drive.google.com/drive/folders/16U_f4xl1THq-mrkFO8OyHx2oJQvrPXm3)
內部草稿資料
# 2023/12/26班務公告
* [學習紀錄](https://docs.google.com/spreadsheets/d/1s1E5I_CgYgIF343VGNCscZy10_fSikVnn6C4baiEzek/edit?usp=sharing)(個人上課前10天填寫,各組5天前完成彙編),避免放太多個資,因為是開放的,小心詐騙集團
* 各組公開hackmd 原設計功能主要是彙編各組每週問題及補充資料
* 請各組及早開始準備報告,報告內容及官方社群避免商業廣告,
* 請於2024/1/15前完成入會申請及付費, 推薦人:請用進修交流委員會,推薦人email填寫 twaiastudy@gmail.com 才能算協會會員到名額
* H.I.T. 生醫創新實作社群請於2024/1/15前完成入會申請
---
* 實做範例以colab方式為主(建議第二講開始都要提供)
* 課後[問卷調查](https://forms.gle/LS6MoGi3zgcU99BN8)請於上完課30分鐘內完成填寫
* 課程準備含補充資料,請兼顅PM及領域專家的學習需求
* 課程準備建議含作業
* 重申本讀書產出,開源教案,開源專案,AI講師,開立收費課程
---
# 敬請指教
[國家電腦中心llm課程](https://hackmd.io/@whYPD8MBSHWRZV6y-ymFwQ/HkHz7qvw6)
---
[Scrum33355 Roger博士20分鐘解說(中文字幕,僅供長宏學員預習用)](https://www.youtube.com/watch?v=B8_2hEAdO3s)
[小團隊最大化,矽谷產品經理教妳「Scrum」管理術 | 西岸+產品學院](https://www.youtube.com/watch?v=8Y89KaUhyw8)
[Scrum in 20 mins... (with examples)](https://www.youtube.com/watch?v=SWDhGSZNF9M)
[大厂程序员是如何做敏捷开发的?大公司程序员编程开发流程|大公司是如何快速响应用户需求并实现产品的持续交付](https://www.youtube.com/watch?v=Mb6WHtja2fs)
[敏捷开发Agile Scrum!99%程序员都没搞明白的Scrum真义!](https://www.youtube.com/watch?v=UkZz9tk2QYc)
[USER STORY ](https://medium.com/3pm-lab/3-use-cases-for-writing-effective-user-stories-cd42625fef53)
---
親愛的LLM學習夥伴:
大家好!
未來將以LINE及FB為主要訊息溝通方式,請大家務必加入以下社群,並留意訊息
LLM讀書會大群,請用手機加入:https://line.me/ti/g/-rG4oCZWC1
LLM讀書會臉書大群
https://www.facebook.com/groups/3203524276459299/
12/26 即將開放第一次正式課程讀書會以下為預計進行的流程,
課程主題:認識大型語言模型
20:58-21:00 活動注意事項宣讀
21:00-21:10:歡迎及團員介紹
簡短的歡迎辭和參與的成員自我介紹(姓名,Line群名稱,來自哪裡(公司或是學校),AI經驗,參加LLM目的與期望)。
21:10-21:50:課程回顧 : 影片內容的回顧,分享個人的學習心得和觀點。
21:50-22:00:QA: 大家在課程中發現的問題。
22:00-22:05:休息
22:05-22:50:補充資料+QA 提供額外的資料和深入探討特定主題。同步解答大家對補充資料的疑問。
22:50-23:00:班務報告
預計使用ZOOM,連結如下,請大家準時出席
https://zoom.us/j/97108451634?pwd=TmU4Y1N6OW83ekRwWGkvU0ZGdDdkZz09
會議ID:971 0845 1634
密碼:iZJ668
進入會議室後請更改名字,將自己組別及底線放在名字前,例如
第一組王大同,改為1_王大同,方便辨識
我們期待在這次讀書會中與您共同學習,請確保影片觀看和筆記完成,以促進更深入的討論和互動。如有疑問或需要協助,隨時聯絡我們。
謹代表主辦單位,期待與您共度一個充實且有趣的讀書會!
歡迎你的參與
主辦單位: 台灣人工智慧協會進修交流委員會, H.I.T. 生醫創新實作社群 。
## 大型語言模型專題實作共學社群工作團隊(內部討論及補充資料)
## 招生
## 審核
## 各組要完成工作項目
選1位組長,2-8副組長
確認加入個別line群組,fb
非報告組別除了週二課程討論外,每週至少開會30分鐘,確認交付給報告組的內容,遇到什麼問題,想聽到什麼,想補充什麼
報告組別:除收集各組意見外,預演排練,至少二週前確認報告人
辦理不定期會議,聚餐等
## 組織團隊,分組,先找好各組,組長,mentor
1. 每個人 至少參加一個團隊 團隊人數2-N人 提出專題
2. 個人以自己的能力自訂題目
3. 專題審核委員會審核過題目,且提案者有成功完成,提供 github link,即可獲得證書
##
進zoom 改名,加數字組別
## 專案媒合
0. 發布提案表單 (我們收提案到啥時 收件期限?/2-N人,預計2024-01-01 至2024-01-10)
1. 分二階段 先填提案 填表結果會公開給大家登記加入(僅過濾開放登記的專題)
1-1. 提案題目
1-2. 是否要開放其他人登記成為隊友
1-3. 專案類型、標籤
1-4. 提案要達成的目的、為什麼要做這個應用
1-5. 提案敘述 (至少200字)
1-6. 預計應用技術 (optional)
1-7. 概述預計要用的資料集 (optional)
1-8. 已掌握的資料集 (optional)
1-9. 預計如何驗證此應用有達到你的預期?
2. 媒合周 會議時間讓大家介紹自己題目 組好後提交表單
3. 成員代號以 email 為準 到時方便寄送證書
#### 專題提案條件
1. 自備數據集
2. idea 不介意被公開
### 12/19 第一周 Opening Agenda
- Opening (TAIA & HIT) 5分鐘
- 說明認證取得機制 要怎樣才可以獲得課程通過認證? (完課/授課) 40分鐘
- 讀書會出席統計
- 期末專題完成
- 我們第N周發布專題提案表單
<!-- 我們將會在第N周辦一次Miro提案會 讓大家線上組隊(要嗎?)-->
- 可以在臉書社團/Line找隊友
- 表單在第N+k周(?)前截止
- 說明臉書社團/Line的用途
- 課程摘要 & 資源池介紹(Abao) 15-20分鐘 [[slides](https://gamma.app/docs/-vsoxoexxs6v3qzp)]
- 各組分開討論 50分鐘
- 選組長/副組長
- 介紹交流 自介貼FB
- 現在的這個組是讀書會的
- 讀書會分工
- 自己開一個Line群組
- 宣傳可以踴躍填提案表單
### 影片網路
## 說明會相關資料,講師及教材分享原則()
## 專案著作權說明
github Mit license(以開源為則)
要有資料集
idea 可公開
驗程式碼
## 講師著作權說明
[CC by SA](https://creativecommons.org/licenses/by-sa/3.0/tw/deed.zh-hant)
## 專案募集
## 課程時間
21:00-21:05 歡迎及團員介紹
21:05-21:40 課程回顧
21:40-21:50 QA
21:50-21:55 休息
21:55-22:30 補充資料
22:30-22:50 QA
22:50-23:00 班務報告
## 專題
技術要求: 必須使用open ai相關API或meta llam2等相關大型語言模型
## 資源池 Resource Pool
- [Model Gallery](https://www.laplace-ai.com/llm-gallery)
- [Dataset Gallery](https://www.laplace-ai.com/dataset-gallery)
- [API Gallery](https://www.laplace-ai.com/api-gallery)
[Text]
- OpenAI GPT-3.5/GPT-4
- Claude 2.0
[Image]
- DALL-E
- Stable Diffusion
[Audio]
- Whisper
[Video]
- Avatar API
### 學術類
### 應用類
參考產品
a. [華麗得](https://www.brecioso.com/)
b. [vocolai](https://www.kocpc.com.tw/archives/492837)
推薦
1. [快速了解大型語言模型](https://youtu.be/wG8-IUtqu-s?si=PE3Uhk96y6EOpgow)
2. [ChatGPT Prompt Engineering for Developers](https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/)
3. [ Building Systems with the ChatGPT API](https://www.deeplearning.ai/short-courses/building-systems-with-chatgpt/)
4. [LangChain for LLM Application Development](https://www.deeplearning.ai/short-courses/langchain-for-llm-application-development/)
5. [LangChain: Chat with Your Data](https://www.deeplearning.ai/short-courses/langchain-chat-with-your-data/)
6. [Building Generative AI Applications with Gradio](https://www.deeplearning.ai/short-courses/building-generative-ai-applications-with-gradio/)
7. [Quality and Safety for LLM Applications](https://www.deeplearning.ai/short-courses/quality-safety-llm-applications/)
8. [Finetuning Large Language Models](https://www.deeplearning.ai/short-courses/finetuning-large-language-models/)
9. [補充教材 : Building and Evaluating Advanced RAG Applications](https://www.deeplearning.ai/short-courses/building-evaluating-advanced-rag/)
### 原始文宣內容
AI 未來,你準備好了嗎?
加入大型語言模型python 專題實作線上共學社群,從基礎到實踐,提升您的專業技能
大型語言模型 (LLM) 是 AI 領域的最新趨勢,在自然語言處理、機器翻譯、創意寫作等領域具有廣泛的應用。
獨自學習覺得孤單嗎?
加入我們的大型語言模型python 專題實作線上共學社群,和一票熱情學習者一起,共學共享、攜手成長!
報名期間: 即日起至2023/12/10
課程亮點:
系統性學習:全面了解 LLM 的理論與應用,培養扎實的 AI 底蘊。
實務操作體驗:透過分組討論及報告,提供實際案例及實作,將知識轉化為實戰能力。
專業成長之路:加強大型語言模型實作技能,培養成為 LLM 專家或講師。
活動時間表:
週二夜晚課程:從 2023 年 12 月 19 日起至 2024 年 2 月 20 日,每週二晚上 21:00 至 23:00。
專案競賽階段:2024 年 2 月 27日至 3 月 19日。
在最後一個階段,準備好迎接一個刺激的、為期一個月的團隊專案實施之旅。你將與其他團隊一較高下,展示在大型語言模型的技能和創造力。每個團隊將呈現他們的專案,由一個優秀的評審團進行評估並提供反饋。最傑出的團隊將獲得獎項和認可,以慶祝他們在這個令人興奮的大型語言模型實作探索之旅中的成就。
成果發表日:在 2024 年 3 月 26 日的 Demo Day 上,展現您的學習成果。
加入我們,您將獲得:
完課證明:80%出席並完成專題實作,將獲得台灣人工智慧協會進修交流委員會完課證明,證明您完成課程與專題實作的實質成就。
講師授課證明:準備教材,通過試講,獲得台灣人工智慧協會進修交流委員會 LLM 講師授課證明,未來也有機會獲得講師認證。
參與條件:
只要您對使用大型語言模型python專題實作充滿興趣,並渴望在 AI 領域不斷進步,因名額有限50名,經審核通過就歡迎加入我們的學習行列!
立即報名,開啟屬於您的 AI 學習之旅!
立刻免費加入,與更多熱心學伴共同探索 AI 的無限可能!
https://forms.gle/1MsFjY3XKt8brkER8