--- title: "正體中文開源資料集 社群課程計畫" tags: TW-Bench lang: zh-tw image: https://i.imgur.com/wKmx1Ef.png description: 正體中文開源資料集 講師Teemo的社群課程計畫 --- # 正體中文開源資料集 社群課程計畫 > https://hackmd.io/@TW-Bench/2023plan > https://youtube.com/playlist?list=PLExch2J8bLbm9xaI717Jsglarjg0B-YOK ## 社群課程講師 Teemo :::success Teemo. 在台大醫院負責台大全體系醫院的健保資料與部分急診系統,推動虛擬健保卡、LLM 應用落地以及隱私強化技術 (PETs) 與就醫識別碼。平時也是 g0v 社群長期參與者,台灣人工智慧學校校友,關注台灣大型模型語言發展與治理,正在籌備給台灣在地 LLM 測試評分的 CC0 資料集。 ::: ## 社群課程計畫 > 包含推廣段宣傳,我每集只有20分鐘 * 0.前提是重要的 * [開源概論](https://youtu.be/wjiEfD7jEUo) * 我會一直更新這個前提 * 盡可能給大家不會過期的想法 * 保持未來的彈性 * 開放多元的意見 * 絕對不叫受眾去google,我們用討論對齊更多知識 * 1.讓通用人工智慧在地化對齊台灣人 * https://youtube.com/live/qJmb1CmDVAk * https://www.canva.com/design/DAFzNqWXew4/C1I77GclVTIdU5tz3YkRzg/view * 更多的台灣味、台灣人情味 * 多模態中文字的力量與影響力 * 在通用人工智慧來臨前,我們可以做的事 * 台灣在地 LLM 測試評分的 CC0 資料集創造的未來 * 詠唱者啊!加入我們行列吧 * 2.給大語言模型的台灣考卷 TW-Bench * https://youtube.com/live/rPWKwOkCrM0 * https://www.canva.com/design/DAFzNzlxSgQ/Tr7wnJ-eOTe4DEhC2-YM0A/view * 未來有個明確的路徑 * 屬於我們的禮貌 * 基礎直覺-評分方向 * 進階推論-評分方向 * 專業運用-評分方向 * 如何評估生成結果的好壞 * 3.大語言模型的民主化 * https://youtube.com/live/Hg7IkVt31qY * https://www.canva.com/design/DAFzN3te2_Y/lQS9_mNO5nRzY83JCXFImA/view * 深化民主的可能性,再論分層解耦 * 對齊我們的民主 * 未來是 * [g0v tw hackath56n — 中場短講 — 從 Dolly 2.0 談 LLM 民主化 _ Teemo](https://youtu.be/BzO6VgecTlw) * 4.開源資料集如何處理隱私與倫理 * https://youtube.com/live/kJvBNjHo81w * https://www.canva.com/design/DAFzli7u7WE/PPe-iJRLmVYQ652bEyrELQ/view * 關於訓練集,雜訊何時是重要 * 我們要的雜訊 * 模型汙染問題 * 差分隱私與合成資料 * 5.關於測試集-隱私與人權 * https://youtube.com/live/zcCbJ8ftZzw * https://www.canva.com/design/DAFzllnJitE/ivq2o9V4xatuljXHjKXD6g/view * 意圖、故意、「知」與「欲」 * 知情同意 * 被逆向的原始模型 * 協同意見 * 兒少保護 * 6.關於內容仲裁 * https://youtube.com/live/lUCWq3lcLqU * https://www.canva.com/design/DAFzlv01vqU/Ke0B7k9wpLctPyQK0scxXQ/view * 過濾、法律、應備的危險常識 * 拒絕違反倫理 * 消除歧視與偏見 * 警語 * 有條件放行 * 7.測試集的評分標準 * https://youtube.com/live/pVXBHxobvB4 * https://www.canva.com/design/DAFzllmH9tc/s4qVEWAPSXTUGfw9-fRVeA/view * 人的部分-閃現與深思 * 以平等之名-人權/隱私 * 給你大番薯-故意錯字/容忍誤差 * 硬幣有正反面,評分也看正反面 * 如何設計驗測? * 8.拆解全知 * https://youtube.com/live/kDr79WnirPg * https://www.canva.com/design/DAFzwUzEsYw/dASrpHMl0t5hNUqoSfe70w/view * 基於知識或是基於推論 * Google不到怎麼辦? * 用有限的選擇抑制幻覺 * 數據向善的邏輯 * 自省修正錯誤 * 對齊人的決策選出知識 * 9.幻覺 * https://youtube.com/live/HhHKlV8ojHI * https://www.canva.com/design/DAFzljAChDw/WfjeAlC-OTVvaq1C8zqDqw/view * 雞同鴨講的部分 * 開書考的部分 * 溫度的影響 * 湧現時刻 * 基於推論的極限 * 基於事實的極限 * 10.暗語、行話以及次文化 * https://youtube.com/live/L-TDsJGOb58 * https://www.canva.com/design/DAFzlgIun-o/-WcCEBbOb5kJYf5weUAnew/view * 形聲轉注假借 * 行話與同義字詞 * 次文化與新流行語 * 一詞多義、消歧議 * 紙袋小姐與指代消解 * 11.專業領域-I-台灣集體記憶 * https://youtube.com/live/-5SAZB5Jbzo * https://www.canva.com/design/DAFzlmwxfx0/ebrMuf21YMU8svNTJaUpqQ/view * 數位典藏的再利用 * 民間信仰的多模態保存方式 * 客語漢字、日語外來語涵容台化 * 集體智慧中好的部分 * 集體智慧中壞的部分 * 12.專業領域-II-兒時陰影 * https://youtube.com/live/rLrp_No19pQ * https://www.canva.com/design/DAFzlqkHAGg/qG31KEuqo6Lg98LVGeu-Lw/view * 教改、課綱與現代化 * 過期的科學 * 原始資料或模型小時候學壞了怎麼辦 * 沖銷、矛盾、多元價值觀 * 13.政府的資料-I-流通的 * https://youtube.com/live/wUmM4-JCIvU * https://www.canva.com/design/DAFzlnYS3rs/az_941IIcZuB317k-X8syQ/view * 開放政府不是開放政府資料而已 * 政府出版品 * 公文書函 * 公署指引 * 市民專線的資料集 * 14.人的反饋 * https://youtube.com/live/Jbr_JLEPAJg * [簡報](https://www.canva.com/design/DAFzlvX5NO4/V00s_fMS4R1WJUr--MpgqQ/view) * 建議回饋的倖存者偏差 * 大聲點,我聽不見 * 脈絡一致性 * 人與人從眾的反饋 * 15.語感 * https://youtube.com/live/M6rJAe46k8A * https://www.canva.com/design/DAFzlhm4DA0/U_GvO282PjFHz5u8DYVsMA/view * 為何不是新加坡式華語 * 為何不是京片子 * 台灣腔的區域性方言 * 再論涵容台化的多元價值 * 16.因為你選擇了未來 * https://youtube.com/live/Lw0vUNRlcwg * https://www.canva.com/design/DAFzlmBxGXw/PlS8LeoP0uc4qDEjq3fzdQ/view * 因果模型 * 句型、詞組、口頭禪造就的台灣特色 * 台灣果語可愛的地方 * 我們正在共創的資料集主宰了未來 * 也許只要7B * 17.關於20231106那天 * https://youtube.com/live/vM2Hapsu6NY * https://www.canva.com/design/DAGBnvlJD20/MinvAxNv3_OdHsBkXnOYog/view * 回顧那天 * AI生態改變了 * 新的機會 * 值得現在 * 18.溫和的部分 * https://youtube.com/live/7L9rXqJfjY0 * https://www.canva.com/design/DAGBnlQ_HdE/B36f6KjrHWLhvoT_2BevNw/view * 極化/去極化 * HyDE的問題 * 多式綜合語(polysynthetic language) * 簡語世代 * 19.費米推論 * https://youtube.com/live/yGpTM6SbjgM * https://www.canva.com/design/DAGBns3wmPI/DnUJrcYIGR3NJY3YT9YkWg/view * 費米問題(Fermi problem) * 費米推論(Fermi Estimation Technique) * 兩題「生活題」 * 兩題「商業題」 * 以及一題「挑戰題」 * 費米悖論(Fermi paradox) * 20.大能力模型 * https://youtube.com/live/7iEORLaFZaM * https://www.canva.com/design/DAGBnssdbz0/mGOpoQFhVNTygN_Cmvv79Q/view * 基於知識或是基於推論 * 摘要、總結 * 模擬退火-局部區間最佳解與鄰近的最佳解 * 效益論與 「e/acc」 (有效加速主義) * 21.大知識模型 * https://youtube.com/live/s28n1_TBo3s * https://www.canva.com/design/DAGBnusjYcY/JIQUbEUqdov2w8beyZRGeg/view * 基於知識或是基於推論 * 排序能力 * 觸發產生湧現 * 「d/acc」(防禦加速主義) * 22.訓練資料的法律問題 * https://youtube.com/live/zgkNcNZnl1Q * https://www.canva.com/design/DAGBnn5_1r4/3xQFGYmtS8H2yJjwMVwUIA/view * 合理使用 * 美國的現況 * 日本的現況 * 中國的現況 * 歐盟的現況 * 台灣現況 :::danger 可能可以留給其他講者講 * LLM 怎麼煉成的 * 訓練用語言資料集的型態、功能、目的、必要條件 * 潛在的法律問題探討 * 資料集實際的長相(資料結構、欄位、檔案格式) * 一個人如何開始一個資料集 * 什麼是有品質的資料集 ::: --- ### 擬定周更計畫時需要回答的問題: > 定義:下面提到備課的暫存檔,可以理解為節目腳本、rundown、老師備課的教案、或是訪綱 1. 你會使用哪種行事曆系統來安排內容製作計畫? * Google Calendar. 執行有在行事曆上的項目 2. 你會以什麼頻率更新你的內容? * 目前傾向星期二晚上 3. 你的內容應在何時更新? * 備課的暫存檔有七堂時,可以啟動周更 * 要直播的當天17:50須完成主持人與講者再次確認當天可以直播 4. 內容的平均時間應該要多長? * 包含推廣段宣傳,我每集只有20分鐘 * 包含收集下次(或未來)議題,可以給 Q&A 5~8分鐘 * 建議要有主持人介紹講者 5. 需要花多少時間製作每一次的內容? * 20分鐘的內容至少需要30分鐘以上撰寫提詞大綱&製作投影片 * 上次課程Q&A延伸的帶到下次,大概需要15分鐘的準備時間來融入備課的暫存檔 6. 你會預備多少内容? * 先備七堂,講者自己有興趣的主題 * 月更:Teemo談上個月有趣的AI新知 7. 你每周會留幾天用來創作內容? * 月更:Teemo談上個月有趣的AI新知,此部分固定於每個月最後一個周一的20:00~21:00寫備課的暫存檔 * 新的備課的暫存檔,來自講者的每周日晚上22:00前生成,有出現在表列算完成備課 * 新的備課的暫存檔,來自歷次課程Q&A建議回饋,訂於每周六晚上22:30~23:00生成,有出現在表列算完成備課 8. 誰負責督促你的計畫進度? * 要有真的人固定確認備課的暫存檔有七堂,需於每次直播完確認備課的暫存檔尚有兩堂, * 不夠時需於每周六晚上19:00由真人提醒講師備課 9. 你預計在每個月哪天保留出時間,用以評估和調整內容製作計畫? * 保留每個月最後一個周一的19:20~20:00討論 1. 這個專案的目標是什麼? 2. 我完成目標了嗎? 3. 哪部分進展順利? 4. 哪裡做得不好? 5. 我從這個專案中學到了什麼? 6. 該專案是否符合我的核心目標&價值觀? 7. 我會再做類似的事嗎? 8. 下次我會採取什麼不同的做法? 9. 我可以採用哪些系統和流程來改進執行? 10. 這是我需要花個人時間做的專案嗎? 還是我可以委託團隊中的某個人或外包出去? --- ### 每次都要回收建議回饋給講者知道 1. 你是怎麼知道我的/找到我的內容的? 2. 你喜歡我製作的內容嗎? 3. 你不喜歡什麼部分? 4. 你現在最大的痛點是什麼? --- 
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up