20260517 - HackMD

# 20260517 ## Attendee - JC, Wei, Ann, Yu, Hugh ... - 請假: Shaoyu ## Milestone Phase 1：正常人測試 1. 2026 年 3 月申請 2nd 期刊 IRB 2. 2026 年 6 月投稿 1st 前導期刊 3. 獲准 IRB 後，開始執行專家＆正常人測試 4. 發 2nd 期刊、Protyotype ## Schedule - [期刊] 5/19 交付以諾老師＆ Claude：Gemma 4 & Gemma 4 + RAG，跑完再現性測試 - [期刊] 2026 年 6 月投稿期刊 ## Action Items Tracking ## Agenda ### 期刊 - 期刊一： - 主旨：探索不同模型產出藥品答案的成效，由 AI 評分 - 實驗方法： - 提供模型生成的答案：1️⃣ Gemma 4 2️⃣ Gemma 4 + RAG（30 種藥 x5 題 x2 輪） - 透過 Claude 評分 - 待辦事項： - ✅ Gemma 4 E4B 已完成 - Gemma 4 + RAG 還在修 XML 格式，5/19 尚無法交付 - 與以諾老師討論 - 評估正確性、再現性的公式 - 目前沒有仿單基準，或仿單資訊未記載，AI 評出來分數可預見很差。需討論調整給 AI 評分的標準。 - 期刊二： - 主旨：探索不同模型產出藥品答案的成效，由藥師人工評分 - 實驗方法： - 提供上次實驗勝出的模型所生成的答案：1️⃣ Gemma 3 + RAG 2️⃣ Gemma 4 + RAG 3️⃣ MedGemma 3 + RAG - 由 10 位藥師做問卷評分，做完 30 個藥品，不知道正在評的 model - 針對易讀性評分（格式、用詞），希望提供 end user 使用的介面以便評分 - 待辦事項： - 專家一次要完成 1 個藥品 x 3 模型的問卷評分 - UI prototype 目標：只服務第2 (專家)、第3實驗 (民眾)，互動簡單、著重呈現資料內容。 - Yu 下次會議準備草圖討論 - 期刊三： - 主旨：探索不同模型產出藥品答案的成效，由一般民眾人工評分 - 實驗方法： - 由 250 位一般民眾做問卷評分 > 問卷在可理解性、可執行性內容與專家評估一致，少了正確性、完整性、精簡性、潛在傷害評估。 ### IRB - 現在有哪些待辦事項？（目前都是 JC 繼續處理） ### Prototype - （有否待辦事項） ### Project - Project logo、One-page slide - 會後 Slack 上討論 - 相簿權限 - 已有個別邀請，差 Hugh email: ostrich.racoondog@gmail.com - [專案收支表](https://docs.google.com/spreadsheets/d/1z3hhJkVvwtc3MAbSS5uvjWow7nYkgLMq55GxdQl40nI/edit?gid=418983676#gid=418983676) - 請 JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL) ## Action Items > 所有成員 go through 一次自己要做的工作 - 下次會議，Yu 準備實驗草圖討論 - 會後，Hugh 上傳 Logo 到 Slack 上討論 - 下次會議，Hugh 完成單頁簡報 - JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL) - JC 撥款給墊款人 - 5/31 JC 上傳全人計劃，要傳全人計畫預算項目表給Wei擬硬體預算 - Wei 下次會議前提供整備好的 RAG （XML）解決方案 ## Next Meeting 6/14（日）20:00 @ Google Meet