# 20260517 ## Attendee - JC, Wei, Ann, Yu, Hugh ... - 請假: Shaoyu ## Milestone Phase 1:正常人測試 1. 2026 年 3 月申請 2nd 期刊 IRB 2. 2026 年 6 月投稿 1st 前導期刊 3. 獲准 IRB 後,開始執行專家&正常人測試 4. 發 2nd 期刊、Protyotype ## Schedule - [期刊] 5/19 交付以諾老師 & Claude:Gemma 4 & Gemma 4 + RAG,跑完再現性測試 - [期刊] 2026 年 6 月投稿期刊 ## Action Items Tracking ## Agenda ### 期刊 - 期刊一: - 主旨:探索不同模型產出藥品答案的成效,由 AI 評分 - 實驗方法: - 提供模型生成的答案:1️⃣ Gemma 4 2️⃣ Gemma 4 + RAG(30 種藥 x5 題 x2 輪) - 透過 Claude 評分 - 待辦事項: - ✅ Gemma 4 E4B 已完成 - Gemma 4 + RAG 還在修 XML 格式,5/19 尚無法交付 - 與以諾老師討論 - 評估正確性、再現性的公式 - 目前沒有仿單基準,或仿單資訊未記載,AI 評出來分數可預見很差。需討論調整給 AI 評分的標準。 - 期刊二: - 主旨:探索不同模型產出藥品答案的成效,由藥師人工評分 - 實驗方法: - 提供上次實驗勝出的模型所生成的答案:1️⃣ Gemma 3 + RAG 2️⃣ Gemma 4 + RAG 3️⃣ MedGemma 3 + RAG - 由 10 位藥師做問卷評分,做完 30 個藥品,不知道正在評的 model - 針對易讀性評分(格式、用詞),希望提供 end user 使用的介面以便評分 - 待辦事項: - 專家一次要完成 1 個藥品 x 3 模型的問卷評分 - UI prototype 目標:只服務第2 (專家)、第3實驗 (民眾),互動簡單、著重呈現資料內容。 - Yu 下次會議準備草圖討論 - 期刊三: - 主旨:探索不同模型產出藥品答案的成效,由一般民眾人工評分 - 實驗方法: - 由 250 位一般民眾做問卷評分 > 問卷在可理解性、可執行性內容與專家評估一致,少了正確性、完整性、精簡性、潛在傷害評估。 ### IRB - 現在有哪些待辦事項?(目前都是 JC 繼續處理) ### Prototype - (有否待辦事項) ### Project - Project logo、One-page slide - 會後 Slack 上討論 - 相簿權限 - 已有個別邀請,差 Hugh email: ostrich.racoondog@gmail.com - [專案收支表](https://docs.google.com/spreadsheets/d/1z3hhJkVvwtc3MAbSS5uvjWow7nYkgLMq55GxdQl40nI/edit?gid=418983676#gid=418983676) - 請 JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL) ## Action Items > 所有成員 go through 一次自己要做的工作 - 下次會議,Yu 準備實驗草圖討論 - 會後,Hugh 上傳 Logo 到 Slack 上討論 - 下次會議,Hugh 完成單頁簡報 - JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL) - JC 撥款給墊款人 - 5/31 JC 上傳全人計劃,要傳全人計畫預算項目表給Wei擬硬體預算 - Wei 下次會議前提供整備好的 RAG (XML)解決方案 ## Next Meeting 6/14(日)20:00 @ Google Meet