# 20260517
## Attendee
- JC, Wei, Ann, Yu, Hugh ...
- 請假: Shaoyu
## Milestone
Phase 1:正常人測試
1. 2026 年 3 月申請 2nd 期刊 IRB
2. 2026 年 6 月投稿 1st 前導期刊
3. 獲准 IRB 後,開始執行專家&正常人測試
4. 發 2nd 期刊、Protyotype
## Schedule
- [期刊] 5/19 交付以諾老師 & Claude:Gemma 4 & Gemma 4 + RAG,跑完再現性測試
- [期刊] 2026 年 6 月投稿期刊
## Action Items Tracking
## Agenda
### 期刊
- 期刊一:
- 主旨:探索不同模型產出藥品答案的成效,由 AI 評分
- 實驗方法:
- 提供模型生成的答案:1️⃣ Gemma 4 2️⃣ Gemma 4 + RAG(30 種藥 x5 題 x2 輪)
- 透過 Claude 評分
- 待辦事項:
- ✅ Gemma 4 E4B 已完成
- Gemma 4 + RAG 還在修 XML 格式,5/19 尚無法交付
- 與以諾老師討論
- 評估正確性、再現性的公式
- 目前沒有仿單基準,或仿單資訊未記載,AI 評出來分數可預見很差。需討論調整給 AI 評分的標準。
- 期刊二:
- 主旨:探索不同模型產出藥品答案的成效,由藥師人工評分
- 實驗方法:
- 提供上次實驗勝出的模型所生成的答案:1️⃣ Gemma 3 + RAG 2️⃣ Gemma 4 + RAG 3️⃣ MedGemma 3 + RAG
- 由 10 位藥師做問卷評分,做完 30 個藥品,不知道正在評的 model
- 針對易讀性評分(格式、用詞),希望提供 end user 使用的介面以便評分
- 待辦事項:
- 專家一次要完成 1 個藥品 x 3 模型的問卷評分
- UI prototype 目標:只服務第2 (專家)、第3實驗 (民眾),互動簡單、著重呈現資料內容。
- Yu 下次會議準備草圖討論
- 期刊三:
- 主旨:探索不同模型產出藥品答案的成效,由一般民眾人工評分
- 實驗方法:
- 由 250 位一般民眾做問卷評分
> 問卷在可理解性、可執行性內容與專家評估一致,少了正確性、完整性、精簡性、潛在傷害評估。
### IRB
- 現在有哪些待辦事項?(目前都是 JC 繼續處理)
### Prototype
- (有否待辦事項)
### Project
- Project logo、One-page slide
- 會後 Slack 上討論
- 相簿權限
- 已有個別邀請,差 Hugh email: ostrich.racoondog@gmail.com
- [專案收支表](https://docs.google.com/spreadsheets/d/1z3hhJkVvwtc3MAbSS5uvjWow7nYkgLMq55GxdQl40nI/edit?gid=418983676#gid=418983676)
- 請 JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL)
## Action Items
> 所有成員 go through 一次自己要做的工作
- 下次會議,Yu 準備實驗草圖討論
- 會後,Hugh 上傳 Logo 到 Slack 上討論
- 下次會議,Hugh 完成單頁簡報
- JC、Wei 上傳花費收據到[資料夾](https://drive.google.com/drive/u/1/folders/1z_uDH9lP4lQVneThmX9WjHtc31RMwzIL)
- JC 撥款給墊款人
- 5/31 JC 上傳全人計劃,要傳全人計畫預算項目表給Wei擬硬體預算
- Wei 下次會議前提供整備好的 RAG (XML)解決方案
## Next Meeting
6/14(日)20:00 @ Google Meet