# 模組期末專題規劃書-評分與建議
## 1. Seek LAB? AskGent
組員:俞博云 張晉翔
### 評分:89
### 建議
* 整合層面具應用創新性,屬於「應用導向的創新設計」。
* 值得肯定的是,明確列出多模組功能與 Agent 執行判斷標準(如是否進行檢索、是否觸發 retry 等)—這是許多提案常見的疏漏。
* 架構與任務拆解合理,但多 Agent 流程協作穩定性,如流程轉移與記憶管理的精確實作,LangGraph 雖具備狀態機特性,但實務上調度容易出現非預期錯誤(如重複查詢、不一致回答)等,仍需妥善因應,待本組同學於期末時作最終呈現。
* 應用有創意,工具有效使用,宜加強後續成果追縱驗證。
## 2. Pedestrian Attribute Recognition
組員:僑阮明哲 紀正豪
### 評分:80
### 建議
* This proposal currently falls under the category of a "technical reimplementation and architectural integration exercise," with relatively low novelty. More innovations in terms of problem formulation and model design are required.
* Think about and point out ways to overcome the challenges mentioned.
* 應用有實用性,建議進行實測以驗證成果。
## 3. COT Assessor
組員:吳禎哲 李沅錞 鄭方喆
### 評分:84
### 建議
* 提出一種「LLM 審查 LLM」的結構,具創新性。
* 存在以下的問題仍待說明或解決:
1. 對於「正確的 CoT」定義仍非常模糊,可能陷入訓練資料品質與標註偏差的困境。
2. CoT 通常具語意模糊性,僅用「最終答案是否正確」來回推整條推理的正確性,過於簡化。
3. 缺乏驗證流程。
4. 建議增加資料標註策略與語料來源的說明。
* There are so many situations. How “根據其回答的答案是否正確對模型產出的 COT 進行標註” can be done correctly? Who have this knowledge?
* 規劃合宜,建議可以強化成果驗證。
## 4. Automating Taint Analysis with LLMs
組員:吳聿謙
### 評分:89
### 建議
* 內容具新穎性與創新性。
* 並未明確區分方法與 Vulnhuntr 之具體差異與改進處,缺乏針對現有技術的創新貢獻比較。
* 就目前所揭露的規劃看起來,實作可行性仍有一定風險,尤其在 LLM 評估可靠性部分尚未具體化。
* 目前專案並未對如何訓練 LLM有足夠的揭露,包括是否自訓模型、微調或依賴現成 API 的黑箱式推論。方法細節雖然有基本描述,但仍偏重概念,僅提供流程概述,缺乏 prompt 工程、模型評估、retry 策略、與容錯設計細節。
* LLM的部份,建議可規劃更完整的模型微調流程或自訓數據建構策略。
* 成果驗證宜加強規劃。
## 5. 水域安全智慧眼即時溺水偵測與即時救援監控系統
組員:張家逞 林品維 李宇弘
### 評分:84
### 建議
* 針對「泳池場域下的溺水風險辨識」,尚屬較少深入探索之應用領域,具應用創新性。
* 以下的內容仍待補足或於期末時說明,包括:(1) 異常判斷機制未揭露原理; (2) 環境適應性(光照、水波、遮蔽)雖提到但無具體實驗驗證策略; (3)測試場域規劃(如泳池、水深、群體密度等)。
* 數據集方面細節揭露不足,例如,訓練數據來源為何?無提及數據集來源、資料量、是否使用公開數據集或自行拍攝資料;溺水樣本標註策略?無說明如何定義與標註溺水 vs 非溺水動作,是否考慮靜止漂浮 vs 掙扎狀態?等。
* Beach, riversides, swimming pools have different situations. Please think about ways to adapt.
* 應用實用性加,期待成果驗證與實際功能。
## 6. GitGPT
組員:張庭嫣 簡蔚驊 蔡維軒
### 評分:83
### 建議
* 這個專案具應用創新性。
* 目前的proposal內容對於模型訓練揭露明顯不足,未提及任何訓練計畫,可能是使用現有模型? 也沒有提到任何資料蒐集或 prompt 調教流程,也未設計 custom QA 或 Git 操作範例集,所以推測沒有計畫自行訓練或finetune LLM,這樣降低了研究或技術貢獻潛力。
* 建議期末時提出使用案例與效益驗證,甚至可以有baseline工具作比較。
* Besides empolying the MCP protocol alone, please consider adding agents, training, or performance comparison in the project.
* 應用具實用性
## 7. AI 有聲書沉浸式敘述平台
組員:林俊毅 姜冠宇 馬侑健
### 評分:83
### 建議
* 規劃的內容有趣。
* 雖明確提出多項挑戰,但也很好奇這些挑戰本組同學準備如何克服,是否已有擬定策略。
* The problem is good and challenging
* Please think about and point out how to overcome the challenges clearly.
## 8. E.A.T.
組員:林玟君 胡芊柔 周巧晴
### 評分:84
### 建議
* 這個project具創新性, 而創新之處在於整合與應用層。
* RAG的語料來源建議要來自具有公信力的出處,如USDA、衛福部、open recipe DB…等
* 食物因為多數已經過烹煮與混合,將造成食物辨識困難,以及難以估測數量與重量,若上述內容的確存在困難,建議可聚焦於成分分類與飲食偏好判斷(高脂、高鈉等)。
* 第3個模組,Google Maps + OCR + 嵌入語意比對需大量實地測試以應對非結構化資料品質落差(如 menu 圖片模糊、語意歧異等)。
* How to have a correct dataset to train food recognition model?
* Besides RAG, consider applying agents to integrate different actions automatically.
* 規劃完善,驗證過程宜多加說明
## 9. 智慧計算機:影像辨識功能及計算機功能的結合
組員:柯承佑 陳祖佑
### 評分:76
### 建議
* 題目過於簡單,性質與規模不符合作為模組課程期末專題,可再嘗試增加深度。
* This is too easy. Please choose problems with greater challenges to overcome.
## 10. HLS4ML-OPTIMCNN
組員:歐杰妮 王羿婷 張筠婷
### 評分:87
### 建議
* 內容與流程均可透過開源工具(如 PyTorch + QKeras + hls4ml)與常見 FPGA 開發環境(如 Vivado HLS)實作,可行性非常高。
* 研究創新或技術突破方面的貢獻是有限的。具體而言:(1) 未對模型結構或訓練策略提出新設計; (2) 未擴展工具功能或提出改進方法; (3) 並未針對特殊應用場景進行設計,而是以通用分類為主; (4) 未針對現有流程中存在的限制或瓶頸提出分析與改進。
* 像是一個「工程實作練習與驗證流程整合」的專題,而非針對壓縮後 CNN 的 FPGA 部署問題提出原創性解法。
## 11. 強化結構化理解的 AI 家教
組員:盧奕潔 林宥嘉 楊筑雯
### 評分:84
### 建議
* 本計畫試圖整合三個元素,RAG、對比學習、知識圖譜,用以改善教材結構化表示與檢索引導,此三者整合若能落實,確實有潛力讓 AI 對話在教材引導、概念查詢與解釋生成上更具組織性與一致性,具有應用上的想像力。
* 但是目前的proposal仍過於簡略,許多地方沒有陳述清楚,待期末時期望本組同學能加強,如多模態(圖表 + 文字)處理能力僅輕描淡寫提及「摘要後儲存」,但LLM 如何整合圖像語意資訊、表格結構並應用於查詢,完全未說明;對比學習僅說明基本訓練流程,但沒有詳細說明樣本數量、選取策略、是否涵蓋跨主題推理樣本。
* 「AI 家教」的應用與互動模式仍非常模糊,未明確界定AI 家教是針對哪類學生、哪種教材、解決什麼教學問題,也沒有設計使用者端的介面行為,換言之,尚看不出如何結合到教學或學習互動場景上。
* 資料來源未說明完整性與多樣性,僅提及使用講義,但沒有說明資料量、主題範圍、知識密度與交叉連結的情形;也建議設計針對知識圖譜與對比學習的 ablation study,以驗證這些module的幫助性,可進行控制變因測試「有/無知識圖譜、有/無對比學習」的組合效果。
* As a tutor, one-way RAG is too simple, add interactions between students and tutors for a more realistic scenario.
* 計畫問題描述清楚,解決方案合理。
## 12. 基於 FPGA 的手寫數字辨識實現
組員:蔡宜樺 洪偉盛 林子恒
### 評分:78
### 建議
* 此專案具有學習上的價值與技術紮實度,但缺乏研究創新性,較像是「工程流程掌握與實作驗證的訓練」。
* 目前project內容無研究新穎性的部分,例如,演算法/模型面,沒有自設模型; 應用場景沒有針對特定場景(如 IoT、醫療、行車辨識)延伸應用結構; 硬體優化技術方面,沒有看到諸如資料重複利用設計、功耗優化設計、或pipeline 深度規劃相關之設計或研發。
* Please describe the challenges and methodologies.
* 實作性強。
## 13. 結合天氣與 LLM 的低軌衛星連線穩定預測系統
組員:蘇雨瑄 趙苡捷 藺弘瑞
### 評分:81
### 建議
* 專案動機佳。
* 使用 LSTM/GRU 作為延遲預測主體、配合天氣特徵,是一個常見的 time-series regression 問題設定,但是新穎性相當有限,深度不足。
* LLM 目前僅為查詢轉換介面,無深入使用 LLM 理解、強化或解釋模型結果,LLM的內容也無創新;整體專案技術面創新度不高。
* 有以下建議,(1) 讓 LLM 參與模型輸出的「解釋性生成」,將延遲預測結果轉為時間序列趨勢,並請 LLM 生成「口語化的判讀說明」,例如,「目前延遲穩定,但風速上升預測會在20分鐘後造成變化。」(2)預測方面,除了 LSTM/GRU,可考慮引入不同模型,例如,Random Forest + SHAP 分析(對氣象變因貢獻度做出直觀可視化),或 transformer-based Time Series Forecasting(如 Informer)。
* Is the simple weather data enough to correlate the latency? Or need more detailed data?
* the project is too simple. consider to add more challenges and methodologies
* 應用具創新性,驗證過程宜多加說明。
## 14. Vision-Based Eye Tracking for Natural Viewing in 3D
組員:郭子銘 游明睿 莊汶娟
### 評分:80
### 建議
* 基於 webcam 的 eye tracking 並非首創,但其「無額外設備 + 即時互動 + 個人化模型」的整合方向,在實用性與普及潛力方面具應用創新性。
* 以下內容仍待交待,(1)資料蒐集與模型個人化缺乏說明:若為 personalized gaze estimation,需有使用者特定資料進行校正或 fine-tuning,現未說明實施方式; (2)與 3D scene 的對應機制模糊:目前未提及 gaze 與 3D environment mapping 的投影邏輯,如何連動尚不清楚。
* 應用場景與呈現方式不過具體,未提供實際使用者流程示意,未說明使用者操作流程與可視化介面設計,無預期成果畫面或範例輸出圖可佐證其「自然性」或「個人化」程度。
* The program is too simple. What are the specific challenges to be overcome? And what are the methodologies.
* 應用具有實用性,但說明較簡略,宜加強技術說明與驗證方式。
## 15. Multi-Agent System for Adaptive FL
組員:鄭義諺 徐偉城 黃元
### 評分:82
### 建議
* LLM 的角色並不清楚,僅提及會“提供建議”,但未說明如何獲得資訊與如何影響 FL 行為。
* 整體架構重在「任務流程自動化」與「報告可讀性提升」,創新點偏向流程整合,而非 FL 演算法或LLM應用的突破。
* 若是作為一個聯邦學習流程包裝器(FL Task Orchestrator),這個專案是可以實作的,但是否有研究價值或推動 任何FL 技術的實質貢獻,目前的proposal看不出太多,有待同學們在期末報告能進一步說明清楚。
* It’s good to implement multi-agent mechanism. Please list out the specific challenges that you want to address and overcome.
* 具技術深度,實作與驗證方式可多加說明。
## 16. Attention and tokenizer on your Web Browser!
組員:陳啟誠 陳惴棋 李哲瑋
### 評分:84
### 建議
* 想法具新穎性。
* 細節的揭露仍不足,有以下建議: (1) 欠缺技術流程,沒有程式架構說明或模組劃分(e.g., tokenizer 模組、可視化模組),建議補充模組設計圖與主要資料流動方向; (2)建議明確說明使用者體驗與輸出內容;(3) 方法方向明確,但缺乏實作細節與模組規劃。
* 應用場景與輸出不清,未展示實際範例畫面,無明確應用情境。
* Please consider how your mechanism can be applied to current LLM models?
* 計畫理念優,但如何實現描述較少,如何解決保密問題也可多說明。
## 17. Smart Diary Analysis and Mental Support Chatbot
組員:顏貝羽 傅靖茹 何思穎
### 評分:89
### 建議
* 雖個別技術均已有先例(如情緒LLM、日記分析、語音輸入),但能針對憂鬱症支持場景整合成一個多模組平台,並考慮無障礙性、多平台適用(Discord/Web),展現應用上的整合創新性。
* 此專案在心理健康支持場景下的整合具有應用創新性。有以下建議: (1)補上交互流程圖或互動腳本: 目前系統整體模組清楚,但若能補上如 使用者日記上傳→情緒分析→視覺化→互動的完整流程圖,以及1~2 組實際對話範例(如使用者提問、模型回應、後續建議),將有助於清楚呈現系統如何輔助使用者。 (2) 加入「使用者個人化學習與調整」機制,建議可納入使用者情緒歷程或 diary profile,並納入 prompt,進行「長期互動記憶」。
* 應用想法優,但情緒不易量化,要如何進行驗證宜多思考。
## 18. IRC – Intelligent Research Companion
組員:高士淵 柯奉煌 林政勳
### 評分:84
### 建議
* 這個專案的創新性在於: (1) 模組化多代理人架構; (2) 跨來源整合能力
* 以下的挑戰需留意, 包括 (1) 多 Agent 的同步與錯誤處理問題; (2) PDF 格式異質性造成處理困難; (3) Web Agent 檢索結果的品質與可信度缺乏驗證機制; (4) 使用者互動介面與需求導向未充分設計
* 以下內容仍待揭露: (1) 模型訓練細節,無訓練參數揭露,未明示是否微調或完全依賴 zero-shot; (2) 資料標註品質,雖提到有人工標註,但無提及標準或一致性機制; (3)prompt 與語境設計,缺乏 prompt 模板與多輪問答控制設計; (4) 系統評估,無明確實驗設計、準確度衡量或與 baseline 比較。 以上這些待於期末時同學們呈現。
* paper summarization is supported by many existent LLMs. What are the key issues that want to be addressed?
* 計畫具實用性,整合難度較高,宜說明如何將不同工具整合並完成目標功能。
## 19. VoyageAI
組員:黃琪鈞 章騰元 詹秉諺
### 評分:84
### 建議
* 整合不同 AI 與 Web 技術於旅遊場景,具實用導向創新。
* 行程推薦如何作到個人化尚不足具體說明,例如未提使用者偏好如何建立,而建檔格式為何?是否依據歷史紀錄?是否有 cold-start 解法?
* RAG 模型的細節仍嫌不足,例如,沒有說明「旅遊知識庫」內容來源、格式與更新方式;缺乏 RAG 的 retrieval component 描述,嵌入向量如何建構?用哪種 embedding model?檢索如何做 ranking?無提示如何將使用者偏好(如美食 vs 景點偏好)轉換為 query,達成真正個人化。
* 翻譯功能實務上具有許多挑戰,例如語音翻譯應用於車站或餐廳等現場場景,實務上具有不少挑戰,包含語音辨識錯誤、模糊語境、噪音背景…等。所以關於「翻譯準確度與互動性」功能上,仍需要更充份的揭露與設計。
* RAG requires data sets. For trip recommendations, it’s not easy to have the right data sets. How will you prepare for that?
* What are the key challenges and how will you overcome them?
* 計畫具實用性,宜多加說明工具鏈如何整合。