# 模組期末專題規劃書-評分與建議 ## 1. Seek LAB? AskGent 組員:俞博云 張晉翔 ### 評分:89 ### 建議 * 整合層面具應用創新性,屬於「應用導向的創新設計」。 * 值得肯定的是,明確列出多模組功能與 Agent 執行判斷標準(如是否進行檢索、是否觸發 retry 等)—這是許多提案常見的疏漏。 * 架構與任務拆解合理,但多 Agent 流程協作穩定性,如流程轉移與記憶管理的精確實作,LangGraph 雖具備狀態機特性,但實務上調度容易出現非預期錯誤(如重複查詢、不一致回答)等,仍需妥善因應,待本組同學於期末時作最終呈現。 * 應用有創意,工具有效使用,宜加強後續成果追縱驗證。 ## 2. Pedestrian Attribute Recognition 組員:僑阮明哲 紀正豪 ### 評分:80 ### 建議 * This proposal currently falls under the category of a "technical reimplementation and architectural integration exercise," with relatively low novelty. More innovations in terms of problem formulation and model design are required. * Think about and point out ways to overcome the challenges mentioned. * 應用有實用性,建議進行實測以驗證成果。 ## 3. COT Assessor 組員:吳禎哲 李沅錞 鄭方喆 ### 評分:84 ### 建議 * 提出一種「LLM 審查 LLM」的結構,具創新性。 * 存在以下的問題仍待說明或解決: 1. 對於「正確的 CoT」定義仍非常模糊,可能陷入訓練資料品質與標註偏差的困境。 2. CoT 通常具語意模糊性,僅用「最終答案是否正確」來回推整條推理的正確性,過於簡化。 3. 缺乏驗證流程。 4. 建議增加資料標註策略與語料來源的說明。 * There are so many situations. How “根據其回答的答案是否正確對模型產出的 COT 進行標註” can be done correctly? Who have this knowledge? * 規劃合宜,建議可以強化成果驗證。 ## 4. Automating Taint Analysis with LLMs 組員:吳聿謙 ### 評分:89 ### 建議 * 內容具新穎性與創新性。 * 並未明確區分方法與 Vulnhuntr 之具體差異與改進處,缺乏針對現有技術的創新貢獻比較。 * 就目前所揭露的規劃看起來,實作可行性仍有一定風險,尤其在 LLM 評估可靠性部分尚未具體化。 * 目前專案並未對如何訓練 LLM有足夠的揭露,包括是否自訓模型、微調或依賴現成 API 的黑箱式推論。方法細節雖然有基本描述,但仍偏重概念,僅提供流程概述,缺乏 prompt 工程、模型評估、retry 策略、與容錯設計細節。 * LLM的部份,建議可規劃更完整的模型微調流程或自訓數據建構策略。 * 成果驗證宜加強規劃。 ## 5. 水域安全智慧眼即時溺水偵測與即時救援監控系統 組員:張家逞 林品維 李宇弘 ### 評分:84 ### 建議 * 針對「泳池場域下的溺水風險辨識」,尚屬較少深入探索之應用領域,具應用創新性。 * 以下的內容仍待補足或於期末時說明,包括:(1) 異常判斷機制未揭露原理; (2) 環境適應性(光照、水波、遮蔽)雖提到但無具體實驗驗證策略; (3)測試場域規劃(如泳池、水深、群體密度等)。 * 數據集方面細節揭露不足,例如,訓練數據來源為何?無提及數據集來源、資料量、是否使用公開數據集或自行拍攝資料;溺水樣本標註策略?無說明如何定義與標註溺水 vs 非溺水動作,是否考慮靜止漂浮 vs 掙扎狀態?等。 * Beach, riversides, swimming pools have different situations. Please think about ways to adapt. * 應用實用性加,期待成果驗證與實際功能。 ## 6. GitGPT 組員:張庭嫣 簡蔚驊 蔡維軒 ### 評分:83 ### 建議 * 這個專案具應用創新性。 * 目前的proposal內容對於模型訓練揭露明顯不足,未提及任何訓練計畫,可能是使用現有模型? 也沒有提到任何資料蒐集或 prompt 調教流程,也未設計 custom QA 或 Git 操作範例集,所以推測沒有計畫自行訓練或finetune LLM,這樣降低了研究或技術貢獻潛力。 * 建議期末時提出使用案例與效益驗證,甚至可以有baseline工具作比較。 * Besides empolying the MCP protocol alone, please consider adding agents, training, or performance comparison in the project. * 應用具實用性 ## 7. AI 有聲書沉浸式敘述平台 組員:林俊毅 姜冠宇 馬侑健 ### 評分:83 ### 建議 * 規劃的內容有趣。 * 雖明確提出多項挑戰,但也很好奇這些挑戰本組同學準備如何克服,是否已有擬定策略。 * The problem is good and challenging * Please think about and point out how to overcome the challenges clearly. ## 8. E.A.T. 組員:林玟君 胡芊柔 周巧晴 ### 評分:84 ### 建議 * 這個project具創新性, 而創新之處在於整合與應用層。 * RAG的語料來源建議要來自具有公信力的出處,如USDA、衛福部、open recipe DB…等 * 食物因為多數已經過烹煮與混合,將造成食物辨識困難,以及難以估測數量與重量,若上述內容的確存在困難,建議可聚焦於成分分類與飲食偏好判斷(高脂、高鈉等)。 * 第3個模組,Google Maps + OCR + 嵌入語意比對需大量實地測試以應對非結構化資料品質落差(如 menu 圖片模糊、語意歧異等)。 * How to have a correct dataset to train food recognition model? * Besides RAG, consider applying agents to integrate different actions automatically. * 規劃完善,驗證過程宜多加說明 ## 9. 智慧計算機:影像辨識功能及計算機功能的結合 組員:柯承佑 陳祖佑 ### 評分:76 ### 建議 * 題目過於簡單,性質與規模不符合作為模組課程期末專題,可再嘗試增加深度。 * This is too easy. Please choose problems with greater challenges to overcome. ## 10. HLS4ML-OPTIMCNN 組員:歐杰妮 王羿婷 張筠婷 ### 評分:87 ### 建議 * 內容與流程均可透過開源工具(如 PyTorch + QKeras + hls4ml)與常見 FPGA 開發環境(如 Vivado HLS)實作,可行性非常高。 * 研究創新或技術突破方面的貢獻是有限的。具體而言:(1) 未對模型結構或訓練策略提出新設計; (2) 未擴展工具功能或提出改進方法; (3) 並未針對特殊應用場景進行設計,而是以通用分類為主; (4) 未針對現有流程中存在的限制或瓶頸提出分析與改進。 * 像是一個「工程實作練習與驗證流程整合」的專題,而非針對壓縮後 CNN 的 FPGA 部署問題提出原創性解法。 ## 11. 強化結構化理解的 AI 家教 組員:盧奕潔 林宥嘉 楊筑雯 ### 評分:84 ### 建議 * 本計畫試圖整合三個元素,RAG、對比學習、知識圖譜,用以改善教材結構化表示與檢索引導,此三者整合若能落實,確實有潛力讓 AI 對話在教材引導、概念查詢與解釋生成上更具組織性與一致性,具有應用上的想像力。 * 但是目前的proposal仍過於簡略,許多地方沒有陳述清楚,待期末時期望本組同學能加強,如多模態(圖表 + 文字)處理能力僅輕描淡寫提及「摘要後儲存」,但LLM 如何整合圖像語意資訊、表格結構並應用於查詢,完全未說明;對比學習僅說明基本訓練流程,但沒有詳細說明樣本數量、選取策略、是否涵蓋跨主題推理樣本。 * 「AI 家教」的應用與互動模式仍非常模糊,未明確界定AI 家教是針對哪類學生、哪種教材、解決什麼教學問題,也沒有設計使用者端的介面行為,換言之,尚看不出如何結合到教學或學習互動場景上。 * 資料來源未說明完整性與多樣性,僅提及使用講義,但沒有說明資料量、主題範圍、知識密度與交叉連結的情形;也建議設計針對知識圖譜與對比學習的 ablation study,以驗證這些module的幫助性,可進行控制變因測試「有/無知識圖譜、有/無對比學習」的組合效果。 * As a tutor, one-way RAG is too simple, add interactions between students and tutors for a more realistic scenario. * 計畫問題描述清楚,解決方案合理。 ## 12. 基於 FPGA 的手寫數字辨識實現 組員:蔡宜樺 洪偉盛 林子恒 ### 評分:78 ### 建議 * 此專案具有學習上的價值與技術紮實度,但缺乏研究創新性,較像是「工程流程掌握與實作驗證的訓練」。 * 目前project內容無研究新穎性的部分,例如,演算法/模型面,沒有自設模型; 應用場景沒有針對特定場景(如 IoT、醫療、行車辨識)延伸應用結構; 硬體優化技術方面,沒有看到諸如資料重複利用設計、功耗優化設計、或pipeline 深度規劃相關之設計或研發。 * Please describe the challenges and methodologies. * 實作性強。 ## 13. 結合天氣與 LLM 的低軌衛星連線穩定預測系統 組員:蘇雨瑄 趙苡捷 藺弘瑞 ### 評分:81 ### 建議 * 專案動機佳。 * 使用 LSTM/GRU 作為延遲預測主體、配合天氣特徵,是一個常見的 time-series regression 問題設定,但是新穎性相當有限,深度不足。 * LLM 目前僅為查詢轉換介面,無深入使用 LLM 理解、強化或解釋模型結果,LLM的內容也無創新;整體專案技術面創新度不高。 * 有以下建議,(1) 讓 LLM 參與模型輸出的「解釋性生成」,將延遲預測結果轉為時間序列趨勢,並請 LLM 生成「口語化的判讀說明」,例如,「目前延遲穩定,但風速上升預測會在20分鐘後造成變化。」(2)預測方面,除了 LSTM/GRU,可考慮引入不同模型,例如,Random Forest + SHAP 分析(對氣象變因貢獻度做出直觀可視化),或 transformer-based Time Series Forecasting(如 Informer)。 * Is the simple weather data enough to correlate the latency? Or need more detailed data? * the project is too simple. consider to add more challenges and methodologies * 應用具創新性,驗證過程宜多加說明。 ## 14. Vision-Based Eye Tracking for Natural Viewing in 3D 組員:郭子銘 游明睿 莊汶娟 ### 評分:80 ### 建議 * 基於 webcam 的 eye tracking 並非首創,但其「無額外設備 + 即時互動 + 個人化模型」的整合方向,在實用性與普及潛力方面具應用創新性。 * 以下內容仍待交待,(1)資料蒐集與模型個人化缺乏說明:若為 personalized gaze estimation,需有使用者特定資料進行校正或 fine-tuning,現未說明實施方式; (2)與 3D scene 的對應機制模糊:目前未提及 gaze 與 3D environment mapping 的投影邏輯,如何連動尚不清楚。 * 應用場景與呈現方式不過具體,未提供實際使用者流程示意,未說明使用者操作流程與可視化介面設計,無預期成果畫面或範例輸出圖可佐證其「自然性」或「個人化」程度。 * The program is too simple. What are the specific challenges to be overcome? And what are the methodologies. * 應用具有實用性,但說明較簡略,宜加強技術說明與驗證方式。 ## 15. Multi-Agent System for Adaptive FL 組員:鄭義諺 徐偉城 黃元 ### 評分:82 ### 建議 * LLM 的角色並不清楚,僅提及會“提供建議”,但未說明如何獲得資訊與如何影響 FL 行為。 * 整體架構重在「任務流程自動化」與「報告可讀性提升」,創新點偏向流程整合,而非 FL 演算法或LLM應用的突破。 * 若是作為一個聯邦學習流程包裝器(FL Task Orchestrator),這個專案是可以實作的,但是否有研究價值或推動 任何FL 技術的實質貢獻,目前的proposal看不出太多,有待同學們在期末報告能進一步說明清楚。 * It’s good to implement multi-agent mechanism. Please list out the specific challenges that you want to address and overcome. * 具技術深度,實作與驗證方式可多加說明。 ## 16. Attention and tokenizer on your Web Browser! 組員:陳啟誠 陳惴棋 李哲瑋 ### 評分:84 ### 建議 * 想法具新穎性。 * 細節的揭露仍不足,有以下建議: (1) 欠缺技術流程,沒有程式架構說明或模組劃分(e.g., tokenizer 模組、可視化模組),建議補充模組設計圖與主要資料流動方向; (2)建議明確說明使用者體驗與輸出內容;(3) 方法方向明確,但缺乏實作細節與模組規劃。 * 應用場景與輸出不清,未展示實際範例畫面,無明確應用情境。 * Please consider how your mechanism can be applied to current LLM models? * 計畫理念優,但如何實現描述較少,如何解決保密問題也可多說明。 ## 17. Smart Diary Analysis and Mental Support Chatbot 組員:顏貝羽 傅靖茹 何思穎 ### 評分:89 ### 建議 * 雖個別技術均已有先例(如情緒LLM、日記分析、語音輸入),但能針對憂鬱症支持場景整合成一個多模組平台,並考慮無障礙性、多平台適用(Discord/Web),展現應用上的整合創新性。 * 此專案在心理健康支持場景下的整合具有應用創新性。有以下建議: (1)補上交互流程圖或互動腳本: 目前系統整體模組清楚,但若能補上如 使用者日記上傳→情緒分析→視覺化→互動的完整流程圖,以及1~2 組實際對話範例(如使用者提問、模型回應、後續建議),將有助於清楚呈現系統如何輔助使用者。 (2) 加入「使用者個人化學習與調整」機制,建議可納入使用者情緒歷程或 diary profile,並納入 prompt,進行「長期互動記憶」。 * 應用想法優,但情緒不易量化,要如何進行驗證宜多思考。 ## 18. IRC – Intelligent Research Companion 組員:高士淵 柯奉煌 林政勳 ### 評分:84 ### 建議 * 這個專案的創新性在於: (1) 模組化多代理人架構; (2) 跨來源整合能力 * 以下的挑戰需留意, 包括 (1) 多 Agent 的同步與錯誤處理問題; (2) PDF 格式異質性造成處理困難; (3) Web Agent 檢索結果的品質與可信度缺乏驗證機制; (4) 使用者互動介面與需求導向未充分設計 * 以下內容仍待揭露: (1) 模型訓練細節,無訓練參數揭露,未明示是否微調或完全依賴 zero-shot; (2) 資料標註品質,雖提到有人工標註,但無提及標準或一致性機制; (3)prompt 與語境設計,缺乏 prompt 模板與多輪問答控制設計; (4) 系統評估,無明確實驗設計、準確度衡量或與 baseline 比較。 以上這些待於期末時同學們呈現。 * paper summarization is supported by many existent LLMs. What are the key issues that want to be addressed? * 計畫具實用性,整合難度較高,宜說明如何將不同工具整合並完成目標功能。 ## 19. VoyageAI 組員:黃琪鈞 章騰元 詹秉諺 ### 評分:84 ### 建議 * 整合不同 AI 與 Web 技術於旅遊場景,具實用導向創新。 * 行程推薦如何作到個人化尚不足具體說明,例如未提使用者偏好如何建立,而建檔格式為何?是否依據歷史紀錄?是否有 cold-start 解法? * RAG 模型的細節仍嫌不足,例如,沒有說明「旅遊知識庫」內容來源、格式與更新方式;缺乏 RAG 的 retrieval component 描述,嵌入向量如何建構?用哪種 embedding model?檢索如何做 ranking?無提示如何將使用者偏好(如美食 vs 景點偏好)轉換為 query,達成真正個人化。 * 翻譯功能實務上具有許多挑戰,例如語音翻譯應用於車站或餐廳等現場場景,實務上具有不少挑戰,包含語音辨識錯誤、模糊語境、噪音背景…等。所以關於「翻譯準確度與互動性」功能上,仍需要更充份的揭露與設計。 * RAG requires data sets. For trip recommendations, it’s not easy to have the right data sets. How will you prepare for that? * What are the key challenges and how will you overcome them? * 計畫具實用性,宜多加說明工具鏈如何整合。