113學年度第二學期模組期末專題規劃書評分與建議彙整表

# 模組期末專題規劃書-評分與建議 ## 1. Seek LAB? AskGent 組員：俞博云張晉翔 ### 評分：89 ### 建議 * 整合層面具應用創新性，屬於「應用導向的創新設計」。 * 值得肯定的是，明確列出多模組功能與 Agent 執行判斷標準(如是否進行檢索、是否觸發 retry 等)—這是許多提案常見的疏漏。 * 架構與任務拆解合理，但多 Agent 流程協作穩定性，如流程轉移與記憶管理的精確實作，LangGraph 雖具備狀態機特性，但實務上調度容易出現非預期錯誤(如重複查詢、不一致回答)等，仍需妥善因應，待本組同學於期末時作最終呈現。 * 應用有創意，工具有效使用，宜加強後續成果追縱驗證。 ## 2. Pedestrian Attribute Recognition 組員：僑阮明哲紀正豪 ### 評分：80 ### 建議 * This proposal currently falls under the category of a "technical reimplementation and architectural integration exercise," with relatively low novelty. More innovations in terms of problem formulation and model design are required. * Think about and point out ways to overcome the challenges mentioned. * 應用有實用性，建議進行實測以驗證成果。 ## 3. COT Assessor 組員：吳禎哲李沅錞鄭方喆 ### 評分：84 ### 建議 * 提出一種「LLM 審查 LLM」的結構，具創新性。 * 存在以下的問題仍待說明或解決： 1. 對於「正確的 CoT」定義仍非常模糊，可能陷入訓練資料品質與標註偏差的困境。 2. CoT 通常具語意模糊性，僅用「最終答案是否正確」來回推整條推理的正確性，過於簡化。 3. 缺乏驗證流程。 4. 建議增加資料標註策略與語料來源的說明。 * There are so many situations. How “根據其回答的答案是否正確對模型產出的 COT 進行標註” can be done correctly? Who have this knowledge? * 規劃合宜，建議可以強化成果驗證。 ## 4. Automating Taint Analysis with LLMs 組員：吳聿謙 ### 評分：89 ### 建議 * 內容具新穎性與創新性。 * 並未明確區分方法與 Vulnhuntr 之具體差異與改進處，缺乏針對現有技術的創新貢獻比較。 * 就目前所揭露的規劃看起來，實作可行性仍有一定風險，尤其在 LLM 評估可靠性部分尚未具體化。 * 目前專案並未對如何訓練 LLM有足夠的揭露，包括是否自訓模型、微調或依賴現成 API 的黑箱式推論。方法細節雖然有基本描述，但仍偏重概念，僅提供流程概述，缺乏 prompt 工程、模型評估、retry 策略、與容錯設計細節。 * LLM的部份，建議可規劃更完整的模型微調流程或自訓數據建構策略。 * 成果驗證宜加強規劃。 ## 5. 水域安全智慧眼即時溺水偵測與即時救援監控系統組員：張家逞林品維李宇弘 ### 評分：84 ### 建議 * 針對「泳池場域下的溺水風險辨識」，尚屬較少深入探索之應用領域，具應用創新性。 * 以下的內容仍待補足或於期末時說明，包括:(1) 異常判斷機制未揭露原理; (2) 環境適應性（光照、水波、遮蔽）雖提到但無具體實驗驗證策略; (3)測試場域規劃（如泳池、水深、群體密度等）。 * 數據集方面細節揭露不足，例如，訓練數據來源為何?無提及數據集來源、資料量、是否使用公開數據集或自行拍攝資料；溺水樣本標註策略?無說明如何定義與標註溺水 vs 非溺水動作，是否考慮靜止漂浮 vs 掙扎狀態？等。 * Beach, riversides, swimming pools have different situations. Please think about ways to adapt. * 應用實用性加，期待成果驗證與實際功能。 ## 6. GitGPT 組員：張庭嫣簡蔚驊蔡維軒 ### 評分：83 ### 建議 * 這個專案具應用創新性。 * 目前的proposal內容對於模型訓練揭露明顯不足，未提及任何訓練計畫，可能是使用現有模型? 也沒有提到任何資料蒐集或 prompt 調教流程，也未設計 custom QA 或 Git 操作範例集，所以推測沒有計畫自行訓練或finetune LLM，這樣降低了研究或技術貢獻潛力。 * 建議期末時提出使用案例與效益驗證，甚至可以有baseline工具作比較。 * Besides empolying the MCP protocol alone, please consider adding agents, training, or performance comparison in the project. * 應用具實用性 ## 7. AI 有聲書沉浸式敘述平台組員：林俊毅姜冠宇馬侑健 ### 評分：83 ### 建議 * 規劃的內容有趣。 * 雖明確提出多項挑戰，但也很好奇這些挑戰本組同學準備如何克服，是否已有擬定策略。 * The problem is good and challenging * Please think about and point out how to overcome the challenges clearly. ## 8. E.A.T. 組員：林玟君胡芊柔周巧晴 ### 評分：84 ### 建議 * 這個project具創新性, 而創新之處在於整合與應用層。 * RAG的語料來源建議要來自具有公信力的出處，如USDA、衛福部、open recipe DB…等 * 食物因為多數已經過烹煮與混合，將造成食物辨識困難，以及難以估測數量與重量，若上述內容的確存在困難，建議可聚焦於成分分類與飲食偏好判斷（高脂、高鈉等）。 * 第3個模組，Google Maps + OCR + 嵌入語意比對需大量實地測試以應對非結構化資料品質落差（如 menu 圖片模糊、語意歧異等）。 * How to have a correct dataset to train food recognition model? * Besides RAG, consider applying agents to integrate different actions automatically. * 規劃完善，驗證過程宜多加說明 ## 9. 智慧計算機：影像辨識功能及計算機功能的結合組員：柯承佑陳祖佑 ### 評分：76 ### 建議 * 題目過於簡單，性質與規模不符合作為模組課程期末專題，可再嘗試增加深度。 * This is too easy. Please choose problems with greater challenges to overcome. ## 10. HLS4ML-OPTIMCNN 組員：歐杰妮王羿婷張筠婷 ### 評分：87 ### 建議 * 內容與流程均可透過開源工具（如 PyTorch + QKeras + hls4ml）與常見 FPGA 開發環境（如 Vivado HLS）實作，可行性非常高。 * 研究創新或技術突破方面的貢獻是有限的。具體而言：(1) 未對模型結構或訓練策略提出新設計; (2) 未擴展工具功能或提出改進方法; (3) 並未針對特殊應用場景進行設計，而是以通用分類為主; (4) 未針對現有流程中存在的限制或瓶頸提出分析與改進。 * 像是一個「工程實作練習與驗證流程整合」的專題，而非針對壓縮後 CNN 的 FPGA 部署問題提出原創性解法。 ## 11. 強化結構化理解的 AI 家教組員：盧奕潔林宥嘉楊筑雯 ### 評分：84 ### 建議 * 本計畫試圖整合三個元素，RAG、對比學習、知識圖譜，用以改善教材結構化表示與檢索引導，此三者整合若能落實，確實有潛力讓 AI 對話在教材引導、概念查詢與解釋生成上更具組織性與一致性，具有應用上的想像力。 * 但是目前的proposal仍過於簡略，許多地方沒有陳述清楚，待期末時期望本組同學能加強，如多模態（圖表 + 文字）處理能力僅輕描淡寫提及「摘要後儲存」，但LLM 如何整合圖像語意資訊、表格結構並應用於查詢，完全未說明；對比學習僅說明基本訓練流程，但沒有詳細說明樣本數量、選取策略、是否涵蓋跨主題推理樣本。 * 「AI 家教」的應用與互動模式仍非常模糊，未明確界定AI 家教是針對哪類學生、哪種教材、解決什麼教學問題，也沒有設計使用者端的介面行為，換言之，尚看不出如何結合到教學或學習互動場景上。 * 資料來源未說明完整性與多樣性，僅提及使用講義，但沒有說明資料量、主題範圍、知識密度與交叉連結的情形；也建議設計針對知識圖譜與對比學習的 ablation study，以驗證這些module的幫助性，可進行控制變因測試「有/無知識圖譜、有/無對比學習」的組合效果。 * As a tutor, one-way RAG is too simple, add interactions between students and tutors for a more realistic scenario. * 計畫問題描述清楚，解決方案合理。 ## 12. 基於 FPGA 的手寫數字辨識實現組員：蔡宜樺洪偉盛林子恒 ### 評分：78 ### 建議 * 此專案具有學習上的價值與技術紮實度，但缺乏研究創新性，較像是「工程流程掌握與實作驗證的訓練」。 * 目前project內容無研究新穎性的部分，例如，演算法/模型面，沒有自設模型; 應用場景沒有針對特定場景（如 IoT、醫療、行車辨識）延伸應用結構; 硬體優化技術方面，沒有看到諸如資料重複利用設計、功耗優化設計、或pipeline 深度規劃相關之設計或研發。 * Please describe the challenges and methodologies. * 實作性強。 ## 13. 結合天氣與 LLM 的低軌衛星連線穩定預測系統組員：蘇雨瑄趙苡捷藺弘瑞 ### 評分：81 ### 建議 * 專案動機佳。 * 使用 LSTM/GRU 作為延遲預測主體、配合天氣特徵，是一個常見的 time-series regression 問題設定，但是新穎性相當有限，深度不足。 * LLM 目前僅為查詢轉換介面，無深入使用 LLM 理解、強化或解釋模型結果，LLM的內容也無創新；整體專案技術面創新度不高。 * 有以下建議，(1) 讓 LLM 參與模型輸出的「解釋性生成」，將延遲預測結果轉為時間序列趨勢，並請 LLM 生成「口語化的判讀說明」，例如，「目前延遲穩定，但風速上升預測會在20分鐘後造成變化。」(2)預測方面，除了 LSTM/GRU，可考慮引入不同模型，例如，Random Forest + SHAP 分析（對氣象變因貢獻度做出直觀可視化），或 transformer-based Time Series Forecasting（如 Informer）。 * Is the simple weather data enough to correlate the latency? Or need more detailed data? * the project is too simple. consider to add more challenges and methodologies * 應用具創新性，驗證過程宜多加說明。 ## 14. Vision-Based Eye Tracking for Natural Viewing in 3D 組員：郭子銘游明睿莊汶娟 ### 評分：80 ### 建議 * 基於 webcam 的 eye tracking 並非首創，但其「無額外設備 + 即時互動 + 個人化模型」的整合方向，在實用性與普及潛力方面具應用創新性。 * 以下內容仍待交待，(1)資料蒐集與模型個人化缺乏說明：若為 personalized gaze estimation，需有使用者特定資料進行校正或 fine-tuning，現未說明實施方式; (2)與 3D scene 的對應機制模糊：目前未提及 gaze 與 3D environment mapping 的投影邏輯，如何連動尚不清楚。 * 應用場景與呈現方式不過具體，未提供實際使用者流程示意，未說明使用者操作流程與可視化介面設計，無預期成果畫面或範例輸出圖可佐證其「自然性」或「個人化」程度。 * The program is too simple. What are the specific challenges to be overcome? And what are the methodologies. * 應用具有實用性，但說明較簡略，宜加強技術說明與驗證方式。 ## 15. Multi-Agent System for Adaptive FL 組員：鄭義諺徐偉城黃元 ### 評分：82 ### 建議 * LLM 的角色並不清楚，僅提及會“提供建議”，但未說明如何獲得資訊與如何影響 FL 行為。 * 整體架構重在「任務流程自動化」與「報告可讀性提升」，創新點偏向流程整合，而非 FL 演算法或LLM應用的突破。 * 若是作為一個聯邦學習流程包裝器（FL Task Orchestrator），這個專案是可以實作的，但是否有研究價值或推動任何FL 技術的實質貢獻，目前的proposal看不出太多，有待同學們在期末報告能進一步說明清楚。 * It’s good to implement multi-agent mechanism. Please list out the specific challenges that you want to address and overcome. * 具技術深度，實作與驗證方式可多加說明。 ## 16. Attention and tokenizer on your Web Browser! 組員：陳啟誠陳惴棋李哲瑋 ### 評分：84 ### 建議 * 想法具新穎性。 * 細節的揭露仍不足，有以下建議: (1) 欠缺技術流程，沒有程式架構說明或模組劃分(e.g., tokenizer 模組、可視化模組)，建議補充模組設計圖與主要資料流動方向; (2)建議明確說明使用者體驗與輸出內容；(3) 方法方向明確，但缺乏實作細節與模組規劃。 * 應用場景與輸出不清，未展示實際範例畫面，無明確應用情境。 * Please consider how your mechanism can be applied to current LLM models? * 計畫理念優，但如何實現描述較少，如何解決保密問題也可多說明。 ## 17. Smart Diary Analysis and Mental Support Chatbot 組員：顏貝羽傅靖茹何思穎 ### 評分：89 ### 建議 * 雖個別技術均已有先例（如情緒LLM、日記分析、語音輸入），但能針對憂鬱症支持場景整合成一個多模組平台，並考慮無障礙性、多平台適用（Discord/Web），展現應用上的整合創新性。 * 此專案在心理健康支持場景下的整合具有應用創新性。有以下建議: (1)補上交互流程圖或互動腳本: 目前系統整體模組清楚，但若能補上如使用者日記上傳→情緒分析→視覺化→互動的完整流程圖，以及1~2 組實際對話範例（如使用者提問、模型回應、後續建議），將有助於清楚呈現系統如何輔助使用者。 (2) 加入「使用者個人化學習與調整」機制，建議可納入使用者情緒歷程或 diary profile，並納入 prompt，進行「長期互動記憶」。 * 應用想法優，但情緒不易量化，要如何進行驗證宜多思考。 ## 18. IRC – Intelligent Research Companion 組員：高士淵柯奉煌林政勳 ### 評分：84 ### 建議 * 這個專案的創新性在於: (1) 模組化多代理人架構; (2) 跨來源整合能力 * 以下的挑戰需留意, 包括 (1) 多 Agent 的同步與錯誤處理問題; (2) PDF 格式異質性造成處理困難; (3) Web Agent 檢索結果的品質與可信度缺乏驗證機制; (4) 使用者互動介面與需求導向未充分設計 * 以下內容仍待揭露: (1) 模型訓練細節，無訓練參數揭露，未明示是否微調或完全依賴 zero-shot; (2) 資料標註品質，雖提到有人工標註，但無提及標準或一致性機制; (3)prompt 與語境設計，缺乏 prompt 模板與多輪問答控制設計; (4) 系統評估，無明確實驗設計、準確度衡量或與 baseline 比較。以上這些待於期末時同學們呈現。 * paper summarization is supported by many existent LLMs. What are the key issues that want to be addressed? * 計畫具實用性，整合難度較高，宜說明如何將不同工具整合並完成目標功能。 ## 19. VoyageAI 組員：黃琪鈞章騰元詹秉諺 ### 評分：84 ### 建議 * 整合不同 AI 與 Web 技術於旅遊場景，具實用導向創新。 * 行程推薦如何作到個人化尚不足具體說明，例如未提使用者偏好如何建立，而建檔格式為何?是否依據歷史紀錄？是否有 cold-start 解法？ * RAG 模型的細節仍嫌不足，例如，沒有說明「旅遊知識庫」內容來源、格式與更新方式；缺乏 RAG 的 retrieval component 描述，嵌入向量如何建構？用哪種 embedding model？檢索如何做 ranking？無提示如何將使用者偏好（如美食 vs 景點偏好）轉換為 query，達成真正個人化。 * 翻譯功能實務上具有許多挑戰，例如語音翻譯應用於車站或餐廳等現場場景，實務上具有不少挑戰，包含語音辨識錯誤、模糊語境、噪音背景…等。所以關於「翻譯準確度與互動性」功能上，仍需要更充份的揭露與設計。 * RAG requires data sets. For trip recommendations, it’s not easy to have the right data sets. How will you prepare for that? * What are the key challenges and how will you overcome them? * 計畫具實用性，宜多加說明工具鏈如何整合。