# 氛圍式程式開發:從 0 到 1 打造直覺式資料專案 {%hackmd @coscup/announcement-2025 %} > 請從這裡開始 * 簡報:[氛圍式程式開發:從 0 到 1 打造直覺式資料專案](https://hackmd.io/@LWS9lwHlSHK5Qb8Aia1L2g/rJLSh2sIxg#/) * [Meta-wiki 上的議程資訊](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/Wikidata_Taiwan/COSCUP_2025/%E6%B0%9B%E5%9C%8D%E5%BC%8F%E7%A8%8B%E5%BC%8F%E9%96%8B%E7%99%BC%EF%BC%9A%E5%BE%9E_0_%E5%88%B0_1_%E6%89%93%E9%80%A0%E7%9B%B4%E8%A6%BA%E5%BC%8F%E8%B3%87%E6%96%99%E5%B0%88%E6%A1%88) ![](https://upload.wikimedia.org/wikipedia/commons/7/71/COSCUP_2025_Day_2_%E6%B4%BB%E5%8B%95%E7%B4%80%E9%8C%84_22.jpg) ## 前言 * Vibe Coding其實N年前就有了 * 老闆負責動嘴,員工負責產出(~~工人智慧~~) * cursor沒辦法產出完整程式碼,不是cursor他做不到,而是太窮 ## 資料爬取 ### 案例1 * 更複雜的資料 * 資料結構化問題 * 流程設計問題 * 效能優化挑戰 * 以「文件」為基礎的開發流程 * 250行的地雷 ### 案例2:新聞手搖飲 * 「文件優先」改成「實作優先」 ### 案例3:財經新聞事實查核 * 過去一週的重要新聞 * OpenAI O3表現最佳 * 時效性挑戰(Claude模型可能理解「過去一週」指令有誤) * 事實準確性(過度推論) * 連結可靠性 * AI幻覺依舊存在,需要再確認真實性 * 屈原老婆姓陳所以叫屈陳氏? ## 身份轉變 * 開發者的轉變 * 資料分析師的轉變 ## 結論 * 練功前講求不傷身體 * 監控&交叉驗證 * 經常問自己: * 快速交付產品還是交付價值? * 有加強自己的核心技能? ## 問答時間 ### 簡報中提到 AI 搜尋部份有幻覺問題,查證用的 AI 也會衍生其他問題,要如何處理? 回答:(1) 依據處理資料的規模,評估幻覺問題的可接受程度、 (2) 運用提示工程 (Prompt engineering) 解決,舉例來說,原先的提示文字採用兩個階段:需求分析、搜尋結果呈現, 調整成:新增驗證步驟,要求 AI 在提供搜尋結果前,先列出引用資料的相關段落。使用其他 AI 來驗證引用邏輯的正確性。 ### 簡報中提到「財經新聞事實查核」AI 對「最近一週」的理解錯誤 回答:舊版模型存在知識截止時間 (knowledge-cutoff) 的限制,不過透過 AI 網路搜尋 API 時,由於回傳的時間資訊都是 2025 年,因此沒有進行額外的處理。對於舊版模型,則需要額外運用 function calling 功能來獲取準確的時間資訊。 ### 我是文字工作者,經常使用 ChatGPT 處理長文章,但經常遇到文章長到某一個程度,就會遺忘原本的文章脈絡、瞎掰,即使透過手動摘要之前的文章也無法解決。 回答:(1) 最直接的解決方案是採用支援更長文本處理能力 (context window) 的模型,例如:Google Gemini 等: * [GPT-4o](https://platform.openai.com/docs/models/gpt-4o): "16,384 max output tokens" 相當於 16,384/3 約 5,461 中文字 * [gemini-2.5-pro](https://ai.google.dev/gemini-api/docs/models#gemini-2.5-pro): "65,536 max output tokens" 相當於 65,536/3 約 21,845 中文字 * [GPT-5](https://platform.openai.com/docs/models/gpt-5): "128,000 max output tokens" 相當於 128,000/3 約 42,666 中文字 (2) 開啟新的對話,將對話內容轉移至新的對話中。針對舊有對話,可以嘗試使用這個提示: ``` 作為新對話的第一個 prompt,請將我們先前的對話整理成: 1. 清楚的操作步驟 2. 用來驗證每個前置步驟成功的指令 ``` ### 日後軟體開發方式,將會從「文件優先」(writing‑first) 改成「實作優先」(building‑first)? 回答:我認為這兩種都是有效的溝通策略,目前我採用混合模式,例如在完成可行性原型網頁後,會要求 AI 同步更新相關文件 (`README.md` 與 `PRD.md`)。這樣在後續新增功能時,能讓 AI 迅速掌握整體專案脈絡,同時達到節省 AI token 使用成本的效果。 文件優先的方式,比較適用於問題定義明確、需求已知的開發情境,可以依據專案特性搭配不同的開發策略。 ## 社群資訊 * 台灣開放街圖社群 OpenStreetMap Taiwan * Website:https://osm.tw/ * Facebook:https://www.facebook.com/openstreetmaptaiwan/ * 臺灣維基數據社群 Wikidata Taiwan * Facebook:https://www.facebook.com/WikidataTW * Mastodon:https://liker.social/@wikidatatw * 近期活動: 8 / 11 [OpenStreetMap x Wikidata 月聚會 #79](https://liker.social/@wikidatatw/114910726957751783) ###### tags: `COSCUP2025`, `zhtw`, `elementary`