氛圍式程式開發：從 0 到 1 打造直覺式資料專案

# 氛圍式程式開發：從 0 到 1 打造直覺式資料專案 {%hackmd @coscup/announcement-2025 %} > 請從這裡開始 * 簡報：[氛圍式程式開發：從 0 到 1 打造直覺式資料專案](https://hackmd.io/@LWS9lwHlSHK5Qb8Aia1L2g/rJLSh2sIxg#/) * [Meta-wiki 上的議程資訊](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/Wikidata_Taiwan/COSCUP_2025/%E6%B0%9B%E5%9C%8D%E5%BC%8F%E7%A8%8B%E5%BC%8F%E9%96%8B%E7%99%BC%EF%BC%9A%E5%BE%9E_0_%E5%88%B0_1_%E6%89%93%E9%80%A0%E7%9B%B4%E8%A6%BA%E5%BC%8F%E8%B3%87%E6%96%99%E5%B0%88%E6%A1%88) ![](https://upload.wikimedia.org/wikipedia/commons/7/71/COSCUP_2025_Day_2_%E6%B4%BB%E5%8B%95%E7%B4%80%E9%8C%84_22.jpg) ## 前言 * Vibe Coding其實Ｎ年前就有了 * 老闆負責動嘴，員工負責產出（~~工人智慧~~） * cursor沒辦法產出完整程式碼，不是cursor他做不到，而是太窮 ## 資料爬取 ### 案例1 * 更複雜的資料 * 資料結構化問題 * 流程設計問題 * 效能優化挑戰 * 以「文件」為基礎的開發流程 * 250行的地雷 ### 案例2：新聞手搖飲 * 「文件優先」改成「實作優先」 ### 案例3：財經新聞事實查核 * 過去一週的重要新聞 * OpenAI O3表現最佳 * 時效性挑戰(Claude模型可能理解「過去一週」指令有誤) * 事實準確性(過度推論) * 連結可靠性 * AI幻覺依舊存在，需要再確認真實性 * 屈原老婆姓陳所以叫屈陳氏？ ## 身份轉變 * 開發者的轉變 * 資料分析師的轉變 ## 結論 * 練功前講求不傷身體 * 監控＆交叉驗證 * 經常問自己： * 快速交付產品還是交付價值？ * 有加強自己的核心技能？ ## 問答時間 ### 簡報中提到 AI 搜尋部份有幻覺問題，查證用的 AI 也會衍生其他問題，要如何處理？回答：(1) 依據處理資料的規模，評估幻覺問題的可接受程度、 (2) 運用提示工程 (Prompt engineering) 解決，舉例來說，原先的提示文字採用兩個階段：需求分析、搜尋結果呈現，調整成：新增驗證步驟，要求 AI 在提供搜尋結果前，先列出引用資料的相關段落。使用其他 AI 來驗證引用邏輯的正確性。 ### 簡報中提到「財經新聞事實查核」AI 對「最近一週」的理解錯誤回答：舊版模型存在知識截止時間 (knowledge-cutoff) 的限制，不過透過 AI 網路搜尋 API 時，由於回傳的時間資訊都是 2025 年，因此沒有進行額外的處理。對於舊版模型，則需要額外運用 function calling 功能來獲取準確的時間資訊。 ### 我是文字工作者，經常使用 ChatGPT 處理長文章，但經常遇到文章長到某一個程度，就會遺忘原本的文章脈絡、瞎掰，即使透過手動摘要之前的文章也無法解決。回答：(1) 最直接的解決方案是採用支援更長文本處理能力 (context window) 的模型，例如：Google Gemini 等： * [GPT-4o](https://platform.openai.com/docs/models/gpt-4o): "16,384 max output tokens" 相當於 16,384/3 約 5,461 中文字 * [gemini-2.5-pro](https://ai.google.dev/gemini-api/docs/models#gemini-2.5-pro): "65,536 max output tokens" 相當於 65,536/3 約 21,845 中文字 * [GPT-5](https://platform.openai.com/docs/models/gpt-5): "128,000 max output tokens" 相當於 128,000/3 約 42,666 中文字 (2) 開啟新的對話，將對話內容轉移至新的對話中。針對舊有對話，可以嘗試使用這個提示： ``` 作為新對話的第一個 prompt，請將我們先前的對話整理成： 1. 清楚的操作步驟 2. 用來驗證每個前置步驟成功的指令 ``` ### 日後軟體開發方式，將會從「文件優先」(writing‑first) 改成「實作優先」(building‑first)？回答：我認為這兩種都是有效的溝通策略，目前我採用混合模式，例如在完成可行性原型網頁後，會要求 AI 同步更新相關文件 (`README.md` 與 `PRD.md`)。這樣在後續新增功能時，能讓 AI 迅速掌握整體專案脈絡，同時達到節省 AI token 使用成本的效果。文件優先的方式，比較適用於問題定義明確、需求已知的開發情境，可以依據專案特性搭配不同的開發策略。 ## 社群資訊 * 台灣開放街圖社群 OpenStreetMap Taiwan * Website：https://osm.tw/ * Facebook：https://www.facebook.com/openstreetmaptaiwan/ * 臺灣維基數據社群 Wikidata Taiwan * Facebook：https://www.facebook.com/WikidataTW * Mastodon：https://liker.social/@wikidatatw * 近期活動： 8 / 11 [OpenStreetMap x Wikidata 月聚會 #79](https://liker.social/@wikidatatw/114910726957751783) ###### tags: `COSCUP2025`, `zhtw`, `elementary`