# 氛圍式程式開發:從 0 到 1 打造直覺式資料專案
{%hackmd @coscup/announcement-2025 %}
> 請從這裡開始
* 簡報:[氛圍式程式開發:從 0 到 1 打造直覺式資料專案](https://hackmd.io/@LWS9lwHlSHK5Qb8Aia1L2g/rJLSh2sIxg#/)
* [Meta-wiki 上的議程資訊](https://meta.wikimedia.org/wiki/Wikimedia_Taiwan/Wikidata_Taiwan/COSCUP_2025/%E6%B0%9B%E5%9C%8D%E5%BC%8F%E7%A8%8B%E5%BC%8F%E9%96%8B%E7%99%BC%EF%BC%9A%E5%BE%9E_0_%E5%88%B0_1_%E6%89%93%E9%80%A0%E7%9B%B4%E8%A6%BA%E5%BC%8F%E8%B3%87%E6%96%99%E5%B0%88%E6%A1%88)

## 前言
* Vibe Coding其實N年前就有了
* 老闆負責動嘴,員工負責產出(~~工人智慧~~)
* cursor沒辦法產出完整程式碼,不是cursor他做不到,而是太窮
## 資料爬取
### 案例1
* 更複雜的資料
* 資料結構化問題
* 流程設計問題
* 效能優化挑戰
* 以「文件」為基礎的開發流程
* 250行的地雷
### 案例2:新聞手搖飲
* 「文件優先」改成「實作優先」
### 案例3:財經新聞事實查核
* 過去一週的重要新聞
* OpenAI O3表現最佳
* 時效性挑戰(Claude模型可能理解「過去一週」指令有誤)
* 事實準確性(過度推論)
* 連結可靠性
* AI幻覺依舊存在,需要再確認真實性
* 屈原老婆姓陳所以叫屈陳氏?
## 身份轉變
* 開發者的轉變
* 資料分析師的轉變
## 結論
* 練功前講求不傷身體
* 監控&交叉驗證
* 經常問自己:
* 快速交付產品還是交付價值?
* 有加強自己的核心技能?
## 問答時間
### 簡報中提到 AI 搜尋部份有幻覺問題,查證用的 AI 也會衍生其他問題,要如何處理?
回答:(1) 依據處理資料的規模,評估幻覺問題的可接受程度、
(2) 運用提示工程 (Prompt engineering) 解決,舉例來說,原先的提示文字採用兩個階段:需求分析、搜尋結果呈現,
調整成:新增驗證步驟,要求 AI 在提供搜尋結果前,先列出引用資料的相關段落。使用其他 AI 來驗證引用邏輯的正確性。
### 簡報中提到「財經新聞事實查核」AI 對「最近一週」的理解錯誤
回答:舊版模型存在知識截止時間 (knowledge-cutoff) 的限制,不過透過 AI 網路搜尋 API 時,由於回傳的時間資訊都是 2025 年,因此沒有進行額外的處理。對於舊版模型,則需要額外運用 function calling 功能來獲取準確的時間資訊。
### 我是文字工作者,經常使用 ChatGPT 處理長文章,但經常遇到文章長到某一個程度,就會遺忘原本的文章脈絡、瞎掰,即使透過手動摘要之前的文章也無法解決。
回答:(1) 最直接的解決方案是採用支援更長文本處理能力 (context window) 的模型,例如:Google Gemini 等:
* [GPT-4o](https://platform.openai.com/docs/models/gpt-4o): "16,384 max output tokens" 相當於 16,384/3 約 5,461 中文字
* [gemini-2.5-pro](https://ai.google.dev/gemini-api/docs/models#gemini-2.5-pro): "65,536 max output tokens" 相當於 65,536/3 約 21,845 中文字
* [GPT-5](https://platform.openai.com/docs/models/gpt-5): "128,000 max output tokens" 相當於 128,000/3 約 42,666 中文字
(2) 開啟新的對話,將對話內容轉移至新的對話中。針對舊有對話,可以嘗試使用這個提示:
```
作為新對話的第一個 prompt,請將我們先前的對話整理成:
1. 清楚的操作步驟
2. 用來驗證每個前置步驟成功的指令
```
### 日後軟體開發方式,將會從「文件優先」(writing‑first) 改成「實作優先」(building‑first)?
回答:我認為這兩種都是有效的溝通策略,目前我採用混合模式,例如在完成可行性原型網頁後,會要求 AI 同步更新相關文件 (`README.md` 與 `PRD.md`)。這樣在後續新增功能時,能讓 AI 迅速掌握整體專案脈絡,同時達到節省 AI token 使用成本的效果。
文件優先的方式,比較適用於問題定義明確、需求已知的開發情境,可以依據專案特性搭配不同的開發策略。
## 社群資訊
* 台灣開放街圖社群 OpenStreetMap Taiwan
* Website:https://osm.tw/
* Facebook:https://www.facebook.com/openstreetmaptaiwan/
* 臺灣維基數據社群 Wikidata Taiwan
* Facebook:https://www.facebook.com/WikidataTW
* Mastodon:https://liker.social/@wikidatatw
* 近期活動: 8 / 11 [OpenStreetMap x Wikidata 月聚會 #79](https://liker.social/@wikidatatw/114910726957751783)
###### tags: `COSCUP2025`, `zhtw`, `elementary`