--- GA: UA-34467841-15 --- # 如果語言模型是鋼鐵人的反應爐,那麼我們該做的是打造鋼鐵衣 - 吳勝繙(Chris) ###### tags: `HelloWorld2025` `HWDC2025` `2025` `BC 會議室` <blockquote> 從個人開源專案到組織開發賦能與流程再造,我們該如何看待 Autonomous software 以及如何導入? 或許可以參考 Andrej Karpathy 在 2025年6月17日「Software Is Changing」演講說的,我們該借鑑自動駕駛一路的歷史演進。 我在方針上以 ADAS 為類比的借鑑思想,以及 2019 年我自己曾宣揚的擴展智慧為藍圖,比起全自動或者聊天機器人,我更看重「協同」與「轉譯」的能力,比如 Vibe Code 這樣的人與機器協同像波浪般透過激起一點漣漪就能形成浪花的應用,大幅度地放大單個人類的能力。 數位發展部目前分為三個面向: 1.行政工作的賦能:RAG 的導入,並非只是 KM,而是讓每個公務員都知道可以運用語言模型協助跟自己的業務資料「對話」,藉此快速整理行政工作上涉及的法規、專業資訊,提高自己的掌握力從而做出判斷。 2.能力放大:語言模型的泛化為原本專精管理或文字策略的撰寫者提供快速開發 MVP 的能力,比如過去可能只是紙上談兵的資安精神 Secure by Default,現在可以藉由 Vibe Code 賦能讓制定制度的人直接實現想法,從而驗證。 3.開發流程賦能:借鑑 Claude Code 的思維,我們團隊思考在 IDE 中整合 Pipeline 工具的 MCP 服務以及 Vibe Code ,試圖降低 Code Review 這件事的負擔,從而在上版風險上進一步獲得更多控制。 此外,在能力被放大後,風險控制就更加重要,我們也許該重新拾起過去的管理學的知識與藝術,把「運用語言模型強化的工作單元」該有什麼樣的準則更細節討論。 聽眾收穫: 也許能在開發軟體上獲得一些靈感,共享同為開發者對於應用語言模型這件事上的想法 </blockquote> {%hackmd @HWDC/announcement-2025 %} ## 會議資訊 **時間:** 13:30 ~ 14:00 **地點:** BC 會議室 **日期:** 2025年10月15日 **語言:** 中文 **難度:** 中階 **相關連結:** - [Hello World Dev Conference 2025 官方網站](https://hwdc.ithome.com.tw/2025) [target=_blank] - [Hello World 2025 議程表](https://hwdc.ithome.com.tw/2025/agenda) [target=_blank] ## 筆記區 AI 當作工具? 用 AI 來製作工具? ### Overview > 完美契合,是理想 如何應用,是現實 我們選擇先學習應用動力 - Karpathy 2025/6/17 Software is Changing ### 科技始終來自人性 ### 使所有人變成開發者 - 自己業務的開發者:NotebookLM, Gem - 輔助別人、自己完成工作的開發者 - 組織流程的開發者 資料業務探索 -> NotebookLM 日常輔助辦公 -> Gemini -> 固定場域或程序 -> Gem -> Google App Script 自動化 ### 重新定義外包 LLM 降低了門檻 公務員能鑽寫測試腳本 局部的程式碼 投餵型外包 => 協作型外包 How MODA try to do Spec code: Plan -> Act Amazon Q: Context & workflow management Multi-agent: - Gemini: web search - Codex - Claude Code ### 認知提升與風險管理 1. LLM 讓個人能力提升,同時感受 model 的不確定性,強調人類作為決策主體的必要性 2. model 應成為中立的輔助者 3. 透過 model 輔助的決策流程,建立風險預警與回饋機制,確保每次自動化都能被人理解、被人修正 ### Future goals ### Contact [moda 數位名片個人版展示](https://db-card.pages.dev/index-bilingual-personal?data=JUU1JTkwJUIzJUU1JThCJTlEJUU3JUI5JTk5fkNocmlzJTIwV3UlN0MlRTclQTclOTElRTklOTUlQjd-U2VjdGlvbiUyMENoaWVmJTdDJTdDaWltMDY2MzQxOCU0MG1vZGEuZ292LnR3JTdDMDItMjM4MC0wNDExJTdDJTdDJTdDJUU1JUJFJTg4JUU5JUFCJTk4JUU4JTg4JTg4JUU4JUFBJThEJUU4JUFEJTk4JUU0JUJEJUEwfk5pY2UlMjB0byUyMG1lZXQlMjB5b3UlN0NMaW5rZWRJbiUzQSVFNSU5MCVCMy0lRTUlOEIlOUQlRTclQjklOTktODdhNDVhMjA2JTdDJUU2JTk1JUI4JUU0JUJEJThEJUU3JTk5JUJDJUU1JUIxJTk1JUU5JTgzJUE4fm1vZGElN0M) ## 討論區 > 歡迎在此進行討論與 Q&A > 講者眼睛好小,很像閉眼講 ## 相關資源 - 投影片連結:(待講者提供) - 相關文件:(待更新) ## 逐字稿 開發左移這件事情上的一些可以跟各位分享的題目。那當然今天的聲前是前到我們如何去把整個開發左營就賦予原本其實沒有IT能力的人。 一些IT的能量,或者是讓我們既有的開發者能夠透過整個開發者為一個方式去試圖能夠有更大的能量去實現一些不管是安全性也好,或者是對專案的掌控度也好。 去做一些這樣的事情。那其實今天的命題,我採用這樣的命題是因為,目前在AI領域上,其實大家都有兩件事情,像最近我輔導了一些廠商,就過一些他們目前的障礙是,大家都還focus在我如何對模型做工程。 Compassi 今天剛好發表了一個項目,就是來更簡單、更輕量的去做模型的訓練課程。其實學過深度學習就知道,生態語模型其實已經是複合性而且高反化的模型。那如果GP用這個模型作為一個驅動的來源,先去完成一些事情,讓自己的一些流程,或者是讓自己的工作, 也許是目前這個階段模型不斷進化的過程中,作為編輯開發者或不是模型本體的開發者所思考的事情。 那,圍繞兩個議題,其實智慧發展部內部最近在討論兩件事,AI到底是自己做為工具,還是拿AI去鑄成工具?那,其實今天這個命題就是用幾個簡單的案例來討論一下,那到底應該我們讓AI直接變成一個工具好呢? 我們可以先仰賴它的機制去鑄造一些工具,或者是把它融合在一起。這是我今天有編導,我的content會分成幾個議題,首先是overview,然後再來是cultivation,終於來自於人性,講講我現在所在的部門,為什麼我們一直很講究開發這個概念作業這件事情。然後再來是我們所有人都變成開發者,所謂的所有人當然不是。 資訊單位的人,而是大家所認知上的公務員們,變成開發者這件事情。然後重新定義外包,來告訴大家說,從民國88年起,整個政府部門開始,就是資訊連資訊部門都大幅度外包的情況下,其他存在一些可以被優化的地方。 比如說以我自己身為從地方政府、從執法單位轉到數位發展部這個比較偏向中央IT單位的,你們去看這件事情,怎麼讓這件事變得更有掌控度,怎麼仰賴語言模型來深化這件事情。 然後最後是認知的提升與風險管理。最近大家能夠看,不管是開發者社群也好,還是社群媒體,都一直在強調Window Code常常就是不小心就噴屁。我常常開個玩笑,我兩年前在帶一個剛進來的新人,他就真的把我們內部的key噴在電腦上。 現在的語言模型,如果你不去做監管監控,或者是你在 code review 的時候一不小心也會幹一模一樣的事情,那其實防治的方法是可以被類似的。 最後是Visual Go跟Context。抱歉,那我就直接開始了。首先其實就讓我開場的,我們到底是應該先從Marvel的engineer,還是我直接進到,我把原模型本體去驅動智慧報號自動化這件事情。 其實一開始,也許組織就要先抉擇這件事,就是你有沒有能量去對模型做一些事情。那以數位發展部自己而言,政府機關其實對於模型工程這件事,也許我們不如科技部。也就是說我們現在要想的是,在我的人力物力的情況下, 我想要去對模型做,前陣子跟資本業者在交流的時候,我也不得不承認SFT結束之後的模型,它確實用很短的卡片可以執行一個非常拖拉庫的工作,那它在整個智慧化、自動化的表現上面,其實講真的,如果可以,我當然想做出這樣的東西,但是不行的情況下, 那我是不是應該退而求其次,就是OK,我透過Pubkins或是我外掛的方式,用語言模型驅動我的工作流,或是驅動我的一些工作的發展。所以,我們最怕不選擇的就是後者,我們可能先掩賴語言模型既有的翻畫能力。 在無可定義的範圍內,優化我們的工作流,改善我們的工作效率。OK,所以我引用一樣的Composite在Software is Transient裡面提到了。 LM就像作業系統,就像能源。比如說,當然GitHub有能力可以改OS裡面的東西,但是其實在OS上去build一些東西,然後會改善我的工作的剛剛提到的那些東西,或者是我把它作為一種energy,我把它拿來驅動我的邊緣的一些器械,這個可能也許是一個 如果沒有那麼大的成本或者是能量的一個組織,可以先去思考的地方。所以回到我今天講的,其實這整個都是一個左翼的過程。不管是我左翼要去完成安全性這件事,還是左翼我試圖讓原本不具有開放能力的人去做。 其實我現在所在的單位,整個數位發展部的資訊處,目前就只有十個人。那這十個人還都是公務員。 其實公務員現在對我們資訊科技類的公務員來說已經快變成典藝詞了,因為在不斷外包的情況下,大家對於 自我諮詢的公務員的觀感其實都不是很好,就覺得我們其實也很沒有能量。我跟各位報告,實際上真的是,包含自己在內訓的時候,自己又深刻感受到 像我們這一群可能當初在土耙湖禁區有比較熱忱的、自己抱持著一定能力的公務員,但是他現在在社會發展部成立兩年之後,我們漸漸開始常態公共機關把他招進來,人類的發展體。 是完全的落差,連教育訓練的課都排不起來。所以我到底要排Advanced的訓練呢?還是要為了這些進來就像白紙的人去做訓練呢?其實這一直以來都是很大的問題。 語音模型的出現其實是能夠第一個我可以對我這裡面的十個人賦能,第二個我可能要開始開發原本不具有開發能量的人去做一些自動化的事情來推進我整個數位遷移的進程,否則 我裡面的一些數位化、自動化,常常都卡在這些能量上面,或者是更進一步的,像目前很大幅度的是我們使用一些AP系統。 它能夠把語言模型加進去,去完成一些處理非結構化資料的一些題目,其實我們的廠商也不見得有能力。那只有我們自己先想起來,才有辦法讓別人跟著上。 OK,所以其實這張簡報在講這個故事,我們的人不夠,能量不夠那我如何透過賦能這件事情讓我們能夠去驅動工作流流的行程? 行政賦能、人力放大、開發流程賦能, 會是今天整個talk的核心主軸。OK,跳太快了。所以第一件事情,我如何讓所有人變成開發者? 其實很久很久以前,我們跟Google就已經在Google Spaces上面簽訂相關的合約,因為對政府部門來說,我們的Data必須保存在我們的國內。所以為了讓我們的部門能夠使用Google Spaces作為辦公室自動化軟體,很久以前我們跟Google說必須把Data保存在商品機房。然後目前的Model這件事情上也是,2.5 Flash是有辦法在商品機房裡跑的,但是 目前 2.5 Pro 還是必須會跑到美籍區。這是一個在模型環境上不斷的挑戰,說是否先把工具禁用在我們的所有 User 身邊。 第二件事情是,當我的可控性這件事情能夠被控制的情況下,我才有辦法去Push我的User,去使用這件Tool去改善他目前的能量。 舉個例子,我們很久很久以前就開始臉書推廣的時候,都不給人家去處理他業務資料因為對現在常任公務員來說法規也好,用資料也好,全部都是純文字資料 如果有公務員每天幹最多的事情是什麼呢?就是每個人負責他自己Domain裡面的東西,把法規定熟、把規定讀熟,然後被長官Challenge。那這件事情其實是應該用一個更有效率的去處理這些文本資料的。所以如果台下有之前做LOP啊或什麼的,其實都知道很多機關其實試圖要去把這件事情去,比如說KM啊或什麼的。 現階段,當你資料很少,或是你資料還不足以集成KM,也沒有儲存的情況下怎麼做。像當初有Novorex出來的時候,就提供了一個小型的RAG。 讓你自己能夠隨時接觸資料的存在。再加上後來Jim的分享,所以漸漸地開始我們對內有些OShock的事,你先透過Germany來解決問題之後。 然後把資料分享給其他人,大家能共享你的工作而去解決問題。OK,所以我們的流程就會像是這個樣子。一開始內部資料的探索,透過危險reg或像是會員這樣的措施,先去對自己的資料的探索。 最終形成一個有點像是法律上的新政,或者是一個解決問題的方式之後,你可以去把這樣的提示詞或者是這樣的型態處理資料的方式,包括分享機制做內部分享。所以我們處罰部現在內部有一個專門用來分享這個的網站或平台。 讓所有公務員能夠參考別人的業務邏輯,解決自己的資料上的問題,或者是把你今天的業務邏輯生成一個固定的 Drip,然後讓你能夠去提問或檢索到你的資料。更進一步的,有些公務員其實他有辦法去看懂 App Screen,那其實你可以透過 Joomla! 來去生成一些簡單的 App Screen,去優化你的 比如說像我們在Google Docs、Google Sheets上面的一些行為,甚至在Google表單的連動行為上,它其實就可以做到一些過去可能對公務員來說只能靠外包才能解決的問題,但現在變成相對可攻擊的通用語言模型,直到語言模型寫專案後,是為了什麼意義?那你其實想解決的其實某個問題,你能精準的解決那個問題。而這些不是由 資訊公務員所發起的,而是由行政公務員所發起的,這個很重要。所以它是一個整個開發主義的一個,我們認為是一個機會。所以智慧發展部不斷地在對內去推動這件事情,我們希望直接由這些 Domain Know How 的公務員驅動整個自動化物資會發展進展。 OK,再來是對我們資訊單位來說,我們企圖在這個左翼過程中做哪些事情?首先我們要重新確定外包這件事情,因為其實在不斷地弱化公務員,尤其是資訊類型公務員的一個治理的情況下,然後我們大家可能就都一直覺得說外包就能解決問題,外包就能解決問題,但是其實控制力不斷地減少的情況下, 我很坦白說,現在遇到的問題就是,我公務員的能力已經少到連專案管理團的人都不夠。那我要怎麼去優化這件事情?我就必須讓這個公務員其實透過某個方式去做好專案管理。但是專案管理這件事情就是很吃重你個人的一些基本背景知識,還有你花的時間這件事情。 所以,第一件事,我能不能讓公務員每個都能創造一個EP?我能把想法,至少寫出一個function也好,或者是一個module也好,這樣做不做得到?讓他至少知道我在這樣的技術戰上面,我會看到什麼東西?第二個,我能不能把spec? 直接轉變成小專案或MPT,讓一個公務員知道說OK,你今天開出了所謂的招標規格書,裡面寫的這些東西到底是什麼?或是廠商給你的spec它到底背後是什麼意義?你選擇的基礎站對不對?影響你最後能不能驗收到你想要的東西? OK,所以我們基於這個思維, 我的想法很簡單,不要求太多,我們先從小東西開始。語言模型是幫我們降低門檻, 推動開發的作業。 那你至少能寫一些測試腳本,至少能夠講出一些電腦看得懂的東西,不管是什麼樣的資料型態也好,或者是你的這些安全性模組,比如說最常講的就是我們資安法訂了一堆東西,2701訂了一堆東西,而且重點是現在還企圖要實現secure by default, 好,那現在問題來了,我們觀光公務員自己,那有那麼多軟體工程師嗎?有辦法hold住這件事嗎?重點是公務員自己懂什麼叫做server-by-default嗎?它其實是一個非常 需要花時間研究的題目,語言模型,或者是你可以透過視頻實驗去驅動一些實踐的小方法,讓你更具體的了解說你在這個專案裡面應該預期到什麼東西,才真的是實現了一個,其實講難題你就是非常 而且需要花時間實現的東西。所以我們試著去做一件事情,透過導入語言培訓這件事情,把橢圍型外包,就是過去可能有參與過政府表覽都知道,就是國務委會給大家要一堆規格之後,變成它的東西。那它到底能不能變成這個東西,這不重要。 因為至少他標的出去,這個東西會有人來投。過去其實很長一段時間都是這樣。我們希望實現的事情是,至少公務員能夠知道說,好,我今天開出去的這個spec到底是什麼樣子。也許我可以通過其他的管道去build一個MVP。 簡單把Docker build起來之後,你可以看到我的UI,然後了解一下這個東西到底是什麼,甚至了解說為什麼這個漏洞那麼的critical,所以你需要修掉,這些都…… OK,所以我們數位發展部內部目前已自訓出自己在 Work 的 Spare Code 的邏輯是這樣子。首先我們還是把 Plan F 的 這兩件事情分開,有使用過Marco的工具都知道,現在所有的Best Practice一定都把這兩件事分開。原因很簡單,如果你直接試圖用App的部分去理解你現在的Structure,或者是你的Blueprint,就是你的藍圖,或者是你的Map,其他的... 結構都會有點不穩定。所以更常做的事情是你必須先去規劃你想要使用的技術在於什麼,你的結構是什麼。甚至像我有朋友是在製造業的,他們可能使用的特別的 API 或特別的語言工具,這些東西其實都應該事前的 Study。那在 plan 出這些 PR 之後, 我剛剛講太專業了,那如果對公務員來說是什麼?很簡單,其實公務員開規格本來就很厲害,法遵這些東西他都很了解,那他把這些東西先以自然語言的方式去跟語言模型討論,我要選用的技術在哪裡,我要使用的語言特性是什麼,那我要開發的對象可以用什麼樣的方式是最有優勢的。 再來才丟進 App 的流程。我們在 App 的流程上其實就像我剛剛提到的,Bytecode 其實有非常大的不可控性。所以一開始我們在針對這件事的情況下,我們就試圖在一個可控流程上去執行。那我們目前選用的方式為什麼以 Amazon Qt Developer 去作為核心的所謂的中控台呢?很簡單。 第一件事,如果您在 Agile 設計中將 Flow 設定起來,它基本上絕對會遵照您的 Flow 走。它在 Prompt 中解釋相對死板了。簡單來說,它比較不容易產生說,比如說,我 Prompt 明明叫 Flow 必須遵守 A, B, C, D, E,但是它跳不走,不容易做成這樣。第二件事情, 是這個工具使用相同模型的Query Code,它在執行SQL Batch命令列這件事情是相對穩定的。 為什麼這件事穩定很重要?因為它攸關的接下來其實我要試著使用Command Line 去實現 Multi Agent。那我怎麼去用 Command Line 實現 Multi Agent 的做法是 我的核心Developer去產生提示詞之後,透過Batch、Execute Batch,直接用非互動式的方式呼叫右邊這三個大家已經看到快爛掉的東西,而這三個不是獨立被呼叫的,它可以各自扮演它需要的角色。舉個例子。 Gemini 在原生裡面有 Web Search 這個 Tools。那如果我今天需要 Structure, 需要外部資訊的情況下,我可以直接用 Command 按的方式呼叫 Gemini 去 Search 之後,給我一個 Structure 或建議,或是局部的 Best Practices,去針對我現在的問題點一個標點。 把這個東西留在場面或是落地,我先把它落地進入短期記憶之後,我把它傳遞給Codex或是Control Code。 去真正執行Coding的行為,相對是有一個基本的概念的。而且重點是,它其實是可以被集合的。這個紀錄可以被落架的這件事情是 如果只是在你自己編輯跟他聊天的過程中用Session的方式去剖析這件事情。 信號不好被集合,原因是在歷程中又失去落地,才被其他人所看。那為了這件事情,我透過多重呼叫的形式,讓信號落在專案裡面。 所以你可以在我的專案裡面看到一系列的結論,包含當初為什麼做這樣的決定,當初為什麼選用這樣的結構,然後他其實做了哪些結論,然後PASS給這些工序裡面去完成這段Coding,最後其實可以做Code Review。 Core Review 除了透過現在的 Structure 去完成整個 Core Review 以外,我們其實也在 CSP 上試著要去實現說 過去可能在我們的測試工程師那邊做的事情,或者是我公務員真的沒辦法看懂 code 這件事情如何去優化,現在分上下兩軌了。上軌是我們透過 IDE 的方式去整 developer, 然後我們試著去把 Azure Pipelines 包裝成 NCP那其實這一塊如果常態來看的話不要這樣子去看這麼複雜把它想像成 GitHub 的 NCP就懂這一段的概念就是我去讀 Thief 或是讀之前推的東西或是我讀出整個專案之後透過語言模型先去 看面的東西,也許看Code對一些公務員來說真的很難,也許他也沒辦法花那麼多時間去看。透過語言模型幫你看Code之後告訴你,現在的Code,這個整個專案,它的結構是什麼。 那你有沒有想要關注的某些事情?或是你乾脆跟我講說,你想測試某些事情。那我們來做個Unitest,做個整合測試。這些都是可以做的。再來就是... 那如果我不是給人看了,我是單純想融合在 CICB 負層中呢?我想要做一些業商測試呢?原模前有沒有機會參與?我們試著去做的事情是,我們在 build 的時候,我就把這些 COI 融進去。那舉個例子,像我們之前在實驗的時候,我們使用的是 Amazon Q 的方式把它 build 進去。 那一個測試腳本本身是用自然語言寫成的,所以對公務員來說它是友善的,就是我至少可以調一調例下來知道我想測什麼東西,然後透過直接標進去的方式,然後風障把他帶起來,用CLI呼叫,然後讓他去執行這些事情,最後可能在某個目錄裡面寫出他的report。 那這個東西可以被提交,可以被review。這是一個我們其實嘗試在整個開發作業過程中,我們是不是能夠全部對齊自然語言的方式,去做一些直接對這些人類友善的方式,然後去實現以前。 其實我們一直都在做的事情。OK,其實我剛剛講得很快,因為其實只有30分鐘的時間,我趕快把現在核心的東西帶了。但是其實講了那麼多,還是有一件事情很重要,不管是我開發給原本不是IT能力的人去執行開發的行動, 或者是我開發索引,然後讓這些其實原本看過有點苦手的公務員們有辦法直接看整個專案去Handle專案。 它都有件事情是,模型器回答你的東西是必須去了解它存在風險的。舉個例子,像前段時間,我教導法治單位人員GPU網頁。 他們其實在我的監管下有一個很簡單的靜態頁面,甚至那個JavaScript,腳本真的沒有寫很多,但大部分都還是CSS樣式的情況下。 它其實都會有洗壞了或是crash的行為。那這其實無關痛癢的東西,是一個很好的教材,是讓這些人了解什麼叫做模型幻覺產生的巨大損害。 今天只是CSS的壞掉,或者是今天只是腳本不夠好。去讓他們感受一下說,如果今天不是樣式壞掉,不是腳本壞掉,而是你的加密根本沒做。 或者是你在呼叫後端的時候,你在包裝API的時候有問題,噴錯的地方。其實就是我們常見的,比如說有一些常見的錯誤態樣。這個東西,讓他們有認識到這件事情之後。 他們其實會更小心的去做這件事情,只是小心沒有用,其實這多多少少還是需要IT的臨時操作。可是這可以有把握一件事情,過去的Workflow是要有人先去轉譯他們的Domain號。 落地寫下來,這邊可能就要有一個設計師做出,先 wireframe 化出來,把 flow 處理好,最後 pass 給架構師,去設計整個架構,然後這邊我們可以把它 人力,也不能說精簡,合併,或是讓這些業務本身的Owner有辦法直接參與開發的情況下,他原本可能只會在UAT的時候才會再參與,或者是如果你是Double Diamond的時候,他只會在應用性測試的時候再出現。 但是他可以直接在前端,或者是整個開發歷程中去作為一個參與的角色。又或者是我們在看其他的part,如果我今天透過相當speakable的方式,我讓公務員在專案跟所有的外包廠商參與過程中,我除了只是去記錄這個角色,我甚至能跟你協同工作。我可以理解,比如說你現在在 CodeLab 上面推的這些 code 最近幾個例子他們正在做什麼東西那我的 spec 是什麼要求或者是某個 function 其實我有辦法多語音的東西可以做這些事情正在發生什麼的話其實增加這些專案的掌控力減低風險 或許他有辦法去做到更多的事情。因為其實這些公務員們他們心裡是想著要去做這些事,但他們可能原本沒時間或沒能力去做這些事情。 所以在整個左翼過程中去賦能,然後讓他們做到這些事情,是一個我們的核心目標。另外,他強調的是什麼?人類作為決策的初期必要性,我們增加一些掌控力,增加人類能夠最終control的事情越來越大。不管是用RAG的方式掌握更多知識,或者是像剛剛的FLOW能夠掌握更多的對機器的知識。 我們需要國際的核心思想就是讓它增加了對決策主體的控制性。 語言模型在這邊真正有去fit某個前進去做viewing嗎?沒有,它其實就是一個中立者。 那它去依照你現在給的實施資格,扮演不同的角色與不同的行徑,參與你整個工作的內容,然後去輔助你做到每一件事情。那這也是為什麼當初使用犯法模式的原因,就是因為我換個提示詞在那裡扮演不同的角色,在工作的內容裡面去扮演。 我不會說未來的工作有變得好有變得好,請我寫,然後不斷地畫。其實如果有製作過M8的開發者們應該都知道,如果可以的話,除非我需要用 在上下五官裡面特地去隔離,特地為了這個SWH去隔離記憶,否則是共用相同的模型並不會有太大的問題。而且這是一個語言模型本身帶來的特色,單言情。 或不同提示詞的翻譯,執行不同的行為。所以,其實我們整個開發作業的過程中,讓所有人參與,第一個讓他負責任,第二個也讓他學習。 第三個就是讓他能夠不斷的自己也能進步。人類其實自己也可以在這個過程中慢慢的變得不一樣,去了解說當我今天這個 有點像是新的東西參與到我們工作的時候,如果去服務。OK,那其實未來的目標很簡單。我剛剛講了那麼多,它底部的對象跟範圍其實都還很小。原因很簡單。 不管是企業也好,組織也好,政府部門也好,一個新的做法,即使它慢慢的接受考驗之後,形成一個可以work的東西之後,我們要每個人的接受,每個人的推展,這都需要花 時間去慢慢的讓大家接受。不管是我剛剛提到的產品開發主要題,即使能用自然語言開發,大家還是會抵觸,還是會不熟悉。那如果讓大家去了解,就像是我昨天在內部的一個跟其他場官在講這件事情的時候,我都會提很簡單,這跟當年公務員從紙筆變成Office到底是一樣的。 那唯有去熟悉,唯有去了解,才有可能不斷的嵌,然後才能改變。那我們現在做的事情,就像是當你使用Office的部分一樣。 OK,那方案開發這邊也是,我讓這些資訊公務人們有機會真正落地實踐的東西這件事情,並沒有辦法短時間就擴展,為什麼?因為他們從蘋果發行那些習慣要十幾年。 現在我們要回頭去找回這些東西,慢慢地把賦能這件事情變成一個自然,然後讓他知道能夠掌控專案這件事對他是好的。這樣的一個前提會是我們 為了整個大方向,希望能夠變成一個推動政府機關的一個牽引的能源。OK,那這個QRCode是我們另外一個專案,是我們的數位明片專案,那它的特性就是它是用Server的結構,它把Data其實全部寫在QRCode也好,或者是NFC也好,大家可以掃看看。 然後透過左上角的連結去看一下這個放在 Github 上面的連結。那它其實它本身就是使用 Linecode 的方式去做。那我個人對這個專案的期許是 第一個在 Context 資料栽培,第二個在 Progress 資料栽培。就像我剛剛講的,我自己在做上下午管理的時候,我會採取長短記憶,這是連接 LSTM 的一些概念進行,去落地在專欄裡面。 讓不同模型或是不同時間段 能夠持續接續工作。因為在打轉蛋的時候,其實常常我的上下我的context window就不是CT。 不太好,那我是柯文哲,謝謝大家,謝謝你們的觀看。 這個就是剛剛那個DP卡的project其實有公開的部分,那沒公開的部分當然是這些工具延伸出來的東西。那像是 裡面的 Snapshot 會記憶每個 Short-Term Memory 裡面過去執行過的 To-Do List 這些資料結構。另外,我會用 Decision 的方式 去記憶專案中每個,比如說你在關鍵節點或是Feedback的時候,你如何去決定如何去處理。那透過這樣的型態呢,讓每次語言模型重新參與你的東西的時候,它有辦法去記憶,那當然這個是純粹在開發面這樣做。如果你進到自動化智慧化裡面的話,在記憶管理這一塊就有其他的做法。 其實剛剛講了那麼多,就是現在模型進步的實在太快。一年前我們還在GDP3.5,我們根本沒有想到原來模型它會看得浮出血扣。 再來,最初的首內3.7出來的時候,我們以為模型能寫的code是特定的技術站才可以做的,結果變相到首內4.5出來之後,它能涵蓋的技術站範圍越來越廣,現在已經 有人會提問說,我如何用這些模型去開發一些電腦的Code,或者是特殊API的Code。那未來會不會我們在這個模型的能力會繼續進化? 我的答案是肯定的,因為過去我自己在學校裡面,在交大裡面學生,學生入學期的時候,那時候搞的verbs就已經是神蹟了。 哇,這個真的好強啊,怎麼有辦法處理這麼複雜的類似的題目?但是現在這個東西已經變成語言模型很基本了。所以其實對我們這些開發者或者是台灣的支付產業來說,也許我們終究其實focus跟當年2.0的時候一樣,我們要去搶社群網站的那塊大紅,不一定我可以做一些周邊的事情。 其實這可能會對我們來說是快速了解說在AI領域的定位或者是我該做什麼的一個先從這邊下手的一個方式 也很高興跟各位分享。 ## 會後摘要 ### 關鍵概念 - 數位發展部資訊處面臨挑戰:僅有10名公務員,但需應對大量IT需求 - 利用語言模型(LM)賦能兩類人員: - 非IT背景的行政公務員,使其能直接參與自動化開發 - 資訊公務員,提升其專案管理和技術掌控能力 - 語言模型如同作業系統或能源,可作為驅動工作流程的基礎 ### 賦能行政公務員 - 使公務員能夠探索和處理其領域內的文本資料 - 透過簡單的提示詞分享機制,讓公務員間可共享解決方案 - 讓有基礎理解的公務員能創建簡單應用,如Google表單自動化 - 目標:由擁有領域知識的公務員直接驅動自動化發展進程 ### 重新定義資訊外包 - 問題:長期外包導致政府IT能力弱化,甚至缺乏足夠專案管理人才 - 解決方向: - 使公務員至少能夠創建MVP(最小可行產品) - 能夠將招標規格轉變成可執行的小專案 - 透過語言模型降低開發門檻 ### 開發工作流程 - 將Plan和App分開處理: - 先以自然語言討論技術選擇和架構 - 再進入實際應用開發流程 - 使用Amazon Qt Developer作為中控台: - 較為嚴格遵循設定的Flow - 在執行SQL、批次命令時較穩定 - 實現多模型協作系統: - 使用Gemini進行Web搜尋獲取結構化資訊 - 傳遞給其他模型進行實際編碼 - 保存歷程記錄供日後參考 ### 專案監督與測試 - 透過語言模型協助程式碼審查 - 用自然語言撰寫測試腳本,對非技術人員更友善 - 將測試整合入CI/CD流程 ### 風險管理與認知提升 - 讓使用者理解模型幻覺可能帶來的風險 - 在監督下讓非IT人員體驗簡單開發時可能遇到的問題 - 增加人類對決策的掌控力和參與度 ### 未來發展方向 - 逐步推廣此工作模式,需時間讓人員適應 - 類比於從紙筆到Office的轉變過程 - 建立上下文和進程記憶管理系統,支持長期專案 - 數位名片專案為實際應用案例 ### 行動項目 - [ ] 透過內部平台分享提示詞和工作流程 - [ ] 實施使用自然語言撰寫測試的機制 - [ ] 建立多模型協作系統進行專案開發 - [ ] 為公務員提供語言模型使用培訓