--- GA: UA-34467841-15 --- # 企業級 LLM Guardrail 與 Prompt Hardening - 劉岦崱 (Nils)、楊芷琳(Cheryl) ###### tags: `HelloWorld2025` `HWDC2025` `2025` `F 會議室` `AI 與系統架構設計` <blockquote> 銀行導入生成式 AI 需同時滿足客戶體驗、資安與監理要求。本議程拆解 Prompt Injection、幻覺、敏感資料洩漏、計費濫用四大風險,提出「前置語義模式 → 執行期 Policy Engine → 事後 Audit Trail」的三層 Guardrail 架構。進一步分享 Prompt Hardening 範式(含前綴模板、上下文封裝、反射型驗證),並展示如何透過 Rule-based Filter、情緒分析器與行為沙箱,在不改模型權重的前提下,讓合規與體驗兼得。 大綱 1. 金融場景風險地圖 監理規範、資安法規、PII 群組 2. Guardrail 三層設計 啟動前:語義模式限制執行期:Policy as Code、沙箱事後:可追溯 Audit Trail 3. Prompt Hardening 實務 System Prompt 前綴Context Packer/DelimiterOutput Self-Check 4. 外部合規系統串接 DLP、SIEM、IAM 5. 示範流程 敏感詞觸發 → 即時遮罩 → 日誌回寫 6. 常見誤區與調整建議 「萬用防火牆」迷思False Positive / Negative 平衡 7. Roadmap 與組織落地 角色分工文化與流程建立 聽眾收穫: 取得一份可直接引用的「三層 Guardrail」設計框架圖。 學會 Prompt Hardening 三件套:前綴模板、Context Packer、Self-Check。 理解如何將 Guardrail 與 DLP/SIEM/IAM 等既有資安系統整合。 </blockquote> {%hackmd @HWDC/announcement-2025 %} ## 會議資訊 **時間:** 14:10 ~ 14:55 **地點:** F 會議室 **日期:** 2025年10月15日 **語言:** 中文 **難度:** 進階 **相關連結:** - [Hello World Dev Conference 2025 官方網站](https://hwdc.ithome.com.tw/2025) [target=_blank] - [Hello World 2025 議程表](https://hwdc.ithome.com.tw/2025/agenda) [target=_blank] ## 筆記區 > 請從這裡開始記錄你的筆記 > [X-teaming](https://arxiv.org/abs/2504.13203) ## 討論區 > 歡迎在此進行討論與 Q&A ## 相關資源 - 投影片連結:(待講者提供) - 相關文件:(待更新)