銀行級 LLM Guardrail 與 Prompt Hardening - 劉岦崱 (Nils)、楊芷琳（Cheryl）

--- GA: UA-34467841-15 --- # 企業級 LLM Guardrail 與 Prompt Hardening - 劉岦崱 (Nils)、楊芷琳（Cheryl） ###### tags: `HelloWorld2025` `HWDC2025` `2025` `F 會議室` `AI 與系統架構設計` <blockquote> 銀行導入生成式 AI 需同時滿足客戶體驗、資安與監理要求。本議程拆解 Prompt Injection、幻覺、敏感資料洩漏、計費濫用四大風險，提出「前置語義模式 → 執行期 Policy Engine → 事後 Audit Trail」的三層 Guardrail 架構。進一步分享 Prompt Hardening 範式（含前綴模板、上下文封裝、反射型驗證），並展示如何透過 Rule-based Filter、情緒分析器與行為沙箱，在不改模型權重的前提下，讓合規與體驗兼得。大綱 1. 金融場景風險地圖監理規範、資安法規、PII 群組 2. Guardrail 三層設計啟動前：語義模式限制執行期：Policy as Code、沙箱事後：可追溯 Audit Trail 3. Prompt Hardening 實務 System Prompt 前綴Context Packer／DelimiterOutput Self-Check 4. 外部合規系統串接 DLP、SIEM、IAM 5. 示範流程敏感詞觸發 → 即時遮罩 → 日誌回寫 6. 常見誤區與調整建議「萬用防火牆」迷思False Positive / Negative 平衡 7. Roadmap 與組織落地角色分工文化與流程建立聽眾收穫：取得一份可直接引用的「三層 Guardrail」設計框架圖。學會 Prompt Hardening 三件套：前綴模板、Context Packer、Self-Check。理解如何將 Guardrail 與 DLP／SIEM／IAM 等既有資安系統整合。 </blockquote> {%hackmd @HWDC/announcement-2025 %} ## 會議資訊 **時間：** 14:10 ~ 14:55 **地點：** F 會議室 **日期：** 2025年10月15日 **語言：** 中文 **難度：** 進階 **相關連結：** - [Hello World Dev Conference 2025 官方網站](https://hwdc.ithome.com.tw/2025) [target=_blank] - [Hello World 2025 議程表](https://hwdc.ithome.com.tw/2025/agenda) [target=_blank] ## 筆記區 > 請從這裡開始記錄你的筆記 > [X-teaming](https://arxiv.org/abs/2504.13203) ## 討論區 > 歡迎在此進行討論與 Q&A ## 相關資源 - 投影片連結：(待講者提供) - 相關文件：(待更新)