owned this note changed 5 years ago
Linked with GitHub

運用自然語言處理於金融業 KYC 之創新實踐 - 陳皓遠

歡迎來到 MOPCON 2020 共筆

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

共筆入口:https://hackmd.io/@mopcon/2020
手機版請點選上方 按鈕展開議程列表。

投影片連結

目標設定

  • 思維改變
  • 具體改變

Agenda

  • 創新中隱含的策略
  • KYC 的創新規劃與實踐
  • 結語

創新中隱含的策略

策略是 謹慎尋求一項行動計畫,用以發展企業的競爭優勢

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

策略思考的原則

在巢狀結構中 願景有一致性 戰術要有差異性

願景
^國家
|產業
|公司
v組織
<> 戰術

中信 AI 團隊的策略

掌握關鍵技術以 垂直式AI(Vertical AI) 驅動金融場景下的數位轉型

應用場域

  • 應用有差異性
  • 資料來源有專屬性
  • 內容有保密性

目標:客製化服務應用場景

實踐方法:

  • 行銷溝通
  • 流程優化
  • 風險控管

垂直式 AI

  • 專屬領域的知識
  • 專屬或機敏資料
  • AI 技術核心
  • 完整的產品

KYC 的創新規劃與實踐

探索與定義問題
解決問題

洗錢防制作業(AML/KYC)為金融業的關鍵場景

  • 因應法令遵循,商業銀行業務承作多半需要經過 AML/KYC 的檢核
  • 違反洗錢防制

姓名檢核的效能為 AML/KYC 的關鍵議題

  • 角色

    • CDC名單掃描(姓名檢核)為AML/KYC 的必要流程
    • 負面新聞判讀為 CDC 名單掃描(姓名檢核)的主要手段
  • 挑戰

    • 負面新聞判讀耗時、費力,人工判讀錯誤,造成經營風險
    • CDC 牽扯人員廣,資料量大,如查某公司行號,連董監事相關新聞都需列入審查
    • 資料沒有重點標示、時間順序,或一個事件重複媒體報導的情形

新聞閱讀智能化 為強化姓名檢核效能的關鍵步驟

  • 需求:

    • 希望新聞能以事件發生順序排序
    • 一次檢核所有事件
  • 流程:

    • 取特徵,處理英、繁中簡中
    • 特徵向量化
  1. 自然語言處理擷取文本特徵
    CKIPTAGGER、NLTK、spaCy

  2. 將特徵轉成向量
    自監督式學習的文本嵌入(Doc2Vec)模型

向量的距離表示語意的距離
講者

  1. 相似向量結集成群
  • 非監督式分層聚類演算法BIRCH
  • 平均側影法Average silhouette method
  1. 負面新聞閱讀系統落地規劃
  • 基於 Client-Server 架構使用 RestfulAPI 與洗錢防制系統介接
  • 洗錢防治系統每次送入一群新聞連結清單,智能閱讀系統回復一個網頁連結

結語:

  • 策略規劃願景要與巢狀結構的上位一致,戰術要因地制宜有差異化。
tags: MOPCON 2020
Select a repo