# 智慧製造與生產線上的資料科學 ###### tags: `20200919` 李家岩 教授 台灣大學 資訊工程系 製造資訊與系統研究所 ## 前言 智慧製造 ![](https://i.imgur.com/otmqXI9.jpg) 人工智慧 有的適合、有的不適合 投入人工智慧產業、賠得比賺得多 因為沒辦法跟財報與市場連結 ## 智慧製造與資料預處理技巧 甚麼叫製造 (manufacutring) 在英文裡面 用手(manus/hand)做出來的(factus/make) 製造是一個「具現化」的過程 甚麼叫做智慧 (intelligent) Data + infomation = knowledge > 資料Data 客觀的紀錄 > > 資訊infomation 資訊相較於資料, > 1.資料具有可解釋性 > 2.資訊開始有主觀意識 > > 知識knowledge 資訊累積與沉澱,就會變成知識 Problem -> Decision -> Experience >問題 problem 發生與預期有落差 >決策 Decision 解決問題的許多方法中,找出一個合適的方法 >經驗 Experience 遇到很多問題、做了很多決策、能夠對一些事務 ### 智慧工廠 李老師的定義:decision-orinented system 可以協助做決策的工廠 以AI的技術,幫助每個製造功能或流程,來確保功能與流程順利 製造的功能 Design, control, process planning, maintance and diagnosis, quality management, scheduling ### Value and Profit Cost-down是在大量製造時,可以讓原料的成本下降,但會有極限 智慧製造:決策 ![](https://i.imgur.com/DXTTmAg.jpg) 製造 vs 服務 兩者有明確的差異 投入、程序、產出、feedback都有差異 但近年來製造朝向服務發展 製造系統 vs 服務系統 主要差異是「inventory」庫存 Lead time + uncertainty = inventory 生產週期 + 不確定性 = 庫存 >庫存的來源是在庫存發生之前就要先預防了 減少庫存、減少lead time、減少uncertainty ### 為何製造現場難管理 資源與KPI的多樣性太多 管理階層與製造現場間目標的衝突 變異太多 但變異,其實是發現問題的地方,也是可以找到強化獲改善的點 CIM與自動化 1. 操作自動化 減少變異、減少操作失誤 2. 工程自動化 支援決策的自動化 自動化不代表要砸大錢買設備 事實上,自動化是製造哲學上的轉變… 透過消除浪費、降低產線不平衡達到生產標準化且具有彈性的一種改善過程 ### Lean manufacturing 精實生產 浪費的來源 ─ 1. Transportation ─ 2. Inventory ─ 3. Motion ─ 4. Waiting ─ 5. Overproduction ─ 6. Overprocessing ─ 7. Defects ─ 8. Eschewed Talents (沒有適才適所) 在導入自動化前,要先檢視流程,把「浪費」排除 因為,沒有檢視流程就導入自動化,反而會產生「自動化浪費」 Big Data Analytics 是很多的analysis的流程所組成的 ### 製造現場的數據處理 現場資料的轉換的方式 ## 重要參數篩選與精度預測 ### 案例1 製程診斷 透過分群來做分類 決策數來分類 (CART,分類與回歸樹) >人腦很難做跨部門或跨製程交互作用關係的判斷,所以要靠AI來幫忙做製程診斷 這個案例好像可以拿來水位分析 ### 案例2 重要工程參數篩選 Feature Selection 從一個大的data set找出重要的參數、以縮小維度 Feature selection的方法論 1. feature/variable selection 有Y與有label,通常是監督式學習 2. Dimension Resuction (feature resuciton),非監督學習、PCA, ICA 篩選原則 MECE原則 1.重要變數要各自獨立 2.重要變數要能夠涵蓋全部資訊 因果必相關 相關不一定因果 不相關必定無因果 所以要篩選大量的因子,可以考慮先使用相關係數來篩選,把不重要的因子排除掉 (R2 0.2或0.3以下篩掉) 也可以使用stepwise regression 一次一次的把變數抓進來做 1. Foeward selection 2. Backward selection 3. Both LASSO Regression Hastie et al. (2008) The elements of static learning 基本上可以用在P>>n的情況 也就是樣本數很少 投票法 Voting 用不同的方法(差異比較大的)做出來哪個變數比較重要,來篩選變數 Pivot Analysis (樞紐分析)也可以來做 很重要的是,所以要做知識管理,把知識紀錄起來 把物理特性給找出來、記錄起來,反應因果關係 那,PCA是不是適合找重要參數? no really,因為PCA可能沒有辦法有效的解釋其物理意義 ### 案例3 良率/精度預測 預測就是因果關係的推論 BPNN =>現在就是用deeplearning Boosting =>用多個弱分類器來切,然後把幾個弱分類器裡整合起來 Random forest ROC curve用來比較2個模型能不能有比較好的預測 比較右下角的面積,越大越好 R2R control ### 案例4 預測保養 (PdM) PdM 剩餘壽命預測,就是甚麼時候要保養 關鍵點其實是轉出重要的資料 - feature engineering ### 排程 1. FCFS 先來先做 2. SPT 最短的先做 3. EDD 交期趕得先做 4. CR CR越小的先做,一個一個算 演算法可以來幫忙做排成的最佳解 #### Meta-heuristics 梯度下降法通常是local的最佳化 #### Tabu search (禁忌搜尋法) Tabu 規則或禁忌 你不可以做甚麼、不可以被觸犯的規則 將規則記憶起來,然後不去觸碰這些規則 Tabu search是依賴記憶與忘記去做計算 當我們把Tabu size (就是規則數量)變得太大時,你只能走一個方向 LEKIN免費排程軟體 ### 失敗案例與注意事項 主管對現場認知的落差 數據、資訊系統與IT基礎建設 解問題的過程 => 不要為AI而AI ## 從預測性思惟到處方性的決策 既然決策很難做… 就想辦法在做決策之後 讓它變成一個好的決策!