## 有關於面部表情變換中深度學習架構論文之比較 <br> <br> <br> 學生: 1071426曾資恒 1071549周皓 1073808劉世星 ---- ### 目錄 <br> <br> 1. GAN 2. StarGAN 3. GANimation 4. StarGAN-EgVA ---- ### Generative Adversarial Network (GAN) ![](https://i.imgur.com/XK4Flmq.png) ---- ## CycleGAN ![](https://i.imgur.com/fcKuJ5N.png) ---- ## CycleGAN ![](https://i.imgur.com/yXGbsGv.png) ---- ##### StarGAN: Unified Generative Adversarial Networks for Multi-Domain Image-to-Image Translation ---- ## StarGAN ![](https://i.imgur.com/IWQNuEY.png) ---- ![](https://i.imgur.com/LOpPe6R.png =x400) ---- ![](https://i.imgur.com/88Cx5jx.png =x400) ---- ## 架構重要貢獻 ---- * 結合CycleGAN在圖像臉部表情變換的優勢 * 學習多個 domain 之間的映射 * 一個**生成器** * 一個**鑑別器** * 在所有domain的人臉圖像轉換領域效果顯著 * 改進了CycleGAN(2個生成器和2個鑑別器),通過提供一種mask vector(one-hot encoder概念)使多個域的特徵轉化只需1個生成器和1個鑑別器 ---- * 優於模型的優勢 * 實現面部屬性轉移 * 實現面部表情合成 ![](https://i.imgur.com/vlU4b48.jpg =x300) ---- #### Mask Vector **$\bar{c} = [c_1,...,c_n,m]$** * $n$ ---> 第n的數據集。 * Ex:有三個數據集CelebA、RaFD、AffectNet故n有1~3。 * $c_n$ ---> 二進制屬性的 ++[one-hot](https://zh.wikipedia.org/wiki/One-hot)++ 向量,用於分類屬性。 * $m$ ---> n-Dimension one-hot vector,用於訓練與測試時domain的轉換。 ---- * Mask Vector * 實現多個數據集之間的多重domain圖像轉換 * 開心 ---> 生氣 * 生氣 ---> 開心 * 使StarGAN能夠控制所有**訓練過的domain標籤** ---- ## Architecture ![](https://i.imgur.com/8sJpLeU.png =x500) ---- ## Architecture ![](https://i.imgur.com/ilgQiKg.png =x500) ---- ##### Result for style ![](https://i.imgur.com/4FSirYM.jpg =x600) ---- ##### Result for emotion ![](https://i.imgur.com/SnH7FqO.jpg) * StarGAN-JNT(CelebA、RaFD) ---> 利用兩個數據集來改善共享的細節,提升較高對臉部細節的處理 * StarGAN-SNG(RaFD) --->背景較模糊,表情線條不細緻 note: * StarGAN-JNT(CelebA、RaFD) ---> 表現出具有較高視覺質量的情感表達,可以利用這兩個數據集來改善共享的細節程序,例如 面部關鍵點檢測和分割。 * StarGAN-SNG(RaFD) ---> 生成具有灰色背景的合理但模糊的圖像。 ---- ## Generator ---- ![](https://i.imgur.com/0d4f3Gk.png =x600) ---- ## Discriminator ---- ![](https://i.imgur.com/a9Hf9Aa.png) ---- ##### 結果 ![](https://i.imgur.com/paPRUiT.jpg =x600) ---- ![](https://i.imgur.com/knUhHh6.jpg =x600) ---- ![](https://i.imgur.com/nBa9POa.jpg) ---- ## GANimation ![](https://i.imgur.com/gUDeWp2.png) ---- ![](https://i.imgur.com/6bAhhxc.png =x450) ---- ![](https://i.imgur.com/VVONe1w.png) * 克服表情只能從離散 one-hot vector決定 * 產生continuous表情變化向量(Action Units)提升訓練精細度 ---- Action units (AUs) --- ![](https://i.imgur.com/9N5gj5p.png) ##### Surprised (驚訝)--->AU 1,2,5組成表情向量 ##### Happily Surprised(非常驚訝)--->AU 1,2,5,25組成表情向量 ---- ## Action units (AUs) ![](https://i.imgur.com/pNegPLe.png) * **FACS(Facial Action Coding System)** 將常見情緒以臉部肌肉分類進而把表情分成46種action units (AU1-AU46) ---- ## Architecture ![](https://i.imgur.com/55iDt8g.png) * conditionalGAN * 2個生成器 * 1個判別器 ---- ![](https://i.imgur.com/UTF27px.png) ---- ![](https://i.imgur.com/RlZfkL2.png) note: yg->要混合的AU目標表情(想要生成的表情向量) Iyr->原始輸入圖片 Iyg->第一個生成圖片 yr->Iyr的表情向量 GA->attention mask A(關注人脸 忽略背景) GC->color mask C(變化後人臉的目標顏色) ---- ## Architecture ![](https://i.imgur.com/QGFyrdY.png) * 臉部肌肉向量levels of intensity (向量長度為N,臉部分為N個不同區域,以0-1表示運動程度) ![](https://i.imgur.com/sWyqI7z.png) ---- ## Attention-based generator ![](https://i.imgur.com/9iCcNox.png) note: GA->attention mask A(關注人脸 忽略背景) GC->color mask C(變化後人臉的目標顏色) ---- ## Experimental Evaluation ![](https://i.imgur.com/nDZHqlQ.png) 注意力掩膜(attention mask)關注在人臉區域的表情變化 note:可以避免對人臉以外背景區域的修改,就可以很好地適應直接在圖像中對表情修改,不需要其他的後處理 ---- ## StarGAN-EgVA: Emotion Guided Continuous Affect Synthesis 十月 12, 2020 ---- ## 架構重要貢獻 改善AUs continuous情緒表情仍有的缺陷 * unconstrained conditions中涉及過多人為主觀因素 * 臉部肌肉的標記---> * 需要生物醫學相關專業幫忙標記辨認 ---> 專業度太高 * 嘴唇動態偵測效率低 ---> 無法準確納入情緒狀態衡量標準 ---- ## 嘴唇動態偵測 ![](https://i.imgur.com/TydYN4K.png) ---- ##### two-dimensional Valence Arousal (VA) plane ![](https://i.imgur.com/Fp1gj0R.png) 單獨以 Valence Arousal (VA intensities) 訓練也有缺點 note: * 相較於單一情緒標籤,訓練過程中會過度敏感失準 * 在VA象限上無法表達兩種情緒在訓練上的實際轉換落差 * 在生氣,噁心2種情緒因為在VA象限中會重疊->失去準確度->無法判斷生氣噁心 2種情緒在訓練後情緒狀態 * 在同一組訓練集中->訓練結果並不唯一且落差大->沒有客觀標準 ----
{"metaMigratedAt":"2023-06-15T20:49:16.138Z","metaMigratedFrom":"Content","title":"Untitled","breaks":true,"contributors":"[{\"id\":\"3edf8d87-56c0-4972-99d9-f2ea9329a308\",\"add\":1664,\"del\":1186},{\"id\":\"78b5aaa5-a4a9-4b1f-b8df-123f53e17c1c\",\"add\":4601,\"del\":3749},{\"id\":\"23d7162c-196b-4bfc-adf7-d13ed86771a6\",\"add\":5893,\"del\":6555},{\"id\":\"4fb5c608-9b1a-4e00-bf51-15f79a9c3827\",\"add\":3874,\"del\":487}]"}
    827 views
   Owned this note