**SD-18 InstantID AI換臉完美版** ![InstantID](https://hackmd.io/_uploads/HyhdXhYia.png) Stable Diffusion的主要工作介面(UI) ![Screenshot 2025-05-17 160929](https://hackmd.io/_uploads/HJyLV6SWxe.png) **"AI換臉" 所找的照片以上半身照片為佳** 教學影片1 https://www.youtube.com/watch?v=pd4EY5udcF8 WebUI使用InstantID,AI換臉完美版 Please use SDXL base model. Currently there is no instant id for sd15. 教學影片2 InstantID换脸插件最佳搭档,最强Web UI生成工具揭晓-Fooocus https://www.youtube.com/watch?v=AE-TdUqmvn8 教學影片3(ComfyUI) 影片AI表情迁移教程!HelloMeme V2|AI Expression Transfer Tutorial! https://www.youtube.com/watch?v=Zjik6-Ll6UY&t=12s **Checkpoint人物臉需用 XL model** https://civitai.com/models/215418(TurboVisionXL-Super Fast XL based on new SDXL Turbo) 因為是SDXL Turbo model 所以尺寸的設定768或1024最佳 Suggested settings for best output **Sampling method取樣方法:Euler a or LCM or DPM2 or DPM++ SDE Schedule type:Automatic or Karras or Simple or Normal** Steps: 4 - 8 CFG: 1 - 4 隨著AI繪畫技術的不斷反覆運算,AI換臉也日臻完美。 https://github.com/Mikubill/sd-webui-controlnet/discussions/2589 InstantID 巧妙地避免了對文生圖模型 UNet 部分的訓練,僅通過訓練一個羽量級的可插拔模組,實現了在推理過程中無需 test-time tuning,同時保持了文本控制的靈活性,確保了面部特徵的高保真度。 InstantID 的工作原理可分為三個關鍵部分: 1. ID Embedding:團隊利用預訓練的面部識別模型代替 CLIP 來提取語義人臉特徵,並使用可訓練的投影層,將這些特徵映射到文本特徵空間,形成 Face Embedding,具有豐富的語義資訊,包括如面部特徵、表情、年齡等,為後續的圖像生成提供了堅實的基礎。 2. Image Adapter:引入一個羽量級的適配模組,將提取的身份資訊與文本提示結合起來。這個模組通過解耦的交叉注意力機制,使得圖像和文本能夠獨立地影響生成過程,從而在保持身份資訊的同時,允許使用者對圖像風格進行精細控制,實現「雙贏」。 3. IdentityNet:一個名為 IdentityNet 的網路,是 InstantID 的核心部分。它通過強語義條件(如面部特徵的詳細描述)和弱空間條件(如面部關鍵點的位置)來編碼參考面部圖像的複雜特徵。在 IdentityNet 中,生成過程完全由 Face Embedding 引導,無需任何文本資訊。僅更新新添加的模組,而預先訓練的文本到圖像模型保持凍結以確保靈活性。 在實際的圖像生成過程中,InstantID 首先會接收到使用者的文本提示和面部圖像。然後通過 ID Embedding 提取關鍵資訊,接著 Image Adapter 將這些資訊與文本提示融合。IdentityNet 會根據這些融合後的資訊生成圖像。 整個過程是自動化的,使用者不需要進行任何額外的微調或訓練,只需等待二十幾秒,就能得到一個既符合文本描述又保留個人身份特徵的定制圖像。 這個工具有獨立安裝版,有comfyUI版及WebUI版。 1、升級ControlNet,至少要到1.1.440版。 2、下載ControlNet使用的模型,模型分兩大類。 ControlNet模型: https://github.com/Mikubill/sd-webui-controlnet/discussions/2589 分別是ip-adapter_instant_id_sdxl.bin和control_instant_id_sdxl.safetensors。 下載後放至D:\SDlocal\stable-diffusion-webui\extensions\sd-webui-controlnet\models 面部識別模型:共計5個 https://huggingface.co/Aitrepreneur/models/tree/main/antelopev2 下載後放至以下目錄D:\SDlocal\stable-diffusion-webui\extensions\sd-webui-controlnet\annotator\downloads\insightface\models\antelopev2 **Instant-ID操作** 注意如果你的顯存不足16G,那麼這裡要選擇低顯存優化,否則會爆顯存。需要注意的是,提示詞不要太複雜,過於複雜的提示詞容易使Instant-ID失效。 Model: turbovisionxlSuperFastXLBasedOnNew_beta0131Bakedvae prompt:best quality,4k,realistic,highly detailed, A men, Negative prompt:NSFW,noisy,ugly,low quality,deform,blurry, **參數設定** ![image](https://hackmd.io/_uploads/S12-vKCQ1x.png) **Sampling method取樣方法:Euler a or LCM or DPM2 or DPM++ SDE Schedule type:Automatic or Karras or Simple or Normal** ![image](https://hackmd.io/_uploads/SkckDF0Q1e.png) ![image](https://hackmd.io/_uploads/rkS98FRQke.png) **Sampling steps 4~8 較佳 CFG Scale 1~4 較佳** 在ControlNet的配置介面,我們需要配置兩個Instant-ID頁面。 第一個頁面:先上傳需要輸出的臉型原型,比如AI教 (1024*720) ![AI -NVIDIA1](https://hackmd.io/_uploads/r1aCSMu4C.jpg) ![image](https://hackmd.io/_uploads/SJoqfz_EC.png) 第二個頁面:這裡上傳想要擺拍的姿勢,instantID會分析這張照片的姿勢,然後把第一張的臉型按照這個姿勢適配,但不是簡單的換臉,除了姿勢外,完全不同,相當於重新生成。 擺拍的姿勢的底圖 ![Sho-1](https://hackmd.io/_uploads/By_VUz_V0.jpg) ![image](https://hackmd.io/_uploads/H1c0ffuNR.png) ![00084-2171654](https://hackmd.io/_uploads/SykzmzdVA.jpg) ![00096-1853594929](https://hackmd.io/_uploads/BJiWBfuER.jpg) prompt:best quality,4k,realistic,highly detailed, A men,giggling, ![00102-2977051893](https://hackmd.io/_uploads/Bk2fDfd4R.jpg) ![image](https://hackmd.io/_uploads/SksHOMONC.png) ![00106-2360902234](https://hackmd.io/_uploads/rJxLuMu40.jpg) ![00129-1619352084](https://hackmd.io/_uploads/B1OpKfOEA.jpg) ![00020-4219721909](https://hackmd.io/_uploads/Syw2ZQdVR.jpg) ![00410-708545](https://hackmd.io/_uploads/SJYukUdVA.jpg) ![00413-1979191819](https://hackmd.io/_uploads/ryUiJU_4R.jpg) 披上戰甲的AI教父 ![image](https://hackmd.io/_uploads/HkG7KcAXJl.png) ![00164-3394300450](https://hackmd.io/_uploads/r16lkXuNA.jpg) ![00183-1564367231](https://hackmd.io/_uploads/rJgsymuNR.jpg) Model: turboDiffusionXL_v112 ![00056-1745280717](https://hackmd.io/_uploads/rJSn1i54A.jpg) 需要輸出的臉型原型 女孩底圖一(1024*768) ![girl3](https://hackmd.io/_uploads/H1NXHc0mJg.jpg) 擺拍的姿勢的底圖 ![螢幕擷取畫面 2024-12-05 105137](https://hackmd.io/_uploads/By0Br9R7kl.png) Model: turbovisionxlSuperFastXLBasedOnNew_beta0131Bakedvae prompt:best quality,4k,realistic,highly detailed, a girl,(giggling:1.3), Negative prompt:NSFW,noisy,ugly,low quality,deform,blurry, ![image](https://hackmd.io/_uploads/BJdP1c0Xyg.png) ![image](https://hackmd.io/_uploads/Bka1ws9EA.png) ![image](https://hackmd.io/_uploads/BJVK0BT4A.png) giggling ![00099-949159152](https://hackmd.io/_uploads/HkzSDocVR.jpg) giggling ![00101-920814894](https://hackmd.io/_uploads/S1cedo9EA.jpg) sad ![00103-3869961056](https://hackmd.io/_uploads/BkU4tjcN0.jpg) 水彩風格 ![image](https://hackmd.io/_uploads/BJ8Te9C7Je.png) ![00179-2882781008](https://hackmd.io/_uploads/By9y-9RXJg.jpg) 黑白風格 ![00251-3997480618](https://hackmd.io/_uploads/ByKoEcCmke.jpg) 照片風格 ![00035-2765705839](https://hackmd.io/_uploads/rkV-as-4kl.jpg) Fantasy Art ![00046-2582351817](https://hackmd.io/_uploads/SJFURsZEke.jpg) (alphonse mucha:1.5),foral_background, ![00056-2884090106](https://hackmd.io/_uploads/SJz9k3WN1l.jpg) (Monet style:2), ![00053-489248021](https://hackmd.io/_uploads/S1ApRoWNJx.jpg) 替換擺拍的姿勢圖片 ![00073-4171532630](https://hackmd.io/_uploads/ryhDZnbNJe.jpg) ![00078-2661634259](https://hackmd.io/_uploads/HJZzzhWEJg.jpg) ![00079-2829701297](https://hackmd.io/_uploads/B1k4G3WVye.jpg)