**SD-18 InstantID AI換臉完美版**

Stable Diffusion的主要工作介面(UI)

**"AI換臉" 所找的照片以上半身照片為佳**
教學影片1
https://www.youtube.com/watch?v=pd4EY5udcF8
WebUI使用InstantID,AI換臉完美版
Please use SDXL base model. Currently there is no instant id for sd15.
教學影片2
InstantID换脸插件最佳搭档,最强Web UI生成工具揭晓-Fooocus
https://www.youtube.com/watch?v=AE-TdUqmvn8
教學影片3(ComfyUI)
影片AI表情迁移教程!HelloMeme V2|AI Expression Transfer Tutorial!
https://www.youtube.com/watch?v=Zjik6-Ll6UY&t=12s
**Checkpoint人物臉需用 XL model**
https://civitai.com/models/215418(TurboVisionXL-Super Fast XL based on new SDXL Turbo)
因為是SDXL Turbo model 所以尺寸的設定768或1024最佳
Suggested settings for best output
**Sampling method取樣方法:Euler a or LCM or DPM2 or DPM++ SDE
Schedule type:Automatic or Karras or Simple or Normal**
Steps: 4 - 8
CFG: 1 - 4
隨著AI繪畫技術的不斷反覆運算,AI換臉也日臻完美。
https://github.com/Mikubill/sd-webui-controlnet/discussions/2589
InstantID 巧妙地避免了對文生圖模型 UNet 部分的訓練,僅通過訓練一個羽量級的可插拔模組,實現了在推理過程中無需 test-time tuning,同時保持了文本控制的靈活性,確保了面部特徵的高保真度。
InstantID 的工作原理可分為三個關鍵部分:
1. ID Embedding:團隊利用預訓練的面部識別模型代替 CLIP 來提取語義人臉特徵,並使用可訓練的投影層,將這些特徵映射到文本特徵空間,形成 Face Embedding,具有豐富的語義資訊,包括如面部特徵、表情、年齡等,為後續的圖像生成提供了堅實的基礎。
2. Image Adapter:引入一個羽量級的適配模組,將提取的身份資訊與文本提示結合起來。這個模組通過解耦的交叉注意力機制,使得圖像和文本能夠獨立地影響生成過程,從而在保持身份資訊的同時,允許使用者對圖像風格進行精細控制,實現「雙贏」。
3. IdentityNet:一個名為 IdentityNet 的網路,是 InstantID 的核心部分。它通過強語義條件(如面部特徵的詳細描述)和弱空間條件(如面部關鍵點的位置)來編碼參考面部圖像的複雜特徵。在 IdentityNet 中,生成過程完全由 Face Embedding 引導,無需任何文本資訊。僅更新新添加的模組,而預先訓練的文本到圖像模型保持凍結以確保靈活性。
在實際的圖像生成過程中,InstantID 首先會接收到使用者的文本提示和面部圖像。然後通過 ID Embedding 提取關鍵資訊,接著 Image Adapter 將這些資訊與文本提示融合。IdentityNet 會根據這些融合後的資訊生成圖像。
整個過程是自動化的,使用者不需要進行任何額外的微調或訓練,只需等待二十幾秒,就能得到一個既符合文本描述又保留個人身份特徵的定制圖像。
這個工具有獨立安裝版,有comfyUI版及WebUI版。
1、升級ControlNet,至少要到1.1.440版。
2、下載ControlNet使用的模型,模型分兩大類。
ControlNet模型: https://github.com/Mikubill/sd-webui-controlnet/discussions/2589
分別是ip-adapter_instant_id_sdxl.bin和control_instant_id_sdxl.safetensors。
下載後放至D:\SDlocal\stable-diffusion-webui\extensions\sd-webui-controlnet\models
面部識別模型:共計5個 https://huggingface.co/Aitrepreneur/models/tree/main/antelopev2
下載後放至以下目錄D:\SDlocal\stable-diffusion-webui\extensions\sd-webui-controlnet\annotator\downloads\insightface\models\antelopev2
**Instant-ID操作**
注意如果你的顯存不足16G,那麼這裡要選擇低顯存優化,否則會爆顯存。需要注意的是,提示詞不要太複雜,過於複雜的提示詞容易使Instant-ID失效。
Model: turbovisionxlSuperFastXLBasedOnNew_beta0131Bakedvae
prompt:best quality,4k,realistic,highly detailed,
A men,
Negative prompt:NSFW,noisy,ugly,low quality,deform,blurry,
**參數設定**

**Sampling method取樣方法:Euler a or LCM or DPM2 or DPM++ SDE
Schedule type:Automatic or Karras or Simple or Normal**


**Sampling steps 4~8 較佳
CFG Scale 1~4 較佳**
在ControlNet的配置介面,我們需要配置兩個Instant-ID頁面。
第一個頁面:先上傳需要輸出的臉型原型,比如AI教
(1024*720)


第二個頁面:這裡上傳想要擺拍的姿勢,instantID會分析這張照片的姿勢,然後把第一張的臉型按照這個姿勢適配,但不是簡單的換臉,除了姿勢外,完全不同,相當於重新生成。
擺拍的姿勢的底圖




prompt:best quality,4k,realistic,highly detailed,
A men,giggling,







披上戰甲的AI教父



Model: turboDiffusionXL_v112

需要輸出的臉型原型 女孩底圖一(1024*768)

擺拍的姿勢的底圖

Model: turbovisionxlSuperFastXLBasedOnNew_beta0131Bakedvae
prompt:best quality,4k,realistic,highly detailed,
a girl,(giggling:1.3),
Negative prompt:NSFW,noisy,ugly,low quality,deform,blurry,



giggling

giggling

sad

水彩風格


黑白風格

照片風格

Fantasy Art

(alphonse mucha:1.5),foral_background,

(Monet style:2),

替換擺拍的姿勢圖片


