# 從基礎大模型看 AIGC 釋放創造 - 林居穎 Kyle {%hackmd mW0XARQZTky8_gI5V_nsiA?view %} **[林居穎 Kyle](https://userxper.kaik.io/@kyle-lin) Alibaba - 通義實驗室 - 產品體驗設計負責人** > 在 AI 時代下,設計師該如何深入本質,調整定位,利用 AI 而不是被 AI 利用,去做好本職工作,發揮更大的能力?本分享將從AIGC的發展切入,拆解影像基礎演算法的演進,再到新一代設計模式的討論。幫助大家見微知著,擁抱 AIGC 設計新時代! > 從這裡開始共筆 🔥 :::success **議程簡報分享:[點我下載](https://drive.google.com/file/d/1j027Haq0g-YITrdpSpcaMfXSkC4cUede/view?usp=sharing)** ::: AIGC最早從1957年AI生成music 伊利亞克組曲 AI生成音樂 (1950s ~ 1990s) > 生成文本 (1990s ~ 2010s) > 大規模圖像 (2010s ~ now) 《2023中國AIGC應用研究報告》 ### 我們要怎麼解決 AI亂回答的問題呢? AGI HHH原則(核心) Helpful有用的(幫助使用者,使其滿意) Honest誠實的(真實的內容,沒有謬誤) Harmless無害的 GPT如何讓回答(數據)越來越好? GPT 3.5 數據層 專業標注人員數據;真實問答用戶數據 → 自動生成答案數據;真人排序的精品數據 模型層 SFT (Supervised Fine Tuning) RM(Reward Model) [Instruct Learning] GPT 4 (加強) CLIP Contrastive Language-Image Pre-Training 對比式語言-圖像化訓練 -如何讓 ai 看得動你的圖片 CoT Chain of Thought 要求大模型展現他思考的過程 ### 怎麼讓AI更像人?(從關注智商到關注情商) 人格、特質、意圖、情緒 (以石頭放眼睛為例,生命感腦補) 認識人格(外而內):末端行為,向上總結人的類型 人的表達(內而外):從人的人格類型,向下約束末端行為 ``` 訓練 AI 的核心在於如何整合人類(由外而內的、由外而內的行為) ``` > 算法同學 = 演算法工程師 > Kyle 的意思是 設計師訓練工程師.. XD AI 是怎麼生成圖像的呢? GAN 生成式對抗圖像 Diffusion 逆擴散的過程其實非常不穩定 Stable Diffusion 命名就是嘗試讓他變穩定 **到底如何才能控制好生成圖像,讓結果可控?** 人類的產出:經驗、理解力、需求 機器的產出:數據集、模型SFT、prompt 沒有足夠的數據,就像人沒有經驗和技法 「先不要」像和人對話一樣和機器對話 用,逗號隔開訴求 '**具體**' Ai 現在在理解人類語言的多重暗喻隱喻是比較難的 好理解的版本 主體什麼? 色彩麼? 環境、氣氛、燈光如何? 構圖什麼? **如何訓練更好的模型?** tips: 好數據挑選/髒數據清洗 1.產品/設計:訂標準 2.數據/設計:標注 3.算法/工程:預訓練 4.設計/數據:驗收結果(不合格回到「2.標注」) 5.算法/工程:大規模訓練 'at me':生成人物圖像的keyword(物體會正面) **會不會被 AI 取代?** 對比 1888 年攝影對藝術界的炸裂影響 攝影對繪畫界影響 否認-> 憤怒 -> 討價還價 -> 沮喪 -> 承認 (印象派、野獸派等等藝術蓬勃發展) 講者感受目前設計界對AI認知大概在憤怒階段 (認為ai做得不怎樣) Before AI的設計方式 前期 查看 dribbble、pinterest.. 透過 AI、PS、figma 等等的工具獲取靈感 後期 以 AI、PS、Figma 等等工具細化完善 After AI的設計方式 前期腦暴、找靈感階段(除素材網站外AIGC類) 後期 細化完善/無須完善 後Agent時代(幫你討價還價的代理人) 給他目標即可,後面讓他自行完善 互動 API 點 體驗 Agent 線 服務 Multi-Agent 面 ### AI的發展 1.0 智能學徒 具備單一aI技能,用戶主動透過 AI 完成任務 (會議記錄、翻譯、問答) 2.0 智能助手 可如人類助手般,在單一領域完成多工複雜任務 (產出會議摘要、整理文件、文件大綱) 3.0 智能顧問 協助人類進行決策 (基於數據給決策) AI 產品 (比喻像汽車引擎) AI+ 可以附加在很多地方 (如用在汽車、卡車...) +AI 通用型 AI 找應用方向(產生新的商業模式-郵務、物流..) AIGC讓每個人/機器都可以釋放創意