# Day-10 有圖有真相-DALL-E、Michelangelo、MixerBox ImageGen ## 0. 前言 昨天我們使用了image search跟gif search這兩個plugin來搜尋圖片跟GIF,但是搜尋結果有時候差強人意,這個時候就來試試自己做圖片吧!今天要使用Michelangelo和其他插件來帶大家認識OpenAI的另一個強項:Dall-E模型。 ## 1. DALL-E、DALL-E2 DALL-E和DALL-E 2是由OpenAI使用深度學習方法開發的文本到圖像模型。這些模型能夠根據prompts生成數字圖像。DALL-E最初於2021年1月公開,並使用了一個修改過的GPT-3版本來生成圖像。2022年4月,OpenAI宣布了DALL-E 2並於2022年7月20日進入了beta階段。此外DALL-E 2也作為API發布,允許開發者將模型集成到他們自己的應用程序中。(API部分將會在最後五天解說) 1. 軟件的名稱 - 是動畫機器人角色 WALL-E 和西班牙超現實主義藝術家 Salvador Dalí 名稱的拼音。 2. 能力 - DALL-E 可以生成多種風格的圖像,包括照片般逼真的圖像、繪畫和表情符號。它可以正確地在新穎的組合中放置設計元素,而不需要明確的指示。 3. 倫理問題 - DALL-E 2 的訓練數據經過過濾以去除暴力和性圖像,但這在某些情況下會增加偏見。 4. 技術限制 - DALL-E 2 的語言理解有限,有時無法區分 "A yellow book and a red vase" 和 "A red book and a yellow vase"。 - 如果想直接從OpenAI官網的DALL-E玩玩看也行,不過需要另外付費,他每次生成都要花credits,而且一次買就要花15美元買115點credits(豪貴>_<) ![](https://hackmd.io/_uploads/r14m0F_ya.png) - 這邊讓大家稍微看一下會長怎樣,我輸入的prompt是:**A futuristic neon lit weapon**,翻譯是**霓虹燈效果的武器** ![](https://hackmd.io/_uploads/B1oxNUm62.png) - 它會生成四張圖片給你,選一張喜歡的點進去,可以看到右上角有`Edit`、`Variations`、`Share`和`Save`,後面兩個選項應該不用多說,就稍微解釋前面兩個好了。 ![](https://hackmd.io/_uploads/rJ7G4Imph.png) 1. **Edit** - 它會給你一個橡皮擦(?)你可以把不滿意的地方擦掉,它會重新在你擦掉的位置生成圖像,其餘則不會改變。 ![](https://hackmd.io/_uploads/S1RorIQTn.png) - 擦完一樣按`Generate`,消耗一點credits它又會給你四張圖片(包括原圖共五張) ![](https://hackmd.io/_uploads/HkXWULm6h.png) 2. **Variations** - 與`Edit`不同的是,`Variations`會直接以這張圖片的風格元素重新再給你四張(同樣包括原圖共五張) ![](https://hackmd.io/_uploads/r1lXELQan.png) - 旁邊的歷史紀錄可以看到我其實試了很多不同主題,對於他的生成圖片能力我只能說時好時壞,可能是因為我不會下文生圖的prompts或是官網的可調選項比較有限制,所以我是不推薦花這15美,或是可以使用接下來要介紹的插件玩玩看再決定。 ## 2. Michelangelo - 這個插件是基於DALL-E模型運作的,並且我在一開始向他詢問如何使用及應該如何給他prompt(Day-4提到的小祕訣:問它如何給prompt),他的回應如下 ![](https://hackmd.io/_uploads/SJ8UqSQ63.png) - 可以看到有一個重點要素是選擇==風格==,所以我除了主題**和服女孩**以外,還指定了**動漫**風格 ![](https://hackmd.io/_uploads/Sk9KjB7p2.png) - 啊?和服呢?結果我的和服完全消失了,所以我又問了一次,然後他就回應用完本月的五次使用額度了QwQ(之前的測試亂玩用了四次) ![](https://hackmd.io/_uploads/HyiMzIXp2.png) - 但我覺得已經很好了,畢竟是免費讓你使用的插件,而且圖片品質也不低。 ## 3. MixerBox ImageGen - 嘿對這個工具從名稱上就能看出來跟前面那些Mixer開頭的插件一樣,都是MixerBox導流打廣告的產品,所以說實在我原本對他的期望不太高,直到他回應生成的圖片後我稍微改觀了,看起來好像效果不錯的樣子OwO ![](https://hackmd.io/_uploads/SyyEYHm62.png) - 到網頁查看圖片,發現MixerBox果然還是死性不改,在圖片加了一堆浮水印=_=。不過至少生成的圖片元素該有的都有,算是差強人意。 ![](https://hackmd.io/_uploads/rJ7HKSX6n.png) ## 4. 結語 今天除了介紹OpenAI自家的DALL-E以外還玩了兩個插件**Michelangelo**和**MixerBox ImageGen**,效果其實都不錯,但就是讓我感覺到**文生圖的prompts精準度必須比平成使用ChatGPT高**,否則就會生出一堆四不像的怪物。以後有機會再來介紹我曾經玩過的Midjourny和Stable Diffusion,有興趣當然也歡迎大家自行研究,然後跟我們分享哦~