Day-10 - HackMD

# Day-10 有圖有真相-DALL-E、Michelangelo、MixerBox ImageGen ## 0. 前言昨天我們使用了image search跟gif search這兩個plugin來搜尋圖片跟GIF，但是搜尋結果有時候差強人意，這個時候就來試試自己做圖片吧!今天要使用Michelangelo和其他插件來帶大家認識OpenAI的另一個強項:Dall-E模型。 ## 1. DALL-E、DALL-E2 DALL-E和DALL-E 2是由OpenAI使用深度學習方法開發的文本到圖像模型。這些模型能夠根據prompts生成數字圖像。DALL-E最初於2021年1月公開，並使用了一個修改過的GPT-3版本來生成圖像。2022年4月，OpenAI宣布了DALL-E 2並於2022年7月20日進入了beta階段。此外DALL-E 2也作為API發布，允許開發者將模型集成到他們自己的應用程序中。(API部分將會在最後五天解說) 1. 軟件的名稱 - 是動畫機器人角色 WALL-E 和西班牙超現實主義藝術家 Salvador Dalí 名稱的拼音。 2. 能力 - DALL-E 可以生成多種風格的圖像，包括照片般逼真的圖像、繪畫和表情符號。它可以正確地在新穎的組合中放置設計元素，而不需要明確的指示。 3. 倫理問題 - DALL-E 2 的訓練數據經過過濾以去除暴力和性圖像，但這在某些情況下會增加偏見。 4. 技術限制 - DALL-E 2 的語言理解有限，有時無法區分 "A yellow book and a red vase" 和 "A red book and a yellow vase"。 - 如果想直接從OpenAI官網的DALL-E玩玩看也行，不過需要另外付費，他每次生成都要花credits，而且一次買就要花15美元買115點credits(豪貴>_<) ![](https://hackmd.io/_uploads/r14m0F_ya.png) - 這邊讓大家稍微看一下會長怎樣，我輸入的prompt是:**A futuristic neon lit weapon**，翻譯是**霓虹燈效果的武器** ![](https://hackmd.io/_uploads/B1oxNUm62.png) - 它會生成四張圖片給你，選一張喜歡的點進去，可以看到右上角有`Edit`、`Variations`、`Share`和`Save`，後面兩個選項應該不用多說，就稍微解釋前面兩個好了。 ![](https://hackmd.io/_uploads/rJ7G4Imph.png) 1. **Edit** - 它會給你一個橡皮擦(?)你可以把不滿意的地方擦掉，它會重新在你擦掉的位置生成圖像，其餘則不會改變。 ![](https://hackmd.io/_uploads/S1RorIQTn.png) - 擦完一樣按`Generate`，消耗一點credits它又會給你四張圖片(包括原圖共五張) ![](https://hackmd.io/_uploads/HkXWULm6h.png) 2. **Variations** - 與`Edit`不同的是，`Variations`會直接以這張圖片的風格元素重新再給你四張(同樣包括原圖共五張) ![](https://hackmd.io/_uploads/r1lXELQan.png) - 旁邊的歷史紀錄可以看到我其實試了很多不同主題，對於他的生成圖片能力我只能說時好時壞，可能是因為我不會下文生圖的prompts或是官網的可調選項比較有限制，所以我是不推薦花這15美，或是可以使用接下來要介紹的插件玩玩看再決定。 ## 2. Michelangelo - 這個插件是基於DALL-E模型運作的，並且我在一開始向他詢問如何使用及應該如何給他prompt(Day-4提到的小祕訣:問它如何給prompt)，他的回應如下 ![](https://hackmd.io/_uploads/SJ8UqSQ63.png) - 可以看到有一個重點要素是選擇==風格==，所以我除了主題**和服女孩**以外，還指定了**動漫**風格 ![](https://hackmd.io/_uploads/Sk9KjB7p2.png) - 啊?和服呢?結果我的和服完全消失了，所以我又問了一次，然後他就回應用完本月的五次使用額度了QwQ(之前的測試亂玩用了四次) ![](https://hackmd.io/_uploads/HyiMzIXp2.png) - 但我覺得已經很好了，畢竟是免費讓你使用的插件，而且圖片品質也不低。 ## 3. MixerBox ImageGen - 嘿對這個工具從名稱上就能看出來跟前面那些Mixer開頭的插件一樣，都是MixerBox導流打廣告的產品，所以說實在我原本對他的期望不太高，直到他回應生成的圖片後我稍微改觀了，看起來好像效果不錯的樣子OwO ![](https://hackmd.io/_uploads/SyyEYHm62.png) - 到網頁查看圖片，發現MixerBox果然還是死性不改，在圖片加了一堆浮水印=_=。不過至少生成的圖片元素該有的都有，算是差強人意。 ![](https://hackmd.io/_uploads/rJ7HKSX6n.png) ## 4. 結語今天除了介紹OpenAI自家的DALL-E以外還玩了兩個插件**Michelangelo**和**MixerBox ImageGen**，效果其實都不錯，但就是讓我感覺到**文生圖的prompts精準度必須比平成使用ChatGPT高**，否則就會生出一堆四不像的怪物。以後有機會再來介紹我曾經玩過的Midjourny和Stable Diffusion，有興趣當然也歡迎大家自行研究，然後跟我們分享哦~