AI繪畫提示詞創作指南：DALL·E 2、Midjourney和 Stable Diffusion最全大比拼 ⛵

💡 作者：韓信子@ShowMeAI
📘 深度學習實戰系列：//www.showmeai.tech/tutorials/42
📘 自然語言處理實戰系列：//www.showmeai.tech/tutorials/45
📘 計算機視覺實戰系列：//www.showmeai.tech/tutorials/46
📘 本文地址：//www.showmeai.tech/article-detail/392
📢 聲明：版權所有，轉載請聯繫平台與作者並註明出處
📢 收藏ShowMeAI查看更多精彩內容

隨着 Diffusion Model 的普及，大家可能注意到互聯網上有着鋪天蓋地的人工智能 (AI) 生成的圖像，這些圖像都是使用『文本到圖像』的生成模型生成的：只需要輸入一個文本描述（prompt/提示），AI 模型就可以在幾秒幾分鐘內生成一個或多個精準匹配提示的精美圖像。

ShowMeAI在前序的文章中也做了一些相關的介紹：

📘 你給文字描述，AI藝術作畫，精美無比！附源碼，快來試試！

📘 使用Hugging Face發佈的diffuser模型快速繪畫

截止目前為止，三個最流行的AI作畫產品是 📘Stable Diffusion、📘Midjourney和 📘DALL·E 2。

在本文中，ShowMeAI將對這3種模型進行比較，我們不會介紹這些 AI 模型後面的複雜數學原理，而聚焦在使用方法和效果對比。

💡 DALL·E2

📘DALL·E2由 📘OpenAI開發，目前產品版本處於 beta 階段。

💦 如何使用

① 文本提示作圖

在 DALL·E2 中，可以使用『文本到圖像』和『文本引導的圖像到圖像』生成算法生成圖像。使用『文本引導的圖像到圖像』生成算法，您可以上傳圖像，AI會以你上傳的圖像為初始圖，根據提示來作圖。

上圖 DALL·E 作畫提示詞：A stop-motion animation still of a cute robot standing in the forest (一個可愛的機械人站在森林裏的定格動畫)。

② 文本提示的圖到圖

它還有『編輯生成的圖像』功能，使用『文本引導圖像到圖像』生成算法，我們可以在已生成的圖像之上生成另一個圖像來擴展生成的圖像，或者對有遮蔽的圖像進行補全創作。

③ 分辨率和格式

在 DALL·E2 中，所有生成的圖像都具有 1024 x 1024 的固定圖像大小 。

💦 使用注意事項

首次訪問 DALL·E 可以獲得 50 個免✦費積分（要求在第一個月內用完）。在接下來的每個月中，都會獲得 15 個免✦費積分（對，同樣的道理，免✦費積分不會累加）。每1個提示默認會創建4個圖像，消耗大約1個積分，你也可以付費花 15 美元購買 115 次作圖。

DALL·E2 生成的圖像可以用於任何合法目的，包括商✦業用途。

💡 Midjourney

📘Midjourney 由同名研究實驗室開發，目前處於公測階段。

💦 如何使用

生成圖像 Midjourney ，您可以使用 📘Midjourney Discord 服務器。

① 文本提示作圖

Midjourney的『文本提示做圖』也非常簡單，也同樣是提交提示文本，就可以生成對應的結果。

上面的截圖，是在 Midjourney Discord Server 上提交提示 A stop-motion animation still of a cute robot standing in the forest (一個可愛的機械人站在森林裏的定格動畫) 的運行結果。

② 圖像變體&高分辨率

此外，您可以創建生成圖像的其他變體或將生成的圖像放大到更高分辨率。

我們也可以輸入一個或多個圖像的 URL，以其作為初始，配以提示文本引導作圖。

③ 分辨率和格式

Midjourney支持創建各種格式的圖像，圖像分辨率高達 2048 x 2048 。

💦 使用注意事項

首次加入 Midjourney Discord 服務器，我們可以獲得 25 分鐘的免✦費 GPU 時間，大致可以支撐 25 次免✦費生成（1次生成大概需要1 GPU 分鐘）。單次請求將根據提示生成4個候選畫作。

Midjourney允許付費會員將 Midjourney 生成的圖像用於商✦業用途。

💡 Stable Diffusion

Stable Diffusion 由 📘CompVis、 📘Stability AI和 📘LAION開源，於 2022 年 8 月發佈，大家都可以使用（但需要一些服務器計算資源支撐）。

💦 如何使用

如果要本地運行 Stable Diffusion，至少需要 10GB VRAM 的 GPU。 Huggingface 提供了有關如何使用 📘Stable Diffusion 教程。

如果您不想編寫和觸碰任何代碼，也可以使用 📘Dream Studio Web 應用程序，只需要註冊一個帳戶即可。

① 文本提示做圖

Dream Studio 提供『文本到圖像』，它具有各種選項，例如設置生成圖像的步驟數或設置隨機種子，可以設置單次生成的圖像數量（1 到 9 之間）。

上圖為 Dream Studio 提示詞 A stop-motion animation still of a cute robot standing in the forest (一個可愛的機械人站在森林裏的定格動畫) 的運行結果。

一個快捷嘗試的方式是在 📘HuggingFace的 📘Diffuse the Rest應用里嘗試，如下圖所示：

② 分辨率和格式

使用 Stable Diffusion，您可以創建各種格式的圖像，圖像分辨率高達 1024 x 1024。

💦 使用注意事項

首次註冊 DreamStudio beta 將獲得價值 2 英鎊的積分。這大約相當於 200 次單張圖免✦費生成的額度。免✦費試用後可以按 10 英鎊的增量購買額外的積分。

隨意使用來自 DreamStudio Beta 和 Stable Diffusion beta Discord 服務的圖像用於任何用途， 包括商✦業目的 。

💡 總結

在本文中，我們比較了目前最流行的3個圖像生成平台 DALL·E2、Midjourney、Stable Diffusion。對比的結果匯總如下表：

不過請大家注意，下表可能會發生變化，因為這三個模型正在積極開發中，功能也在不斷完善。下方的信息來源時間點為2022年9月。

參考資料

推薦閱讀

Tags: CV實戰通關指南 ⛵ 視覺項目航母級實操 DALL·E2 Midjourney NLP實戰通關指南 ⛵ 文本&語音項目實操大全 Stable Diffusion 人工智能深度學習深度學習實戰通關指南 ⛵ 頂級「煉丹師」案例驅動成長之路自然語言處理計算機視覺

Previous post

HCIE Routing&Switching之MPLS靜態LSP配置

Next post

Spring Boot 配置多數據源