你給文字描述,AI藝術作畫,精美無比!附源碼,快來試試!
- 2022 年 10 月 30 日
- 筆記
- TensorFlow, 人工智能, 深度學習, 深度學習實戰通關指南 ⛵ 頂級「煉丹師」案例驅動成長之路, 神經網絡, 計算機視覺
💡 作者:韓信子@ShowMeAI
📘 深度學習實戰系列://www.showmeai.tech/tutorials/42
📘 TensorFlow 實戰系列://www.showmeai.tech/tutorials/43
📘 本文地址://www.showmeai.tech/article-detail/313
📢 聲明:版權所有,轉載請聯繫平台與作者並註明出處
📢 收藏ShowMeAI查看更多精彩內容
AI 在藝術界的覆蓋越來越廣,從最早的 GPT3 等模型文本生成和音樂創作,到最近非常讓人驚艷的藝術畫繪製,最近最流行的2個付費工具是 📘OpenAI 的 Dall-E2和 📘MidJourney。
通過使用 AI 高級算法(各類 Diffusion 模型),它們可以根據人類的提示文本信息創作極其精美的藝術畫品,從肖像到風景畫,全部都能完成,創作的精美逼真程度有時甚至與人類藝術家不相上下,如下圖就來自AI作畫生成。
上面提到的商業工具 📘OpenAI 的 Dall-E2和 📘MidJourney都非常強大並且可以產生一流的圖像(大家可以在它們的官方測試),但它們都有一些訪問和使用限制。 Dall-E2 不可公開訪問,MidJourney 的免費套餐僅提供 25 張圖片。
但我們找到了開源的替代 AI 產品 Disco Diffusion,它是一款功能強大的文本到藝術畫生成器,可與 MidJourney 相媲美,而且完全免費。
下面 ShowMeAI 帶大家來體驗Disco Diffusion,基於它的代碼生成圖像,你也快來試試!
💡 Disco Diffusion介紹
Disco Diffusion 是發佈於 Google Colab 平台的一款利用人工智能深度學習進行數字藝術創作的工具,它是基於 MIT 許可協議的開源工具,可以在 Google Drive 直接運行,也可以部署到本地運行,目前最新的版本是 Disco Diffusion v5.6。
用白話講 Disco Diffusion 的基本工作就是把你給出的 Prompts(提示/描述)由文字信息變成圖像信息,把你用文字描述的畫面『畫』出來。實際操作也基本如此,很簡單,下面是幾張基於文本提示用 Disco Diffusion 生成的圖片。
文本提示: A digital painting of cyberpunk city by beeple, mist, trending on artstation, V-Ray.
文本提示: Spaceship about to landing on a cornfield, steampunk, clouds in the sky, by Greg Rutkowski, concept art.
文本提示: A beautiful painting of captivating castles on hills and mountains, along plains and rivers, by Ismail Inceoglu.
💡 AI作畫實踐
我們下面準備在 📘Google Colab 中完成整個繪畫過程,簡單地說,大家只需要準備好瀏覽器(保證可以訪問 Google),有 Google 賬號的話會更方便。
📌 步驟1. 打開Disco Diffusion Google Colab
準備好瀏覽器,並保證 Google 訪問正常,然後點擊 📘這裡,大家會直接在瀏覽器進入 Google colab 的項目地址,如下圖所示。
Colab項目中大家可以看到編號從 1-5 的對應步驟,我們只需按下運行代碼的小播放按鈕即可執行對應的代碼。不過因為是定製作畫,大家需要做一些設置和填入部分提示信息,如下步驟。
📌 步驟2.添加文字提示prompt
展開設置 (3) 階段的內容,可以看到更詳細的子設置,我們。在『Prompts』(提示1)部分,修改文本提示,之後 Diffusion 模型就可以根據你的提示作畫啦!
📌 步驟3. 生成圖像
接下來就可以運行代碼作畫啦!我們按從上到下的順序運行各個階段。 運行的方法非常簡單,只需按下左側代碼塊對應的小播放按鈕,如下圖所示。
接下來大家就可以等待AI作畫啦!在 Colab 工具的免費版本中,完全渲染生成 1028×768 的圖像大約需要 10 分鐘。 大家在等待期間可以做其他事情。
生成的圖像將自動保存在谷歌網盤/google drive中。
root\AI\Disco_Diffusion\images_out\TimeToDisco*
💡 AI繪畫產品結果對比
我們來對比一下,同樣的提示文本語句下,Dall-E2、MidJourney 和我們使用 DIsco Diffusion 生成的圖片。
我用類似的提示輸入了所有三個工具。
A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and thomas kinkade, Trending on artstation.”, “yellow color scheme”
翻譯成中文就是:一幅美麗的奇異燈塔畫作,將光芒照耀在洶湧的紅色海洋中。 greg rutkowski 和 thomas kinkade 的黃色配色方案,artstation網站上的流行趨勢。
📌 Disco Diffusion
Disco Diffusion AI 生成的圖片如下:
📌 MidJourney
MidJourney AI 生成的圖片如下:
📌 Dall-E2
OpenAI Dall-E2 生成的圖像如下:
大家覺得這段文字描述,生成的圖片中,3個平台哪個結果最好看?你也動手修改描述,一鍵生成自己的藝術畫吧!!
參考資料
- 📘 OpenAI 的 Dall-E2://openai.com/dall-e-2/
- 📘 MidJourney://www.midjourney.com/app
- 📘 OpenAI 的 Dall-E2://openai.com/dall-e-2
- 📘 MidJourney://www.midjourney.com/app/
- 📘 Google Colab://colab.research.google.com/
- 📘 Disco Diffusion Google Colab