原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

沒想到,平常都是我拿著最新AI的Demo到處去安利。

這回竟然被美術圈的朋友安利了一個AI繪畫APP???

話不多說先看效果:

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

這摩登又玄幻的畫面,一上來就衝擊到我了。

抽象的線條兼具了美感和想像力,同時還傳遞出未來城市的感覺。

要不是被劇透,我還真不一定能立刻猜出來這是出自AI之手。

而且除了能對照片進行二改,這個AI還能根據文字命題、憑自己想像作畫。

比如輸入落日飛車四個字,在AI的「想像」中會是這樣:

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

另外還可以畫出不同畫風,目前已支援20種。

還真是能滿足你提出的所有需求,怪不得能征服美術設計圈(doge)。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

AI畫完後,甚至可以一鍵保存成手機壁紙。

在微信公眾號後台回復「wombo」,可開盲盒獲得隨機壁紙,總共5款哦~

過去幾天,這款APP還在Apple Store圖形和設計區霸榜多日(Android版本也有)。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

要知道,過去美術圈、藝術圈可是有不少人吐槽AI生成的內容沒得靈魂。。。

結果現在紛紛在社交平台上po自己的作品,還有設計區大V要專門聊聊這個事兒。

但更讓我震驚的是,這個APP背後公司的故事。

公司創始人現在只有25歲,為了創業,他直接從多倫多大學退學。

公司首次推出的APP(WOMBO.AI),能讓照片對口型唱歌。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

沒錯,就是那個此前在抖音上爆火、席捲全球互聯網的魔性特效。

憑藉著這款APP,這家公司估值直衝4000萬美元(摺合人民幣約2.5億)。

而他們最初的啟動資金,只有6萬美元。

這不禁讓人好奇,到底是怎樣的一伙人,能憑藉AI一次又一次做出全球爆火的APP?

25歲輟學創業,公司估值4000萬美元

先從小哥的公司Wombo創辦說起。

Wombo是一家加拿大公司,創始人及CEO名叫Ben-Zion Benkhin,今年25歲。

(接下來我們暫時用「小本哥」來稱呼他)

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

小本哥本來是多倫多大學數學與哲學專業的一位學生。

在學校的時候,他組建過一個人工智慧興趣社團,自己對deepfake也十分感興趣。

2020年8月的一個夏夜,小本哥和他的室友在公寓屋頂上吹風,突然靈光一現:

為什麼沒有人做一個APP,可以把一張普通的照片變成搞笑影片?

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

△Wombo效果

在經過4個小時的討論之後,Wombo的雛形輪廓逐漸清晰了起來。

雖然當時吹風的時候小本哥還順帶飛了點葉子(doge),但是他對這個想法還真不是一時上頭。

為此,他選擇輟學完成創業。

同時還拉來了自己做管理顧問的朋友Paul Pavel一起「搞事」,並在多倫多大學招募了一些學生。

其中Angad Arneja放棄了全額獎學金,選擇和小本哥一樣輟學,現在他是Wombo的人力主管。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

公司最初啟動資金有6萬美元,主要依靠各位創始人的父母慷慨解囊。

小本哥說這些錢主要用在了買電腦、招募開發人員和品牌推廣上。

大約半年以後,2021年2月28日,Wombo就準備好發布了。

小本哥和其他公司創始人們把這個應用發給了大約10個人。

一周之內,Wombo的下載量就達到了50萬次。

第二周,這個數字躍升到了900萬。

由此,Wombo也引起了各方投資人的關注,順利拿到了由Global Founders Capital和Sofreh Capital共同領投600萬美元天使輪。

現在估值達到了4000萬美元。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

值得一提的是,Wombo在爆火前,曾被200多家VC拒絕過。

所以這一波下來,真正贏麻了的是最初提供啟動資金的家長們。

比如Paul Pavel的父母就是資助2萬美元,最終換來了數十萬美元的股票。

目前,Wombo旗下的兩個APP下載量已經達到了8400萬+,月活用戶超過1000萬。

Wombo上的創作量已經達到10億,Dream by Wombo這一數據也達到了1.8億。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

由此帶來的收入也非常可觀,去年Wombo上線4個多月,依靠內部廣告和免費歌曲庫獲得了數十萬美元的收入。

Dream by Wombo支援用戶購買自己用AI生成的作品。

20美元可訂製一張海報,加邊框的價格則從45美元起算。

這個AI是怎麼畫畫的?

讓AI根據文字作畫,了解AI的朋友會知道這屬於多模態生成。

模態,指的是文本、影像、聲音等不同的資訊表現形式。

多模態,則是把不同類型的資訊結合起來。

如果給每個圖片標上文字描述組成一對,用大量這種圖文對去訓練AI,就能讓它理解到圖文之間的對應關係。

OpenAI開源的CLIP就是這個原理,Wombo工程師也曾在一次採訪中透露過,他們的演算法中就使用了CLIP。

CLIP使用了4億組從網上收集的圖文對做訓練,可以理解顏色和形狀,日常物品或建築物,甚至抽象的藝術風格比如「印象派」或「賽博朋克」。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

△CLIP訓練數據示例

接下來,還要解決影像生成的部分。

沒錯,又要請出GAN了,而且這次GAN要接受CLIP的指揮。

整個流程是這樣的:

首先生成一張平平無奇的隨機影像當種子。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

讓CLIP給影像與文字描述的相似度打分,回饋給GAN,GAN以提升分數為目標不斷迭代。

整個迭代過程可以在App中直觀地看到。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

其中的隨機性意味著AI幾乎不可能兩次生成同樣的影像。

如果第一次結果不滿意,還可以點擊按鈕用相同配置再試一次。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

至於Wombo的演算法具體使用了哪種GAN,並未公開。

但在招聘資訊里,高級機器學習工程師的崗位描述中寫著,有DC-GAN經驗的優先。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

DC-GAN最早於2015年提出,是第一個使用深度卷積網路生成影像的GAN變體。

意味著Wombo的演算法大概率是以此為基礎改進而來。

Wombo選擇卷積網路而不是Transformer的理由也不難猜。

要做成移動App給全球玩家使用,而且生成的是高解析度影像,卷積在效率上要佔優勢。

CLIP+GAN結合成AI畫家的方法並非Wombo首創。

CLIP於2021年1月發布,第二天網友@advadnoun就開始試驗其與各種生成模型的組合。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

最終他選擇了BigGAN,將程式碼發布為Colab筆記The Big Sleep

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

早期The Big Sleep生成的畫,怎麼說呢,總是帶點精神污染,解析度也不高。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

(建議不要去翻@advadnoun的早期分享,真的有毒)

後來西班牙玩家Katherine Crowson在此基礎上發布了CLIP+VQGAN的版本。

VQGAN是CVPR 2021 Oral入選論文,將CNN的高效率和Transformer的高性能結合起來,生成的影像品質更高。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

這一版Colab筆記真正流行了起來,不少人開始分享AI創作的畫,還開發出各種技巧。

比如文字提示中加入虛幻引擎或者光線追蹤,畫質還能大幅提升。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

圍繞CLIP+VQGAN開始形成社區,程式碼不斷有人做優化改進,還有了專門收集發布AI畫作的帳號。

而最早的先驅@advadnoun還順利入職Adobe擔任研究員。

但這一波AI作畫浪潮的玩家主要還是技術愛好者。

畢竟在Colab上排隊申請GPU、運行程式碼訓練AI,時不時還要處理一下報錯,門檻還是有點高了。

直到Dream by WOMBO的出現,改變了一切。

AI作畫開始被認真對待

實際上,這幾年已經浮現出不少讓AI作畫的技術工具。

最早是Google在2015年推出的DeepDream。

後來,除了前面提到的以外,還有NVIDIA 的GauGAN、OpenAI的DALL·E,開源的Disco Diffusion等。

憑藉著獨一無二還驚艷眾人的特點,AI作畫影響到的圈層也越來越廣泛,比較典型的有美術圈、藝術收藏圈以及NFT領域。

首先來看美術圈,他們接觸更多的是Disco Diffusion。

這款AI用擴散模型代替了GAN,生成影像的品質更高,幾乎達到了原畫級。

儘管要在Colab上自己運行程式碼,門檻不低,但還是大受歡迎,甚至出現了專門收集提示詞的共享文檔。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

知乎上最近也有一個與之相關的熱門話題。

AI繪畫會對美術行業產生什麼樣的影響呢?

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

在這個討論中,大部分人都覺得,AI對當下美術圈的影響還比較有限。

但是未來呢?大家的觀點不盡相同。

有人認為AI可以成為創作者的輔助工具;有人卻覺得AI能直接取代畫師。

知乎答主@畫畫的花噎菜認為,AI繪畫依舊淘汰不了繪畫行業。

往遠了說,照相機沒有淘汰寫實油畫;往近了說3D輔助也沒有淘汰寫實數繪。……如果你還是怕被搶了飯碗,那不妨讓自己畫得好一點。因為不論什麼行業,高端的市場都是最難被淘汰的。

@魚一般也覺得,AI將會是專業畫師手中一個很好的工具,可以提供很多靈感,也可以當做底稿使用。

@Liuuzaki雖然也贊同AI在想像力上是長板,但他認為,AI有一天會取代與之工作方式相似的從業者。

AI並不擅長邏輯,只擅長美感。它是天生的藝術家,而不是工程師。

這種工作方式很像現在的一些美術工作者。

而如果再把目光延伸到藝術收藏圈來看,AI作畫在這幾年已經帶來了一些肉眼可見的影響。

2018年,一幅由AI創作出的肖像畫在紐約佳士得拍賣會上以43.2萬美元成交。

這一價格也是該場拍賣會的最高成交價,甚至超過了同場拍賣的畢加索作品。

這幅畫最大的噱頭,便是用GAN作畫所帶來的的獨一無二性。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

One More Thing

最後,AI作畫還影響到了同樣在衝擊藝術圈的NFT。

此前有人推出了一個平台Eponym。

它能夠利用AI將文本轉化為圖畫,然後再將這些作品直接鑄造到最大的NFT市場OpenSea。

在這個平台上,每個文本只能生成一幅畫作。

由它推出第一批NFT(3500個),在OpenSea上一夜售罄。

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

△Eponym生成的作品

關於AI作畫將成為NFT領域的下一個趨勢,也成為最近圈內熱議的話題。

實際上,Wombo也有進軍NFT領域的打算。

去年年底,有位網友在推特上向他們發問:

你們是否把用戶生成的畫作鑄造成了NFT?

對此官方給出回應:目前還沒有鑄造,但是正在考慮這一計劃!

原畫師驚到:爆火AI真把夢境畫成現實了!下載APP人人可用

這事兒,你怎麼看呢?

(別忘了在微信公眾號後台回復「wombo」,可開盲盒獲得隨機壁紙~)

AI繪圖靈感共享庫://docs.qq.com/sheet/DWFR0VmpQa3ZtbXda

TheBigSleep://colab.research.google.com/drive/1NCceX2mbiKOSlAd_o7IU7nA9UskKN5WR

CLIP+VQGAN://ljvmiranda921.github.io/notebook/2021/08/11/vqgan-list/

Disco Diffusion://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb

參考鏈接:

[1]//www.theglobeandmail.com/business/article-making-it-by-faking-it-how-torontos-wombo-became-canadas-fastest/

[2]//www.8btc.com/article/6722724

[3]//artthescience.com/magazine/2022/02/16/features-wombo-dream-and-ai-art-with-salman-shahid/

[4]//weibo.com/u/5619550614?is_hot=1

[5]//www.zhihu.com/question/528563685/answer/2447959396

[6]//www.zhihu.com/question/528563685/answer/2445286621

[7]//www.zhihu.com/question/528563685/answer/2445279372