AI 時代的人機協同創作
- 2019 年 10 月 8 日
- 筆記
這是mixlab社區成員00-ML04的文章,總結了她在4月的一次活動中分享的內容。
mixlab有一期文章訪談過00:
00的斜桿:
交互設計 / 服務設計 / 產品經理 / Maker / AI / New Media Art / Generative Art / Data & Sound Visualization / 心理學和認知科學 / 旅遊景區規劃
在AI時代設計師們、程序員們都焦慮了,AI可以用來做設計(鹿班),AI還可以用來寫代碼(UI2Code),AI也可以做遊戲,AI也可以譜曲,AI當你的老師……例子非常多,人與機器的關係從人機交互逐漸地往人機協同演進,我們可以找到很多例子,比如:
大界機械人
https://www.roboticplus.ai/
建築領域的機械人系統
2018設計人工智能報告
http://sheji.ai/
腦機比,人機關係的研究
——————————-
下面把時間留給00:

為什麼分享這個話題呢?
我做了好多年交互設計的工作,所以學習和工作一直有一個離不開的主題——人機交互 (Human-Computer Interaction)。
人機關係的演進
什麼是人機交互?我把它簡單理解為:
人如何與機器或某個複雜系統的溝通和互動過程。
更為完整的版本,請看我在知乎上的回答 什麼是交互設計? (https://www.zhihu.com/question/19788122/answer/119319267)
比如,鼠標就是一個解決人和機器互動問題的經典產品。

現在大家都覺得鼠標再平常不過了,但是在當年,Douglas Engelbart 的這一項發明,極好地解決了人們在圖形化計算機界面操縱屏幕元素的問題。為了表彰這項發明以及在人機交互領域的開拓式貢獻,Douglas Engelbart 在 1997 年獲得了「計算機界的諾貝爾獎」——圖靈獎。
For an inspiring vision of the future of interactive computing and the invention of key technologies to help realize this vision. — Turing Award Citation
人和機器的對話、交互一直在演進。這也從一個側面反映了人創造工具的歷史:

人創造的工具越來越多樣、複雜、強大。想想看,今天我們在手機上能完成多少事情。
於是,有人慢慢感到這種發展速度似乎不大對勁……奇點要來了,AlphaGo 也出現了。

隨着深度學習熱潮的演進,大家發現,以前為了讓機器智能化而不得不做的很多工作,比如,符號化、標準化、模塊化、輸入大量專家知識、需要龐大的訓練數據集、要做苦臟累的特徵工程等等,現在都簡化了。基本上,只要目標足夠清晰、可操作,訓練數據和計算資源足夠,機器學習產生的結果就可以滿足要求。
我個人也經歷了一次切身的體驗。
今年年初在上 Udacity 的 Deep Learning Nano Degree 課程的時候,最後一個實踐項目,是基於人臉圖像庫,用生成對抗網絡(GAN)算法自動生成人臉。
雖然在學習過程中,早已對算法能實現的結果有所預期。但是當我把程序放到 AWS 的 GPU 上面跑了不到二十分鐘,看到結果時還是忍不住隱隱感到機器的強大和壓迫。
這是最開始幾個訓練迭代生成的模糊不清的輪廓:

這是十幾分鐘訓練結束後生成的人臉:

說一點兒都不焦慮是假的。
何況各種媒體還鋪天蓋地強化這種焦慮,今天是一百零八種會被機器取代的工作,明天是哪個比賽機器又戰勝了人……
於是大家經不住會問:

似乎只有像詩詞、小說、爵士樂、即興表演這些領域,機器看起來就是不太擅長。
但,也不好說。
Paul 是一個專門給人畫肖像畫的機器。從 2011 年至今已經創做了非常多的作品。看起來非常有藝術感,不是嗎?

……

有時候在焦慮之餘,又忍不住會想:這種焦慮到底從何而來?
如果看過萊考夫「我們賴以生存的隱喻」的同學都知道,隱喻 Metaphor 對我們的影響有多麼大。仔細想想,感到機器的威脅,是不是也源於人機關係的一些基本隱喻?
我們基本上都是以一種對立或一分為二的方式來看待這些基本詞彙:

看到這些詞彙,我們會下意識地覺得它們是對立關係。邏輯、精確、冰冷的工程思維,怎麼跟想像、感性、個性、創作融為一爐呢?
這大概就是問題所在了。
隱喻和可能
語言有邊界。這是語言能高效傳遞信息的代價之一。
所以,打破語言或者說概念的界限,也許就是找到新出路的起點。
(PS. 在心理諮詢中,諮詢師很重要的一部分工作,是幫助來訪者呈現問題、reframe 問題,而不是直接插手去替他解決問題。)
其實早在 50 多年前,就有人探討過人機關係的「未來簡史」。
美國心理學家和計算機科學家 Licklider 在 Man-Computer Symbiosis 這篇論文中,討論人跟機器的關係存在什麼樣的可能性,提出「人機共生」的概念。

快 60 年過去了,技術的發展讓「蠢機器」第一次有可能成為人類的「好基友」,我們為什麼首先感到的是焦慮而不是興奮呢?
還記得 2016 年,在 AlphaGo 戰勝李世石後,跟安豬老師在大理有過一次討論。當時我的感慨是,為 AlphaGo 的勝利感到挺開心的,但並不是因為我是技術的腦殘粉,而是因為我覺得到了這個時候,人不得不去面對這樣一個問題:
人到底擅長什麼?
也就是說,當接受生物智能無法跟上非生物智能的發展時:

人到底有哪些可以讓機器「羨慕」(當然,機器不會有這種情緒)的天賦呢?
至今我還沒有答案,但我想,大概會包括:直覺、洞察力、探索和意外的創造。人欣賞「意外」的審美、運用「意外」的創造力,應該會長期秒殺機器。
人跟機器最大的區別到底是什麼?
我一直在問自己這個問題。

意圖,可能是現階段人跟機器最大的差別。
人因為時間、空間、認知方面的三大局限,因為生命時長極其有限、可觸達的空間極其有限、工作記憶(內存)極其有限,決定了人類的一些基本 drive 和價值觀。
人的美妙與荒謬,可能都來自於兩行二選一的核心代碼:
Be numb/sober and Duplicate Be insane/self-distroying and Love
所以我(naive地)認為,突破時間、空間、認知限制,渴望無限,是人類物種永恆的追求,換一個詞來概括,那就是——意圖。
我們在基本意圖上發展出複雜的能力,會體會微妙的情感,會追求意義,會審美、表達、共情,會講故事和構建社會關係……
而機器,無所不能,但就是沒有意圖!
這樣看來,現在難道不是人類最好的時代嗎?
有一個毫無私心、任勞任怨、潛力無限的助手,為什麼我們擔心的是被助手取代,而不是興高采烈地放開手腳去創造呢?
人機關係的新階段
無論技術如何發展,人類從來沒有停止過創造。
這是用 Google DeepDream 算法生成的作品:

DeepDream 網站的首頁,已經為人機關係的新時代做了註腳:

藝術家們一直在嘗試探索人機關係,可能是這樣的:

也可能是這樣的:

上圖是一位叫做 Dragan iLiC 藝術家的項目,人充當機器的筆刷,由機械臂控制着人去作畫。
在分享的現場,這張圖片引發了熱烈的討論。有的小夥伴表示,這樣做的目的到底是什麼,她看不出任何意義。有的小夥伴認為這是對人機關係一種悲觀的表達。有的小夥伴的態度則更為中立而開放……
我想,這恰恰就是藝術家的目的吧:激發人們的反思與討論。並不存在對與錯,只是 raise questions,這也許就是最大的善意。
音樂,人機協同即將爆發的領域?
最近關注音樂和技術結合的領域比較多,越來越覺得音樂也許會迎來人機共創的繁榮時期。
音樂本身是符號化、形式化非常強的「語言」。音樂的規律經過數百年的研究和沉澱,幾乎已經沒有太多規律上的「未知和秘密」,更多的變化會來自文化思潮影響下的風格探索。
算法作曲早已不是什麼新鮮事,基於 AI 自動生成音樂已經有很多成熟的應用。甚至是在對即興表演要求相當高的爵士樂,也已經有人機共同即興表演的嘗試。
比如 Al Biles 教授的 GenJam 項目,從 2005 年至今,已經演出過數十場。
而去年的 Qosmo AI DJ 項目也展示了人類 DJ 和 AI DJ 一起 Jam 的效果~
何以解憂?
這是最壞的時代 也是最好的時代
這取決於我們現在每做的一個決定、每投入的分分秒秒。
知識可以學習,但智慧更多是一種體驗。
回到主題,如何破解 AI 時代的焦慮呢?
以下是 00 給(自己)的解藥:




回歸創造者的使命,裝備上創造所需要的心、眼、腦、手,
去看,
去愛,
去體驗。
把技術當成夥伴和切磋的對手,
去行動,
去試驗,
去創造。
最後

Ref
- Doug Engelbart 1968 Demo https://web.stanford.edu/dept/SUL/library/extra4/sloan/MouseSite/1968Demo.html
- PATRICK TRESSET | http://patricktresset.com/new/
- Licklider – Man-Computer Symbiosis.pdf http://worrydream.com/refs/Licklider%20-%20Man-Computer%20Symbiosis.pdf
- www.draganilic.org http://www.draganilic.org/
- GenJam http://igm.rit.edu/~jabics/GenJam.html