三次元的世界裡,機械臂的手活兒也無敵了

  • 2019 年 11 月 29 日
  • 筆記

By 超神經

對於疊疊樂( Jenga )這種積木遊戲,想必很多人都深有體會,因為稍有不慎,辛辛苦苦堆起來的積木塔就毀於一旦。這樣的事情,交給 AI 和機器人來做,會怎麼樣呢?

似乎研究人工智慧的團隊,總喜歡通過遊戲找到突破口,麻省理工學院的團隊研發出來的機械臂,也從三次元世界的遊戲開始。

疊疊樂,一般是把積木條先將木塊三根為一層,交錯疊高成塔,然後從下部抽取積木,放到塔頂,創造一個更高的積木塔。

疊疊樂遊戲是對耐心、平衡、力度等多方面的考驗,對很多人來說,(尤其是容易手抖的同學)這個遊戲實在是太難了。而 MIT 研製出的這個機器人,則通過探測、演算法結合推拉、對齊等操作,輕鬆的攻克了這個任務。

它究竟是何方神聖?

人類總會說自己「手抖」,所以機械臂的研究就是為了完成一些精細化或者高危的操作。項目團隊成員之一,MIT 機械工程系的助理教授 Alberto Rodriguez ,指出這個機器人的關鍵在於,它把視覺和觸感完美的結合了起來。

這項技術不僅上了 Science Robotics 期刊 ,

還在今天上了中央台電視台的午間新聞

但從外觀上看,這個機器人和一些常見的應用型機器類似,像一個普普通通的機械臂,但它配備了一個軟齒狀夾持器、一個力感應腕帶和一個外部攝影機,這相當於給它賦予了手,觸感和眼睛。

在工作時,夾持器用來操作積木,也能回饋觸感;感應腕帶用來控制操作積木的力度的力感;攝影機用來收集視覺影像。

除了擁有這些讓機器人能夠靈活移動積木的外形,它最關鍵的還是擁有和之前機器人不一樣的「靈魂」——研究人員使用新的演算法讓它變得更擅長這項工作。

根據 MIT 研究人員的介紹,這款機器人沒有使用傳統的 AI 學習方法,而是創造性的使用了分層模型動態,去建立一個聚類學習模型。

這樣做的好處是不再依賴大量的數據,而是能夠根據回饋的數據,作出實時的分析,邊接觸探測,邊預測移動下一塊積木的方案。

它是怎樣玩疊疊樂的?

事實上,機器人能夠處理看起來複雜的疊疊樂遊戲,關鍵用到了聚類學習。

傳統的思路去解決這個遊戲,就是把積木、機器人、積木塔之間會發生的所有關係都收集起來,從而計算出最好的方式。但這明顯會帶來海量的數據,而且計算難度也大大提升。

而這個研究中,選擇了讓機器人去模仿人類玩遊戲的方式。首先是先通過嘗試,對數據標註和聚類。然後通過和標記的數據對比判斷新操作的可行性。

首先讓機器人面對一個積木塔,隨機的選擇積木塊並按一個比較小的力度推出,對於每次推出和抽積木的操作,電腦會記錄下相應的視覺和力度數據,並和操作的結果一起標註出來。

這個研究中用了約 300 次嘗試,就積累到了足夠的數據,然後就就是對數據進行處理。這裡用到了聚類處理,要把數據和結果類似的操作分為一組,表示特定的積木行為。

不同的組代表了不同的可操作程度,這也是了衡量每個操作的標準。比如一組數據代表機器人在難以移動的積木上的嘗試,而另一組數據則代表一個比較容易移動的積木上的嘗試。

而每一個不同的數據集,再相應的給出一個簡單的模型,結合這些模型,機器人相當於學會了實時的學習。

最後,就可以進行實際演練,機械臂在推出積木塊時,利用攝影機和腕帶去接受視覺和觸覺資訊,然後把接收到的這個回饋和之前的數據作對比,如果數據對應到好的結果,就執行這個操作,如果會有倒塌的危險,就放棄此操作。

並不只是疊疊樂

MIT 的研究人員指出,雖然在研究中實現了機器人玩這個個遊戲,但要是拿來和人類高手比賽,估計還需要一些改進。因為在這個研究中, AI 機器人重點解決的是物理交互問題,解決了這塊積木能不能抽出來,擺上去之類的問題。但疊疊樂的遊戲還需要一些策略,這就涉及到考慮和分析關聯步驟。

但 MIT 的這個研究團隊明顯沒有這個想法,或許對他們來說,製造出一個玩疊疊樂的高手並沒有太多的價值。根據團隊研究人員 Rodríguez 的說法,正在考慮把這項技術用在實際的工作環境中,比如應用在製造裝配線的機器人等領域。

反正我們經常說自己手抖,那以後這些專業的事情就讓專業的「人」去做吧,我們還是等著被過年的美食淹沒著吧。

超神經小百科

聚類 Clustering

聚類是一種對數據分組的機器學習技術。一般就是將數據對象分組成為多個類或簇 ( Cluster ),使得在同一簇中的對象之間具有較高的相似度,而不同簇中的對象差別較大。

對於給定一組數據點,可以用聚類演算法將每個數據點分到特定的組中。理論上,屬於同一組的數據點應該有相似的屬性和/或特徵。聚類是屬於無監督學習方法。