AlphaFold抗疫,DeepMind公布六種新冠病毒蛋白質結構預測結果
- 2020 年 3 月 11 日
- 筆記
機器之心報道
參與:張倩、蛋醬、杜偉
最近,一款名為「Foldit」的遊戲風靡全球。在這款遊戲中,玩家可以在線幫助研究人員尋找具有對抗新型冠狀病毒潛力的蛋白結構,其本質是充分利用所有可利用的人力、算力。說到算力,不少人提到,希望科技巨頭 DeepMind 也參與到這場行動中。不負眾望,DeepMind 其實早已開始行動,並於昨日公布了他們的最新成果。
在昨天發表的博客文章中,DeepMind 表示,他們用 AlohaFold 生成了六種可能與新冠病毒有關的蛋白質結構預測結果,而且已經開放下載。這一結果可能對新冠病毒疫苗研發等工作起到推動作用。

DeepMind 開放的新冠病毒蛋白質結構預測結果下載鏈接:https://storage.googleapis.com/deepmind-com-v3-datasets/alphafold-covid19/structures_4_3_2020.zip
為什麼要用深度學習預測新冠病毒蛋白結構?
蛋白質是維持生命所必需的大而複雜的分子。幾乎滲透到我們身體的每一個功能——收縮肌肉,感知光線,或將食物轉化為能量——都可以追溯到一種或多種蛋白質,以及它們是如何運動和變化的。
任何給定的蛋白質能做什麼取決於它獨特的 3D 結構。例如,構成我們免疫系統的抗體蛋白是「Y」形的。通過與病毒和細菌結合,抗體蛋白能夠檢測並標記致病微生物並進行消滅。
為了檢測病毒,開發疫苗,科學家必須首先理解病毒的機制,尤其是蛋白質結構。
然而,用傳統方法預測病毒蛋白質結構往往要花費數月時間,而且也不一定能獲得滿意的結果。對於來勢洶洶的新冠病毒疫情,幾個月的時間還是太長了。
深度學習系統的應用可以加快這一過程,其中最具代表性的要數 DeepMind 2018 年底推出的 AlphaFold 系統。
AlphaFold 為何被寄予厚望?
DeepMind 的人工智能 AlphaGo 在國際象棋、圍棋等遊戲項目中取得了令世人矚目的表現,但卻沒有止步於此。該公司還不斷地嘗試將人工智能應用於最具挑戰性的科學研究問題上,2018 年 12 月,DeepMind 推出了 Alphafold,它可以僅根據基因代碼預測蛋白質的 3D 結構。
在過去很多年時間裏,科學家已經能使用低溫電子顯微鏡和核磁共振等實驗技術確定蛋白質的形狀,但是每一種方法都依賴大量的試驗與誤差反饋,每種結構可能需要花費數萬美元、歷時數年進行研究。因此生物學家轉攻 AI 方法,以完成這一困難且單調的過程。
近年來,DeepMind 等科技公司越來越傾向於利用深度學習方法來解決基因組數據的預測問題,其中 Alphafold 就是成果之一。
在參加一年兩次的蛋白質摺疊奧運會 CASP 上,Alpafold 在預測蛋白質結構的物理性質上達到了高度的準確性,然後基於這些預測可以使用兩種不同的方法預測構建完整的蛋白質結構。
第一種方法建立在結構生物學的常用技術上,用新的蛋白質片段反覆替換蛋白質整體結構的某個部分。他們訓練了一個生成神經網絡來創造新的片段,這些片段被用來不斷提高蛋白質結構的評分。

先通過神經網絡預測氨基酸之間的距離和化學鍵角度,然後再根據兩種物理屬性對結構進行評分,最後通過梯度下降優化評分。
第二種方法是通過梯度下降來優化評分,得到的結構高度精確。梯度優化被用在整個蛋白質鏈,而不是組裝前必須單獨摺疊的片段,這種做法降低了預測過程的複雜性。
預測蛋白質摺疊形狀非常重要,對解決很多世紀難題有重大影響。DeepMind 一位發言人曾在接受採訪時表示,「公司的長期任務是推進人工智能研究的發展,並促使它們產生積極的效益。我們相信人工智能在促進科學發現方面具有巨大的潛力,我們對公司在蛋白質摺疊等領域產生的影響感到非常自豪。DeepMind 團隊將繼續取得巨大的進步,並將我們的專業技能和知識應用於現實世界的挑戰之中」。
此次。DeepMind 使用 Alphafold 來預測新冠病毒的蛋白質結構可以解讀為一種將技術「應用於現實世界」的體現。
預測結果僅供參考,還未通過實驗驗證
在最新的博客文章中,DeepMind 表示:「我們決定發佈幾種可能與新型冠狀病毒有關的病毒蛋白質結構,這幾種蛋白質結構還在進一步研究中。需要強調的是,這幾種結構預測尚未通過科學實驗的驗證,其準確性不能完全確定。」
通常,DeepMind 會在研究成果經過同行評審並正式發表在期刊之後,再進行官方發佈。這一次跳過常規步驟,先行公開結構預測結果,也是基於疫情的嚴峻形勢和時間敏感性做出的決定。
DeepMind 表示,這一結構預測系統仍在開發過程中。可以確定的是,最新系統比之前的 CASP 13 系統更準確。此次發佈的結果有助於科研界增進對病毒機制的了解,可為新冠肺炎的治療方案開發工作提供一個假設生成平台。
參考鏈接:https://deepmind.com/research/open-source/computational-predictions-of-protein-structures-associated-with-COVID-19