DeepMind新突破!首次用深度學習從第一性原理計算分子能量

  • 2020 年 10 月 24 日
  • AI

編譯 | 青暮

DeepMind發表了一項新研究,展示了深度學習如何幫助解決現實系統中的量子力學基本方程問題,相關論文發表在物理學期刊《Physical Review Research》,代碼也已經開源。
這種新的神經網絡架構叫做Fermionic神經網絡或FermiNet,該架構適合對大量電子集合體(化學鍵的基本組成部分)的量子態進行建模。
DeepMind表示,FermiNet是第一個利用深度學習來從第一性原理計算原子和分子能量的嘗試,並擁有足夠的精確度。
他們還計劃將FermiNet用於蛋白質摺疊、玻璃態動力學、晶格量子色動力學等研究項目,以將這一願景變為現實。
論文地址://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.2.033429
代碼地址://github.com/deepmind/ferminet

1

FermiNet

量子力學擁有大量的計算工具,但是構建有效的表示仍然是個難題。
即使是最近似的方法,量子化學計算最多只能求解包含數萬個電子的模型,而經典的(即非量子的)化學計算技術(例如分子動力學)可以處理數百萬個原子。
經典系統的狀態可以用很簡單的方式描述,只需要知道每個粒子的位置和動量。而表示量子系統的狀態則更具挑戰性,因為電子的位置是不確定的,必須給出其概率分佈。
波函數可用於編碼電子的位置分佈,並且波函數的平方給出了其概率值。要描述所有可能的位置,基本是不可能的。例如,假設有每個維度上具有100個點的網格,則硅原子的可能位置分佈數將大於宇宙中的原子數。
圖1:不同的原子軌道波函數圖像,表面代表出找到電子的高概率區域。在藍色區域,波函數為正,而在紫色區域,波函數為負。
這正是DeepMind認為深度神經網絡可以提供幫助的地方。
在過去的幾年中,神經網絡在表示複雜的高維概率分佈方面取得了巨大的進步。現在,神經網絡已經可以高效、可擴展地訓練。
DeepMind推測,鑒於神經網絡已經證明了在解決人工智能問題中擬合高維函數方面的能力,也許它們也可以用來表示量子波函數。
這個想法不是DeepMind第一個提出的,例如Giuseppe Carleo和Matthias Troyer等曾經在Science上發表論文「Solving the quantum many-body problem with artificial neural networks」,表明使用現代深度學習解決理想的量子問題是可行的。
如今,DeepMind想使用深度學習來解決化學和凝聚態物理中更實際的問題,這意味着在計算中會包括電子。
電子必須遵守泡利不相容原理,這意味着任意兩個電子不能同時處於相同的狀態。因為電子是費米子,費米子包括了質子、中子、夸克、中微子等,它們都遵守泡利不相容原理。交換兩個電子會使得總波函數乘以-1,如果兩個電子的波函數是全同的,則總波函數將為0。
這意味着我們必須開發一種其輸入是反對稱的新型神經網絡,DeepMind將其稱為Fermionic神經網絡或FermiNet。
在大多數量子化學方法中,使用行列式引入反對稱性。矩陣的行列式具有以下屬性:如果交換兩行,則輸出將乘以-1,就像費米子的波函數一樣。
因此,對於一系列單電子函數,可以將其轉換成一個矩陣。該矩陣的行列式就是適當的反對稱波函數。
這種方法的主要局限性在於所得到的函數(稱為Slater行列式)不是很通用。實際系統的波函數通常要複雜得多。
典型的改進方法是採用Slater行列式的大規模線性組合(有時甚至數百萬個),並基於電子對添加一些簡單的校正。即使那樣,這仍不足以精確地計算能量。
圖2:Slater行列式展示,每個曲線都是圖1中的某個軌道的波函數。當電子1和2交換位置時,Slater行列式的其中兩行交換,波函數乘以-1,從而保證遵守泡利不相容原理。
與基函數的線性組合相比,深度神經網絡在表示複雜函數上通常效率更高。
在FermiNet中,這是通過使行列式中的每個函數作為所有電子的函數來實現的,這遠遠超出僅使用單電子和雙電子函數的方法。
FermiNet對每個電子都有單獨的信息流。如果這些流之間沒有任何交互,網絡的表示能力將不會超過常規的Slater行列式。
為了解決這個問題,DeepMind將來自網絡每一層所有流的信息平均化,然後將此信息傳遞給下一層的每一流。
這樣,這些流具有正確的對稱性,從而可以創建反對稱函數。這類似於圖神經網絡在每一層匯總信息的方式。
與Slater行列式不同,FermiNets是通用函數逼近器(至少在神經網絡層變得足夠寬的極限內)。
這意味着,如果可以正確地訓練這些網絡,它們將能夠幾乎精確地擬合薛定諤方程的解。
圖3:FermiNets圖示。網絡函數的單個流(藍色、紫色或粉紅色)非常類似於常規軌道。FermiNets引入了流之間的對稱相互作用,使得波函數更具一般性和更具表達能力。就像常規的行列式一樣,將兩個電子位置交換仍將導致行列式交換兩個行,並將總波函數乘以-1。
我們通過最小化系統的能量來擬合FermiNet。為了精確地做到這一點,我們需要評估所有可能的電子構型下的波函數,因此不得不進行近似。
我們隨機選擇電子構型,在每個電子排列中局部地估計能量,將每個排列的貢獻相加,並將其(而不是真實能量)最小化。
這稱為蒙特卡洛方法,因為它有點像賭徒一遍又一遍地擲骰子。雖然是近似值,但如果我們需要使其更精確,則可以隨時再次擲骰子。
由於波函數平方代表可以觀察到的任何位置的粒子排列,因此最方便的是從波函數本身生成樣本(本質上是模擬觀察粒子的行為)。
雖然大多數神經網絡都是從一些外部數據中訓練出來的,但在DeepMind的這個案例中,用於訓練神經網絡的輸入是由神經網絡本身生成的。這意味着我們不需要任何訓練數據,除了電子在的原子核周圍的位置。
上述基本概念被稱為變分量子蒙特卡洛(variational quantum Monte Carlo,VMC),自20世紀60年代就出現了,通常被認為是一種廉價但不太精確的計算系統能量的方法。
通過用FermiNet替換基於Slater行列式的簡單波動函數,DeepMind極大地提高了該方法在多個系統上的精度。

圖4:從FermiNet採樣的模擬電子圍繞雙環戊烷分子的運動。
為了確保FermiNet確實代表了SOTA,DeepMind首先研究了簡單且經過充分研究的系統,例如元素周期表第一行(氫到氖)中的原子。這些系統很小(少於10個電子)且足夠簡單,可以用最準確的方法進行處理。
FermiNet的性能遠勝於對應的VMC計算(相對於指數縮放計算,通常可以將誤差減少一半或更多)。
在更大的系統上,指數縮放方法變得棘手,因此DeepMind將「耦合簇」方法用作基準。該方法對處於穩定構型的分子效果很好,但是當鍵被拉伸或斷裂時會很費力(這對於理解化學反應至關重要)。
儘管耦合聚類的縮放比指數縮放好得多,但它只能用於中等大小的分子。DeepMind將FermiNet逐漸應用於更大的分子,從氫化鋰開始,一直到雙環丁烷(它具有30個電子)。
在最小的分子上,FermiNet驚人地捕獲了耦合簇能量和單個Slater行列式獲得的能量之差的99.8%。在雙環丁烷上,FermiNet仍捕獲了97%或更多的相關能量。
圖5:FermiNet在分子上捕獲的相關能量的分數的圖示。紫色條表示99%的相關能量。從左至右:氫化鋰、氮、乙烯、臭氧、乙醇和雙環丁烷。
儘管耦合簇方法對於穩定的分子非常有效,但計算化學的真正前沿是理解分子如何拉伸、扭曲和斷裂。
在那裡,耦合簇方法經常會遇到困難,因此我們必須與儘可能多的基準進行比較,以確保獲得一致的答案。
DeepMind研究了兩個基準拉伸系統——氮分子(N2)和具有10個原子的氫鏈(H10)。氮是一個特別具有挑戰性的分子鍵,因為每個氮原子貢獻3個電子。同時,氫鏈對於了解電子在材料中的行為方式(例如預測材料是否會導電)很重要。
在這兩個系統上,耦合簇在平衡狀態下都表現良好,但是隨着鍵的拉伸,問題就出現了。常規的VMC計算結果總體而言效果不佳。但是,無論鍵長如何,FermiNet都是研究的最佳方法之一。

2

結論

DeepMind表示,FermiNet是深度學習與計算量子化學融合的偉大事物的開始。到目前為止,他們研究的大多數系統都經過了充分的研究和很好的理解。
DeepMind希望FermiNet將激發大量的擴展工作,並為新的甚至更好的網絡體系結構激發許多想法。
自從去年DeepMind首次將工作放到arXiv以來,其他小組已經分享了他們將深度學習應用於多電子問題的第一性原理計算的方法。DeepMind表示,他們期待將FermiNet應用於材料科學和凝聚態物理中的難題。
原文鏈接://www.deepmind.com/blog/article/FermiNet

[贈書福利]

在10月19日頭條《專訪吳軍:未來10年,AI的發展方向是應用,不會出現重大的理論突破留言區留言,談一談吳軍博士對你的啟示,或你對信息技術發展的理解。

AI 科技評論將會在留言區選出 10 名讀者,每人送出《信息傳》一本。

活動規則:

1. 在留言區留言,留言點贊最高的前 10 位讀者將獲得贈書。獲得贈書的讀者請聯繫 AI 科技評論客服(aitechreview)。

2. 留言內容會有篩選,例如「選我上去」等內容將不會被篩選,亦不會中獎。

3. 本活動時間為2020年10月19日 – 2020年10月23日(23:00),活動推送內僅允許中獎一次


NeurIPS 2020論文接收列表已出,歡迎大家投稿讓更多的人了解你們的工作~

點擊閱讀原文,直達NeurIPS小組~