用神經網路求解薛定諤方程,DeepMind開啟量子化學新道路

  • 2019 年 10 月 5 日
  • 筆記

選自i-programmer

作者:Lucy Black

機器之心編譯

參與:熊貓、一鳴

神經網路因其強大的近似擬合能力,被廣泛應用在各種各樣的領域。現在,量子化學也在逐漸使用神經網路進行相關的工作了。近日,DeepMind 的科學家開發了一種新的神經網路架構,可以用於近似計算薛定諤方程。這為深度學習在量子化學領域的發展奠定了基礎。

論文地址:https://arxiv.org/abs/1909.02487

神經網路已知最好的應用是在人工智慧領域——視覺、語音和遊戲,但它們在科學和工程領域也有嚴肅的應用。Google的 DeepMind 已經訓練出了一個能求解薛定諤方程的神經網路。

為什麼要計算薛定諤方程呢?這是因為求解薛定諤方程可以為化學反應提供線索。化學反應的結果基本上與電子以及它們環繞原子和分子的方式有關。而控制事物反應的能量以及電子在分子中的軌道的差異決定了化學物質的形狀,也由此決定了其性質。計算這一能量的方式就是求解薛定諤方程。換句話說,求解出薛定諤方程,就可以知道化學反應的結果。

原理上看,化學很簡單。如果給定多電子薛定諤方程的準確解,幾乎所有的化學反應都可以通過第一原理推導出來。只需要寫下反應的薛定諤方程並求解它即可。但在實踐中,這幾乎是不可能的,因為多體薛定諤方程很難求解。相關化學系統的精準的波函數是遙不可及的,因為通常而言它們的計算是 NP-hard 問題,只能使用多項式縮放(polynomially-scaling)演算法找到近似。事實上,我們目前可以真正求解的原子只有氫原子——帶有一個質子和一個電子。其它所有原子都是通過被稱為擾動技術(perturbation techniques)來近似求解的。至於分子,我們實際上還在起點上,量子化學家已經耗費了幾十年時間試圖實現完美的近似——能夠快速地計算出準確的結果。儘管進展很不錯,但很多實際的計算仍然難以實現,在這些情況下,化學又會回頭依賴猜測和直覺。

在求解近似上,很多這類演算法都面臨著一個關鍵難題,即波函數近似的選擇(即擬設「ansatz」),這必須考慮效率與準確度的權衡。因為神經網路的擬合能力,其在用作準確的實用型函數近似器方面表現出色,並有望用作自旋系統的緊湊型波函數擬設器。

DeepMind 的研究者引入了一種全新的深度學習架構——費米子神經網路(費米子神經網路),這是一種用於多電子系統的強大的波函數擬設器。在多種不同的原子和小分子上,這種費米子神經網路的準確度能超過其它變分式蒙特卡洛擬設器。這種神經網路使用的數據只有原子的位置和電荷,就能預測出氮分子和氫鏈的解離曲線(dissociation curve)——這兩者是很有難度的強關聯繫統。相比於之前被廣泛視為量子化學的黃金標準的耦合聚類方法,這種新方法得到的準確度顯著更高。這表明,深度神經網路的表現可以超過已有的從頭開始式(ab-initio)量子化學方法,為之前難以處理的分子和固體的波函數的準確直接優化提供了新的可能性。

之所以能夠用深度學習去計算是因為,神經網路可以被視為一種函數近似方法。也就是說,如果為神經網路提供所要學習的函數,它就能學習近似它。提供輸入 x,然後訓練它得到 f(x),其中這裡的 x 代表許多不同的變數。其思想是,它能學習得到 f(x) 的已知值,即你提供的作為訓練集的那些值,但它也能在你提供了從未見過的 x 時給出很好的結果。

神經網路能很好地泛化。這就意味著當它們經過了識別貓的訓練之後,還能識別出未在訓練集中出現的不同的貓。在 AI 應用中,這是很合理的:網路以某種方式提取出了「貓」的本質屬性,現在可以泛化使用它們。在更抽象的函數近似中,想像方程中的「貓」會更為困難。在這裡,DeepMind 的網路似乎確實提取出了薛定諤函數中的貓。

圖 1:費米子神經網路(Fermi Net)。上圖:全局架構。一個或兩個電子位置的特徵是該網路的不同串流的輸入。這些特徵經過幾層的變換,再應用一個行列式,然後在那個位置的波函數就作為輸出。下圖:單一一層的細節。網路將具有同樣自旋的電子的特徵放到一起求平均,然後將這些特徵連接起來,為每層構建一個電子位置的等變函數。

這個神經網路實際上做的事情是找到一個滿足費米-狄拉克統計的近似多電子波函數,即這個波函數是反對稱的。所需的一切只不過是初始的電子配置(比如電子數量),然後這個神經網路就會為任意配置輸出波函數。這個網路的訓練目標是通過最小化器能量狀態,找到基態波函數的近似。按照定義,基態是指能量最低的狀態,網路會修改其參數直到它達到最小值。

正如論文中說的那樣:

「這裡我們引入一種全新的深度學習架構——費米子神經網路,並將其作為多電子系統的強大的波函數擬設器。在多種不同的原子和小分子,費米子神經網路的準確度能超過其它變分式蒙特卡洛擬設器。僅使用原子的位置和電荷數據,我們就能預測出氮分子和氫鏈的解離曲線——這兩者是很有難度的強關聯繫統。相比於之前被廣泛視為量子化學的黃金標準的耦合聚類方法,這種新方法得到的準確度顯著更高。

對於算力方面,論文表示:

「Fermi Net 的所有程式碼都是用 TensorFlow 實現的,每個實驗都在 8 個 V100 GPU 上以並行的方式運行。使用更小的批大小,我們可以在單個 GPU 上訓練,但收斂速度顯著更慢。比如,乙烯在使用 8 個 GPU 訓練 2 天后收斂,而在單個 GPU 上需要幾周時間。」

該網路有大約 70000 個參數,只訓練一次,之後它似乎就能找到能為所預測的性質給出優良結果的近似波函數。重要的是,具有一個訓練參數集的單個網路架構可以在檢查過的每個系統上取得較高的準確度。說明該神經網路具有很好的泛化能力。

正如該論文總結的那樣:「這有潛力讓量子化學的發展速度達到深度學習在其它許多人工智慧領域推動進步的速度。

參考鏈接:

https://www.i-programmer.info/news/105-artificial-intelligence/13072-deepmind-solves-quantum-chemistry.html

本文為機器之心編譯,轉載請聯繫本公眾號獲得授權。