Science重磅:DeepMind再獲突破,用AI開啟理解電子相互作用之路
大數據文摘轉載自學術頭條
作者:青蘋果
編輯:hs
排版:李雪薇
當電子問題遇到了神經網絡,會碰撞出什么樣的火花呢?
DeepMind 的最新研究向我們揭曉了答案??窃谧钚乱黄?Science 論文 Pushing the frontiers of density functionals by solving the fractional electron problem 顯示,神經網絡可以用來構建比以前更精確的電子密度和相互作用圖。
這一結果無疑會幫助科學家們更好地理解電子之間的相互作用,向著深入的研究進一步邁進,這也表明了深度學習(DL, Deep Learning)有望在量子力學水平上精確模擬物質——這可能使得研究人員在納米水平上探索關于材料、****物和催化劑的問題,從而改進計算機的設計。簡而言之,這是一次電子和分子的深度結合。
DFT 是什么?
這次研究涉及一個非常重要的理論——密度泛函理論(DFT, Density functional theory)。
早在 50 多年前,這個用來描述量子物質基本性質的理論首次建立,實現了在量子水平上描述物質,該方法將電子在給定原子組中的位置與原子共享的總能量相關聯,以確定分子的化學和物理特性。
作為人類智慧的結晶之一,很快地,它便成為物理、化學、材料科學等多個領域的強有力工具,是學習計算凝聚態(tài)物理/計算材料學/計算化學的必修基礎理論。
通俗來說,密度指的是電子數密度,泛函則表示能量是電子密度的函數,而電子密度又是空間坐標的函數。那么,函數的函數,便稱之為泛函(Functional)。也就是說,這是一種通過電子密度研究多電子體系電子結構的方法。
如果放到具體的操作中,DFT 可以通過各種各樣的近似,把難以解決的包含電子-電子相互作用的問題化繁為簡,變?yōu)闊o相互作用的問題,再將所有誤差單獨放進一項中(XC Potential),進而對誤差進行分析。
然而,困擾已久的問題是:電子密度和相互作用能之間映射的確切性質,即所謂的密度泛函(density functional),仍然是未知的。
傳統(tǒng)的 DFT 工具可以對具有一兩個電子的系統(tǒng)進行建模,但它們無法對具有 1.5 個電子的系統(tǒng)進行建模,而這在一個電子被多個原子之間共享的情況下是很重要的。
一方面,這種帶小數點的電子是虛構的物體,沒有這樣的電子,根據定義,電子是整體的,但是通過解決這些電子問題,我們能夠正確描述化學系統(tǒng)。
正因為如此,即使是最先進的 DFT 在描述分數電子電荷(fractional electron charges)和自旋(spins)時,也會受到基本的系統(tǒng)誤差的困擾。
“功力強大”的 DM21 框架
DeepMind 的神經網絡可以用于構建比先前更精確的電子密度和相互作用圖,擺脫了此前的諸多限制。
作為 DeepMind 的研究科學家,James Kirkpatrick 和他的同事使用 DeepMind 平臺開發(fā)了“DM21”(DeepMind 2021)框架,可以利用精確的化學數據和分數電荷約束來訓練神經網絡。
根據研究報告,DM21 能夠避免兩個重要的系統(tǒng)誤差(離域誤差和自旋對稱性)的破壞,從而學習泛函,更好地描述廣泛的化學反應類別。
研究人員用 2235 個化學反應示例訓練了他們的人工智能,并提供了有關所涉及的電子和系統(tǒng)能量的信息。其中,1074 個代表了分數電子會對傳統(tǒng) DFT 分析造成問題的系統(tǒng)。
然后,他們將人工智能應用于未包含在訓練數據中的化學反應。
DeepMind 21 不僅正確地表示了分數電子,而且其結果比傳統(tǒng)的 DFT 分析更精確。它甚至可以處理關于具有奇怪屬性的原子的數據,這些數據與訓練數據中的任何東西都不相似。
DM21 正確描述了人工電荷離域和強相關性的典例,并且在主族(main-group)原子和分子的全面基準評估上優(yōu)于傳統(tǒng)泛函。此外,DM21 可以準確地模擬復雜系統(tǒng),如氫鍵鏈(hydrogen chains)、帶電荷 DNA 堿基對和雙自由基體系的過渡態(tài)。
更為關鍵的是,該研究中的方案依賴于不斷改進的數據和約束,因此,它代表著一條通向泛函的可行途徑。
DM21 之所以極大地提高了性能,因為它服從兩類分數電荷系統(tǒng)的約束:
1)具有非整數總電荷的分數電荷(FC, Fractional Charge)系統(tǒng);
2)具有非整數自旋磁化的分數自旋(FS, Fractional Spin)系統(tǒng)。
盡管 FC 和 FS 系統(tǒng)是虛構的,但實際電荷密度可以包括具有 FC 或 FS 特性的區(qū)域,因此,正確建模這些理想化問題有助于確保泛函在各種分子和材料中的正確表現。
實驗結果顯示,在 55 個不同熱化學分子性質、大而多樣的數據集上,DM21 的加權絕對誤差為 4 kcal/mol。
這個非常小的誤差與大多數泛函誤差相比,是由大量精心選擇的成分和擬合的分子數據造成的。無論是否包含分數電荷和自旋數據,誤差本質上是相同的。然而,這些數據的加入提高了 DM21 在電荷轉移和強相關性問題上的性能。
DM21可以與強約束和適當賦范泛函(SCAN, Strongly Constrained and Appropriately Normed)進行比較,該泛函是通過假設方程滿足 17 個精確約束,但不滿足分數電荷和自旋約束而創(chuàng)建的。SCAN 產生的誤差為 8 kcal/mol。然而,當 SCAN 進行密度校正時,該誤差降低到 6 kcal/mol。這說明,密度校正可以消除 SCAN 的電荷轉移誤差。
Jon Perdew 在相關觀點中寫道:“由 Kirkpatrick 等人開發(fā)的 DM21 的重要性,并不在于產生了最終密度泛函,而是用一種 AI 方法解決了分數電子和自旋問題,該問題一直無法通過直接解析方法來創(chuàng)建泛函?!?/p>
整個研究工作表明,通過結合約束滿足和 AI 擬合大而多樣的數據集,可以設計出更具有預測性的精確密度函數。
DeepMind 演示了神經網絡如何提高密度泛函的近似值,有力地顯示了 DL 在量子力學水平上精確模擬物質的前景。此外,DeepMind 還開源了代碼,為研究者提供了探索研究的基礎。
對于這一成果,James Kirkpatrick 表示:“了解微觀尺度現象對于幫助我們應對 21 世紀的一些重大挑戰(zhàn),從清潔電力到塑料污染,正變得越來越重要……這項研究朝著正確方向邁出的關鍵一步,使我們能夠更好地理解電子之間的相互作用,而電子就是將分子粘在一起的‘膠水’。”
從短期來看,這將使研究人員能夠通過代碼的可用性,獲得一個改進的精確密度函數的近似值;從長遠來看,這是 DL 在量子力學水平上精確模擬物質的更進一步——這可能使研究人員能夠在納米水平上探索材料、****物和催化劑的問題,從而在計算機上實現材料設計。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
pa相關文章:pa是什么
電荷放大器相關文章:電荷放大器原理