訂閱
糾錯
加入自媒體

AI再一次“擊敗了”人類,自學(xué)習(xí)AI算法發(fā)現(xiàn)高性能材料

每當(dāng)看到 AI 這個詞,你腦海中是否會浮現(xiàn)出超級智能計算機(jī)?或者想到不需要人類輔助即可執(zhí)行任務(wù)的機(jī)器人?或許,這些夢想并不遙遠(yuǎn)。

近年來,機(jī)器學(xué)習(xí)在化學(xué)領(lǐng)域的應(yīng)用正以驚人的速度增長,在材料性能預(yù)測、新材料探索與設(shè)計等領(lǐng)域也取得了很大進(jìn)展。但是,機(jī)器學(xué)習(xí)與實驗過程的直接耦合還存在巨大的挑戰(zhàn)。

近日,一個包括美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)在內(nèi)的多機(jī)構(gòu)研究團(tuán)隊在 AI 研究領(lǐng)域取得了又一項重要研究成果:他們開發(fā)出了一種名為 CAMEO 的 AI 算法,該算法在不需要科學(xué)家額外訓(xùn)練的情況下,自主發(fā)現(xiàn)了一種潛在的實用新材料。利用 CAMEO 算法實現(xiàn)的 AI 系統(tǒng),可以有效地減少科學(xué)家在實驗室中花費(fèi)的“反復(fù)”實驗時間,同時最大限度地提高科研效率。

該研究成果以“ On-the-fly closed-loop materials discovery via Bayesian active learning ”為題,于 11 月 24 日在線發(fā)表在科學(xué)期刊《自然-通訊》(Nature Communications)上。

(來源:Nature Communications)

對此,論文作者之一、NIST 研究員 Aaron Gilad Kusne 表示,在材料科學(xué)領(lǐng)域,科學(xué)家們一直以來都在不斷尋求可用于特定應(yīng)用場合的新材料,比如 “一種可用于制造汽車的輕巧堅固金屬,或者可承受噴氣發(fā)動機(jī)的高應(yīng)力和高溫環(huán)境的材料”。

幫助解決科研痛點

新材料的發(fā)現(xiàn)是推動現(xiàn)代科學(xué)發(fā)展與技術(shù)革新的源動力之一,而傳統(tǒng)的材料研發(fā)需要進(jìn)行大量的試驗,效率低且成本高——要想尋找這樣的新材料,不僅需要研究人員進(jìn)行大量的實驗,還需要耗費(fèi)大量的時間去做理論調(diào)查。

如果一個研究人員想要分析一種材料在不同溫度下的特性,那么他可能需要在各種不同溫度下進(jìn)行 N 次試驗。然而,溫度只是材料的一個指標(biāo)之一,如果在一項實驗中有 5 個指標(biāo)要分析,每個指標(biāo)又有 10 個值,那就意味著該研究人員必須進(jìn)行 10^5 次試驗。

Kusne 表示,對于試驗次數(shù)如此多的實驗,研究人員可能會花費(fèi)幾年甚至幾十年的時間,所以,這樣的實驗,幾乎不可能進(jìn)行。

CAMEO 算法的“用武之地”正在于此,CAMEO 可以跳過那些會提供冗余信息的實驗,確保每個實驗都可以最大限度地幫助科學(xué)家獲取知識和見解,提升他們的理解能力。通過節(jié)省實驗時間,可以有效幫助科學(xué)家更快實現(xiàn)其目標(biāo),也使實驗室的有限資源能夠得到更有效地利用。

那么,CAMEO 算法如何實現(xiàn)這一點?

CAMEO 是基于機(jī)器學(xué)習(xí)的一個自學(xué)習(xí) AI 算法,為材料研究領(lǐng)域的探索提供了一種全新的范式。CAMEO 通過閉環(huán)操作來尋找有用的新材料,首先從數(shù)據(jù)庫中加載材料數(shù)據(jù),然后通過貝葉斯機(jī)器學(xué)習(xí)對數(shù)據(jù)進(jìn)行分析,預(yù)測未知材料的結(jié)構(gòu)和功能特性,并通過主動學(xué)習(xí)來確定下一步要研究的最有價值的材料。在進(jìn)行下一輪實驗之前,CAMEO 還可以要求科學(xué)家根據(jù)過去所執(zhí)行的實驗經(jīng)驗,提供材料的晶體結(jié)構(gòu)等信息。

論文作者之一、馬里蘭大學(xué)材料科學(xué)與工程教授 Ichiro Takeuchi 表示:“實驗的關(guān)鍵在于,我們能夠在一個由多種材料構(gòu)成的組合庫中啟動(unleash)CAMEO 算法!

在通常的組合研究中,陣列中的每一種材料都會被依次測量,以尋找具有最佳性能的化合物。即使使用快速的測量設(shè)置,也需要花費(fèi)很長時間。而有了 CAMEO 算法,僅需很少量的常規(guī)測量就可以找到最佳材料。

圖 | CAMEO 在一個閉環(huán)操作中尋找新材料的過程(來源:NIST)

該 AI 算法還被設(shè)計成包含關(guān)鍵原理的知識,包括過去的模擬和實驗室實驗的知識、設(shè)備的工作原理以及物理概念。例如,研究人員使 CAMEO 掌握了相位圖知識,相位圖描述了材料中原子的排列如何隨化學(xué)成分和溫度的變化而變化。而理解原子在材料中的排列方式對于確定材料的特性至關(guān)重要,根據(jù)排列方式可以確定材料的硬度、電絕緣性,以及材料的應(yīng)用場合。

Kusne 說:“CAMEO 算法是無監(jiān)督的,許多類型的 AI 算法都需要進(jìn)行訓(xùn)練或監(jiān)督,我們不要求它學(xué)習(xí)物理規(guī)律,而是將它們編碼到 AI 中。這樣一來,就不需要人類再去訓(xùn)練 AI 模型!

了解材料結(jié)構(gòu)的最佳方法之一是 X 射線衍射法,即使用 X 射線轟擊材料。通過識別 X 射線反射的角度,科學(xué)家可以確定原子在材料中的排列方式,從而使他們能夠確定其晶體結(jié)構(gòu)。然而,一次內(nèi)部 X 射線衍射實驗可能需要一個小時或更長時間。在斯坦福同步輻射光源(SSRL)進(jìn)行的實驗中,由于快速移動的粒子會發(fā)射大量的 X 射線,一臺足球場大小的大型機(jī)器以接近光速的速度加速帶電粒子,整個過程可能需要 10 秒鐘。

(來源:Nature Communications)

CAMEO 算法安裝在一臺計算機(jī)上,通過數(shù)據(jù)網(wǎng)絡(luò)與 X 射線衍射設(shè)備相連接,通過確定 X 射線反射的角度,科學(xué)家們可以確定原子在材料中的排列方式,從而弄清楚材料的晶體結(jié)構(gòu)。在每次進(jìn)行新的迭代時,CAMEO 都會從過去的測量中學(xué)習(xí)并確定下一個要研究的材料。這使得 AI 可以探索材料的成分如何影響其結(jié)構(gòu),并確定完成任務(wù)的最佳材料。

Kusne 說:“把這個過程想象成制作一份完美的蛋糕,你正在混合各種類型的材料(比如,面粉、雞蛋或黃油),通過使用各種配方來制作最好的蛋糕! 而借助人工智能,則可以搜索制作 “配方” 或?qū)嶒灹鞒?來確定材料的最佳成分。如此一來,便節(jié)省了大量的實驗時間。

自主發(fā)現(xiàn),性能更優(yōu)

CAMEO 就是使用這種方法發(fā)現(xiàn)了 GST467 材料。

CAMEO 通過給定的 177 種潛在的材料進(jìn)行研究,這些材料涵蓋了大范圍的組成配方。為了獲得這種材料,CAMEO 耗時 10 小時完成了 19 個不同的實驗,相比之下,一個科學(xué)家大約需要 90 個小時才能完成同樣多的實驗。

圖 | GST467 的發(fā)現(xiàn)過程(圖片來源:nature communications)

CAMEO 發(fā)現(xiàn)的新材料 GST467 由三種不同的元素(鍺、銻、碲,Te-Ge-Sb)組成,是一種相變存儲材料,即當(dāng)它受熱迅速熔化時,其原子結(jié)構(gòu)會從晶態(tài)(原子在指定的、有規(guī)律的位置上的固體材料)變?yōu)榉蔷B(tài)(原子在隨機(jī)位置上的固體材料)。這種相變存儲材料被用于數(shù)據(jù)存儲等電子存儲應(yīng)用程序。

圖 | GST467 的納米結(jié)構(gòu)和器件性能(圖片來源:nature communications)

雖然 Ge-Sb-Te 合金系統(tǒng)中可能存在無限種成分變化,但 GST467 是適合相變應(yīng)用的最佳材料。研究人員希望 CAMEO 算法能找到最佳組合的 Ge-Sb-Te 合金,以滿足在晶態(tài)和非晶態(tài)之間的 “光學(xué)對比度” 差異最大的特性。

例如,在 DVD 或藍(lán)光光盤上,光學(xué)對比度允許掃描激光通過區(qū)分高反射率或低反射率的區(qū)域來讀取光盤。研究人員發(fā)現(xiàn),GST467 的光學(xué)對比度是 DVD 常用的材料 GST225 的兩倍,較大的對比優(yōu)勢也使其表現(xiàn)出了明顯優(yōu)于傳統(tǒng)材料的特性。

GST467 還可應(yīng)用于用于控制電路中光的方向的光子開關(guān)器件,還可以應(yīng)用于神經(jīng)形態(tài)計算(旨在開發(fā)模擬大腦神經(jīng)元結(jié)構(gòu)和功能的設(shè)備,為新型計算機(jī)的出現(xiàn)以及從復(fù)雜圖像中提取有用數(shù)據(jù)等其他應(yīng)用提供可能)。

遠(yuǎn)程科研或成現(xiàn)實

研究人員認(rèn)為,不只是 GST467,CAMEO 還可以發(fā)現(xiàn)許多其他材料。如今,他們已經(jīng)將 CAMEO 的代碼開源,免費(fèi)提供給科學(xué)家和研究人員使用。

與類似的機(jī)器學(xué)習(xí)方法不同,CAMEO 算法不是對大量數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)和預(yù)測,而是通過關(guān)注晶體材料的成分、結(jié)構(gòu)和性質(zhì)之間的關(guān)系,追蹤材料相應(yīng)功能的結(jié)構(gòu)來源,引導(dǎo)系統(tǒng)發(fā)現(xiàn)有用的新化合物。

CAMEO 的一個好處是最大限度地降低了成本,因為在同步加速器設(shè)施中進(jìn)行實驗是需要花費(fèi)時間和金錢的。研究人員估計,使用 CAMEO 可以將實驗數(shù)量減少十分之一,相應(yīng)地可以將實驗時間縮短十倍。由于人工智能正在運(yùn)行測量數(shù)據(jù)、收集數(shù)據(jù),分析數(shù)據(jù)的過程,這也大大降低了研究人員進(jìn)行實驗所需的知識量,他們只需關(guān)注正在運(yùn)行的 AI 系統(tǒng)。

CAMEO 的另一個好處是為科學(xué)家提供了遠(yuǎn)程工作的能力。SLAC 美國國家加速器實驗室的研究員 Apurva Mehta 說:“這掀起了一波科研熱潮,科學(xué)家不需要在實驗室中,就可以繼續(xù)工作和生產(chǎn)。” 這可能意味著,如果科學(xué)家們可以依靠人工智能在實驗室進(jìn)行實驗,更加安全地遠(yuǎn)程從事傳染性疾病或病毒的研究。

研究人員表示,他們將繼續(xù)改進(jìn)這一 AI 算法,并嘗試使該算法可以解決更復(fù)雜的問題。Kusne 說:“CAMEO 擁有機(jī)器人科學(xué)家的智慧,它的構(gòu)建,是為了以一種非常高效的方式,來設(shè)計、運(yùn)行和學(xué)習(xí)實驗!

圖片標(biāo)題



聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯
x
*文字標(biāo)題:
*糾錯內(nèi)容:
聯(lián)系郵箱:
*驗 證 碼:

粵公網(wǎng)安備 44030502002758號