“文獻進,產(chǎn)物出” AI 化學家引領化學數(shù)字化發(fā)展
一直以來,化學家在科研過程中需要面對十分復雜的物質(zhì)體系和實驗過程,常常為了一個實驗結果要進行不計其數(shù)的實驗。
近年來,自動化在化學領域的應用在一定程度上幫助化學家簡化了繁復的實驗研究,尤其是隨著人工智能的發(fā)展,基于機器學習的 “AI化學家” 更是提升了實驗的效率和準確性,在化學研究領域釋放出更多紅利。
如今,來自英國格拉斯哥大學(University of Glasgow)Cronin 實驗室的化學家們在自動化化學合成領域取得了開拓性成果——他們開發(fā)了一個軟件,可以將學術論文轉(zhuǎn)化為可執(zhí)行的程序,即實現(xiàn)了“文獻進,產(chǎn)物出(Paper in, product out)”的過程,且研究人員無需學習代碼就可以編輯。
相關工作以 “A universal system for digitization and automatic execution of the chemical synthesis literature” 為題,在線發(fā)表在頂級科學期刊《科學》(Science)上。
圖 | Science 發(fā)表相關論文(來源:Science)
“文獻進,產(chǎn)物出” AI 化學家引領化學數(shù)字化發(fā)展
早在 2018 年底,Cronin 團隊就研發(fā)了一個名為 “chemputer” 的化學計算機,該系統(tǒng)由試管、燒瓶、輸送化學物質(zhì)的管道、閥門和泵等傳統(tǒng)化學實驗器皿組成,通過系統(tǒng)上運行的一套由化學描述語言(XDL,其中 “X” 的發(fā)音是 “kai”,取自希臘語中化學的第一個字母)編寫的程序,來控制化學分子的合成。去年,Cronin 團隊展示了該計算機可以生產(chǎn)多個分子的能力。如今,他們利用機器編程的便捷方式,再次向化學數(shù)字化領域邁出了重要一步。
這項工作的核心在于化學描述語言。對于該計算機而言,化學描述語言就像 HTML 對于瀏覽器一樣,它告訴機器該做什么。
圖 | 用化學描述語言 XDL 編寫程序(來源:The Cronin Group 官網(wǎng))
該系統(tǒng)創(chuàng)建了一個名為 SynthReader 的軟件,它可以掃描經(jīng)同行評審的文獻中的化學配方,比如生產(chǎn)瑞德西韋的 6 個步驟,并使用自然語言處理來挑選出“添加”、“攪拌”或“加熱”等動詞、“逐滴式”等修飾符,以及持續(xù)時間和溫度等一些其他細節(jié),然后系統(tǒng)將這些指令轉(zhuǎn)換為化學描述語言,通過執(zhí)行語言命令來驅(qū)動化學機器人在實驗室完成化合物的全自動合成。
近期剛被美國食品藥品監(jiān)督管理局(FDA)批準可用于治療新冠住院患者的藥物瑞德西韋試驗就在這臺 chemputer 上高速運行著。前幾日,制造瑞德西韋藥物的吉利德公司宣布,他們將在 10 月底前滿足全球?qū)τ谌鸬挛黜f的需求,由此可見其生產(chǎn)效率之高。
論文作者之一 Cronin 介紹,該框架的優(yōu)勢之一在于化學家們可以用純英文編輯化學方案,因此無需培訓即可操作,還有至關重要的一點是,他們還可以利用化學專業(yè)知識來發(fā)現(xiàn)代碼中的錯誤。
研究人員表示,他們從化學的相關文獻中提取了 12 種示范配方,其中包括麻醉劑利多卡因、Dess-Martin 高碘烷氧化劑和氟化劑 AlkylFluor。經(jīng)測試,所有這些配方都是由 chemputer 以類似于人類化學家的效率進行操作的。
Cronin 表示:“如果我們有標準的方法來發(fā)現(xiàn)分子、制造分子,然后生產(chǎn)化學物質(zhì),突然間沒有什么東西會被淘汰,這就像化學的電子書閱讀器。”
多年來,Cronin 一直夢想著未來研究人員可以像發(fā)送電子郵件和打印 PDF 文件一樣,輕松地分發(fā)和生產(chǎn)分子,從而使無法訂購藥物變得像無法找到現(xiàn)代文本一樣古老。
如今,越來越多的科研團隊都在競相將化學技術帶入數(shù)字時代,Cronin 團隊僅代表了跨越學術界和工業(yè)界的數(shù)十個小組之一,此次研究成果或?qū)⒁I更安全的藥物生產(chǎn)、更高效的太陽能電池板,以及更具顛覆性的新型產(chǎn)業(yè)。
化學機器人推動制藥公司數(shù)字化轉(zhuǎn)型
如今,Cronin 創(chuàng)立了一家名為 Chemify 的公司,來銷售化學機器人 chemputer 和對應的 XDL 軟件包,他也在網(wǎng)上免費發(fā)布了用于機器的搭建和編程的程序包。chemputer 已經(jīng)在化學界取得了一定的進展,該團隊于去年 5 月在制藥公司葛蘭素史克(GSK )安裝了一臺原型機。
葛蘭素史克高級副總裁兼人工智能和機器學習全球負責人 Kim Branson 博士表示:“chemputer 這一概念的產(chǎn)生,以及 Cronin 團隊圍繞化學機器人所做的工作的確具有很大的變革性。”
眾所周知,葛蘭素史克是一家以研發(fā)為基礎的藥品和保健品公司,其產(chǎn)品遍及全球市場。目前,該公司正在探索各種自動化技術,以提高生產(chǎn)效率。Branson 表示,Cronin 團隊正在進行的這項研究工作,可能會讓葛蘭素史克在公司內(nèi)部更加方便地“傳輸專業(yè)知識”。一旦化學家設計出了一個有前景的分子配方,他們就不用再去寫報告或給同事講解,而是直接一鍵 “分享” 配方。
研究人員表示,盡管 Chemify 不是最復雜的自動化化學平臺,但它可能卻是最易于訪問的平臺。它是基于燒杯和試管這些傳統(tǒng)工具建立起來的,并在化學家們使用了幾個世紀的 “批量” 模式中逐步發(fā)揮作用。
如今,Cronin 團隊正在研究它的通用性(即與任何批處理化學機器人兼容),研究人員只需要告訴軟件他們有哪些零件,并給它一些相應的溫度等數(shù)字,就可以讓機器運行。
AutoSyn 自動化學系統(tǒng)
此外,還有很多其他研究團體也在做一些打破傳統(tǒng)化學領域認知的研究。
SRI International 公司 SRI Biosciences 部門的首席戰(zhàn)略官 Nathan Collins 說:“與我們過去 200 年間所采用的的工作方式相比,大多數(shù)化學過程沒有什么變化,都是一種純手工的、靠工匠驅(qū)動的過程,這一領域還有數(shù)十億美元的機會等待挖掘!
今年 6 月,Collins 和他的同事們發(fā)表了一篇題為 “Fully Automated Chemical Synthesis: Toward the Universal Synthesizer” 的研究論文,描述了一種自動化多步化學合成儀 AutoSyn 進行藥物合成的研究。
圖 | AutoSyn的俯視圖
圖 | AutoSyn流動化學平臺中使用的單元操作模塊(UOM)的順序示意圖
圖 | 多步驟化學合成自動化
AutoSyn 平臺使用一種“流動”化學的方法,來替代傳統(tǒng)的物質(zhì)混合方法。
以往,物質(zhì)的混合首先需要將它們在一個燒杯中混合,然后再倒入另一個燒瓶,而 AutoSyn 平臺的物質(zhì)混合過程則是當化學物質(zhì)流經(jīng)管子的時候,在這個動態(tài)過程中實現(xiàn)連續(xù)的化學反應。
AutoSyn 平臺具備 3000 多種合成途徑,可在幾小時內(nèi)實現(xiàn)毫克級甚至是克級的任何藥物小分子的合成,幾乎可以復制所有類型的液體之間的反應。
Collins 說:“在流體中進行化學反應不僅需要專門的硬件,還需要一些額外的努力,才能從其批次說明中翻譯化學程序,從而實現(xiàn)傳熱和混合等方面的‘精妙’控制。如果像 AutoSyn 這樣的平臺可以針對已公開的反應自動運行數(shù)百種細微的變化,那么它們生成的詳細數(shù)據(jù)集可能會突出顯示制造化學物質(zhì)的最佳方法!
這項工作可能是一個很好的起點,但許多已發(fā)表的實驗都存在缺陷。據(jù) Collins 估計,化學家們會花費 30%-70% 的時間來解決已知反應中遺漏的細節(jié)!斑M行一個化學反應,是需要研究人員根據(jù)之前的實驗記錄,坐下來逐步操作的! Collins 說。
盡管 AutoSyn 和 chemputer 都能復制如今大部分已發(fā)布的反應,但他們下一步需要讓機器變得更可靠,就像 Cronin 所說的那樣 “讓 Apple 變得時髦”。
Collins 說,我們過去需要一名工程師來維持 AutoSyn 一半以上的運行,但現(xiàn)在所需的修復時間不到 10%。他希望,最終可能實現(xiàn)用戶只通過電話就可以對系統(tǒng)進行故障排除。
Collins 表示:“這仍然是一門非常新的科學。過去 18 個月,它才開始真正爆發(fā)。”
Make-It
美國國防高級研究計劃局(DARPA)在推動這一科學發(fā)展的過程中發(fā)揮了重要作用,DARPA 剛結束了一項為期 4 年的 Make-It 項目,該項目的重點研究領域包括自動化分子設計、自動合成(生產(chǎn))和快速反應篩選,在全自動快速分子生產(chǎn)領域取得重大進展。chemputer 和 AutoSyn 都是它的原型。
在過去,化學家們辛辛苦苦地將原子精加工成新穎的分子結構,需要一個漫長的等待過程。Make-It 項目的經(jīng)理 Anne Fischer 的一個長期目標就是加快發(fā)現(xiàn)有用分子的過程,她說:“制造和測試分子始終是一個緩慢的步驟!
但現(xiàn)在,Make-It 已經(jīng)生產(chǎn)了 chemputer、AutoSyn 等制造分子的機器人工具,Fischer 正在指導一個新的 DARPA 項目“加速分子發(fā)現(xiàn)(Accelerated Molecular Discovery)”,該項目著眼于開發(fā)更智能的軟件,來告訴機器人要制造什么分子,以及如何制造。
Fischer 說:“我們現(xiàn)在正在嘗試擴展 Make-It 項目所做的工作,這樣我們就可以逐步教計算機去發(fā)現(xiàn)新的分子!
許多人認為,我們實現(xiàn)這一過程的秘密武器是機器學習,其實一些能夠進行初級化學學習的機器還在研發(fā)中。
自動流動化學系統(tǒng)的持續(xù)改進
麻省理工學院的化學家 Connor Coley 所在的團隊去年將自動流動化學系統(tǒng)融合了一種算法,以對其進行指導。該算法在數(shù)十萬個反應的數(shù)據(jù)庫上進行了訓練,能夠預測新產(chǎn)品的配方。Coley 說:“基于這些模式,該系統(tǒng)試圖了解什么樣的轉(zhuǎn)化方式應該適用于從未見過的新分子合成”。
Coley 還強調(diào),該系統(tǒng)還有很長的路要走。它是基于相似的分子進行預測,而人類化學家還需要補充機器生成的輪廓中所缺失的細節(jié)。盡管如此,這項工作還是支持了軟件可以提出有用配方的概念。
麻省理工學院正在與十多家化學和制藥公司合作,以改進其分子預測算法,并且一些公司已經(jīng)將該軟件投入使用。默克公司(Merck)計算和結構化學助理副總裁 Juan Alvarez 表示,Coley 的機器學習算法是該公司向其內(nèi)部研究人員提供的多種化學預測工具之一。他說:“它的部署絕對會影響我們今天的時間表。”
雖然每個研究團隊都從不同角度探究自動化,但他們都在解決同一個問題。存在著近乎無限多種的分子,其中某些必定是可以拯救生命的藥物,或者是一些革命性的新材料,但很少有人擁有這方面的專業(yè)技能,來對這些化合物進行分析、制造和測試。
而這些化學自動化研究團隊的目標就是避免浪費那些稀有技能。
在某些方面,化學家的工作仍然類似于抄寫員的工作,他們曾經(jīng)費盡心思地復制和修正他人的著作。像 Cronin 這樣的研究人員,就是希望借助相當于印刷機、文字處理器和自動更正機的化學制劑在手,未來的化學家們將花費更少的時間進行重復創(chuàng)作,轉(zhuǎn)而花費更多的時間進行新的創(chuàng)作。
Fischer 說:“這不是要取代化學家,而是要給化學家提供工具,讓他們成為有創(chuàng)造力的高級思考者!
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結構工程師 廣東省/深圳市