用RoseTTAFold設計全新結(jié)構(gòu)與功能的蛋白質(zhì)
01
文章背景簡介
BACKGROUND INTRODUCTION
科學家們長期認為蛋白質(zhì)的形狀決定了其功能。只要了解蛋白質(zhì)的形狀,就能猜測其在細胞中的作用,并且開發(fā)出與其形狀相關的藥物。因此,研究人員通過冷凍電鏡、核磁共振、X射線等多種手段來確定蛋白質(zhì)的形狀。這一過程不僅繁瑣而且成本高昂。為此,CASP(Critical Assessment of protein Structure Prediction)大賽應運而生。2020年,隨著AI技術的發(fā)展,Deepmind公司的AlphaFold2在CASP中橫空出世,有望解決這一困擾研究人員多年的難題。
為了探究合成全新蛋白質(zhì)算法的準確度,2021年7月,華盛頓大學生物學家大衛(wèi)·貝克(David Baker)團隊研發(fā)的RoseTTAFold構(gòu)建了一種“三軌(three-track)”神經(jīng)網(wǎng)絡,能在十幾分鐘之內(nèi)解析給定序列的三維結(jié)構(gòu)。2023年7月,該團隊成功獲得了一個蛋白質(zhì)骨架生成模型(generative model),并且通過實驗表征和電鏡驗證后,證明了該模型的可靠性,完成了真正意義上的蛋白質(zhì)從頭設計(de novo protein design),并且在《Nature》雜志(IF=64.8,Q1)上發(fā)表了題為“De novo design of protein structure and function with RFdiffusion”的文章。
02
所用到的主要方法
METHODS
1、RFdiffusion
2、DDPM
3、冷凍電鏡
4、圓二色光譜
5、尺寸排阻色譜
03
文章主要內(nèi)容摘要
ABSTRACT
對于蛋白質(zhì)設計的軟件來說,最終需要建立可視化的蛋白質(zhì)三維結(jié)構(gòu),為達成這一目標,該團隊使用了去噪擴散概率模型(Denoising Diffusion Probabilistic Model,DDPM)對已知的蛋白結(jié)構(gòu)模型進行學習并且根據(jù)所需條件引導該模型生成目標蛋白。遺憾的是,無論是生成全新的蛋白質(zhì)還是二級結(jié)構(gòu),最終結(jié)果與實驗數(shù)據(jù)大相徑庭。
該團隊在DDPM中加入了RoseTTAFold(RF),不僅能夠生成高精度的蛋白質(zhì)結(jié)構(gòu),以具有旋轉(zhuǎn)等變性的殘基的剛性框架表示,并且具有能夠在單個殘基、殘基間距離和方向以及3D坐標水平上對設計規(guī)格進行調(diào)節(jié)的體系結(jié)構(gòu)。首先,對RF進行了微調(diào),一步完成圍繞輸入的功能基序的蛋白質(zhì)骨架。實驗結(jié)果表明,該方法可以以原子精度支持廣泛的蛋白質(zhì)功能基序,但該方法只能接收精確的指令,對于給定的問題只能產(chǎn)生有限的設計多樣性。最終,該團隊通過算法優(yōu)化,建立了RFdiffusion模型,并且利用PDB數(shù)據(jù)庫進行深度學習。
圖1強調(diào)了RF結(jié)構(gòu)預測和RF擴散去噪步驟之間的相似之處:在這兩種情況下,根據(jù)模型的輸入條件將坐標轉(zhuǎn)換為預測結(jié)構(gòu)。在RF中,輸入蛋白序列,并提供額外的結(jié)構(gòu)信息作為模板和模型的初始坐標。在RF擴散中,主要的輸入是上一步得到的加噪坐標。對于特定的設計任務,可以提供一系列輔助條件信息,包括部分序列、折疊信息或固定的功能模體坐標。
該實驗獲得了一個蛋白質(zhì)骨架的生成模型,該模型在無條件和拓撲受限的蛋白質(zhì)單體設計、蛋白質(zhì)粘合劑設計、對稱寡聚物設計、酶活性位點支架和對稱基序支架用于治療性和金屬結(jié)合蛋白設計方面取得了出色的性能。通過實驗表征數(shù)百種設計的對稱組裝體、金屬結(jié)合蛋白和蛋白粘合劑的結(jié)構(gòu)和功能,證明了該方法的威力和通用性,稱為Rose TTAFold diffusion ( RF diffusion )。
用RFdiffusion方法解決的問題的廣度和復雜性以及和精確性遠遠超過了以前的結(jié)果。與從文本提示生成圖像的方式類似,RFdiffusion使得用最少的專業(yè)知識從最小的分子規(guī)格(例如,對用戶指定的目標蛋白質(zhì)具有高親和力的粘合劑,以及來自用戶指定對稱性的各種蛋白質(zhì)組裝體)生成功能蛋白成為可能。將RF擴展到包含配體,同樣可以使RFdiffusion擴展到顯式地模擬配體原子,并允許設計蛋白質(zhì)-配體相互作用。通過添加外部勢能和微調(diào)來定制RF擴散以應對特定設計挑戰(zhàn)的能力,以及對基礎方法的持續(xù)改進,應該能夠使從頭設計的蛋白質(zhì)設計達到更高的復雜性水平,以接近并在某些情況下超過自然進化所取得的成就。
簡而言之,本研究的主要內(nèi)容有:
1、獲得了一個蛋白質(zhì)骨架的生成模型
2、該模型在無條件和拓撲受限的蛋白質(zhì)單體設計、蛋白質(zhì)粘合劑設計、對稱寡聚物設計、酶活性位點支架和對稱基序支架用于治療性和金屬結(jié)合蛋白設計方面取得了出色的性能。
3、將RF擴展到包含配體,同樣可以使RF擴散擴展到顯式地模擬配體原子,并允許設計蛋白質(zhì)-配體相互作用。
原文標題 : 用RoseTTAFold設計全新結(jié)構(gòu)與功能的蛋白質(zhì)
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
圖片新聞
最新活動更多
-
10 BD新浪潮
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市