|
全原子蛋白質(zhì)序列設(shè)計(jì)中取得新進(jìn)展2024-11-08 16:56
基于骨架結(jié)構(gòu)的蛋白質(zhì)序列設(shè)計(jì)是全新蛋白質(zhì)設(shè)計(jì)的關(guān)鍵問(wèn)題之一。近年來(lái),隨著深度學(xué)習(xí)方法和技術(shù)的發(fā)展,全新蛋白質(zhì)序列設(shè)計(jì)取得了重要進(jìn)展。其中代表性的工作包括ProteinMPNN、ABACUS-R、ProDesign-LE等,都在序列設(shè)計(jì)中取得了重要進(jìn)展,并進(jìn)行了相應(yīng)的實(shí)驗(yàn)驗(yàn)證。然而,這些代表性的方法在模型訓(xùn)練和結(jié)果輸出中均沒(méi)有直接考慮蛋白質(zhì)側(cè)鏈的原子細(xì)節(jié)信息。一方面,蛋白質(zhì)側(cè)鏈構(gòu)象對(duì)蛋白質(zhì)執(zhí)行功能具有重要作用。另一方面,大量的序列設(shè)計(jì)算法依賴結(jié)構(gòu)預(yù)測(cè)來(lái)評(píng)估設(shè)計(jì)序列的可靠性,而單序列結(jié)構(gòu)預(yù)測(cè)依舊是一個(gè)非常大的挑戰(zhàn)。近期,北京大學(xué)化學(xué)與分子工程學(xué)院/前沿交叉學(xué)科研究院定量生物學(xué)中心/北大-清華生命科學(xué)聯(lián)合中心/北京大學(xué)成都前沿交叉生物技術(shù)研究院教授來(lái)魯華和北京大學(xué)化學(xué)與分子工程學(xué)院副研究員張長(zhǎng)勝團(tuán)隊(duì)發(fā)展了全原子蛋白質(zhì)序列設(shè)計(jì)的深度學(xué)習(xí)算法GeoSeqBuilder,這一成果近期發(fā)表于Angewandte Chemie1,文章初稿2024年3月以預(yù)印本形式發(fā)表2。GeoSeqBuilder在生成序列的同時(shí),也給出了高精度的側(cè)鏈構(gòu)象,可以更直接給出原子之間的相互作用,不需要進(jìn)行單序列結(jié)構(gòu)預(yù)測(cè)。GeoSeqBuilder在天然蛋白質(zhì)結(jié)構(gòu)、全新設(shè)計(jì)結(jié)構(gòu)和酶的序列設(shè)計(jì)的實(shí)驗(yàn)測(cè)試中獲得了高成功率,解析的晶體結(jié)構(gòu)與設(shè)計(jì)結(jié)構(gòu)模型在原子尺度細(xì)節(jié)上高度吻合。 GeoSeqBuilder主要包含三部分:(1)多尺度圖卷積網(wǎng)絡(luò)用于學(xué)習(xí)中心殘基周圍5階鄰居的環(huán)境信息;(2)三角網(wǎng)絡(luò)用于表示學(xué)習(xí)殘基水平的二體和三體相互作用;(3)迭代模塊基于以上網(wǎng)絡(luò)從起始序列出發(fā)更新序列,多步迭代后得到收斂序列。GeoSeqBuilder最終輸出設(shè)計(jì)序列對(duì)應(yīng)的蛋白質(zhì)全原子模型。 GeoSeqBuilder在CATH4.3數(shù)據(jù)集上進(jìn)行訓(xùn)練和驗(yàn)證,序列恢復(fù)率達(dá)到了52%,與ProteinMPNN等方法的表現(xiàn)類似。此外,GeoSeqBuilder設(shè)計(jì)出來(lái)的各位點(diǎn)的殘基類型通常和野生型具有相似的物理化學(xué)性質(zhì)。GeoSeqBuilde生成的各種殘基的豐度與天然蛋白類似。GeoSeqBuider對(duì)側(cè)鏈構(gòu)象預(yù)測(cè)的結(jié)果也遠(yuǎn)優(yōu)于基于傳統(tǒng)能量函數(shù)的方法FASPR和Scwrl4. 該工作首先選擇了兩個(gè)典型的蛋白質(zhì)折疊骨架對(duì)GeoSeqBuilder生成的序列進(jìn)行實(shí)驗(yàn)驗(yàn)證,包括天然硫氧還原蛋白(1FB0)和通過(guò)幻想模型人工設(shè)計(jì)的螺旋束骨架(0705)。作者分別為其設(shè)計(jì)了9條和6條序列,這些序列均可以在大腸桿菌中以可溶形式表達(dá)。對(duì)硫氧還原蛋白重新設(shè)計(jì)的序列具有很高的熱穩(wěn)定性,熱變性溫度較野生型蛋白提高了40攝氏度,X-射線晶體學(xué)結(jié)構(gòu)解析表明設(shè)計(jì)的全原子模型與所解出的晶體結(jié)構(gòu)高度吻合,并且設(shè)計(jì)蛋白質(zhì)擁有新的疏水堆積核心。 以上結(jié)果表明GeoSeqBuilder學(xué)習(xí)到了蛋白質(zhì)折疊結(jié)構(gòu)和序列的關(guān)系,可以在保持蛋白質(zhì)折疊結(jié)構(gòu)正確性的同時(shí)設(shè)計(jì)出新的疏水核心。一般認(rèn)為疏水核心在蛋白序列的自然進(jìn)化過(guò)程中是比較保守的,疏水核心重新設(shè)計(jì)后的蛋白是否還會(huì)保持原有的功能是一個(gè)很有趣的問(wèn)題。作者選擇細(xì)胞鐵死亡中的關(guān)鍵蛋白谷胱甘肽過(guò)氧化物酶(gpx4,PDB代碼2obi)作為研究對(duì)象,固定gpx4的溶劑暴露殘基位點(diǎn),只設(shè)計(jì)gpx4的疏水核心區(qū)域,并選擇5條序列進(jìn)行實(shí)驗(yàn)驗(yàn)證,其中4條序列的蛋白可以測(cè)出gpx4的酶反應(yīng)活性,3條活性高于野生型蛋白。作者隨后解出了這4個(gè)有酶活性的設(shè)計(jì)蛋白的高分辨晶體結(jié)構(gòu),均與計(jì)算設(shè)計(jì)的結(jié)構(gòu)模型在原子水平上高度一致。 本網(wǎng)站所有轉(zhuǎn)載文章系出于傳遞更多信息之目的,轉(zhuǎn)載內(nèi)容不代表本站立場(chǎng)。不希望被轉(zhuǎn)載的媒體或個(gè)人可與我們聯(lián)系,我們將立即進(jìn)行刪除處理。 |