近日,北京大學(xué)計(jì)算機(jī)學(xué)院張銘教授團(tuán)隊(duì)聯(lián)合華盛頓大學(xué)等團(tuán)隊(duì),成功提出了生物活性基礎(chǔ)模型ActFound,登上國(guó)際AI頂刊。在跨域生物活性預(yù)測(cè)、先導(dǎo)小分子優(yōu)化、癌癥藥物反應(yīng)上,ActFound表現(xiàn)出色。
小分子生物活性在藥物研發(fā)中扮演著至關(guān)重要的角色。生物活性反映了小分子與生物系統(tǒng)中特定靶點(diǎn)(如蛋白質(zhì)、受體或酶)相互作用并引起可測(cè)量的生物學(xué)反應(yīng)的程度,是篩選潛在藥物候選物、優(yōu)化分子結(jié)構(gòu)以及預(yù)測(cè)藥物療效和安全性的關(guān)鍵指標(biāo)。
準(zhǔn)確預(yù)測(cè)和評(píng)估生物活性不僅可以大幅縮短藥物篩選時(shí)間、降低研發(fā)成本,還能幫助研究人員理解藥物作用機(jī)制,從而加速新藥開(kāi)發(fā)進(jìn)程,為患者帶來(lái)更有效、更安全的治療方案。
在生物活性預(yù)測(cè)領(lǐng)域,已有的基于物理的計(jì)算方法如自由能微擾(FEP)可以給出準(zhǔn)確的預(yù)測(cè),但是他們卻面臨著計(jì)算成本高昂的問(wèn)題。
近年來(lái),深度學(xué)習(xí)方法展現(xiàn)出巨大潛力,但面臨著實(shí)驗(yàn)數(shù)據(jù)有限和不同實(shí)驗(yàn)測(cè)量的生物活性不兼容的問(wèn)題。
以往研究者使用了遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)和元學(xué)習(xí)等先進(jìn)機(jī)器學(xué)習(xí)技術(shù),但是他們只在特定類型(例如Ki,Kd,IC50)和單位為摩爾濃度的生物活性數(shù)據(jù)上訓(xùn)練,使得模型難以泛化到具有從未見(jiàn)過(guò)的類型(例如EC50)或者單位(例如‘%’)的生物活性預(yù)測(cè)任務(wù)上。
為解決這一挑戰(zhàn),北京大學(xué)計(jì)算機(jī)學(xué)院張銘教授團(tuán)隊(duì)聯(lián)合華盛頓大學(xué)助理教授王晟、博士后肖之屏和復(fù)旦大學(xué)教授徐盈輝等,提出了一個(gè)由ChEMBL數(shù)據(jù)庫(kù)中160萬(wàn)個(gè)實(shí)驗(yàn)測(cè)量的生物活性數(shù)據(jù)訓(xùn)練而成的生物活性基礎(chǔ)模型——ActFound。
目前,這項(xiàng)工作已登上國(guó)際頂尖AI期刊NatureMachineIntelligence(簡(jiǎn)稱NMI,最新影響因子為18.8)。
ActFound的核心思想是采用成對(duì)學(xué)習(xí)方法,學(xué)習(xí)同一組實(shí)驗(yàn)中兩個(gè)小分子之間的相對(duì)生物活性差異,從而避開(kāi)不同實(shí)驗(yàn)之間的生物活性的不兼容問(wèn)題。該模型還利用元學(xué)習(xí)技術(shù),幫助模型在僅有少量數(shù)據(jù)的情況下提升預(yù)測(cè)準(zhǔn)確度。
審稿人認(rèn)為成對(duì)學(xué)習(xí)和元學(xué)習(xí)的組合不但成功解決了活性預(yù)測(cè)的核心問(wèn)題,而且還對(duì)其他領(lǐng)域的發(fā)展有所啟發(fā)。
在六個(gè)生物活性評(píng)測(cè)基準(zhǔn)數(shù)據(jù)集上,ActFound展現(xiàn)出了準(zhǔn)確的預(yù)測(cè)能力,以及在不同生物活性類型和分子骨架之間的強(qiáng)大泛化能力。
研究還表明,ActFound可以作為領(lǐng)先的基于物理的計(jì)算工具FEP+的替代方案,僅使用少量數(shù)據(jù)進(jìn)行微調(diào)就能達(dá)到相當(dāng)?shù)男阅堋?/p>
為了驗(yàn)證ActFound模型的性能和實(shí)際價(jià)值,研究團(tuán)隊(duì)進(jìn)行了一系列生物活性預(yù)測(cè)任務(wù)的實(shí)驗(yàn)。
首先,研究人員在六個(gè)不同的數(shù)據(jù)集上評(píng)估了ActFound的性能,ActFound在ChEMBL、BindingDB、FS-Mol、pQSAR-ChEMBL、Davis和Kiba上的表現(xiàn)優(yōu)于所有九種對(duì)比方法,展示了其在幾乎所有類型實(shí)驗(yàn)中的廣泛適用性。
在跨域生物活性預(yù)測(cè)方面,ActFound同樣超越了現(xiàn)有的最先進(jìn)方法,證明了在不同類型的生物活性數(shù)據(jù)上良好的泛化能力。
其次,研究團(tuán)隊(duì)將ActFound與自由能微擾(FEP)計(jì)算工具進(jìn)行了比較,以展示ActFound在先導(dǎo)小分子優(yōu)化方面的實(shí)際價(jià)值。
實(shí)驗(yàn)結(jié)果表明,ActFound具有作為FEP+替代工具的潛力。
具體來(lái)說(shuō),Actfound在僅僅使用了平均4.8個(gè)分子進(jìn)行微調(diào)的情況下,ActFound的效果超越了FEP+。且Actfound可以在一秒之內(nèi)預(yù)測(cè)超過(guò)一萬(wàn)化合物的活性,然而FEP需要24-48個(gè)GPU小時(shí)才能計(jì)算一對(duì)分子的相對(duì)活性差值。
最后,研究人員展示了使用ActFound預(yù)訓(xùn)練的癌癥藥物反應(yīng)預(yù)測(cè)模型的出色表現(xiàn)。
實(shí)驗(yàn)結(jié)果表明,使用ActFound初始化的癌癥藥物反應(yīng)預(yù)測(cè)模型無(wú)需微調(diào)就具有出色的表現(xiàn),進(jìn)一步證明了ActFound的廣泛應(yīng)用潛力。
總的來(lái)說(shuō),這些實(shí)驗(yàn)結(jié)果展示了ActFound作為一個(gè)生物活性基礎(chǔ)模型,不僅在各種生物活性預(yù)測(cè)任務(wù)中表現(xiàn)出色,還顯示了在藥物開(kāi)發(fā)和發(fā)現(xiàn)的其他環(huán)節(jié)的應(yīng)用前景。
這些發(fā)現(xiàn)為解決現(xiàn)有生物活性預(yù)測(cè)方法中的局限性提供了有效的解決方案,同時(shí)也為加速藥物研發(fā)過(guò)程提供了新的可能性。
分享到微信 ×
打開(kāi)微信,點(diǎn)擊底部的“發(fā)現(xiàn)”,
使用“掃一掃”即可將網(wǎng)頁(yè)分享至朋友圈。