AlphaFold 3發(fā)布,谷歌DeepMind是如何顛覆AI生物學(xué)的?
最近,生物學(xué)預(yù)測模型AlphaFold的最新版本——AlphaFold 3正式發(fā)布了,而這是谷歌在AI生物學(xué)領(lǐng)域的又一次突破。一起來看看AI可以如何應(yīng)用于生物學(xué)領(lǐng)域。
在大語言模型領(lǐng)域處處被OpenAI壓一頭的谷歌,還是憑借自己在AI生物學(xué)領(lǐng)域的優(yōu)勢成功搶得了一次頭條。
北京時間5月8日晚,谷歌DeepMind和谷歌旗下藥物發(fā)現(xiàn)子公司Isomorphic Labs聯(lián)合發(fā)布了其生物學(xué)預(yù)測模型AlphaFold的最新版本——AlphaFold 3。這是在AlphaFold 2發(fā)布三年后,谷歌在AI生物學(xué)領(lǐng)域的又一次突破,相關(guān)成果已發(fā)表在《Nature》上。
與前代相比,AlphaFold 3不僅可以預(yù)測蛋白質(zhì)的結(jié)構(gòu),還可以預(yù)測生物生命中幾乎所有元素(DNA、RNA、配體等)的結(jié)構(gòu),并且可以準(zhǔn)確預(yù)測蛋白質(zhì)與其他分子的相互作用。與現(xiàn)有的預(yù)測方法相比,AlphaFold 3發(fā)現(xiàn)蛋白質(zhì)與其他分子類型的相互作用至少提高了50%,對于一些重要的相互作用類別,如蛋白質(zhì)與配體的結(jié)合、以及抗體與其靶蛋白的結(jié)合等,預(yù)測準(zhǔn)確率甚至提高了一倍。
DeepMind首席執(zhí)行官德米什·哈薩比斯(Demis Hassabis)在新聞發(fā)布會上表示:“發(fā)布 AlphaFold 3 對我們來說是一個重要的里程碑,生物學(xué)是一個動態(tài)系統(tǒng),你必須了解生物學(xué)特性是如何通過細(xì)胞中不同分子之間的相互作用而出現(xiàn)的。你可以將AlphaFold 3視為我們朝著這個目標(biāo)邁出的第一步?!?/p>
Isomorphic Labs已經(jīng)將該模型用于科研,并與制藥公司合作,探索新的疾病治療方法。
一、基于擴(kuò)散模型解決分子預(yù)測泛化難題
DeepMind比OpenAI成立時間更早,但它沒有像OpenAI一樣在大語言模型領(lǐng)域越走越深,而是在蛋白質(zhì)結(jié)構(gòu)預(yù)測上大放異彩。
2018年,谷歌DeepMind推出了首個蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold,并在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽中獲得第一名。2020年,DeepMind發(fā)布了AlphaFold軟件的第二個版本,AlphaFold 2整合了一個子網(wǎng)絡(luò)系統(tǒng)到單一的可微模型中,應(yīng)用Transformer來預(yù)測基于氨基酸序列的復(fù)雜3D結(jié)構(gòu)。
在2020年的CASP14,AlphaFold 2脫穎而出,預(yù)測精確到原子精度,即使對于缺乏模板的蛋白質(zhì),它也能在幾分鐘內(nèi)產(chǎn)生出色的結(jié)果。
2021年,DeepMind發(fā)布了AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,與歐洲分子生物學(xué)實(shí)驗(yàn)室的歐洲生物信息學(xué)研究所(EMBL-EBI)合作創(chuàng)建,為全球研究人員提供了數(shù)百萬預(yù)測的蛋白質(zhì)結(jié)構(gòu)。
如今,全球已有數(shù)百萬研究人員將AlphaFold 2應(yīng)用在瘧疾疫苗、癌癥治療和酶設(shè)計(jì)等領(lǐng)域。AlphaFold已被引用超過20000次,其科學(xué)影響力通過許多獎項(xiàng)得到了認(rèn)可,其中最近的一個是生命科學(xué)突破獎(Breakthrough Prize in Life Sciences Awarded),之后發(fā)布的AlphaFold-Multimer則推動了對蛋白質(zhì)-蛋白質(zhì)復(fù)合物的預(yù)測。
AlphaFold 3解決了一個生物分子預(yù)測懸而未決的難題——由于不同分子類型的特異性相互作用差異太大,難以通過擴(kuò)大單一深度學(xué)習(xí)模型來預(yù)測所有復(fù)合物范圍。
AlphaFold 3在AlphaFold 2的基礎(chǔ)上更進(jìn)一步,采用了AI繪畫的常見技術(shù)——去噪擴(kuò)散模型(DDPM,Denoising Diffusion Probabiblistic Model)。
想象一下,這個模型像是一位藝術(shù)家,從一團(tuán)模糊的原子“泥漿”開始,一步步雕琢,最后呈現(xiàn)出了清晰的分子結(jié)構(gòu),連每個原子的三維位置都能精準(zhǔn)給出。于是,AlphaFold 3預(yù)測分子之間相互作用本事,比現(xiàn)在所有的工具都要厲害。
比如,在一個案例里,AlphaFold 3預(yù)測了一個蛋白質(zhì)(我們可以想象成藍(lán)色的積木)和DNA雙螺旋(粉紅色的梯子)如何緊密擁抱,而且這個預(yù)測幾乎和科學(xué)家辛苦實(shí)驗(yàn)發(fā)現(xiàn)的真實(shí)樣子一模一樣。
7R6R – DNA 結(jié)合蛋白:AlphaFold 3 對分子復(fù)合物的預(yù)測,其特征是蛋白質(zhì)(藍(lán)色)與 DNA 雙螺旋(粉色)結(jié)合,與通過艱苦實(shí)驗(yàn)發(fā)現(xiàn)的真實(shí)分子結(jié)構(gòu)(灰色)近乎完美匹配。
AlphaFold 3的工作方式很簡單,你給它一份分子名單,它就能畫出這些分子怎么拼在一起的立體圖像。不管是蛋白質(zhì)、DNA還是RNA這樣的大塊頭,還是藥物小分子這樣的小配件,它都能搞定。要知道,很多藥物就是通過這些小分子和特定大分子的“握手”(指相互作用)來治病的。
不僅如此,AlphaFold 3還能模擬這些分子的化學(xué)修飾(就像開關(guān),控制著細(xì)胞的健康功能),這些細(xì)胞一旦受到破壞就會導(dǎo)致疾病。研究團(tuán)隊(duì)表示,其預(yù)測準(zhǔn)確度無人能敵,而且作為全能選手,它能一次性計(jì)算出整個分子團(tuán)隊(duì)的行動策略,這是前所未有的科學(xué)洞察力。
也正是得益于AlphaFold 3的這種能力,其在「藥物發(fā)現(xiàn)」中作用巨大,實(shí)現(xiàn)了前所未有的準(zhǔn)確性,包括蛋白質(zhì)與配體的結(jié)合以及抗體與其靶蛋白的結(jié)合。
論文顯示,在無需輸入任何結(jié)構(gòu)信息的情況下,AlphaFold 3比PoseBusters基準(zhǔn)測試中最好的傳統(tǒng)方法準(zhǔn)確率高50%,這使得AlphaFold 3成為第一個超越基于物理的生物分子結(jié)構(gòu)預(yù)測工具的人工智能系統(tǒng)。
預(yù)測「抗體-蛋白質(zhì)」結(jié)合的能力對于理解人類免疫反應(yīng)的各個方面和新抗體的設(shè)計(jì)至關(guān)重要,這是一種不斷增長的治療方法。哥倫比亞大學(xué)系統(tǒng)生物學(xué)助理教授Mohammed AlQuraishi表示, “AlphaFold 2系統(tǒng)只了解氨基酸,因此它對于生物制藥的效用非常有限,”他說。 “但現(xiàn)在,AlphaFold 3原則上可以預(yù)測藥物與蛋白質(zhì)結(jié)合的位置。”
AlQuraishi表示,盡管在某些方面,AlphaFold 3的成功率是RoseTTAFold等類似領(lǐng)先模型的兩倍,已經(jīng)是AI在生物學(xué)研究領(lǐng)域的一個巨大的飛躍,但它也不是完全沒有缺點(diǎn)——比如蛋白質(zhì)-RNA 相互作用上,它仍然非常不準(zhǔn)確。
對此,DeepMind回應(yīng)稱,在建模的交互過程中,AlphaFold 3的預(yù)測準(zhǔn)確度可以從40%提高到80%以上;同時在回答一些基礎(chǔ)性的科研問題時(比如“哪些酶可能分解水瓶中的塑料”等),AlphaFold 3比其他模型靠譜的多。
目前,DeepMind旗下的Isomorphic Labs正在使用AlphaFold 3來加速藥物設(shè)計(jì),將其應(yīng)用在疾病靶點(diǎn)靠近、新靶點(diǎn)發(fā)現(xiàn)等項(xiàng)目上。
二、免費(fèi)賦能科學(xué)家,但尚未發(fā)布源代碼
在推出AlphaFold 3的同時,Google DeepMind也基于AlphaFold 3推出了一個免費(fèi)平臺——AlphaFold Server,供全世界的科學(xué)家進(jìn)行非商業(yè)性研究,預(yù)測蛋白質(zhì)如何與細(xì)胞中的其他分子相互作用。
只需點(diǎn)擊幾下,科學(xué)家就可以利用AlphaFold 3為由蛋白質(zhì)、DNA、RNA以及選擇的配體、離子和化學(xué)修飾組成的結(jié)構(gòu)進(jìn)行建模。
對此,F(xiàn)rancis Crick研究所Uhlmann實(shí)驗(yàn)室的研究科學(xué)家Céline Bouchoux評價道:“AlphaFold 3一經(jīng)發(fā)布,有可能像AlphaFold一樣具有開創(chuàng)性。有了AlphaFold Server,其不再僅僅是預(yù)測結(jié)構(gòu),而是慷慨地提供訪問權(quán)限:允許研究人員提出大膽的問題,并加速發(fā)現(xiàn)?!?/p>
然而,Nature報(bào)道指出,科學(xué)家對AlphaFold 3服務(wù)器的訪問是有限的,目前每天只能進(jìn)行10次預(yù)測,而且不可能獲得可能與藥物結(jié)合的蛋白質(zhì)結(jié)構(gòu),也不能將其用于商業(yè)用途。同時,DeepMind似乎也沒有發(fā)布AlphaFold 3的開源代碼,而是只發(fā)布了AlphaFold 2的。
對此,有Narure論文的審稿人在X平臺上呼吁,應(yīng)該盡快發(fā)布AlphaFold 3的開源代碼,以促進(jìn)更廣泛的科學(xué)研究:“我們已經(jīng)用AlphaFold 2代碼制作了大約10萬個模型,如果不發(fā)布AlphaFold 3的代碼,我們怎么能用AlphaFold Server處理這些研究數(shù)據(jù)呢?”
三、AI制藥商業(yè)化提速
盡管對于外界的科學(xué)家提供了訪問限制,但是對于自家“親兄弟”Isomorphic Labs,DeepMind卻給予了廣泛的權(quán)限——不僅擁有無限制的訪問次數(shù),Isomorphic Labs的研究人員還擁有對 AlphaFold 3商業(yè)用途的獨(dú)家訪問權(quán)限。
2021年AlphaFold數(shù)據(jù)庫推出后,谷歌積極為其尋找商業(yè)化途徑,在同年成立了Isomorhpic Labs子公司,旨在運(yùn)用AI尤其是機(jī)器學(xué)習(xí)的方法、從第一性原理重構(gòu)藥物發(fā)現(xiàn)過程,通過建立新的生物現(xiàn)象預(yù)測和生成模型,最終找到一些人類最具破壞性疾病的治療方法。
如果說DeepMind的工作主要聚焦基礎(chǔ)研究,那么Isomorphic就專注于更具體的藥物發(fā)現(xiàn)。
在2023年9月Endpoints News的專訪中,Demis Hassabis表示,AlphaFold只是整個藥物發(fā)現(xiàn)過程的一小部分,AlphaFold不會做ADME(藥代動力學(xué)和藥理學(xué)中吸收、分布、代謝和排泄的英文首字母縮寫,描述了藥物化合物在生物體內(nèi)處置的動態(tài)變化)屬性之類的事情。言外之意是,這些事情都由Isomorphic Labs來做。
Isomorphic Labs的誕生,代表了從AI模型到AI制藥工業(yè)的落地。它預(yù)示著「AI制藥」真正從實(shí)驗(yàn)室走向了產(chǎn)業(yè),為人類研發(fā)出真正有效的創(chuàng)新藥提供了更多的可能。
創(chuàng)立以來,Isomorphic Labs也相當(dāng)爭氣,與DeepMind密切配合,取得了不少成果:
- 2023年9月19日,《Science》雜志的封面文章發(fā)表了DeepMind和Isomorphic團(tuán)隊(duì)在AlphaFold的基礎(chǔ)上改進(jìn)衍生的錯義變異致病性預(yù)測模型AlphaMissense。AlphaMissense總共分析了7100個可能的錯義不清,其中的89%進(jìn)行了分類,其中有32%可能是疾病的,另外57%則可能是良性的;
- 兩天后的9月21日,被譽(yù)為諾獎風(fēng)向標(biāo)的“2023拉斯克獎”,頒給了DeepMind的首席執(zhí)行官Demis Hassabis博士,和John Jumper博士,代表了主流科學(xué)界的認(rèn)可;
- 2023年10月,Google DeepMind聯(lián)合Isomorphic Labs共同發(fā)布了新一代AlphaFold模型,它可以預(yù)測蛋白質(zhì)數(shù)據(jù)庫(PDB)中幾乎任何分子的結(jié)構(gòu),通常具有原子精度,包括配體(小分子)、蛋白質(zhì)、核酸(DNA 和 RNA)以及含有翻譯后修飾(PTM)的生物分子;
- 2024年1月,Isomorphic Labs宣布與禮來(Eli lilly)和諾華(Novartis)達(dá)成藥物研發(fā)外包合作,通過人工智能方式針對多個靶點(diǎn)開發(fā)小分子療法,交易價值達(dá)30億美元,這是lsomorphic Labs首次建立制藥合作關(guān)系。
目前,關(guān)于Isomorphic自身藥物項(xiàng)目的細(xì)節(jié)仍處于保密狀態(tài),但I(xiàn)somorphic已將大約20個靶點(diǎn)的清單縮短到幾個,并且正在利用CRO來制造和測試潛在的化合物。
近些年來,“AI+醫(yī)藥”成為熱門賽道。在國外,以英偉達(dá)為代表,不僅有CEO黃仁勛在公共場合力推、投入重金布局(2023年有10家AI制藥企業(yè)獲得英偉達(dá)的投資),更是在2023年推出BioNeMo云服務(wù)、在2024年推出新的醫(yī)療保健項(xiàng)目GenAI和聚焦醫(yī)療場景的25個微服務(wù)(Nim);在國內(nèi),阿里、百度、騰訊等互聯(lián)網(wǎng)巨頭也紛紛成立了醫(yī)療AI部門,雖目前尚無明確數(shù)據(jù)顯示其將直接參與制藥環(huán)節(jié),但毫無疑問的是,科技巨頭們正在試圖用AI為制藥打開無限的想象空間。
然而,近兩年AI制藥行業(yè)也出現(xiàn)了一些泡沫,降本增效的故事開始被質(zhì)疑,臨床階段的藥物也面臨著有效性不足的難題。
對此,Demis Hassabis在Endpoints News的專訪中似乎做出了回應(yīng):“如果我們是正確的并且能夠?qū)崿F(xiàn)另外六個AlphaFold級別的突破,我們可以將藥物研發(fā)所需的時間減少一個數(shù)量級,也許是成本和時間,并且在下一階段獲得更高的成功率。”
作者:王藝;編輯:趙健
原文標(biāo)題:AlphaFold 3發(fā)布,谷歌DeepMind是如何顛覆AI生物學(xué)的?|甲子光年
來源公眾號:甲子光年(ID:jazzyear),立足中國科技創(chuàng)新前沿陣地,動態(tài)跟蹤頭部科技企業(yè)發(fā)展和傳統(tǒng)產(chǎn)業(yè)技術(shù)升級案例。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @甲子光年 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!