Google 發佈重磅 AI 模型!預測地球所有生物分子,將大大加速癌症等疾病治療研究
Google 旗下的 DeepMind,一夜之間讓學術界炸了鍋。
5 月 8 日,DeepMind 官宣了一個新的 AI 模型:AlphaFold 3。
相關的研究論文,發表在權威的《自然》雜誌上,一來就佔據了頭版。
ChatGPT 之後,AI 模型不計其數,但最有資格自稱改變世界的,可能只有 AlphaFold 3。
AlphaFold 超級進化,讓生物世界更加「高清」
我們在中學生物課上學過,蛋白質是由氨基酸通過肽鍵連接形成的長鏈分子,在空間中摺疊成複雜的三維結構。
三維結構決定了蛋白質的功能,直接影響了藥物設計和疾病治療。
可以説,蛋白質結構預測,是生物學最重要的命題之一。
但預測蛋白質的三維結構,是一件難事,往往需要複雜的實驗,甚至被形容為「困擾了生物學家 50 年的問題」。
2016 年,DeepMind 的 AlphaGo,戰勝了職業九段棋手,重寫了圍棋這門古老的技藝。
DeepMind 的 AlphaFold,則要探聽生物學的密碼,窺探生命本身的堂奧。
2018 年,AlphaFold 1 發佈。
2020 年,AlphaFold 2 面世,已經可以在幾分鐘內大規模地準確預測蛋白質的形狀,並精確到原子級別。
現在,我們迎來了 AlphaFold 3,一個野心更大的 AI:超越蛋白質,探索所有的生物分子。
生物分子,即構成生物體的分子,包括蛋白質、DNA、RNA 等。
DeepMind 認為,只有瞭解生物分子如何在數百萬種組合中相互作用,才能開始真正理解生命的過程。
一言以蔽之,AlphaFold 3 比起前代,覆蓋的範圍更廣了,可以準確預測蛋白質、DNA、RNA、配體等生物分子的結構,以及它們如何相互作用。
先來看一些 AlphaFold 3 的預測結果。
7PNM,是一種普通感冒病毒的刺突蛋白。
如圖所示,AlphaFold 3 對 7PNM(藍色部分)與抗體(綠色部分)、單糖(黃色部分)相互作用時的結構預測,與真實結構(灰色部分)吻合。
預測背後有其意義,把這類蛋白質研究清楚,科學家便能更瞭解免疫系統和包括新冠在內的冠狀病毒,甚至提出更好的治療方案。
除了蛋白質的結構,AlphaFold 還能預測分子複合物,即多個分子組成的複雜結構。
下圖的酶,來自一種對植物有害的土壤真菌。
AlphaFold 的預測結果,包含一個酶蛋白(藍色部分)、一個離子(黃色球體)和一些單糖(黃色部分),契合了真實結構(灰色部分)。
深入瞭解這種酶與植物細胞如何相互作用,可以幫助研究人員開發更健康、抵抗力更強的作物,給農業生產帶來實際的好處。
類似地,AlphaFold 3 預測了一個由蛋白質(藍色部分)、RNA 鏈(紫色部分)和兩個離子(黃色部分)組成的分子複合物,同樣和真實結構(灰色部分)高度匹配。
這種複合物參與蛋白質的合成,即細胞生命活動和健康的基本過程之一,研究意義同樣深遠。
展現預測結果的準確性,再強調相關的用途,DeepMind 想要告訴世界,AlphaFold 3 是一種「革命性的模型」。
一方面,研究範圍更廣了。把視野擴充到蛋白質之外,特別是配體等小分子,可以涵蓋更多的藥物。
另一方面,準確度也提高了。對於蛋白質與其他分子類型的相互作用,與現有的預測方法相比,AlphaFold 3 的精度至少進步了 50%。其中一些重要的相互作用,提升甚至達到了 100%。
這樣一來,AlphaFold 3 可以造福更多的研究,加速藥物設計、推動基因組學、研發更健康的作物、開發生物可再生材料……
説到技術原理,AlphaFold 3 基於 AlphaFold 2 改進,核心是 Evoformer 深度學習架構,並使用了類似 Midjourney 的擴散網絡。
使用 AlphaFold 3 的過程,有些像我們和大語言模型聊天。輸入對生物分子的描述,AlphaFold 3 生成這些分子的三維結構,並研究它們如何相互作用。
AlphaFold 3 給出預測結果的過程,類似逐步去噪的 AI 文生圖擴散模型,從模糊的原子雲開始,逐步匯聚成準確的分子結構。
講人話的生成式 AI,增強了格子間打工人的生產力。AlphaFold 對科學家們的意義,也不外如是。
在實驗室進行蛋白質結構預測,可能要花掉攻讀一個博士學位的時間,以及數十萬美元。上億個預測,怕是窮盡幾百萬人的一生也無法完成。
但有了 AlphaFold,科學家們可以提出大膽的問題、創新的假設,然後在實驗室進行測試,加速研究的進程。
DeepMind 的一句話,足以向普通人概括 AlphaFold 3 的意義:
將 AlphaFold 交給世界,等待科學發現的新文藝復興
之前為了嘲諷 OpenAI 的閉源,馬斯克給它起了個綽號:CloseAI。
投餵了 OpenAI 好幾篇論文的 Google,在某些方面更有開源的精神。
2021 年 7 月,AlphaFold 2 在 Nature 發佈了論文,也開源了代碼。
截至目前,AlphaFold 2 已用於預測數億個結構。全球數百萬研究人員,將 AlphaFold 2 用於瘧疾疫苗、癌症治療和酶設計等領域。
也是在 2021 年 7 月,DeepMind 和歐洲生物信息研究所(EMBL-EBI)合作,發佈了 AlphaFold 蛋白結構數據庫,提供了迄今為止最完整、最準確的人類蛋白質組圖景。
DeepMind 在官宣的博客裏提到,這是自人類基因組繪圖以來最重要的數據集之一,現在他們將 AlphaFold 的力量,免費交到全世界科研人員的手中。
一年之內,超過 50 萬研究人員使用了 AlphaFold 數據庫,查看了超過 200 萬個結構,加速解決塑料污染、抗生素耐藥性等現實問題。
自那以後,數據庫還在不斷地擴充。
2022 年 7 月,DeepMind 發佈了幾乎所有科學已知的蛋白質預測結構,總共超過 2 億個,除了人類,其中還包括了植物、細菌、動物和其他生物體的預測結構。
AlphaFold 數據庫,就像蛋白質結構的「Google 搜索」,也像一個繁星閃爍的蛋白質宇宙。蛋白質的三維結構是生命的基石,看起來又精緻美觀,讓人感嘆大自然造物的神奇。
不過,這次發佈的 AlphaFold 3,相比 AlphaFold 2,態度稍微顯得保守,招致了一些批評的聲音。
AlphaFold 3 目前沒有開源,不能在本地部署,研究人員只能通過 DeepMind 最新推出的研究平台 AlphaFold Server,免費訪問大部分功能,且用途是非商業的。
最阻礙科學進步的是服務的訪問次數:每天只能進行 10 次預測。
摳門行為的背後,DeepMind 可能有自己的商業考量——子公司 Isomorphic Labs 已經與製藥公司合作,將 AlphaFold 3 應用於藥物設計。
Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis 樂觀地表示,首批 AI 設計的藥物可能會在未來幾年內準備好進行測試。
當然,AlphaFold 還是有侷限性的。
中國結構生物學家顏寧,曾經在 2022 年回答過關於 AlphaFold 2 會否替代科學家的話題。
在 Nav/Cav 方面,AlphaFold 2 依舊停留在他們 2017 年的水平,而在測試新型小分子與蛋白的相互作用時,AI 預測無一正確。
顏寧解釋,生物結構學不僅僅是關於摺疊,更要理解蛋白質的動態變化,理解與其他生物大分子或者調節小分子的相互作用,理解在細胞原位裏的狀態,因為數據不夠,這些都是 AI 還無能為力的領域。
如今,AlphaFold 3 在 AlphaFold 2 的不足之處,邁出了一大步,讓我們看到了預測不同生物分子相互作用的可能性,但它仍然是專注於分子結構的靜態預測,有時還會產生幻覺。
之前在接受採訪時,Demis Hassabis 批評了 AI 的炒作現象。
他認為,AI 應該被作為「科學的終極工具」,比如預測蛋白質結構的 AlphaFold 模型,人類即將迎來科學發現的新文藝復興。
英雄所見略同,英偉達的黃仁勳,也很看好醫療和生物技術的 AI 賽道,在 2024 年 GTC AI 大會上介紹了不少 AI 醫療服務,並與強生等公司在手術和醫學成像領域達成了合作。
Sora 模擬物理世界,而 AlphaFold 3 更讓我們瞭解生物世界,迴歸了我們對 AI 最初的期待——加速科學發現,推動人類進步,理解生命本身。
雖然 AGI 還遠在天邊,文字、圖片、視頻、蛋白質分子,彼此不同,卻又相互呼應。
AI 確實已經如此強大,也與日常生活越來越緊密相關,我們可以期待,每天都有更多的創新出現,也有更多的謎團被解開。
資料來源:愛範兒(ifanr)
5 月 8 日,DeepMind 官宣了一個新的 AI 模型:AlphaFold 3。
相關的研究論文,發表在權威的《自然》雜誌上,一來就佔據了頭版。
ChatGPT 之後,AI 模型不計其數,但最有資格自稱改變世界的,可能只有 AlphaFold 3。
AlphaFold 超級進化,讓生物世界更加「高清」
我們在中學生物課上學過,蛋白質是由氨基酸通過肽鍵連接形成的長鏈分子,在空間中摺疊成複雜的三維結構。
三維結構決定了蛋白質的功能,直接影響了藥物設計和疾病治療。
可以説,蛋白質結構預測,是生物學最重要的命題之一。
但預測蛋白質的三維結構,是一件難事,往往需要複雜的實驗,甚至被形容為「困擾了生物學家 50 年的問題」。
2016 年,DeepMind 的 AlphaGo,戰勝了職業九段棋手,重寫了圍棋這門古老的技藝。
DeepMind 的 AlphaFold,則要探聽生物學的密碼,窺探生命本身的堂奧。
2018 年,AlphaFold 1 發佈。
2020 年,AlphaFold 2 面世,已經可以在幾分鐘內大規模地準確預測蛋白質的形狀,並精確到原子級別。
現在,我們迎來了 AlphaFold 3,一個野心更大的 AI:超越蛋白質,探索所有的生物分子。
生物分子,即構成生物體的分子,包括蛋白質、DNA、RNA 等。
DeepMind 認為,只有瞭解生物分子如何在數百萬種組合中相互作用,才能開始真正理解生命的過程。
一言以蔽之,AlphaFold 3 比起前代,覆蓋的範圍更廣了,可以準確預測蛋白質、DNA、RNA、配體等生物分子的結構,以及它們如何相互作用。
先來看一些 AlphaFold 3 的預測結果。
7PNM,是一種普通感冒病毒的刺突蛋白。
如圖所示,AlphaFold 3 對 7PNM(藍色部分)與抗體(綠色部分)、單糖(黃色部分)相互作用時的結構預測,與真實結構(灰色部分)吻合。
預測背後有其意義,把這類蛋白質研究清楚,科學家便能更瞭解免疫系統和包括新冠在內的冠狀病毒,甚至提出更好的治療方案。
除了蛋白質的結構,AlphaFold 還能預測分子複合物,即多個分子組成的複雜結構。
下圖的酶,來自一種對植物有害的土壤真菌。
AlphaFold 的預測結果,包含一個酶蛋白(藍色部分)、一個離子(黃色球體)和一些單糖(黃色部分),契合了真實結構(灰色部分)。
深入瞭解這種酶與植物細胞如何相互作用,可以幫助研究人員開發更健康、抵抗力更強的作物,給農業生產帶來實際的好處。
類似地,AlphaFold 3 預測了一個由蛋白質(藍色部分)、RNA 鏈(紫色部分)和兩個離子(黃色部分)組成的分子複合物,同樣和真實結構(灰色部分)高度匹配。
這種複合物參與蛋白質的合成,即細胞生命活動和健康的基本過程之一,研究意義同樣深遠。
展現預測結果的準確性,再強調相關的用途,DeepMind 想要告訴世界,AlphaFold 3 是一種「革命性的模型」。
一方面,研究範圍更廣了。把視野擴充到蛋白質之外,特別是配體等小分子,可以涵蓋更多的藥物。
另一方面,準確度也提高了。對於蛋白質與其他分子類型的相互作用,與現有的預測方法相比,AlphaFold 3 的精度至少進步了 50%。其中一些重要的相互作用,提升甚至達到了 100%。
這樣一來,AlphaFold 3 可以造福更多的研究,加速藥物設計、推動基因組學、研發更健康的作物、開發生物可再生材料……
説到技術原理,AlphaFold 3 基於 AlphaFold 2 改進,核心是 Evoformer 深度學習架構,並使用了類似 Midjourney 的擴散網絡。
使用 AlphaFold 3 的過程,有些像我們和大語言模型聊天。輸入對生物分子的描述,AlphaFold 3 生成這些分子的三維結構,並研究它們如何相互作用。
AlphaFold 3 給出預測結果的過程,類似逐步去噪的 AI 文生圖擴散模型,從模糊的原子雲開始,逐步匯聚成準確的分子結構。
講人話的生成式 AI,增強了格子間打工人的生產力。AlphaFold 對科學家們的意義,也不外如是。
在實驗室進行蛋白質結構預測,可能要花掉攻讀一個博士學位的時間,以及數十萬美元。上億個預測,怕是窮盡幾百萬人的一生也無法完成。
但有了 AlphaFold,科學家們可以提出大膽的問題、創新的假設,然後在實驗室進行測試,加速研究的進程。
DeepMind 的一句話,足以向普通人概括 AlphaFold 3 的意義:
引用AlphaFold 3 將生物世界帶入高清。
將 AlphaFold 交給世界,等待科學發現的新文藝復興
之前為了嘲諷 OpenAI 的閉源,馬斯克給它起了個綽號:CloseAI。
投餵了 OpenAI 好幾篇論文的 Google,在某些方面更有開源的精神。
2021 年 7 月,AlphaFold 2 在 Nature 發佈了論文,也開源了代碼。
截至目前,AlphaFold 2 已用於預測數億個結構。全球數百萬研究人員,將 AlphaFold 2 用於瘧疾疫苗、癌症治療和酶設計等領域。
也是在 2021 年 7 月,DeepMind 和歐洲生物信息研究所(EMBL-EBI)合作,發佈了 AlphaFold 蛋白結構數據庫,提供了迄今為止最完整、最準確的人類蛋白質組圖景。
DeepMind 在官宣的博客裏提到,這是自人類基因組繪圖以來最重要的數據集之一,現在他們將 AlphaFold 的力量,免費交到全世界科研人員的手中。
一年之內,超過 50 萬研究人員使用了 AlphaFold 數據庫,查看了超過 200 萬個結構,加速解決塑料污染、抗生素耐藥性等現實問題。
自那以後,數據庫還在不斷地擴充。
2022 年 7 月,DeepMind 發佈了幾乎所有科學已知的蛋白質預測結構,總共超過 2 億個,除了人類,其中還包括了植物、細菌、動物和其他生物體的預測結構。
AlphaFold 數據庫,就像蛋白質結構的「Google 搜索」,也像一個繁星閃爍的蛋白質宇宙。蛋白質的三維結構是生命的基石,看起來又精緻美觀,讓人感嘆大自然造物的神奇。
不過,這次發佈的 AlphaFold 3,相比 AlphaFold 2,態度稍微顯得保守,招致了一些批評的聲音。
AlphaFold 3 目前沒有開源,不能在本地部署,研究人員只能通過 DeepMind 最新推出的研究平台 AlphaFold Server,免費訪問大部分功能,且用途是非商業的。
最阻礙科學進步的是服務的訪問次數:每天只能進行 10 次預測。
摳門行為的背後,DeepMind 可能有自己的商業考量——子公司 Isomorphic Labs 已經與製藥公司合作,將 AlphaFold 3 應用於藥物設計。
Google DeepMind 聯合創始人兼首席執行官 Demis Hassabis 樂觀地表示,首批 AI 設計的藥物可能會在未來幾年內準備好進行測試。
當然,AlphaFold 還是有侷限性的。
中國結構生物學家顏寧,曾經在 2022 年回答過關於 AlphaFold 2 會否替代科學家的話題。
在 Nav/Cav 方面,AlphaFold 2 依舊停留在他們 2017 年的水平,而在測試新型小分子與蛋白的相互作用時,AI 預測無一正確。
顏寧解釋,生物結構學不僅僅是關於摺疊,更要理解蛋白質的動態變化,理解與其他生物大分子或者調節小分子的相互作用,理解在細胞原位裏的狀態,因為數據不夠,這些都是 AI 還無能為力的領域。
如今,AlphaFold 3 在 AlphaFold 2 的不足之處,邁出了一大步,讓我們看到了預測不同生物分子相互作用的可能性,但它仍然是專注於分子結構的靜態預測,有時還會產生幻覺。
之前在接受採訪時,Demis Hassabis 批評了 AI 的炒作現象。
他認為,AI 應該被作為「科學的終極工具」,比如預測蛋白質結構的 AlphaFold 模型,人類即將迎來科學發現的新文藝復興。
英雄所見略同,英偉達的黃仁勳,也很看好醫療和生物技術的 AI 賽道,在 2024 年 GTC AI 大會上介紹了不少 AI 醫療服務,並與強生等公司在手術和醫學成像領域達成了合作。
Sora 模擬物理世界,而 AlphaFold 3 更讓我們瞭解生物世界,迴歸了我們對 AI 最初的期待——加速科學發現,推動人類進步,理解生命本身。
雖然 AGI 還遠在天邊,文字、圖片、視頻、蛋白質分子,彼此不同,卻又相互呼應。
AI 確實已經如此強大,也與日常生活越來越緊密相關,我們可以期待,每天都有更多的創新出現,也有更多的謎團被解開。
資料來源:愛範兒(ifanr)