文章來(lái)源公眾號(hào):lmmumome 作者:lmmumome
導(dǎo)語(yǔ)
下一次大流行來(lái)襲,我們能否在幾天內(nèi)造出解藥?
在醫(yī)學(xué)界,抗體是對(duì)抗疾病的“魔法子彈”。從癌癥到自身免疫病,從新冠到流感,抗體藥物已成為現(xiàn)代醫(yī)學(xué)不可或缺的一部分。
然而,傳統(tǒng)的抗體發(fā)現(xiàn)過(guò)程如同“大海撈針”:耗時(shí)漫長(zhǎng)、成本高昂、成功率極低,嚴(yán)重依賴動(dòng)物免疫或從數(shù)十億細(xì)胞中篩選。
現(xiàn)在,一場(chǎng)革命正在發(fā)生。2025年11月11日,發(fā)表在頂級(jí)學(xué)術(shù)期刊《Cell》上的一項(xiàng)重磅研究《Generation of antigen-specific paired-chain antibodies using large language models》宣布:研究人員利用類似ChatGPT的“大語(yǔ)言模型”,成功實(shí)現(xiàn)了從零開始、按需生成針對(duì)特定病毒的高效人類抗體!
這標(biāo)志著AI制藥領(lǐng)域邁出了里程碑式的一步。接下來(lái),讓我們一起揭開這項(xiàng)突破性技術(shù)的神秘面紗。
一、傳統(tǒng)抗體研發(fā)的“痛點(diǎn)”與AI的“亮劍”
傳統(tǒng)路徑的局限:
以往,科學(xué)家需要先獲得康復(fù)者的血液樣本,或?qū)?dòng)物進(jìn)行免疫,然后從其體內(nèi)數(shù)以億計(jì)的B細(xì)胞中,篩選出極少數(shù)能產(chǎn)生目標(biāo)抗體的細(xì)胞。這個(gè)過(guò)程費(fèi)力、昂貴且充滿不確定性。
AI的破局之道:
近年來(lái),人工智能,特別是大語(yǔ)言模型在理解蛋白質(zhì)“語(yǔ)言”上展現(xiàn)出巨大潛力。蛋白質(zhì)由氨基酸序列構(gòu)成,如同單詞組成句子。如果一個(gè)模型學(xué)習(xí)了海量的蛋白質(zhì)序列,它就能理解構(gòu)成一個(gè)“好”蛋白質(zhì)的語(yǔ)法和語(yǔ)義。
基于此,來(lái)自范德堡大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)開發(fā)了一個(gè)名為 MAGE 的AI模型。
二、MAGE:抗體設(shè)計(jì)界的“ChatGPT”
1.MAGE究竟是什么?
MAGE,意為“單克隆抗體生成器”,可以被看作是一個(gè)專門精通抗體設(shè)計(jì)的AI專家。
師從名家:它的基礎(chǔ)是名為ProGen2的通用蛋白質(zhì)語(yǔ)言模型,該模型已通過(guò)超過(guò)10億個(gè)蛋白質(zhì)序列的“預(yù)訓(xùn)練”,具備了深厚的蛋白質(zhì)知識(shí)底蘊(yùn)。
專業(yè)深造:研究人員用一個(gè)包含18,507對(duì)抗體-抗原序列的數(shù)據(jù)庫(kù)對(duì)MAGE進(jìn)行“微調(diào)”,使其專門學(xué)習(xí)“什么樣的抗體序列能結(jié)合什么樣的抗原”這一核心任務(wù)。
2.MAGE如何工作?其工作流程簡(jiǎn)潔而強(qiáng)大:
輸入:給定一個(gè)目標(biāo)抗原(如病毒蛋白)的氨基酸序列。
生成:MAGE模型會(huì)自動(dòng)“構(gòu)思”并輸出一對(duì)全新的、匹配的抗體重鏈和輕鏈可變區(qū)序列。
輸出與驗(yàn)證:研究人員將這些AI設(shè)計(jì)的序列合成出來(lái),并在實(shí)驗(yàn)室中檢驗(yàn)其是否真能結(jié)合并中和目標(biāo)病毒。
3.核心突破:真正的“從無(wú)到有”
與之前大多數(shù)只能“優(yōu)化”或“改造”現(xiàn)有抗體的AI不同,MAGE是首個(gè)無(wú)需任何起始模板就能直接生成全新、完整抗體序列的模型。它設(shè)計(jì)的抗體,從框架區(qū)到互補(bǔ)決定區(qū)都是全新的。
三、實(shí)驗(yàn)驗(yàn)證:AI設(shè)計(jì)的抗體,真能打!
論文的硬核之處在于,他們沒有停留在計(jì)算機(jī)預(yù)測(cè),而是對(duì)MAGE生成的抗體進(jìn)行了大規(guī)模、全方位的實(shí)驗(yàn)驗(yàn)證,結(jié)果令人振奮。
1. 對(duì)戰(zhàn)新冠病毒
成功率:在針對(duì)SARS-CoV-2刺突蛋白的20個(gè)測(cè)試抗體中,9個(gè)(45%) 被證實(shí)具有結(jié)合能力。
高活性:其中一個(gè)抗體(RBD-409)表現(xiàn)出極強(qiáng)的中和能力。
多樣性:生成的抗體序列多樣,靶向不同的表位,有些抗體還能交叉結(jié)合其他冠狀病毒。
2. 挑戰(zhàn)呼吸道合胞病毒
成功率:針對(duì)RSV-A病毒設(shè)計(jì)的23個(gè)測(cè)試抗體中,7個(gè)(30%) 成功結(jié)合。
強(qiáng)中和:其中3個(gè)抗體表現(xiàn)出強(qiáng)大的病毒中和活性。
結(jié)構(gòu)佐證:研究人員甚至通過(guò)冷凍電鏡解析了其中兩個(gè)抗體與病毒蛋白結(jié)合的精細(xì)結(jié)構(gòu),證實(shí)了AI設(shè)計(jì)的抗體能以正確的方式與目標(biāo)結(jié)合。
3. “零樣本”學(xué)習(xí):阻擊未知流感病毒
最令人驚艷的是MAGE的“零樣本”學(xué)習(xí)能力。研究人員用2024年新出現(xiàn)的H5N1禽流感病毒株的序列去提示MAGE,而這個(gè)特定病毒株在訓(xùn)練數(shù)據(jù)中從未出現(xiàn)過(guò)。
結(jié)果如何?MAGE成功生成了結(jié)合并中和該新病毒株的抗體!18個(gè)測(cè)試抗體中有5個(gè)(28%)有效。這證明了MAGE不僅能記憶,更能舉一反三,這對(duì)于快速應(yīng)對(duì)新興病原體具有無(wú)可估量的價(jià)值。
四、深遠(yuǎn)意義與未來(lái)展望
這項(xiàng)研究的成功,為我們描繪了一個(gè)充滿希望的未來(lái):
1.極速響應(yīng):面對(duì)下一次新發(fā)傳染病大流行,我們或許不再需要等待康復(fù)者血漿,而是可以直接用AI生成候選抗體藥物,將發(fā)現(xiàn)時(shí)間從數(shù)年縮短至數(shù)周甚至數(shù)天。
2. 成本大幅降低:AI驅(qū)動(dòng)的“干實(shí)驗(yàn)”大大減少了昂貴且耗時(shí)的“濕實(shí)驗(yàn)”篩選工作量。
3. 突破“不可成藥”靶點(diǎn):對(duì)于一些難以通過(guò)傳統(tǒng)方法獲得抗體的靶點(diǎn),AI可能提供全新的解決方案。
當(dāng)然,目前技術(shù)仍有局限,例如模型尚不能直接指定生成抗體的親和力或中和活性,仍需通過(guò)實(shí)驗(yàn)篩選。但隨著數(shù)據(jù)量的擴(kuò)大和算法的迭代,未來(lái)的AI必將在抗體藥物研發(fā)中扮演更加核心的角色。
結(jié)語(yǔ)
從大海撈針到按圖索驥,再到如今的 “無(wú)中生有” ,MAGE模型的出現(xiàn),標(biāo)志著我們正進(jìn)入一個(gè)計(jì)算驅(qū)動(dòng)生物設(shè)計(jì)的新時(shí)代。
它不僅是AI在基礎(chǔ)科學(xué)領(lǐng)域的一次華麗應(yīng)用,更預(yù)示著一條更快速、更高效、更精準(zhǔn)的藥物研發(fā)新路徑正在開啟。當(dāng)生物學(xué)遇見人工智能,生命的密碼正被以我們前所未見的方式解讀和重寫。