新藥發(fā)現(xiàn)是個(gè)極低概率事件,所以業(yè)界尋找提高成功率的努力一直就沒(méi)有停止過(guò)。一個(gè)陣營(yíng)認(rèn)為找到PCSK9這樣的優(yōu)質(zhì)靶點(diǎn)或者苯并二氮卓這樣的優(yōu)質(zhì)骨架事半功倍,所以從海量文獻(xiàn)中去找這類優(yōu)質(zhì)種子是一個(gè)前沿。最近人工智能(AI)的大潮進(jìn)入靶點(diǎn)發(fā)現(xiàn)領(lǐng)域,據(jù)說(shuō)已有>200家小型企業(yè)以AI作為平臺(tái)、其中以Insitro最為著名。另一個(gè)陣營(yíng)認(rèn)為藥物是訓(xùn)練出來(lái)的,TNF抗體失敗了敗血癥才去抗炎、PD-1抗體最早是作為艾滋病藥物、更不要提偉哥這種純粹意外發(fā)現(xiàn)。所以你手里有檸檬還是西紅柿并不重要,重要的是拿到檸檬需要知道用它來(lái)做檸檬水、拿到西紅柿要知道做番茄醬。最近一個(gè)叫做Protodigm的公司成立要幫助藥廠提高決策質(zhì)量。
當(dāng)然任何一個(gè)策略執(zhí)行到極致都可以勝出,如同冠軍球隊(duì)既可以是進(jìn)攻型也可以是防守型。現(xiàn)在從科技雜志到專利文獻(xiàn)都在指數(shù)增長(zhǎng),沒(méi)有任何一個(gè)公司或科研機(jī)構(gòu)有足夠的人力閱讀所有分析數(shù)據(jù)。AI雖然現(xiàn)在智力還達(dá)不到人的水平、但閱讀速度卻是任何人都無(wú)法比擬的,所以如果AI經(jīng)過(guò)足夠訓(xùn)練是可以在非常大范圍內(nèi)尋找有用信息和模式。但新藥發(fā)現(xiàn)的每一步都非常復(fù)雜,尤其是靶點(diǎn)發(fā)現(xiàn)。AI的終極目標(biāo)是能與人腦一樣聰明、但現(xiàn)在還需要大量人工培訓(xùn)。遺憾的是人腦在新藥發(fā)現(xiàn)中的劣勢(shì)不在于閱讀量不夠、而是穿透力不足,即使有超人能一天讀完所有文獻(xiàn)并熟知新藥研發(fā)整個(gè)過(guò)程還是不一定能找出下一個(gè)PD-1。
所以制藥業(yè)需要顛覆性靶點(diǎn),但AI更適合做me-too藥物。現(xiàn)在上市藥物靶點(diǎn)不超過(guò)1000個(gè),理論上我們可以把這些靶點(diǎn)臨床概念驗(yàn)證前的所有相關(guān)數(shù)據(jù)和其它信息提煉出來(lái)訓(xùn)練AI,如果這里面有可重復(fù)的模式AI應(yīng)該可以找出下1000個(gè)成藥靶點(diǎn)。這里面有些模式是肯定有預(yù)測(cè)能力的、比如如果看到默沙東突然把一期臨床人數(shù)從100增加到1000,這十有八九是個(gè)重要可成藥靶點(diǎn)、但這不需要AI也能做到。有些模式雖然是真正驅(qū)動(dòng)但不一定能重復(fù),比如碳酸鋰的毒性被錯(cuò)誤解讀為鎮(zhèn)靜療效、但不能依賴錯(cuò)誤解讀作為前進(jìn)依據(jù)。
在這些極端事件之間還是可以富集一些比背景噪音成功幾率更大靶點(diǎn),比如人體基因?qū)W、動(dòng)物基因敲除、RNA干擾都顯示劑量相關(guān)一致表型變化的靶點(diǎn)比沒(méi)有這些數(shù)據(jù)或者有數(shù)據(jù)但相互矛盾的靶點(diǎn)成功可能更大,這也是現(xiàn)在人工在做的工作、但做的不一定完全徹底。現(xiàn)在的AI可以比較詳盡地把人體約2萬(wàn)基因與約25萬(wàn)種表型和1萬(wàn)種疾病相關(guān)數(shù)據(jù)從海量文獻(xiàn)中提取出來(lái),并已有一些數(shù)據(jù)庫(kù)。但如何給這些證據(jù)質(zhì)量打分、哪些可靠哪些不可靠,尤其是判斷哪些是因果關(guān)系哪些只是相關(guān)關(guān)系連專家分析都一頭霧水,讓魔法師的門徒去決策顯然不現(xiàn)實(shí)。所以雖然阿爾法狗所向披靡,但I(xiàn)BM Watson卻黯然收?qǐng)觥J占瘮?shù)據(jù)容易,但把數(shù)據(jù)變成知識(shí)、把知識(shí)變成智慧現(xiàn)在還需要人的參與。
Protodigm的邏輯是藥物成功與否主要看你如何調(diào)教,制藥業(yè)的瓶頸不在于靶點(diǎn)太少或者靶點(diǎn)不夠好、關(guān)鍵是如何根據(jù)不斷積累的數(shù)據(jù)找到最佳用途。這當(dāng)然有很多支持的例子,因?yàn)閹缀跛械闹匾幬锒加羞^(guò)九死一生的經(jīng)歷,但PSCK9也可以作為一個(gè)有力的反證。Protodigm雖然沒(méi)有公布細(xì)節(jié)但估計(jì)也不外乎更嚴(yán)格在多維度評(píng)價(jià)藥物和靶點(diǎn)的可靠性和價(jià)值。這雖然是專家的特長(zhǎng)、但理論上也是可以由AI完成的,尤其是p53這樣將來(lái)可能成藥、現(xiàn)在公開信息很多的靶點(diǎn)。顯然如果AI能把可能的千里馬先圈起來(lái),伯樂(lè)的工作要輕松很多。
美中藥源原創(chuàng)文章,轉(zhuǎn)載注明出處并添加超鏈接,商業(yè)用途需經(jīng)書面授權(quán)。★ 請(qǐng)關(guān)注《美中藥源》微信公眾號(hào) ★
要發(fā)表評(píng)論,您必須先登錄。