【新聞事件】:昨天兩年一度的預(yù)測蛋白結(jié)構(gòu)CASP大賽揭曉,結(jié)果谷歌旗下Deepmind的AlphaFold2以較大優(yōu)勢冠軍。這個AI從氨基酸序列準確預(yù)測了約100個蛋白的三維結(jié)構(gòu),平均GDT(大概測量與實驗結(jié)構(gòu)的平均偏差)分值92.4、幾乎達到實驗水平。這個結(jié)果引起各界一片驚嘆,《自然》雜志說這將改變一切、有人甚至聲稱蛋白折疊問題已經(jīng)不再是問題。這一方面是大家對AI工夫如此了得的驚訝、另一方面似乎也期待新藥發(fā)現(xiàn)將變得容易很多。
【藥源解析】:這個結(jié)果無疑是個巨大成就。蛋白本是一個長鏈氨基酸聚合物,可能構(gòu)象數(shù)目巨大。據(jù)估計一個普通蛋白的構(gòu)象數(shù)目在10的300次方,而且很多構(gòu)象能量非常接近、所以預(yù)測天然結(jié)構(gòu)如大海撈針。很多天然蛋白可在極短時間內(nèi)折疊成極少數(shù)具有高選擇性、高活性的三維結(jié)構(gòu),如同一根鐵絲眨眼間自己折成一個大熊貓。獲得三維結(jié)構(gòu)可以通過實驗如X光、冷電鏡、核磁等實驗手段,也可以同源蛋白做模板預(yù)測。這個AlphaFold利用機器學(xué)習(xí)技術(shù)擺脫了上面這些技術(shù)限制,而且準確度驚人。這顯然對新藥發(fā)現(xiàn)可能有一定幫助。
但是這并一定能轉(zhuǎn)化成新藥產(chǎn)出的大幅增加。一是對于復(fù)雜蛋白復(fù)合物現(xiàn)在AI還預(yù)測能力有限,而這些蛋白-蛋白、核酸-蛋白復(fù)合物如表觀遺傳蛋白、DNA解旋酶等正在成為制藥業(yè)關(guān)注的新興靶點家族。二是雖然蛋白結(jié)構(gòu)很重要但蛋白因為上面提到存在多個能量類似構(gòu)象也很容易變形,尤其是與小分子配體結(jié)合后,所謂誘導(dǎo)契合是個很老的現(xiàn)象。所以如果沒有與先導(dǎo)物的共晶結(jié)構(gòu)藥物設(shè)計還是會受到限制。很多做CADD的朋友認為docking等計算技術(shù)可以根據(jù)蛋白結(jié)構(gòu)預(yù)測小分子配體結(jié)合強度,我不否認有成功案例、但當(dāng)代最重要的有機化學(xué)家George Whitesides最近還說總體上docking仍是一個懸而未決的技術(shù)難題。三是蛋白結(jié)構(gòu)只能提供更可靠思路,但把設(shè)計變成化合物還受合成技術(shù)的限制、也與結(jié)合腔的內(nèi)在結(jié)構(gòu)有關(guān)。分子間相互作用是有極限的(0.3 kcal/mol/重原子),如果沒有足夠的接觸面積是無法達到藥物水平的結(jié)合力的。
找到高活性小分子配體也只是新藥發(fā)現(xiàn)的一小部分,選擇性、過膜性、穩(wěn)定性等成藥性質(zhì)也需要優(yōu)化。雖然活性配體越多選擇也越多,但如何評價這些性質(zhì)并不是精準科學(xué)。除了化學(xué)問題還有更難的生物問題,這個靶點是否在治療疾病有用幾乎是無法在三期臨床前可靠預(yù)測的,這也是為什么臨床試驗失敗率多年高居不下的原因。蛋白結(jié)構(gòu)在很多藥靶并非限制因素,一些有實驗晶體結(jié)構(gòu)的靶點如Kras還是找不到高效配體。當(dāng)然能加快可成藥靶點配體的發(fā)現(xiàn)速度也是一個重要貢獻,但說能改變一切有點過于樂觀。當(dāng)年RBW合成奎寧后也令很多人樂觀地預(yù)測人類將不再依賴自然界獲取藥物,但現(xiàn)在合成技術(shù)與RBW時代不可同日而語但還是不能產(chǎn)業(yè)化全合成紫杉醇。AI如此高效也引起有些人擔(dān)心會取代科學(xué)家的工作,當(dāng)然有些工作會被AI代替、但AI進步的凈結(jié)果基本是會擴展人類技術(shù)的可及范圍,而不僅僅是把科學(xué)家踢出現(xiàn)在的小圈子。
美中藥源原創(chuàng)文章,轉(zhuǎn)載注明出處并添加超鏈接,商業(yè)用途需經(jīng)書面授權(quán)。★ 請關(guān)注《美中藥源》微信公眾號 ★
要發(fā)表評論,您必須先登錄。