機(jī)器學(xué)習(xí)初創(chuàng)企業(yè)獲強(qiáng)力支持

byb8w684o5zz

【新聞事件】:今天由著名機(jī)器學(xué)習(xí)(ML)專家Daphne Koller創(chuàng)建的Insitro宣布獲得包括Arch、Thirdrock在內(nèi)著名風(fēng)投的1億美元資助和與吉利德科學(xué)在NASH領(lǐng)域5000萬美元的合作(1500萬首付+3500萬近期里程金),長期吉利德最多可以每個項目2億美元獲得5個研發(fā)項目。Insitro將利用已有人體基因?qū)W數(shù)據(jù)并將自己大規(guī)模采集適合ML的生物學(xué)數(shù)據(jù)、建立ML模型,最終目的是提高新藥發(fā)現(xiàn)成功率、降低成本。Insitro定位不是數(shù)據(jù)提供和分析的服務(wù)型企業(yè),而是創(chuàng)新藥研發(fā)。

【藥源解析】:Insitro是in silico與in vitro兩個詞的縮寫,這是新藥發(fā)現(xiàn)食物鏈底端的兩個技術(shù),所以大家很容易對整個理念嗤之以鼻。AI和ML現(xiàn)在是被熱炒的概念,其中魚目混珠有、不少是起哄的吃瓜群眾,也經(jīng)常令這個技術(shù)蒙受不白之冤。但Daphne Koller可是ML領(lǐng)域著名專家、學(xué)術(shù)和工業(yè)界生涯都十分顯赫,據(jù)說在星巴克與Nelsen聊了1小時就獲得了Arch的支持。Insitro公開的信息不多,Koller去年曾發(fā)表一篇影響較大的博文闡述她的理念。雖然沒有太多具體信息,但I(xiàn)nsitro似乎主要目標(biāo)是尋找新靶點(diǎn)和預(yù)測應(yīng)答的生物標(biāo)記。

新藥發(fā)現(xiàn)十分復(fù)雜,不過剝皮剔肉剩下的核心是尋找蛋白或其它生物物質(zhì)的異常與疾病的相關(guān)性,然后發(fā)現(xiàn)足夠活性和選擇性的調(diào)控物質(zhì)、即藥物。人體雖然高度復(fù)雜但信息不是無限的,理論上每個細(xì)胞中的每種物質(zhì)(包括DNA、RNA、蛋白)在任何時刻(健康或疾病)的狀態(tài)和濃度是可知的。所以這些物質(zhì)的特征與疾病發(fā)生、疾病模型表型的相關(guān)性理論上也是可知的,當(dāng)然ML模型的智能程度和計算時間肯定是個限制因素、這也是為什么只有Koller這樣的頂級高手才能獲得VC青睞的原因。投資者寄希望阿爾法狗要是有個同樣聰明的雙胞胎弟弟經(jīng)Koller的訓(xùn)練可能會對靶點(diǎn)和生物標(biāo)記的發(fā)現(xiàn)起到一定幫助。

雖然我對ML一竅不通但我估計這個領(lǐng)域還沒成熟到可以大規(guī)模發(fā)現(xiàn)新靶點(diǎn)的程度,投資者也不會期待他們一下能找到10個PD-1水平的靶點(diǎn)。實際情況更可能是如果切入點(diǎn)選擇老道,某些具體問題可能會通過ML更有效地解決,如同電影《徒手攀巖》中幾個關(guān)鍵點(diǎn)(如那個boulder難題)如果能多出一個著力點(diǎn)就可以顯著降低整個攀登的難度、而不一定要在El Cap上裝一電梯。沒有新藥開發(fā)新技術(shù)的目標(biāo)是把成功率從0%提高到100%,5%到10%的提高就可以令整個行業(yè)從垂死回到增長狀態(tài)。

ML的雛形在新藥發(fā)現(xiàn)中早就存在,藥物化學(xué)中QSAR的基本原則就是通過統(tǒng)計回歸分析尋找分子特征與活性的相關(guān)性。當(dāng)然受當(dāng)時條件限制一般的QSAR分析只包含幾個分子特征(如clogP、氫鍵等),一般的訓(xùn)練數(shù)據(jù)也只有幾十個化合物。一個分子可能有數(shù)千分子特征、一個HTS可以獲得上百萬的活性數(shù)據(jù)點(diǎn),所以QSAR理論上在ML時代也可能變得更有威力。當(dāng)然現(xiàn)在每年產(chǎn)生的高質(zhì)量生物學(xué)數(shù)據(jù)點(diǎn)可能比分子特征數(shù)量要高幾個數(shù)量級,所以ML可能起的作用更大,另外Insitro也將自己量身采集大量更容易使用的數(shù)據(jù)。高質(zhì)量數(shù)據(jù)的大規(guī)模出現(xiàn)是ML進(jìn)入新藥的重要基礎(chǔ)。

當(dāng)然這里面的困難也是顯而易見的。無論你用什么分析方法,動物或細(xì)胞模型表型向人體疾病的轉(zhuǎn)化仍是個獨(dú)立的技術(shù)障礙。雖然現(xiàn)在數(shù)據(jù)的質(zhì)量有所提高但可靠性、可重復(fù)性是否足以與噪音分開仍需要實踐檢驗,前幾天去世的分子生物學(xué)奠基人Sydney Brenner稱大數(shù)據(jù)生物學(xué)是高通量、無產(chǎn)出,ML要高效影響新藥開發(fā)需要與深刻的生物學(xué)洞見相結(jié)合。另外ML輸出也要容易驗證,你說俺家機(jī)器說了低劑量二甲雙胍能逆轉(zhuǎn)帕金森、誰也不敢就因此開始一個三期臨床。ML機(jī)會與挑戰(zhàn)并存,所以頂級VC資助頂級科學(xué)家去看個究竟。

美中藥源原創(chuàng)文章,轉(zhuǎn)載注明出處并添加超鏈接,商業(yè)用途需經(jīng)書面授權(quán)
★更多深度解析訪問《美中藥源》~

請關(guān)注《美中藥源》微信公眾號

YaoYuan

發(fā)表評論

高陵县| 雷州市| 温泉县| 长沙县| 普兰县| 化州市| 红桥区| 万山特区| 赫章县| 莱芜市| 塘沽区| 东乡县| 渭南市| 大庆市| 安阳县| 卓尼县| 密云县| 彩票| 民权县| 茂名市| 浠水县| 米林县| 辽宁省| 绥德县| 长武县| 若羌县| 浮山县| 图们市| 贵溪市| 山东省| 宜兴市| 永丰县| 抚松县| 台东县| 黑水县| 当阳市| 稷山县| 田阳县| 双辽市| 庄浪县| 砀山县|