應用

技術

物聯網世界 >> 物聯網新聞 >> 物聯網熱點新聞
企業注冊個人注冊登錄

醫藥研發領域大數據和人工智能的應用探討

2019-04-09 09:23 火石創造

導讀:近年來,人工智能技術(AI)與醫療健康領域的融合不斷加深。AI在醫療領域主要應用場景包括語音錄入病歷、醫療影像輔助診斷、藥物研發、醫療機器人和個人健康大數據的智能分析等。

醫藥;互聯網醫療;生物制藥,新藥研發,人工智能,新藥研發,醫療健康,Al應用場景

圖片來自“123rf.com.cn”


【編者按】人工智能(AI)技術應用的重要場景之一是助力藥物研發,相比傳統的藥物研發耗時耗力、成功率低,AI技術的應用可大大縮短藥物研發時間、提高研發效率并控制研發成本。

本文來源于火石創造,作者孫翔宇;經億歐大健康編輯,供行業人士參考。


近年來,人工智能技術(AI)與醫療健康領域的融合不斷加深。AI在醫療領域主要應用場景包括語音錄入病歷、醫療影像輔助診斷、藥物研發、醫療機器人和個人健康大數據的智能分析等。隨著語音交互、文本識別、圖像識別和大數據分析,以及智能終端等技術的逐漸成熟,AI的應用場景越發多樣。

 人工智能在醫療領域的應用.png


圖1  人工智能在醫療領域的應用

藥物研發是AI技術應用的重要場景之一。藥物研發要經歷靶點的發現與驗證、先導化合物的發現與優化、候選化合物的挑選及開發和臨床研究等多個階段。傳統的藥物研發耗時耗力,且成功率低。AI助力藥物研發,可大大縮短藥物研發時間、提高研發效率并控制研發成本。


新藥開發流程圖.jpg


圖2  新藥開發流程圖

一、AI助力新藥研發的六大應用場景

目前制藥企業紛紛布局AI領域,主要應用在新藥發現和臨床試驗階段,主要有以下六大應用場景:

1.海量文獻信息分析整合

海量文獻信息分析整合對于藥物研發工作者來說,最讓他們頭疼的事如何去甄別每天產生的海量科研信息。而人工智能技術恰恰可以從這些散亂無章的海量信息中提取出能夠推動藥物研發的知識,提出新的可以被驗證的假說,從而加速藥物研發的過程。

英國生物科技公司Benevolent Bio(隸屬于 Benevolent AI),利用技術平臺JACS(Judgment Augmented Cognition System),從全球范圍內海量的學術論文、專利、臨床試驗結果、患者記錄等數據中,提取出有用的信息,發現新藥研發的蛛絲馬跡。

2017年,借助JACS的分析能力,Benevolent Bio 標記了100個可用于治療肌萎縮性側索硬化癥(ALS)的潛在化合物,從中篩選出5個化合物。經過英國謝菲爾德神經轉化研究所的小鼠試驗,證實4個化合物在治愈運動神經衰退方面確有療效。4/5的有效篩選率,這是研究人員之前從未想過的。

位于英國倫敦的BenevolentAI成立于2013年,是一家致力于AI技術開發和應用的公司,是歐洲大的AI初創公司。他們的目標是建立人們期盼已久的“制藥企業2.0”,利用AI助力新藥開發,降低臨床試驗的失敗率。自2013年以來,Benevolent AI已經開發出24個候選藥物,且已經有藥物進入臨床IIb期試驗階段。

國際制藥巨頭之一的強生公司已經與Benevolent AI達成合作協議,強生將一些已經進入臨床階段的試驗藥物連帶一起特許給Benevolent AI,而Benevolent AI將利用人工智能系統來指導臨床試驗的進行和數據的收集。

2.化合物高通量篩選

化合物篩選,是指通過規范化的實驗手段,從大量化合物或者新化合物中選擇對某一特定作用靶點具有較高活性的化合物的過程。而要從數以萬計的化合物分子中篩選出符合活性指標的化合物,往往需要較長的時間和成本。

AI 技術可以通過對現有化合物數據庫信息的整合和數據提取、機器學習,提取大量化合物與毒性、有效性的關鍵信息,既避免了盲人摸象般的試錯路徑,還可以大幅提高篩選的成功率。

典型代表是硅谷公司Atomwise。Atomwise公司成立于2012年,其核心產品為AtomNet是一種基于深度學習神經網絡的虛擬藥物發現平臺。AtomNet就像一位人類化學家,使用強大的深度學習算法和計算能力,來分析數以百萬計的潛在新藥數據。目前,AtomNet已經學會識別重要的化學基團,如氫鍵、芳香度和單鍵碳,同時該系統可以分析化合物的構效關系,識別醫藥化學中的基礎模塊,用于新藥發現和評估新藥風險。


AtomNet通過訓練能夠識別抗生素中常見的化合物結構——磺酰基.jpg


圖2  AtomNet通過訓練能夠識別抗生素中常見的化合物結構——磺酰基

 AtomNet在抗腫瘤藥物、神經系統疾病藥物、抗病毒藥物、抗寄生蟲藥和抗生素藥物的藥物篩選方面表現出色。例如,2015年AtomNet僅用一周模擬出2種有潛力用于埃博拉病毒治療的化合物。Atomwise正與全球知名藥企和大學院校進行合作,其中包括輝瑞、默克、abbvie和哈佛大學等。

類似于Atomwise ,現在有一系列人工智能公司專注于藥物分子篩選,包括Recursion Pharmaceuticals、BenevolentAI、TwoXAR、Cyclica和Reverie Labs等。

3.發掘藥物靶點

現代新藥研究與開發的關鍵是尋找、確定和制備藥物靶點。靶點是指藥物在體內的作用結合位點,包括基因位點、受體、酶、離子通道和核酸等生物大分子。

典型代表是Exscientia公司,Exscientia與葛蘭素史克(GSK)在藥物研發達成戰略合作。Exscientia 通過AI藥物研發平臺為GSK的10個疾病靶點開發創新小分子藥物。

Exscientia開發的AI系統可以從每個設計周期里的現有數據資源中學習,其原理與人類的學習方式相似,但AI在識別多種微妙變化以平衡藥效、選擇性和藥代動力學方面要更加高效。其AI系統完成新藥候選的時間和資金成本只需傳統方法的1/4。目前該公司與國際多家知名藥企形成戰略合作,包括強生、默克和賽諾菲等。


Exscientia 藥物研發流程圖示.jpg


圖3  Exscientia 藥物研發流程圖示

4.預測藥物分子動力學指標(ADMET)

ADMET包括藥物的吸收、分配、代謝、排泄和毒性。預測ADMET是當代藥物設計和藥物篩選中十分重要的方法。過去藥物ADMET性質研究以體外研究技術與計算機模擬等方法相結合,研究藥物在生物體內的動力學表現。目前市場中有數十種計算機模擬軟件,包括ADMET Predicator、MOE、Discovery Studio和Shrodinger等。該類軟件現已在國內外的藥品監管部門、制藥企業和研究院所得到了廣泛應用。

典型的代表包括晶泰科技(XtalPi)、Numerate等。為了進一步提升ADMET性質預測的準確度,已有生物科技企業探索通過深度神經網絡算法有效提取結構特征,加速藥物的早期發現和篩選過程。其中晶泰科技通過應用人工智能高效地動態配置藥物晶型,能完整預測一個小分子藥物的所有可能的晶型,大大縮短晶型開發周期,更有效地挑選出合適的藥物晶型,減少成本。


晶泰科技提供的晶型篩選服務.jpg


圖4  晶泰科技提供的晶型篩選服務

5.病理生物學研究

病理生物學(pathophysiology)是一門研究疾病發生、發展、轉歸的規律和機制的科學。病理生物學研究是醫藥研發的基礎,至今許多疾病尚無治療方法,是由于在病理生物學研究方面沒有取得進展。

肌萎縮側索硬化(ALS)是一種破壞性的神經退行性疾病,發病機制至今不明。ALS的一個突出病理特征是,一些RNA結合蛋白(RNA binding proteins, RBPs)在ALS中發生突變或異常表達/分布。人類基因組中至少有1 542種RBPs,目前已發現17種RBPs與ALS相關,除此以外,其他RBPs是否與ALS相關呢?


IBM Watson鑒定RBPs.jpg


圖6  IBM Watson鑒定RBPs

典型案例是IBM公司開發的Watson系統,通過閱讀了2 500萬篇文獻摘要,100萬篇完整論文和400萬專利文獻,并基于相關文獻的大量學習,建立了模型預測RBPs與ALS相關性。有研究者為了測試其模型的預測能力,首先將IBM Watson的知識庫限制在2013年之前的學術出版物上,并要求Watson使用這些可用的信息來預測與ALS相關的其他RBPs。在2013—2017年期間,Watson在對4個導致突變的RBPs給出了高度評價,證明了模型的有效性。而后,Watson對基因組中所有的RBPs進行篩選,并成功鑒定在ALS中改變的5種新型RBPs。

6.發掘藥物新適應癥

利用深入學習技術,將臨床藥物與新的適應癥相匹配。這樣可以繞過動物實驗和安全性實驗。

例如,沙利度胺曾用來治療麻風病,后來研究人員發現其對多發性骨髓瘤具有療效。由于該藥物已經積累了大量的安全性與劑量數據,研究人員能夠繞過第一階段的安全性和劑量試驗。

根據實驗結果,FDA在2012年批準沙利度胺治療多發性骨髓瘤。據彭博預測,這個過程總共花費了4 000~8 000 萬美元。如果從零開始,一個新藥所需的平均費用為20 億美元。


1554689757104817.jpg


圖7  藥物再利用與新藥研發的成本對比

典型代表為Lam Therapeutics、NuMedii、Healx和Insilico Medicine等人工智能公司,他們已經在“老藥新用”這個領域進行了深度探索。

二、AI新藥研發公司

中國在AI領域的論文發表數量位居全球第一。在醫學領域,我們在放射影像、病理、自然語言處理和智能語音錄入等領域的研究與歐美并駕齊驅,但在AI+新藥研發領域,卻差距較大。部分AI新藥研發公司名單見表1。


IBM Watson鑒定RBPs.jpg


表1 部分人工智能藥物研發公司名單

2014年,晶泰科技創立于麻省理工學院校園。其核心總部位于深圳,并在北京、波士頓設有分部。晶泰科技目前已與多家世界頂級藥企與科研機構建立深度合作,其藥物固相篩選與設計平臺是行業最先進的解決方案。憑借團隊的技術優勢與項目廣闊的市場空間,晶泰科技已獲得騰訊、真格基金、峰瑞資本數千萬元的A輪投資,以及來自紅杉、Google、騰訊的數千萬美金B輪融資,成為全球AI+制藥領域獲得融資最高的創業公司之一。

2018年12月,天津國際生物醫藥聯合研究院與北京天云大數據簽署戰略合作協議,雙方將在人工智能醫藥研發平臺建設領域聯手,為京津冀乃至全國提供服務。根據協議,雙方將共同建設人工智能醫藥研發平臺,立足京津地區,為藥物研發等大健康行業創新發展賦能,致力于人工智能與大數據技術在醫藥行業內的推廣和應用。同時,雙方各自發揮優勢,共同開展人工智能醫藥研發平臺的推廣工作,推動建立京津冀醫藥智能技術創新聯盟。

三、AI藥物研發領域的關鍵要素

中國在AI藥物開發領域已經開始起步,但遠未成熟,還有非常大發展空間。在筆者看來,我國進行AI藥物研發需要在人才培養、數據共享和商業模式創新等方面進行發力。

1.培養高端人工智能人才,探索跨學科人才合作機制。

創業的競爭歸根結底是人才的競爭,這在人工智能領域表現得愈加明顯。在全球范圍內,大約有2.2萬名具有博士以上學歷的人工智能從業人員和研究人員,中國僅600名左右。國內人工智能人才幾乎被幾大頭部企業壟斷,比如商湯有150多名人工智能博士,占比全國人工智能博士總數1/4。

數據顯示,未來中國人工智能人才缺口高達500萬,唯一的解決辦法就是成體系地培養人工智能人才。

2018華為全聯接大會上,華為云推出了“沃土AI開發者計劃”,投入10億人民幣培養高校和研究所的AI人才,并與清華大學、中科院、中國科學技術大學、浙江大學等達成AI合作。

2018年8月,商湯科技攜手香港中文大學、亞馬遜、南洋理工大學、悉尼大學聯合舉辦的首屆WIDER Face and Pedestrian Challenge 2018(簡稱:WIDER Challenge)挑戰賽,包括中科院計算所、微軟亞洲研究院、北京大學、卡耐基梅隆大學、香港大學以及雅虎、京東、曠視、科大訊飛、滴滴等科技公司參賽。

此外,AI應用于藥物研發需要若干個垂直領域的專家共同參與才能有所突破。既需要物理學家、化學專家、藥物學家、藥企研發高管,又需要人工智能科學家、云計算工程師等跨學科人才。通過在多個領域人才和經驗的積累,

整個團隊需要緊密合作,這樣才更容易獲得突破性的思路和好的成果。

2.建立研發數據標準體系,完善數據共享機制。

AI藥物研發需要高質量數據支持。國內創新藥研發起步較晚,與國外相比,對于優質數據的積累還有一定差距。

制藥產業的專業門檻高、鏈條長,加之國內長期以來的“多頭管理”體制,造成了國內的藥品數據極度割裂,標準不統一、數據孤島現象嚴重;另外,醫藥領域的監管政策與機構改革頻繁,造成歷史藥品數據銜接難度較大。這些都會導致醫藥數據統計在完整度和精準度上的不足,從而影響相關決策。

當前國內企業“大數據化”采取的一個路徑,便是以“專業人工+機器輔助”方式建立數據標準詞典(包括藥品、企業、靶點、疾病等),持續進行數據清洗、識別、匹配和挖掘算法,將市場上分散的數據全面重構,形成一系統標準數據模塊倉庫,根據用戶場景對數據模塊進行組合。比如國內的醫藥魔方、米內數據、藥渡等醫藥大數據服務公司。

3.定位產業鏈角色,創新商業模式。

目前人工智能醫藥研發領域存在三種商業模式:

(1)開放和反饋模式。晶泰科技一開始就明確了初期主要客戶群,在地域設置上形成國內研發,國際業務拓展的模式。在有效控制研發成本的同時,起步階段就努力在國際范圍內尋求合作者。

基于藥物研發流程的復雜性,人工智能在藥物研發中的大規模應用依賴于整個產業鏈的共同努力。晶泰科技主導開放和反饋模式,其長處是為傳統研發人員提供最先進的計算軟硬件工具,幫助他們更好更快地完成科研任務。

(2)虛擬篩選團隊外包驗證模式。虛擬篩選團隊外包的主要方式有是與利益相關者或非利益相關者合作。

與入利益相關者合作,比如一個更大的醫藥公司,公司將受益頗多,比如激勵一致、與已有臨床生產線的整合、致力于特定疾病團隊帶來的專業知識等。雖然公司需要割舍部分控制力或所有權, 但是有利于項目研發成功率的提升。

與非利益相關者合作(例如CRO),公司保留完全的知識產權,執行速度快但是成本高。而且在實驗設計上有可能面對控制權的損失,所以為了保證高質量的結果必須給予特殊的關注。

這個模式的好處是成本低,速度快,特別是工業界的合作伙伴在新化合物后期驗證和臨床研發中具有巨大機會。合作伙伴能夠理解這些驗證實驗的動機和設計是至關重要的,因為他們在后續的臨床研發中充當重要角色。Nimbus Therapeutics,TwoXAR,Atomwise等公司就采用這種模式。

(3)獨立的藥物研發團隊和虛擬篩選團隊的合作模式。在這個模式中,公司團隊專注于計算機虛擬篩選,而其他團隊給予實驗藥物研發的支持。和通常專注于特定的配體\受體、生物現象或者疾病領域的團隊的良好合作,使項目研發團隊有獨特的專業性。

雖然配合程度沒有一個完全整合團隊那么強,但這種模式的優勢在于,提供的處理結構的可變性和合作者的可選擇性。具有廣泛應用平臺的虛擬篩選團隊可以考慮用這個結構,在使資本成本最小化的同時處理很多研發項目。

四、小結

1.新藥研發存在環節多、研發費用高、研發周期長和研發成功率低等問題。

新藥研發從上游到下游的幾個環節包括藥物靶標的確定,先導化合物的篩選,先導化合物的優化和最終的臨床實驗。研發費用高、研發周期長、研發成功率低一直是壓在制藥企業身上的“三座大山”。塔夫茨藥物開發研究中心(Tufts Center for The Study of DrugDevelopment)的數據顯示:開發一種新藥的平均成本為 26 億美元;一種新藥上市的平均時間約為12 年;大約只有 10% 的候選藥物能從第一階段測試走向市場。德勤的數據顯示:2017 年,美國最大的生物制藥公司的投資回報率下降至3.2%。

2.AI技術的崛起,為新藥研發帶來了新方向。

過去 20 年,計算機處理能力的持續快速增長,大量數據集的可用性和先進算法的開發,大大推動了機器學習的發展。新藥研發領域數據密集,這讓人工智能有了用武之地。AI 不僅能夠挖掘出不易被發現的隱性關系,構建藥物、疾病和基因之間的深層次關系。同時,可對候選化合物進行虛擬篩選,更快地篩選出具有較高活性的化合物,為后期臨床試驗做準備。

目前,AI 在新藥研發領域主要應用于靶點發現、化合物合成、化合物篩選、晶型預測、患者招募、優化臨床試驗設計和藥物適應癥開拓等場景。來自 Tech Emergence 的一份報告研究了所有行業的人工智能應用,結果表明:人工智能可以將新藥研發的成功率從 12%提高到 14%,可以為生物制藥行業節省數十億美元。

自2017年以來,AI在制藥領域的應用可謂如火如荼,國際制藥巨頭紛紛入局AI開發,用于提高新藥的研發效率。據統計,有100 多家初創企業在探索用 AI 發現藥物,傳統的大型制藥企業更傾向于與采用合作的方式,如阿斯利康與 Berg,強生與 Benevolent AI,默沙東與 Atomwise,武田制藥與 Numerate,賽諾菲和葛蘭素史克與 Exscientia,輝瑞與 IBM Watson 等。同時,AI應用于新藥研發仍需面對人才短缺、數據標準化與共享機制、商業模式創新等諸多問題。

在制藥和生命科學中,數據是AI的關鍵。AI被應用于藥物研發的各個階段,但若是數據質量不高,即便使用非常可靠的算法,也不會取得好結果,反而會浪費大量的資源和時間。鑒于此,IBM 曾在2016年斥資26億美元收購醫療數據公司Truven;羅氏曾在2018年以19億美金收購腫瘤大數據公司Flatiron Health的全部股份。也有專家表示,通過知識共享開展合作和提高已有數據的質量比積累數據更為重要,關鍵是建立一套切實可行的數據標準,與風險利益共擔的數據分享機制。

3.AI和藥物開發的模式,主要包括AI研發外包、企業內部組建AI研發部門,但每種模式都有各自的優缺點。

AI研發外包。由制藥公司提供特定的研究數據和生物靶點信息,然后由AI驅動的藥物發現初創公司依靠這些數據建立模型。一旦成功篩選出候選藥物,制藥公司會根據協議進行授權或自行擁有這種藥物。這種策略靈活性高且成本較低,但AI公司做為服務方需要獲取制藥公司整個藥物開發流程中最“隱私”的情報,因此,選擇合適的合作伙伴是重中之重。

在企業內部組建AI研發部門。在與外部積極合作的同時,制藥公司也在培養內部AI專業技能,并建立數字基礎設施,以提高數據使用效率。這種方式的挑戰在于如何建立內部專業的AI算法和自動化流程,以及高效的運算平臺。

無論哪種模式,AI和藥物開發的結合,與其說是對IT技術人員的挑戰,不如說更是對藥學人員的挑戰。一個運營良好的AI藥物發現團隊,應該是能夠讓IT技術人員和藥學科學家保持溝通無障礙,彼此交流更明晰,清楚對方的意圖。


公式规律七尾