share_log

应用前景广阔!AI将成药物发现领域“主力军”

應用前景廣闊!AI將成藥物發現領域“主力軍”

智通財經 ·  05/05 23:26

來源:智通財經

據從事人工智能和醫療保健交叉領域工作的高管表示,在不久的將來,該領域將完全由人工智能生成藥物。一些業內人士則表示,最多在幾年內,它將成爲藥物發現的一種規範。              

$禮來 (LLY.US)$一直在使用生成式人工智能發現藥物分子。數據顯示,人工智能在五分鐘內發現的藥物分子數量相當於禮來在傳統實驗室一整年合成的分子數量,因此測試人工智能在醫學領域的極限是有意義的。我們無法知道大量人工智能生成的設計是否能在現實世界中發揮作用,而這正是持懷疑態度的公司高管想要了解更多的東西。

禮來首席信息和數字官Diogo Rau最近參與了一些由人工智能生成藥物分子的非典型實驗。他描述這些人工智能生成的生物設計爲具有“奇怪結構”的分子,且無法與該公司現有的分子數據庫想匹配,但看起來似乎是潛在的強大候選藥物。這些由人工智能生成的藥物分子被交給了禮來的研究科學家,並讓他們感到驚訝。

據從事人工智能和醫療保健交叉領域工作的高管表示,在不久的將來,該領域將完全由人工智能生成藥物。一些業內人士則表示,最多在幾年內,它將成爲藥物發現的一種規範。生成式人工智能正在迅速加速器在新藥物開發和發現中的應用。此舉不僅將重塑製藥行業,還將重塑幾個世紀以來已融入科學方法的基本思想。

谷歌DeepMind成“先行者”

與人工智能相關的進步發生在生物領域,這一領域正在以英偉達醫療保健副總裁Kimberly Powell所描述的“前所未有的規模和分辨率”日益數字化。

這一變化實際發生在OpenAI的ChatGPT在公衆裏變得熟悉之前的幾年。2021年,谷歌的DeepMind人工智能部門率先將人工智能大語言模型應用於生物學。Kimberly Powell表示:“我們可以用非常大的數據集訓練這些變形模型,從氨基酸序列到蛋白質結構,這是藥物開發和設計的核心。”

這是一場醫學革命,包括以3D方式掃描組織內數百萬個細胞的空間基因組學,以及受益於已經以數字形式存在的化學物質目錄的AI模型構建,這允許生成人工智能transformer模型現在對它們進行工作。Kimberly Powell表示:“這種訓練可以通過無人監督和自我監督學習來完成,而且不僅可以快速完成,而且可以富有想象力。人工智能可以‘思考’出人類無法做到的藥物模型。”

ChatGPT的機制可以作爲理解人工智能藥物開發的類比。Kimberly Powell表示:“它基本上是在每一本書、每一個網頁、每一個PDF文件上進行了訓練,它以這樣一種方式編碼了世界上的知識,你可以向它提問,它可以爲你提供答案。”

GPT版本的藥物發現

藥物發現是一個見證生物行爲相互作用和變化的過程,但在實驗室中需要數月或數年的時間,可以在模擬傳統生物行爲的計算機模型中得到體現。Kimberly Powell表示:“當你能模擬它們的行爲時,你就能預測它們是如何協同工作和相互作用的。”“我們現在有能力表現藥物世界——生物學和化學——因爲我們有人工智能超級計算機,使用人工智能和類似GPT的方法,有了所有的數字生物學數據,我們第一次可以在計算機中表現藥物世界。”

這與上個世紀主導藥物發現的經典經驗方法截然不同:廣泛的實驗,隨後的數據收集,在人類層面上的數據分析,然後是基於這些結果的另一個設計過程——在公司內部進行實驗,然後是幾個決策點,科學家和高管們希望這些決策點將導致成功的臨床試驗。Kimberly Powell表示:“這是一個非常手工的過程。因此,這是一個失敗率高達90%的藥物發現過程。”

人工智能的支持者認爲,這將節省時間,提高成功率,將經典過程轉變爲更系統化和可重複的工程,使藥物研究人員能夠建立更高的成功率。Kimberly Powell援引最近發表在《自然》雜誌上的研究結果指出,安進發現,在人工智能的幫助下,一種藥物的發現過程原本可能需要數年時間,現在可以縮短到幾個月。更重要的是,考慮到藥物開發的成本(每次試驗的成本可能在3000萬至3億美元之間),在早期將人工智能引入這一過程後,成功率大幅提高。經過兩年的傳統開發過程,成功的概率是50%。Kimberly Powell表示,在更快的人工智能增強過程結束時,成功率上升到90%。

Kimberly Powell表示:“我們預測,藥物發現的進展應該會大幅提升。”生成式人工智能的一些值得注意的缺陷,比如它的“幻覺”傾向,可能會在藥物發現方面發揮重要作用。Kimberly Powell 補充稱:“在過去的幾十年裏,我們一直在尋找相同的目標,但如果我們可以使用生成方法來開闢新的目標呢?”

“幻覺”發現的新藥

人工智能可以從模型中不存在的蛋白質開始工作,這種方法在經典的經驗模型中是站不住腳的。從數字上看,人工智能有更大的發現需要探索。Kimberly Powell表示,可以作爲一種治療方法的蛋白質的潛在數量基本上是無限的——10的160次方,或者10的160次方——現有的利用自然賦予人類的蛋白質的限制將被打破。“你可以使用這些模型來產生可能具有我們需要的所有功能和特徵的‘幻覺’蛋白質。它可以做到人腦無法做到的事情,但計算機可以做到。”

德克薩斯大學奧斯汀分校最近爲其新的生成式人工智能中心購買了最大的英偉達計算集群之一。分子生物科學教授Andy Ellington表示:“就像ChatGPT能夠從字母串中學習一樣,化學物質也可以用字符串來表示,我們可以從中學習。”他表示,人工智能正在學習區分藥物和非藥物,並創造新的藥物,就像ChatGPT可以創造句子一樣,“隨着這些進步與預測蛋白質結構的持續努力相結合,應該很快就可以識別出適合關鍵目標的類似藥物的化合物。”

德州大學機器學習基礎研究所計算機科學博士後Daniel Diaz表示,目前人工智能在藥物方面的大部分工作都集中在小分子發現上,但他認爲,更大的影響將是在新型生物製劑(基於蛋白質的藥物)的開發上,他已經看到了人工智能如何加快尋找最佳設計的過程。

Daniel Diaz的研究小組目前正在進行一種治療乳腺癌的動物實驗,這種治療方法是一種人類蛋白質的工程化版本。這種蛋白質可以降解乳腺癌所依賴的一種關鍵代謝物。傳統上,當科學家需要一種蛋白質用於治療時,他們會尋找幾種特徵,包括不易分解的穩定蛋白質。這需要科學家引入基因工程來調整蛋白質,這在實驗室工作中是一個繁瑣的過程——繪製結構並從所有可能的基因修飾中識別出最佳選擇。

現在,人工智能模型正在幫助縮小可能性,因此科學家們可以更快地知道要嘗試的最佳修改。在Daniel Diaz引用的實驗中,使用更穩定的人工智能增強版本導致蛋白質產量提高了大約七倍,因此研究人員最終有更多的蛋白質可供測試和使用。Daniel Diaz 表示:“結果看起來非常有希望。”而且由於它是一種基於人體的蛋白質,病人對這種藥物過敏的幾率——對基於蛋白質的藥物的過敏反應是一個大問題——被降到最低。

英偉達最近發佈了所謂的人工智能醫療“微服務”,包括藥物發現——這是該公司在醫療領域採用人工智能的雄心壯志的一部分——使研究人員能夠篩選數萬億種藥物化合物並預測蛋白質結構。計算軟件設計公司Cadence正在將英偉達AI集成到一個分子設計平台中,該平台允許研究人員使用數千億化合物生成、搜索和建模數據庫。它還提供與DeepMind的AlphaFold-2蛋白質模型相關的研究功能。

最終,人工智能設計的藥物將取決於藥物開發的傳統最後一步:人體試驗的表現。Kimberly Powell表示:“你仍然需要拿出確鑿的證據。”她將目前的進展水平與自動駕駛汽車的訓練進行了比較——自動駕駛汽車正在不斷收集數據,以加強和重新增強模型。Kimberly Powell 表示:“同樣的事情也發生在藥物發現領域。你可以用這些方法來探索新的空間……磨練它,磨練它……進行更智能的實驗,獲取實驗數據並將其反饋到模型中,循環往復。”

但相比之下,在更廣泛的人工智能模型領域中,生物領域的空間仍然很小。在多模態和自然語言處理領域,人工智能行業擁有一萬億或更多參數的模型,相比之下,生物模型的參數量僅達數百億。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論