share_log

さくらインターネットとCOGNANOのAI創薬に関する共同研究論文が、世界最高峰のAI国際会議「NeurIPS 2024」に採択

櫻花互聯網和COGNANO的AI藥物研究聯合論文被世界頂尖的AI國際會議"NeurIPS 2024"所接受

SAKURA Internet ·  09/29 11:00

位於大阪府大阪市,由經理合夥人田中邦裕擔任總裁的Sakura Internet株式會社的內部研究所「Sakura Internet Institute」和位於京都府京都市,由總裁伊村明浩擔任總裁的Cognano株式會社共同進行人工智能(AI)藥物研究,在機器學習領域最具挑戰性的國際會議「Neural Information Processing Systems(NeurIPS)2024」的數據集和基準測試領域被採納。
此外,該論文將在加拿大不列顛哥倫比亞省溫哥華發表,時間爲2024年12月11日(星期三)至13日(星期五)。

大

研究概要圖

Sakura Internet Institute和Cognano選擇了新冠病毒(SARS-CoV-2)作爲靶抗原,利用活着的羊駝免疫系統創建了與SARS-CoV-2和多種抗體的大規模標記交互作用數據集,並加以公開。該公開數據集的獨特性和實用性得到了評價,從而使研究論文被採納。

ChatGPT的出現催生了大規模語言模型(LLM)的研究,自然語言處理技術正迅速發展。這種技術進步不僅僅限於我們日常使用的自然語言,也擴展到藥物研究領域,特別是抗體藥物研究領域。原因在於,抗體可以以20種氨基酸的排列(用1個字母表示)表達,這使其與目前利用大量抗體序列數據進行學習的語言模型(以下稱爲抗體語言模型)的研究開發蓬勃發展,有望擴大有效的抗體藥物探索的可能性。然而,與自然語言相比,抗體序列數據的公開數據相對有限。特別對於缺乏表明特定抗體序列與哪種抗原(如病毒或細菌等)相互作用的標記數據集,這是今後在抗體語言模型發展中的重要挑戰。

爲了解決這一問題,Sakura Internet Institute和Cognano確立了利用羊駝等駝科動物實現大規模抗原抗體互作用數據生成的方法,並公開了生成的數據集。與其他動物相比,像羊駝這樣的駱駝科動物具有異乎尋常簡單的抗體組織,能夠更有效地將序列數據化。自2020年初以來,Sakura Internet Institute和Cognano選擇了造成全球大流行的新冠病毒(SARS-CoV-2)作爲靶抗原,利用活着的羊駝免疫系統創建了與SARS-CoV-2和多種抗體的大規模標記交互作用數據集,並加以公開。通過該數據集的公開,全球研究人員可以開發和評估更精確的抗體語言模型。該論文對這一新公佈數據集的獨特性和實用性進行了評估,進而被採納。這一研究成果利用AI技術帶來了抗體藥物研究的新可能性,有望爲醫學進步和AI應用領域的拓展做出貢獻。

Sakura Internet Institute和Cognano將繼續努力進行研究開發,實現對社會有用且新穎的互聯網基礎設施。

※1 AI藥物研究是指利用人工智能技術推動藥物研發過程的方法。
※2 抗體是指免疫系統生成的一種蛋白質,用於清除體內進入的病毒、細菌等有害異物。 抗體目前是治療人類疾病的重要藥物開發模式之一。

本合作研究中的各自角色

veru inc公司

通過生物實驗,負責構建AI學習所需的數據集。 COGNANO獨自開發了構建抗原抗體相互作用標記數據集的創新方法,並創建和公開了針對SARS-CoV-2的大規模標記數據集。

櫻雲網絡研究所

負責使用創建的數據集構建和評估抗原抗體相互作用的AI模型。 它獨立開發了抗體語言模型,並通過與各種公開的蛋白質及抗體語言模型的比較實驗驗證了所提出數據集的有效性。

所選論文

此刻,將真正體現土豆味和醬油的精髓的新款產品「Pure Potato 海鮮醬油」推出紀念活動。我們將推出可以獲得新款產品「Pure Potato 海鮮醬油」和其他三款「Pure Potato」產品(共6袋)的禮品。非常容易參加,只需關注和轉發活動頁面即可。

抗體語言模型的SARS-CoV-2相互作用數據集和VHH序列語料庫
鶴田弘文(櫻花互聯網公司、COGNANO公司)、山崎寬章(COGNANO公司、Biorhodes公司)、前田涼太(COGNANO公司、Biorhodes公司)、田村龍太郎(櫻花互聯網公司、COGNANO公司)、伊村明浩(COGNANO公司、Biorhodes公司)

(和譯)
抗體言語模型的SARS-CoV-2相互作用數據集和VHH序列語料庫
鶴田弘文(櫻花互聯網股份有限公司、COGNANO公司)、山崎寬章(COGNANO公司、Biorhodes公司)、前田涼太(COGNANO公司、Biorhodes公司)、田村龍太郎(櫻花互聯網股份有限公司、COGNANO公司)、伊村明浩(COGNANO公司、Biorhodes公司)

論文

公開數據集

概要

抗體は、ウイルスや細菌などの有害な異物を排除するために免疫システムによって生成される重要なタンパク質であり、人間の病気の治療に極めて重要な治療薬です。近年、抗體治療薬の探索を加速するために、抗體配列を用いた言語モデルの構築への関心が高まっています。しかし、構築された言語モデルの抗體探索への適用性を十分に評価するためのラベル付きデータセットが不足していることが課題として挙げられます。この課題を克服するためにさくらインターネット研究所とCOGNANOは、SARS-CoV-2のスパイクタンパク質で免疫された2頭のアルパカから得られた抗原抗體相互作用に関するデータセットであるAVIDa-SARS-CoV-2を公開しました。AVIDa-SARS-CoV-2には、アルパカから採取された多様なVHH抗體が、デルタ株やオミクロン株を含む12のSARS-CoV-2変異體に対して結合するかしないかを示すラベルが含まれています。さらに、抗體言語モデルの事前學習用コーパスとして、200萬を超えるVHH配列を含むVHHCorpus-2Mを公開しました。論文中の実験では、既存のさまざまなタンパク質、抗體言語モデル、およびVHHCorpus-2Mを用いて獨自に事前學習した言語モデルを用いて、SARS-CoV-2とVHH間の結合を予測したベンチマーク結果を報告しました。これらの実験結果は、AVIDa-SARS-CoV-2が、抗體言語モデルの性能を評価するための貴重なベンチマークを提供し、AIを活用した抗體探索を促進することを示しました。

「NeurIPS 2024」での発表について

「NeurIPS」について

「NeurIPS」は、1987年に設立されたAIおよび機械學習分野の國際會議であり、投稿件數の多さと厳格な査読プロセスによる低い採択率から、世界的に権威のある會議の一つとされています。本會議では、深層學習、強化學習、コンピュータビジョン、自然言語処理、さらには様々な分野の応用研究など、AIと機械學習の広範な領域における最先端の研究成果が発表されています。
本會議の第38回目となる「NeurIPS 2024」は、2024年12月にカナダで開催されます。

日時・場所

日時:2024年12月11日(水)~13日(金)
地點:加拿大不列顛哥倫比亞省溫哥華 溫哥華會議中心

演講者

櫻花互聯網股份有限公司、COGNANO株式會社 鶴田博文

詳細信息

請參考以下網站。

數據集和基準賽道簡介

「數據集和基準賽道」是NeurIPS 2021年新增的研究賽道,旨在爲人工智能和機器學習領域未來發展提供關鍵的高質量數據集和基準賽場的設計、開發,以及圍繞以數據爲中心的人工智能展開研究討論。

關於各公司

佐賀互聯網株式公司

負責人:總經理田中邦裕
本社:大阪府大阪市北區大深町6-38 グラングリーン大阪 北館 JAM BASE 3樓
創業:1996年12月23日
成立:1999年8月17日
網址:

veru inc公司

代表者:代表取締役社長 伊村 明浩
住所:京都府京都市左京區上高野東山64-101
創業:2014年10月17日
設立:2014年10月17日
網址:

新聞發佈有關諮詢聯繫人(報社窗口)

Sakura網絡有限公司公關官

查詢表格:

veru inc公司

查詢表格:

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論