share_log

さくらインターネットとCOGNANOのAI創薬に関する共同研究論文が、世界最高峰のAI国際会議「NeurIPS 2024」に採択

樱花互联网和COGNANO关于AI药物研发的合作研究论文被世界顶尖的AI国际会议「NeurIPS 2024」录取

SAKURA Internet ·  09/29 11:00

位于大阪府大阪市,由经理合伙人田中邦裕担任总裁的Sakura Internet株式会社的内部研究所“Sakura Internet Institute”和位于京都府京都市,由总裁伊村明浩担任总裁的Cognano株式会社共同进行人工智能(AI)药物研究,在机器学习领域最具挑战性的国际会议“Neural Information Processing Systems(NeurIPS)2024”的数据集和基准测试领域被采纳。
此外,该论文将在加拿大不列颠哥伦比亚省温哥华发表,时间为2024年12月11日(星期三)至13日(星期五)。

big

研究概要图

Sakura Internet Institute和Cognano选择了新冠病毒(SARS-CoV-2)作为靶抗原,利用活着的羊驼免疫系统创建了与SARS-CoV-2和多种抗体的大规模标记交互作用数据集,并加以公开。该公开数据集的独特性和实用性得到了评价,从而使研究论文被采纳。

ChatGPT的出现催生了大规模语言模型(LLM)的研究,自然语言处理技术正迅速发展。这种技术进步不仅仅限于我们日常使用的自然语言,也扩展到药物研究领域,特别是抗体药物研究领域。原因在于,抗体可以以20种氨基酸的排列(用1个字母表示)表达,这使其与目前利用大量抗体序列数据进行学习的语言模型(以下称为抗体语言模型)的研究开发蓬勃发展,有望扩大有效的抗体药物探索的可能性。然而,与自然语言相比,抗体序列数据的公开数据相对有限。特别对于缺乏表明特定抗体序列与哪种抗原(如病毒或细菌等)相互作用的标记数据集,这是今后在抗体语言模型发展中的重要挑战。

为了解决这一问题,Sakura Internet Institute和Cognano确立了利用羊驼等驼科动物实现大规模抗原抗体互作用数据生成的方法,并公开了生成的数据集。与其他动物相比,像羊驼这样的骆驼科动物具有异乎寻常简单的抗体组织,能够更有效地将序列数据化。自2020年初以来,Sakura Internet Institute和Cognano选择了造成全球大流行的新冠病毒(SARS-CoV-2)作为靶抗原,利用活着的羊驼免疫系统创建了与SARS-CoV-2和多种抗体的大规模标记交互作用数据集,并加以公开。通过该数据集的公开,全球研究人员可以开发和评估更精确的抗体语言模型。该论文对这一新公布数据集的独特性和实用性进行了评估,进而被采纳。这一研究成果利用AI技术带来了抗体药物研究的新可能性,有望为医学进步和AI应用领域的拓展做出贡献。

Sakura Internet Institute和Cognano将继续努力进行研究开发,实现对社会有用且新颖的互联网基础设施。

※1 AI药物研究是指利用人工智能技术推动药物研发过程的方法。
※2 抗体是指免疫系统生成的一种蛋白质,用于清除体内进入的病毒、细菌等有害异物。 抗体目前是治疗人类疾病的重要药物开发模式之一。

本合作研究中的各自角色

veru inc公司

通过生物实验,负责构建AI学习所需的数据集。 COGNANO独自开发了构建抗原抗体相互作用标记数据集的创新方法,并创建和公开了针对SARS-CoV-2的大规模标记数据集。

樱云网络研究所

负责使用创建的数据集构建和评估抗原抗体相互作用的AI模型。 它独立开发了抗体语言模型,并通过与各种公开的蛋白质及抗体语言模型的比较实验验证了所提出数据集的有效性。

所选论文

此刻,将真正体现土豆味和酱油的精髓的新款产品“Pure Potato 海鲜酱油”推出纪念活动。我们将推出可以获得新款产品“Pure Potato 海鲜酱油”和其他三款“Pure Potato”产品(共6袋)的礼品。非常容易参加,只需关注和转发活动页面即可。

抗体语言模型的SARS-CoV-2相互作用数据集和VHH序列语料库
鹤田弘文(樱花互联网公司、COGNANO公司)、山崎宽章(COGNANO公司、Biorhodes公司)、前田涼太(COGNANO公司、Biorhodes公司)、田村龙太郎(樱花互联网公司、COGNANO公司)、伊村明浩(COGNANO公司、Biorhodes公司)

(和译)
抗体言语模型的SARS-CoV-2相互作用数据集和VHH序列语料库
鹤田弘文(樱花互联网股份有限公司、COGNANO公司)、山崎宽章(COGNANO公司、Biorhodes公司)、前田涼太(COGNANO公司、Biorhodes公司)、田村龙太郎(樱花互联网股份有限公司、COGNANO公司)、伊村明浩(COGNANO公司、Biorhodes公司)

论文

公开数据集

概要

抗体は、ウイルスや細菌などの有害な異物を排除するために免疫システムによって生成される重要なタンパク質であり、人間の病気の治療に極めて重要な治療薬です。近年、抗体治療薬の探索を加速するために、抗体配列を用いた言語モデルの構築への関心が高まっています。しかし、構築された言語モデルの抗体探索への適用性を十分に評価するためのラベル付きデータセットが不足していることが課題として挙げられます。この課題を克服するためにさくらインターネット研究所とCOGNANOは、SARS-CoV-2のスパイクタンパク質で免疫された2頭のアルパカから得られた抗原抗体相互作用に関するデータセットであるAVIDa-SARS-CoV-2を公開しました。AVIDa-SARS-CoV-2には、アルパカから採取された多様なVHH抗体が、デルタ株やオミクロン株を含む12のSARS-CoV-2変異体に対して結合するかしないかを示すラベルが含まれています。さらに、抗体言語モデルの事前学習用コーパスとして、200万を超えるVHH配列を含むVHHCorpus-2Mを公開しました。論文中の実験では、既存のさまざまなタンパク質、抗体言語モデル、およびVHHCorpus-2Mを用いて独自に事前学習した言語モデルを用いて、SARS-CoV-2とVHH間の結合を予測したベンチマーク結果を報告しました。これらの実験結果は、AVIDa-SARS-CoV-2が、抗体言語モデルの性能を評価するための貴重なベンチマークを提供し、AIを活用した抗体探索を促進することを示しました。

「NeurIPS 2024」での発表について

「NeurIPS」について

「NeurIPS」は、1987年に設立されたAIおよび機械学習分野の国際会議であり、投稿件数の多さと厳格な査読プロセスによる低い採択率から、世界的に権威のある会議の一つとされています。本会議では、深層学習、強化学習、コンピュータビジョン、自然言語処理、さらには様々な分野の応用研究など、AIと機械学習の広範な領域における最先端の研究成果が発表されています。
本会議の第38回目となる「NeurIPS 2024」は、2024年12月にカナダで開催されます。

日時・場所

日時:2024年12月11日(水)~13日(金)
地点:加拿大不列颠哥伦比亚省温哥华 温哥华会议中心

演讲者

樱花互联网股份有限公司、COGNANO株式会社 鹤田博文

详细信息

请参考以下网站。

数据集和基准赛道简介

「数据集和基准赛道」是NeurIPS 2021年新增的研究赛道,旨在为人工智能和机器学习领域未来发展提供关键的高质量数据集和基准赛场的设计、开发,以及围绕以数据为中心的人工智能展开研究讨论。

关于各公司

佐贺互联网株式公司

负责人:总经理田中邦裕
本社:大阪府大阪市北区大深町6-38 グラングリーン大阪 北馆 JAM BASE 3楼
创业:1996年12月23日
成立:1999年8月17日
网址:

veru inc公司

代表者:代表取締役社长 伊村 明浩
住所:京都府京都市左京区上高野东山64-101
创业:2014年10月17日
设立:2014年10月17日
网址:

新闻发布有关咨询联系人(报社窗口)

Sakura网络有限公司公关官

查询表格:

veru inc公司

查询表格:

声明:本内容仅用作提供资讯及教育之目的,不构成对任何特定投资或投资策略的推荐或认可。 更多信息
    抢沙发