share_log

Wikimedia Deutschland Launches AI Knowledge Project in Collaboration With DataStax Built With NVIDIA AI

ウィキメディア・ドイチュラントがエヌビディアの人工知能を使用してデータスタックスと協力し、人工知能知識プロジェクトを開始しました

Businesswire ·  2024/12/03 22:00

DataStaxの人工知能プラットフォームがWikimedia Deutschlandに、3日未満で1000万のWikidata記事を取り込み、埋め込むことを可能にします。

カリフォルニア州サンタクララ--(ビジネスワイヤ)--人工知能プラットフォームリーダーのDataStaxは、企業や開発者が開発時間を60%短縮し、より正確な人工知能アプリケーションを作成する手助けを提供しており、今日、ドイツ語版ウィキペディアを支援し、WikidataおよびWikibaseを開発している団体であるWikimedia Deutschlandが、NVIDIA人工知能を使用して構築されたDataStax人工知能プラットフォーム(NVIDIA NeMo RetrieverおよびNImマイクロサービスを含む)を活用し、Wikidataを開発者向けに組み込まれたベクトル化データベースとして利用できることを発表しました。



Wikidataは、すべてのWikipedia言語版に対して統合されたリンクドオープンデータプラットフォームとして機能し、300以上の言語で編集可能でアクセス可能なデータのための最も大きな共同知識グラフです。グローバルコミュニティは、24,000人以上のボランティアが参加しており、これまでに114,000,000件以上のエントリが寄稿されています。これらのエントリは、オープンソースの開発環境において数千人のソフトウェア開発者によって使用されています。Wikimedia DeutschlandとDataStaxの共通の目標は、このデータをオープンソース人工知能/機械学習コミュニティが利用できる世界知識のオープンアクセスデータセットとして提供することです。大きくかつ常に変化するデータセットをベクトル埋め込みし、開発者が常に最新のデータを使用できるようにすることは、重要な技術的課題の一つでした。

「WMDEは、DataStaxのAPIポータルを通じてJina AIのような完全な多言語モデルを活用し、Wikidataに表現されている100の言語まで意味的に検索できるようにすることによって、オープンソースの人工知能/機械学習コミュニティのためにWikidataのデータを簡単にアクセスできるようにする計画です。大規模で、多言語、多文化、動的なデータセットをベクトル埋め込むことは、特にリソースが限られ、能力が低いオープンソース開発者にとっては難しい課題です。DataStaxとのコラボレーションによって、世界が自分たちの人工知能/機械学習アプリケーションのためにWikidataの大規模サブセットにより簡単にアクセスできる可能性があります。現時点では英語のみで利用可能ですが、DataStaxのソリューションは、以前のオンプレミスのGPUソリューションよりも約10倍速い貴重な初期実験を提供しました。この近いリアルタイムの速度により、Wikidataの頻繁な更新に合わせたベクトルデータベース内で大規模なサブセットの統合をテストすることで、スケールとスピードで実験を行うことができます」とWikimedia Deutschlandの最高技術責任者であるジョナサン・フレイン博士は述べました。

開発者の効率性はウィキメディア・ドイチュラントにとっても重要であり、ウィキデータは世界最大のオープンソース知識グラフの一つです。AWS上のDataStax人工知能プラットフォームを使用することで、1000万件以上のエントリーを3日以内に取り込み、処理し、ベクトル埋め込みを行うことが可能でした。ベクトル化されたデータは確実に無制限のCC0ライセンスの下で利用可能です。

このような大規模なデータセットをベクトル化することは非常に複雑であり、各ドキュメントはリアルタイム検索とアクセシビリティを支えるためにリソース集約型の埋め込みプロセスを必要とします。従来の線形の読み書き取引種類は、ウィキメディア・ドイチュラントが全世界のコミュニティによる何十万もの日々の更新を瞬時に何百万ものユーザーに提供するために必要なスケールと速度に追いつくことはできません。世界における最も重要なオープンソース知識グラフとして、ウィキデータは毎分何百もの更新に対して高品質でリアルタイムの結果を要求します。AWS上にホストされたAstra DBのサーバーレスベクトル化機能とエヌビディアNeMoにより、DataStax人工知能プラットフォームはウィキデータのベクトルデータベースを常に最新の状態に保つために必要なほぼゼロ遅延とスケーラビリティを提供します。これは、ウィキメディアのグローバルなオーディエンスへのサービスに必要不可欠な信頼性を維持します。

「DataStaxとの協力とそのアプローチにより、新たな能力が開かれ、プロセスが効率化され、コミュニティに対してより迅速で正確なインサイトを提供できるようになります」と、ウィキデータのポートフォリオリードであるリディア・ピンツシャーは述べました。「DataStaxは、オープンで高品質なデータを用いて公共の利益のための人工知能アプリケーションの開発を支援し、奨励するために必要なスケーラビリティ、使いやすさ、および高度な埋め込みモデルの組み合わせを提供しています。」

「私たちは、ウィキメディア・ドイチュラントが私たちの人工知能プラットフォームを用いて世界最大の知識グラフへのアクセスを向上させるのを見ることができて非常に興奮しています。オープンソースコミュニティは、より多くの共同利益をもたらし、デジタル世界に多くの新しいアイデアや革新を生み出すために重要です」と、DataStaxの最高製品責任者であるエド・アナフは述べました。

ウィキメディア・ドイチュラントとDataStaxは、これらの初期プロジェクトを拡大し、検索の信頼性をさらに向上させるためにgraphRAGのような機能を探り、アクセシビリティを向上させるために何百もの言語をサポートする計画です。AWSにより強化されたAstra DBのサーバーレスモデルの組み合わせにより、ウィキメディア・ドイチュラントのインフラ関連はデータの需要に応じて柔軟に成長することができ、オープンソースの人工知能駆動の知識におけるグローバルリーダーとしての地位を固めることができます。

DataStaxは、AWSの顧客に最先端のAI開発プラットフォームをエンドツーエンドで提供し、アイデアから生産まで開発者を支援しています。Astra Vectorizeは、AWS上で実行中のAstra Dbで埋め込み生成を直接処理することにより、ベクトル埋め込みを簡素化し、加速します。アマゾンベッドロックもDataStax Langflowでサポートされており、AWS開発者が実データを使って基盤モデルをテストするためのドラッグアンドドロップ体験を提供します。LangflowにはAmazon Qのサポートも追加され、ユーザーはAWSの人工知能によるアシスタントとの統合のためのローコードの利便性を享受できます。DataStaxは、AWS Gravitonプロセッサを活用することで、AWSユーザーにコスト削減をもたらし、運用コストを低下させ、AWSユーザーがTCOを管理するのを支援します。

DataStaxについて

DataStaxは、開発者や企業がGenAIを通じて大胆な新しい世界を成功裏に創造する手助けをする会社です。私たちは、関連性のある反応的なGenAIアプリケーションのために、迅速で容易な生産への道を提供するすべてを備えたワンストップ生成AIスタックを提供しています。DataStaxは、先進的なAIエコシステムパートナーへの一流の統合を持つRAG優先の開発者体験を提供し、開発者の選んだ既存のスタックで作業します。DataStaxを使えば、誰でも、無限のスケールで、あらゆるクラウド上で賢く、高成長のAIアプリケーションを迅速に構築できます。アウディ、バドファイナンシャル、キャピタルワン、スカイポイントなど、世界のリーディング企業数百社がDataStaxに依存しています。詳細はDataStax.comをご覧ください。

2024 DataStax Inc.、全著作権所有。DataStaxは、アメリカ合衆国および他の国におけるDataStax, Inc.およびその子会社の登録商標です。

Wikimedia Deutschlandについて

Wikimedia Deutschlandは、デジタル空間で自由に利用できる知識の普及に努める非営利団体で、11万1000人以上のメンバーと180人の従業員を有しています。国際的なWikimediaムーブメントの最大の国内代表として、ドイツにおけるWikipediaやその他のウィキプロジェクトのボランティアコミュニティを推進しています。Wikimedia Deutschlandは、自由なソフトウェアや無料のWikidataデータベースを開発し、無料での知識とデータへのアクセスを促進するための政治的教育活動にも関与しています。詳細はWikimedia.deをご覧ください。


連絡先

データスタックス
レガン・シアッパ
regan.schiappa@datastax.com

ウィキメディア・ドイチュラント
ザラ・ジアディ
Zarah.ziadi@wikimedia.de

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする