マイクロソフトはニュースグループ-B傘下のハーパーコリンズ出版会社と契約を結び、後者の豊富なノンフィクションの書籍資源を利用して人工知能モデルのトレーニングを行う予定です。
智通財経APPが得た情報によると、関係者が述べたところによれば、マイクロソフト社(MSFT.US)はニュースグループ-B(NWS.US)傘下のハーパーコリンズ出版会社と契約を結び、後者の豊富なノンフィクションの書籍資源を利用して人工知能モデルのトレーニングを行い、モデルの質とパフォーマンスを向上させる予定です。この協力は、厳選された古い書籍を使用してモデルをトレーニングすることに限定されており、新しい書籍の創作には関与せず、著者は参加の選択権を持っています。
具体的には、マイクロソフトはハーパーコリンズの書籍を、まだ発表されていない人工知能モデルに組み込むことを希望しており、高品質のテキストソースを拡充し、モデルの正確性と専門知識の提供能力を向上させることを目指しています。マイクロソフトはコメントを控えていますが、ハーパーコリンズはこの契約を確認しており、この契約は「選ばれたノンフィクションの古書を使用して人工知能モデルをトレーニングすることを許可する」と述べています。
同時に、ハーパーコリンズはこの契約の範囲が限られており、著者の権利を尊重する模範的な成果に明確な制限があることを強調しており、著者は参加の選択権を持っています。
「私たちのタスクの一つは、著者たちに機会を創出し、熟考させることです。同時に、彼らの作品の核心的な価値と私たちが共同で享受する収益と印税が保護されることを確保します」とハーパーコリンズは述べました。「この契約は範囲が限られており、著者の権利を尊重する優れた作品に対して明確な限界を設定し、この目標を達成しました。」
知られていることとして、テクノロジー会社は常に人工知能モデルのトレーニングに用いるためのより高品質なテキストソースを探求しており、マイクロソフトなどの会社も例外ではありません。彼らは許可を得て、ソーシャルメディアサイトからニュース記事に至るまでの一連のデータを使用し、プログラムをより正確にし、質問に対する回答や特定のテーマに関する専門知識を提供するために改善を図っています。
注目すべきは、ニュースグループが以前にOpenAIと契約を結び、傘下の多くの出版物のコンテンツの使用を許可していることです。マイクロソフトも複数の出版社と協力して人工知能プロジェクトを進めています。
さらに、今年の初めに、グーグルはRedditと6000万ドルの契約を結び、この検索の巨人は多くのsubredditを利用してAIモデルを訓練することができるようになりました。
しかし、一部の出版者は人工知能会社が無断でコンテンツを引用する行為に不満を表明し、訴訟を提起しました。例えば、ニューヨークタイムズはOpenAIとマイクロソフトを訴え、著作権侵害を主張しています。
総じて、マイクロソフトとハーパーコリンズが結んだ契約は、テクノロジー会社が人工知能モデルを訓練するために高品質なテキストソースを探し求める重要な進展を示しています。しかし、これらのリソースを利用する際に著作者の権利を尊重する方法は、出版者とテクノロジー会社が共に直面しなければならない課題です。