新浪テクノロジーニュース 9月25日の午後、アリババクラウドは本日、オープンソースのQwen-Q 140億パラメータモデルであるQwen-14B、Qwen-14B-Chat、およびその対話モデルであるQwen-14B-Chatが無料で商用利用できることを発表しました。報告によると、Qwen-14Bはいくつかの信頼できる評価で同じスケールのモデルを上回り、一部の指標はLlama2-70Bにさえ近かったです。
以前、Alibaba Cloudは70億のパラメータモデルQwen-7Bなどをオープンソース化しており、ダウンロード数は1か月以上で100万を超えました。現在のオープンソースのQwen-14Bは、複数の言語をサポートする高性能なオープンソースモデルです。類似のモデルと比較して、より高品質なデータを使用します。トレーニングデータ全体が3兆トークンを超え、推論、認知、計画、記憶においてモデルがより強力になっています。Qwen-14bは、最大8kのコンテキストウィンドウ長をサポートします。
QWEN-14B-chatは、台座モデルで細かいSFTによって得られた会話モデルです。台座モデルの強力なパフォーマンスにより、Qwen-14B-Chatによって生成されるコンテンツの精度は大幅に向上し、より人間の好みに沿ったものになりました。コンテンツ制作の想像力と豊かさも大幅に広がりました。
Qwenを使用すると、開発者はQWENベースのエージェント(エージェント)をより速く構築できます。開発者は、コードインタープリターツールを使用してPythonコードを実行して複雑な数学的計算、データ分析、チャート描画などを実行するなど、簡単な指示に従ってQwenに複雑なツールの使用を教えることができます。また、質問に答えたり、複数の文書に答えたり、長いテキストを書いたりできる「高度なデジタルアシスタント」を開発することもできます。
アリババクラウドのCTOである周景仁氏は、アリババクラウドは引き続きオープンソースを採用し、中国でのビッグモデルエコシステムの構築を促進すると述べました。Alibaba Cloudは、オープンソースとオープン性の力を信じており、オープンソースからのビッグモデルの開発を主導してきました。ビッグモデルのテクノロジーを中小企業や個人の開発者がより早く利用できるようにしたいと考えています。(ウェン・メン)