share_log

阿里云宣布开源通义千问14B模型,周靖人:持续拥抱开源开放

阿里雲が通用千問14Bモデルをオープンソース化したことを発表。周靖人氏:オープンソース・オープン化の継続的な支持を実施

新浪科技 ·  2023/09/25 02:47

新浪テクノロジーニュース 9月25日の午後、アリババクラウドは本日、オープンソースのQwen-Q 140億パラメータモデルであるQwen-14B、Qwen-14B-Chat、およびその対話モデルであるQwen-14B-Chatが無料で商用利用できることを発表しました。報告によると、Qwen-14Bはいくつかの信頼できる評価で同じスケールのモデルを上回り、一部の指標はLlama2-70Bにさえ近かったです。

以前、Alibaba Cloudは70億のパラメータモデルQwen-7Bなどをオープンソース化しており、ダウンロード数は1か月以上で100万を超えました。現在のオープンソースのQwen-14Bは、複数の言語をサポートする高性能なオープンソースモデルです。類似のモデルと比較して、より高品質なデータを使用します。トレーニングデータ全体が3兆トークンを超え、推論、認知、計画、記憶においてモデルがより強力になっています。Qwen-14bは、最大8kのコンテキストウィンドウ長をサポートします。

QWEN-14B-chatは、台座モデルで細かいSFTによって得られた会話モデルです。台座モデルの強力なパフォーマンスにより、Qwen-14B-Chatによって生成されるコンテンツの精度は大幅に向上し、より人間の好みに沿ったものになりました。コンテンツ制作の想像力と豊かさも大幅に広がりました。

Qwenを使用すると、開発者はQWENベースのエージェント(エージェント)をより速く構築できます。開発者は、コードインタープリターツールを使用してPythonコードを実行して複雑な数学的計算、データ分析、チャート描画などを実行するなど、簡単な指示に従ってQwenに複雑なツールの使用を教えることができます。また、質問に答えたり、複数の文書に答えたり、長いテキストを書いたりできる「高度なデジタルアシスタント」を開発することもできます。

アリババクラウドのCTOである周景仁氏は、アリババクラウドは引き続きオープンソースを採用し、中国でのビッグモデルエコシステムの構築を促進すると述べました。Alibaba Cloudは、オープンソースとオープン性の力を信じており、オープンソースからのビッグモデルの開発を主導してきました。ビッグモデルのテクノロジーを中小企業や個人の開発者がより早く利用できるようにしたいと考えています。(ウェン・メン)

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。 更に詳しい情報
    コメントする