share_log

阿里云宣布开源通义千问14B模型,周靖人:持续拥抱开源开放

阿里雲宣佈開源通義千問14B模型,周靖人:持續擁抱開源開放

新浪科技 ·  2023/09/25 02:47

新浪科技訊 9月25日下午消息,阿裡雲今日宣佈開源通義千問140億參數模型Qwen-14B及其對話模型Qwen-14B-Chat,免費可商用。據悉,Qwen-14B在多個權威評測中超越同等規模模型,部分指標甚至接近Llama2-70B。

此前,阿裡雲開源了70億參數模型Qwen-7B等,一個多月下載量破100萬。此次開源的Qwen-14B是一款支持多種語言的高性能開源模型,相比同類模型使用了更多的高質量數據,整體訓練數據超過3萬億Token,使得模型具備更強大的推理、認知、規劃和記憶能力。Qwen-14B最大支持8k的上下文窗口長度。

Qwen-14B-Chat是在基座模型上經過精細SFT得到的對話模型。藉助基座模型強大性能,Qwen-14B-Chat生成內容的準確度大幅提升,也更符合人類偏好,內容創作上的想像力和豐富度也有顯著擴展。

Qwen能讓開發者更快地構建基於Qwen的Agent(智慧體)。開發者可用簡單指令教會Qwen使用複雜工具,比如使用Code Interpreter工具執行Python代碼以進行復雜的數學計算、數據分析、圖表繪製等;還能開發具有多文檔問答、長文寫作等能力的“高級數位助理”。

阿裡雲CTO周靖人表示,阿裡雲將持續擁抱開源開放,推動中國大模型生態建設。阿裡雲篤信開源開放的力量,率先開源自研大模型,希望讓大模型技術更快觸達中小企業和個人開發者。(文猛)

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論