快科技7月10日消息,根據SuperCLUE發佈的中文大模型基準測評最新報告,阿里通義千問開源模型Qwen2-72B-Instruct以卓越的表現位居國內通用能力第一,更在全球範圍內成爲最強開源模型。
SuperCLUE報告詳細披露了對國內外33個大模型的綜合測評結果,Qwen2-72B在一級總分上以77分的高分與Claude-3.5-Sonnet並列第二,僅次於OpenAI的GPT-4o。
這一得分超越了百度文心一言4.0、訊飛星火V4.0、Llama-3-70B等開閉源大模型。
具體來看,在理科、文科和Hard三個維度的具體測評中,Qwen2-72B展現了全面而均衡的能力。
特別是在理科任務上,Qwen2-72B與GPT-4o的分差僅爲5分,顯示出其在計算、邏輯推理和代碼測評方面的強勁實力。
在文科任務和Hard任務上,Qwen2-72B同樣表現不俗,得分均達到了76分,與GPT-4o的得分相差無幾。
特別值得一提的是,在端側小模型測評中,Qwen2-7B以70億參數的模型規模,超越了上一代320億參數的Qwen1.5-32B和130億參數的Llama-3-8B-Instruct,奪得了排名第一的寶座。
這一成績不僅證明了Qwen2-7B在小尺寸模型中的極致性能,也極大提升了端側小模型落地的可行性。
數據顯示,截至目前Qwen系列模型的下載量已突破2000萬次,其應用場景覆蓋了工業、金融、醫療、汽車等多個垂直領域。