share_log

通义千问开源数学模型Qwen2-Math 测评得分超GPT-4o

通義千問開源數學模型Qwen2-Math 測評得分超GPT-4o

格隆匯 ·  08/09 00:27

格隆匯8月9日|阿里通義團隊開源新一代數學模型Qwen2-Math,包含1.5B、7B、72B三個參數的基礎模型和指令微調模型。Qwen2-Math基於通義千問開源大語言模型Qwen2研發,旗艦模型 Qwen2-Math-72B-Instruct在權威測評集MATH上的得分超越GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama-3.1-405B等,以84%的準確率處理了代數、幾何、計數與概率、數論等多種數學問題。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論