share_log

微软正式开源 Phi-4 语言模型

微軟正式開源 Phi-4 語言模型

騰訊自選股 ·  01/09 14:18

編譯/前方智能

微軟於 2025 年 1 月 8 日正式宣佈,將其 Phi-4 語言模型完整開源,並在 AI 代碼共享平台 Hugging Face 上發佈了包含模型權重在內的所有內容。該模型採用 MIT 許可,這意味着開發者可以將其用於商業應用。

Phi-4 是一個僅有 140 億參數的小型語言模型,其訓練數據包含 9.8 萬億個 tokens,涵蓋經過嚴格篩選的公開文檔、類似教科書的合成數據以及高質量的學術著作和問答數據集。儘管體量較小,但在多項基準測試中表現出色,特別是數學推理和編程。該模型在 MATH 和 MGSM 等具有挑戰性的基準測試中得分超過 80%,超越了包括 Gemini Pro 和 GPT-4o-mini 在內的多個更大規模模型。

在 2024 年 11 月的美國數學競賽測試中,Phi-4 取得了 91.8% 的平均得分,這一成績出人意料地超過了所有參與測試的競爭對手。值得注意的是,這些測試題目是在模型訓練完成後才出現的,這證明了模型具有真正的推理能力,而不僅僅是記憶訓練數據。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論