share_log

微软正式开源 Phi-4 语言模型

Tencent Stocks ·  Jan 9 14:18

编译/前方智能

微软于 2025 年 1 月 8 日正式宣布,将其 Phi-4 语言模型完整开源,并在 AI 代码共享平台 Hugging Face 上发布了包含模型权重在内的所有内容。该模型采用 MIT 许可,这意味着开发者可以将其用于商业应用。

Phi-4 是一个仅有 140 亿参数的小型语言模型,其训练数据包含 9.8 万亿个 tokens,涵盖经过严格筛选的公开文档、类似教科书的合成数据以及高质量的学术著作和问答数据集。尽管体量较小,但在多项基准测试中表现出色,特别是数学推理和编程。该模型在 MATH 和 MGSM 等具有挑战性的基准测试中得分超过 80%,超越了包括 Gemini Pro 和 GPT-4o-mini 在内的多个更大规模模型。

在 2024 年 11 月的美国数学竞赛测试中,Phi-4 取得了 91.8% 的平均得分,这一成绩出人意料地超过了所有参与测试的竞争对手。值得注意的是,这些测试题目是在模型训练完成后才出现的,这证明了模型具有真正的推理能力,而不仅仅是记忆训练数据。

Disclaimer: This content is for informational and educational purposes only and does not constitute a recommendation or endorsement of any specific investment or investment strategy. Read more
    Write a comment