share_log

英伟达财报前夜,OpenAI下一代模型“泄漏”:吃“草莓”的“猎户座”

英偉達業績前夜,OpenAI下一代模型「泄漏」:吃「草莓」的「獵戶座」

華爾街見聞 ·  21:39

GPT-5遲遲未出,等來了「草莓」和「獵戶座」模型,「草莓」是一個推理模型,推理能力大爆發,可處理複雜數學問題;「獵戶座」則是超越GPT-4的下一代大模型,使用「草莓」的高質量數據訓練,從而減少模型產生的幻覺或錯誤。

GPT-5遲遲未出,等來了神祕的「草莓」和「獵戶座」模型,OpenAI再次站在風口浪尖。

據科技媒體The Information最新報道,OpenAI神祕「草莓」(Strawberry,前身爲Q*)項目,計劃最早今年秋季推出。同時用「草莓」合成數據來開發的最新大模型「獵戶座」(Orion),該模型或於明年年初推出。

此前,OpenAI多次「放風」將推出「草莓」模型,ChatGPT曾於8月初在X上發佈了草莓的表情,似乎在暗示在「草莓」大模型,Sam Altman最近也在社交媒體上發佈了一張草莓的圖片。

「草莓」是一個推理模型,核心能力在於強大的推理能力,可處理複雜的問題;「獵戶座」則是超越GPT-4的下一代大模型,減少過程中幻覺或錯誤大幅減少。

此外,「草莓」模型不僅會爲獵戶座提供訓練數據,OpenAI可能還會用「草莓」的簡化版本集成在ChatGPT中,增強GPT-4的推理能力。

神祕的「草莓」和「獵戶座」模型是什麼?

具體來看,「草莓」是一個推理模型:

  • 核心能力在於強大的推理能力,它並不侷限於回答技術問題,而是擁有處理複雜問題的能力,例如解決編程和數學問題,這在傳統的對話式AI中一直是一個難題。
  • 儘管提高語言理解和推理能力,但同時需要額外更多地時間去「思考」;

而「獵戶座」則是超越GPT-4的下一代大模型:

使用「草莓」的高質量數據訓練,從而減少模型產生的幻覺或錯誤。

「草莓」技術對「獵戶座」的重要性不言而喻。據研究人員透露,使用「草莓」可以爲「獵戶座」生成高質量的訓練數據,「獵戶座」通過訓練數據學習,接觸到的正確複雜推理示例越多,學習效果就越好。

big

推理能力大爆發,「草莓」更像個推理插件

OpenAI創始人兼CEO奧特曼曾強調,今後AI發展的關鍵將圍繞推理能力展開。

由於推理能力限制,目前AI技術在諸如航空航天、結構工程之類的數學密集型行業中並沒有得到廣泛應用。因此,大模型數學推理能力的優化成爲普及AI應用的必備條件,也是AI公司們進一步提升盈利能力的必經之路。

「草莓」模型的前身是Q*算法模型,Q*能夠解決棘手的科學和數學問題。如果AI模型掌握了數學能力,將擁有更強的推理能力,甚至可以解決從未見過的數學問題或者自發解決變成問題,與人類智能相媲美。

值得一提的是,「草莓」模型在 MATH 基準測試中的得分已經超過90%,整體性能十分驚豔。

big

有網友稱,相信草莓模型會成爲金融等科技的行業改變規則,徹底解決複雜計算、推理的方式。

big

從產品路線上看,OpenAI或將原始的「草莓」模型通過「蒸餾」生成簡化版本,將改進的推理能力整合到GPT中。簡化版本旨在保持與原始模型相同的性能水平,同時操作更容易、成本更低。

big

儘管這可能會使答案更準確,但花費的時間可能更多,這意味着「草莓」可能不適合需要即時響應的應用,預計ChatGPT用戶將能夠根據需求選擇開啓或關閉「草莓」功能。

声明:本內容僅用作提供資訊及教育之目的,不構成對任何特定投資或投資策略的推薦或認可。 更多信息
    搶先評論