AIの新しい時代が幕を開けました！「思考解決ロジック」を持つOpenAIの推論大型モデルが登場しました

cls.cn · 09/13 07:30

①OpenAI o1模型（“草莓”大模型）标志着人工智能在复杂推理任务领域的崭新水平；②通过改变AI模型的行为方式，新模型能够有效提高回答质量，同时避免一些机制性缺陷；③OpenAI首发推出o1-预览版和o1 mini两款模型。

财联社9月13日讯（编辑史正丞）北京时间周五凌晨1时许，AI时代迎来崭新的起点——能够进行通用复杂推理的大模型终于走到台前。

OpenAI在官网发布公告称，开始向全体订阅用户开始推送OpenAI o1预览模型——也就是此前被广泛期待的“草莓”大模型。OpenAI表示，对于复杂推理任务而言，新模型代表着人工智能能力的崭新水平，因此值得将计数重置为1，给它一个有别于“GPT-4”系列的全新名号。

推理大模型的特点，就是AI会在回答之前花更多时间进行思考，就像人类思考解决问题的过程一样。以往的大模型，背后的逻辑是通过学习大量数据集中的模式，来预测单词生成的序列，严格来说并不是真正理解提问。

认知将跃升至“理科博士生水准”

OpenAI曾解释过，2023年发布的GPT-4类似于高中生的智能水平，而GPT-5则是完成AI从“高中生跃升至博士”的成长。这个o1模型就是其中关键的一步。

相较于GPT-4o等现有的大模型，OpenAI o1能够解决更加困难的推理问题，同时改善过往模型中存在的机制性缺陷。

举例而言，这个新模型能够数清楚strawberry里到底有几个“r”。

同时AI在解答编程问题时也会更有条理，在着手写代码前，把整个回答的流程全部思考完一遍，再动手输出代码。

例如在预设条件的写诗任务（例如第二句的最后一个单词需要以i收尾）中，“拿起笔就写”的GPT-4o的确给出了回答，但往往只会满足了一部分条件，同时不会自我纠正。这意味着AI必须在第一次生成时就能碰上正确的答案，否则就一定会出错。但在o1模型中，AI会不断试错并打磨答案，从而显著提高生成结果的准确率和质量。

有趣的是，点开AI思考的过程，还会出现AI表示“我在思考这个事情这么做行不行”、“啊时间不够了得尽快给出答案”等。OpenAI确认，这里展示的并不是原始的思维链，而是“模型生成的摘要”，公司也坦率承认这里有保持“竞争优势”的因素。

OpenAI的研究负责人Jerry Tworek透露，o1模型背后的训练与之前的产品有着根本性的区别。之前的GPT模型旨在模仿其训练数据中的模式，而o1的训练旨在让其独立解决问题。在强化学习的过程中，使用奖励和惩罚机制来“教育”AI使用“思维链”来处理问题，就像人类习得拆解、分析问题的方式一样。

根据测试，o1模型在国际数学奥林匹克的资格考试中，能够拿到83%的分数，而GPT-4o只能正确解决13%的问题。而在编程能力比赛Codeforces中，o1模型拿到89%百分位的成绩，而GPT-4o只有11%。

（图上显示，o1模型预览版的能力会比正式版低一截）

OpenAI表示，根据测试，在下一个更新的版本中，AI在物理、化学和生物学的挑战性基准测试中，表现能够与博士生水平类似。

该讲讲缺点和局限性了

不难理解，会自己思考问题的AI模型，对于程序员、创意工作者，以及几乎所有的理科相关专业工作者而言是有益的升级，但这个新模型也有局限性。

首先，OpenAI o1模型（至少目前）还不是多模态大模型，同时在回答事实性问题时也不如其他模型。所以在图像互动、常识问答、互联网搜索方面，GPT-4o依然是更胜一筹的选择。当然，OpenAI明确表示未来会给这个模型增加联网、文件和图像上传等功能。

另一个问题则是贵，而且是非常贵。o1-预览模型的定价是每百万个输入tokens 15美元，每百万个输出tokens 则要60美元，分别是GPT-4o的3倍和4倍。一百万tokens大致相当于75万个英文单词。

除了OpenAI o1-预览版外，OpenAI也同步推出了o1-mini模型。后者是一个更快、更便宜的模型，定价也会便宜80%，适用于需要推理但不需要广泛世界知识的场景。

而且从OpenAI“抠抠索索”的举动来看，这个推理模型恐怕非常消耗算力。公司宣布，从9月12日起，ChatGPT订阅用户可以访问这两个新模型，但目前o1-preview每周消息数量限制为30条，o1-mini则为50条。

企业版ChatGPT和教育用户可以从下周开始访问这两个模型。API使用等级达到5级的开发者可以立即开始使用这两个模型，每分钟的速率限制为20次。OpenAI未来准备向免费用户提供o1-mini模型，但目前还没有时间表。

编辑/Somer

①OpenAI o1モデル（「ストロベリー」大モデル）は、人工知能が複雑な推論タスクの領域で新たなレベルに達することを示しています。②AIモデルの動作方法を変更することで、新しいモデルは回答の品質を効果的に向上させ、同時にいくつかのメカニズム上の欠陥を回避することができます。③OpenAIは、o1プレビューバージョンとo1 miniの2つのモデルを初めて発表しました。

財聯社9月13日訊（編集史正丞）北京時間の金曜日の午前1時ごろ、AI時代は新たなスタートを迎えます-一般的な複雑な推論が可能な大きなモデルがついに前に出てきました。

OpenAIは、公式サイトでお知らせし、すべてのサブスクライバーにOpenAI o1プレビューモデル（「ストロベリー」大モデル）を配信することを開始しました。OpenAIは、複雑な推論タスクにおいて、新しいモデルは人工知能の能力の新たなレベルを表しているため、そのためにカウントを1にリセットし、「GPT-4」シリーズとは異なる新しい名前を付ける価値があると述べています。

大規模モデルの特徴は、AIが回答する前により多くの時間を考えるということであり、まるで人間が問題を解決するために考えるプロセスのようです。従来の大規模モデルでは、背後にある論理は、大量のデータセットからパターンを学習して単語生成のシーケンスを予測することであり、厳密には質問を理解することではありません。

認知能力は「理科博士課程の水準」に到達するでしょう

2023年にリリースされたGPT-4は、高校生の知能レベルと似ていますが、GPT-5はAIが「高校生から博士」に成長するのを完了するものです。このo1モデルはその重要な一歩です。

GPT-4oなどの既存の大規模モデルと比較して、OpenAI o1はより困難な推論問題を解決でき、かつ過去のモデルのメカニズム上の欠陥を改善することができます。

例えば、この新しいモデルは、strawberryの中に実際にいくつの「r」があるのかを数えることができます。

また、コーディングの問題に関するAIの回答は、より整理されたものになります。コードを書く前に、回答の流れを完全に考えてからコードを出力することです。

例えば、予定された条件に基づいての詩作業（例えば、2番目の行の最後の単語は「i」で終わる必要がある）では、「ペンを取って書けばいい」というGPT-4oでは回答は出るかもしれませんが、通常は一部の条件を満たすだけであり、自己修正はしません。これは、AIが最初に生成するときに正しい答えに出会う必要があることを意味します。そうでなければ、間違いが起こる可能性があります。しかし、o1モデルでは、AIは継続的に試行錯誤を行い、答えを磨くことで、生成結果の精度と品質を大幅に向上させます。

興味深いことに、AIの思考プロセスを開くと、「この問題について考えてみてもいいですか？」、「ああ、時間がないので早く答えを出さなければなりません」というAIの表現も出てきます。OpenAIは、ここで表示されているのは「生成モデルの要約」であり、企業も「競争上の優位性を保持する」要因があることを率直に認めています。

OpenAIの研究責任者であるJerry Tworek氏によれば、o1モデルのトレーニングは、以前の製品と根本的に異なります。以前のGPTモデルは、トレーニングデータ内のパターンを模倣することを目的としていましたが、o1のトレーニングは問題を独自に解決することを目指しています。強化学習の過程では、報酬とペナルティのメカニズムを使用して、AIに「思考プロセス」を使用して問題を処理することを「教育」することが行われます。これは人間が問題を分解し分析する方法を学ぶことと同様です。

テストによると、o1モデルは国際数学オリンピックの資格試験において83%のスコアを獲得することができ、一方GPT-4oは13%の問題を正しく解決することができます。また、プログラミング競技大会Codeforcesでは、o1モデルは89%パーセンタイル以上の成績を収める一方、GPT-4oは11%しかありません。

（図で示されているように、o1モデルのプレビューバージョンの能力は正式版よりも低いです）

OpenAIによると、次のアップデートのバージョンでは物理、化学、生物学のチャレンジングなベンチマークテストで、AIのパフォーマンスが博士レベルに近いと表れています。

その欠点と制約について話しましょう

自分で問題を考えることができるAIモデルは、プログラマーやクリエイティブな作業者、およびほとんどの理系関連の専門家にとって有益なアップグレードだと理解するのは難しくありませんが、この新しいモデルには制約があります。

まず第一に、OpenAI o1モデルはまだ多モードの大規模モデルではなく、また事実性の質問に答える点でも他のモデルには及びません。そのため、画像対話、一般常識の質問、インターネット検索などでは、GPT-4oの方がまだ優れています。もちろん、OpenAIは将来的にこのモデルにネットワーク連携、ファイルのアップロード、画像検索などの機能を追加する予定です。

もう一つの問題は価格であり、非常に高額です。o1-previewモデルの価格は、100万の入力トークンごとに15ドル、100万の出力トークンごとに60ドルであり、それぞれGPT-4oの3倍と4倍です。100万のトークンはおおよそ75万の英単語に相当します。

o1-プレビューモデルの他に、OpenAIはo1-miniモデルも同時にリリースしました。o1-miniはより速く、より安価なモデルであり、価格も80%オフになり、広範な世界知識を必要としないシナリオに適しています。

また、OpenAIの動きから判断すると、この推論モデルは非常に計算リソースを消費する恐れがあります。同社は、9月12日からChatGPTサブスクリプションユーザーにこれら2つの新しいモデルへのアクセスを提供しますが、現時点ではo1-previewは週に30回のメッセージ数の制限があり、o1-miniは50回の制限があります。

企業向けChatGPTおよび教育ユーザーは来週からこれら2つのモデルにアクセスできます。API使用レベルが5レベルに達する開発者は、これら2つのモデルをすぐに使用でき、1分あたりの速度制限は20回です。OpenAIは将来的にo1-miniモデルを無料ユーザーに提供する予定ですが、現時点ではスケジュールがありません。

編集/Somer

これらの内容は、情報提供及び投資家教育のためのものであり、いかなる個別株や投資方法を推奨するものではありません。更に詳しい情報

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登场

AIの新しい時代が幕を開けました！「思考解決ロジック」を持つOpenAIの推論大型モデルが登場しました

认知将跃升至“理科博士生水准”

该讲讲缺点和局限性了

認知能力は「理科博士課程の水準」に到達するでしょう

その欠点と制約について話しましょう

リスク免責事項

免責事項