OpenAI「GPT-5.2」発表!思考するAIエージェントが専門業務をコスト1/100に

2025年12月11日、OpenAIはプロフェッショナル業務と「長期間稼働するエージェント(Long-running Agents)」向けに最適化された新モデル「GPT-5.2」を発表しました。

このモデルは、新たなベンチマークにおいて、多くの専門職種で人間と同等以上のパフォーマンスを記録したとされ、AIエージェントが「チャットボット」から「自律的な社員」へと進化する決定的な一歩となる可能性があります。

人間の専門家を凌駕する「思考力」とコストパフォーマンス

GPT-5.2の最大の特徴は、その圧倒的なコスト対効果と処理能力です。

専門家レベルの仕事を1%のコストで

発表によると、GPT-5.2は44の職種にわたる専門的な知識労働タスクを評価するベンチマーク「GDPval」において、人間の専門家を上回る、あるいは同等の成果を出しました。衝撃的なのはそのコストで、人間の専門家が同等のタスクを行う場合に比べて100分の1未満のコストで実行可能だとしています。

また、処理速度においても人間より11倍以上高速にタスクを完了できるとされ、企業の生産性革命を強力に後押しします。

自律的に計画し、試行錯誤する

GPT-5.2は「Thinking Model(思考するモデル)」としての能力が大幅に強化されています。

従来のモデルのようにユーザーからの指示を待つのではなく、複雑な目標を達成するために必要な手順を自律的に計画し、実行します。途中でエラーが発生しても、自ら修正案を考えて試行錯誤(リトライ)を行う能力が向上しており、人間の介入なしにタスクを完遂する力が飛躍的に高まりました。

「長期間稼働」に耐えうる堅牢性

これまでのAIエージェントの課題の一つに、長時間にわたるタスクで文脈を見失ったり、動作が不安定になったりする点がありました。GPT-5.2はこの点に焦点を当てて最適化されています。

数日にわたるタスクも遂行可能

「Long-running Agents」向けに設計されたこのモデルは、数時間から数日にわたる長いタイムスパンの業務でも、文脈を正確に維持し続けます。

例えば、「大規模なシステムログの解析」や「市場調査レポートの作成」といった、これまでは人間が数日かけて行っていたようなヘビーな業務を、AIエージェントに完全に任せることが現実的になります。

まとめ

OpenAIによるGPT-5.2の発表は、生成AIの活用フェーズが「対話」から「業務の完全代行」へと移行したことを明確に示しています。

専門職の知見を低コストかつ高速に利用できるこの技術は、人手不足に悩む企業にとって福音となる一方で、ホワイトカラー業務の在り方を根本から再定義するインパクトを持っています。自律型エージェントの導入を検討している企業にとって、GPT-5.2の検証は避けて通れない最重要事項となるでしょう。

出典: OpenAI