ニュース

GPT-5.2公開 知的労働で専門家を超える「世界一賢い公開モデル」

OpenAIは11日(米国時間)、最新のAIモデル「GPT-5.2」を公開した。汎用的で高速な「GPT‑5.2 Instant」、推論モデルの「Thinking」、最上位の「GPT-5.2 Pro」の3つのモデルを展開し、有料プランのChatGPT Plus、 Pro、Business、Enterpriseユーザーから順次利用可能となる。

GPT-5.2は汎用知能、長い文脈の理解、エージェント型ツールの呼び出し、ビジュアル処理などにおいて大幅な性能改善を実現。これにより、複雑な実世界タスクの実行能力を高めており、OpenAIのサム・アルトマンCEOは「世界で最も賢い一般公開モデル」としている

Googleが高性能なGemini 3を発表後、OpenAI社内では「コードレッド(非常事態)」が宣言され、ChatGPTそのものの性能向上を最優先する方針を決めたと報じられている。GPT-5.2はそのコードレッド以降、最初のOpenAIのモデル投入となる。

現実のプロフェッショナルワークで高い性能を発揮し、44職種の知識労働タスクを評価するベンチマーク「GDPval」では、GPT-5.2 Thinkingが最高スコア(70.9%)を記録し、人間の専門家レベル以上の性能を発揮したという(GPT-5 Thinkingは38%)。これらのタスクにはプレゼンテーション作成、スプレッドシート作成などが含まれ、タスクの成果物を、専門家よりも11倍以上の速度と1%未満のコストで生成できるという。特に、GPT-5.2 Thinkingでは生成するスプレッドシートとスライドの洗練度・書式設定が向上している。

GPT-5.1 Thinking(左)とGPT-5.2 Thinking(右)の比較

コーディングにおいても、GPT-5.2 Thinkingは、SWE-Bench Proにおいて55.6%、RC-AGI-2で52.9%、Frontier Mathで40.3%と高いスコアを実現。特に、フロントエンドのソフトウェア開発に優れ、3D要素を含むものなど、複雑なUI作業の対応力を高めた。ハルシネーションも低減している。

長文の理解においても高い性能を示すほか、視覚認識(Vision)の対応力も向上。科学論文の視覚的図表に関する質問に回答できるほか、GUIのスクリーンショットの理解や、画像内の要素配置の認識などを高めている。

3つのモデルでは「GPT-5.2 Instant」は日常業務や学習向けとし、高速で温かみのある会話調を基盤に、情報検索やハウツー、手順説明、技術文書作成、翻訳などで高い性能を示す。

「GPT-5.2 Thinking」はより複雑なタスクに向けたもので、コーディング、長文文書の要約、アップロードされたファイルに関する質問への回答、数学や論理の段階的な解法、明確な構造による計画立案や意思決定のサポートなどに優れるという。

「GPT‑5.2 Pro」は、高品質な回答のために待ち時間を許容できる“難しい質問”に対する、最も賢く信頼性の高いモデルとしている。

なお、18歳未満のユーザーに対しては、センシティブコンテンツへのアクセス制限を自動適用する年齢予測モデルを初期段階から導入するなど、安全対策も強化している。

API価格

ChatGPTでは、GPT-5.1はレガシーモデルとして有料ユーザー向けに3カ月間に限り提供を継続する。

ChatGPTの有料サービスやAPIでGPT-5.2が利用可能となるほか、Microsoft 365 Copilot、GitHub Copilot、Microsoft Foundry、Copilot Studioなどでも対応する。

Microsoft 365 CopilotなどもGPT-5.2に対応