西田宗千佳のイマトミライ

第304回

GPT-5の登場賢さ・正確性向上の裏で起きた「意外な声」

西田宗千佳

2025年8月12日 08:20

GPT-5はすでにChatGPT上で使えるようになっている

OpenAIは8月7日(米国時間)、AIモデル「GPT-5」を正式発表した。詳細は発表に合わせた第一報に掲載したので、そちらも併読いただきたい。

OpenAIは毎週のように新しい発表をしているが、今回は特に長い、1時間を超える長さのプレゼンテーション・ビデオを配信した。それだけ力が入っていたということだろう。

OpenAIの狙いがどこにあるのか、そしてそれはどのような影響を及ぼすのかを考えてみよう。

Introducing GPT-5

賢さ・スピードを大幅に改善

GPT-5とはなにか?

それは、OpenAIのサム・アルトマンCEOによる2つの説明で明確だ。

OpenAIのサム・アルトマンCEO

1つ目は以下のもの。

「GPT-3は高校生レベル、GPT-4は賢い大学生レベルだった。それに対してGPT-5は、Ph.D.(博士号取得者)レベルの専門家のようだ。GPT-5を皆、これまでのどのAIシステムよりも気に入って使うだろう」

これはシンプルでわかりやすい。

AIモデルの賢さはもっと向上する必要がある。文章能力ももっと高まって欲しいし、いわゆるハルシネーション(誤った回答)を減らすことも必要だ。

現在はソフト制作や込み入ったリサーチのように、大量の作業をAIに行なわせることもある。現状ではそうしたタスクに無理が発生した際にも、「できない」「問題が発生した」とは答えず、無理矢理タスクを継続して内容を台無しにすることがある。これも一種のハルシネーションだ。GPT-5ではそうした部分で「できない」と明確に伝えるようになったという。

また、AIモデルの信頼性を測定する新しい評価基準が導入されているという。

AIにソフトを書いてもらう「Vive Cording」も重要になり、コードを書く能力も重要になっている。

これまで課題とされている要素を、新しいAIモデルでいかに解決するか。生成AIプラットフォーマーとして業界をリードする立場であるOpenAIとしては、「明確に改善されたモデル」を提示する必要がある。

もちろん、まだ完璧ではない。Ph.D.レベルとはいうものの、実際に使ってみると、びっくりするくらい単純なミスをしてしまう例もある。

だが筆者の試す限り、確かに着実な進化を遂げている。文章を校正する能力や、回答に答えてソフトを書く能力、ウェブアプリであればそのまま実行できる能力など、大幅な進化を感じる。

以下はOpenAIが公開したベンチマークの値だが、ツールやPythonをGPT-5自体が使うことで旧モデルよりも賢くなっているし、最上位モデルのGPT-5 Proはさらに良い結果を出している。

OpenAIが公開したベンチマークの1つ。難しい問題を詰め込んだ「Humanity's Last Exam(人類最後の試験)」で、過去モデルに比べ大きく改善

回答速度の変化も大きい。GPT-5以前に比べ、ほとんどの作業で反応が早く帰ってくる。これは、GPT-5というAIモデルの進化であると同時に、GPT-5を動作させるインフラを改良した結果でもあるらしい。

アルトマンCEOは「GPT-5はAGI(汎用人工知能)ではない」と明言しているし、実際そうではないと筆者も考える。

だが同社がAGIを目指すのであれば、GPT-5は重要な過程であり、大きな到達点としてアピールすべきことだ。

また、OpenAIのAIモデルは多数のサービスで使われている。それらの価値を高めることも、「企業としてのOpenAI」にとっては重要だ。

そのためか、今回は多くの企業がすばやくGPT-5に対応。マイクロソフトもMicrosoft CopilotにGPT-5を即日統合している。

複雑化していた「AIモデル提示」をシンプル化　自動選択も導入

2つ目のアルトマンCEOのコメントは、よりビジネス的な側面の強いものだ。

「モデル選択は非常にシンプルなものになる。これまで無料サービスの利用者にはReasoning(論理的推論)モデルが提供されてこなかったが、GPT-5は最初に提供されるReasoningモデルになる」

生成AIのトップ企業は、自社で使うAIのモデルが「どこまで賢いのか」で鎬を削っている。その中で、OpenAIがいつ次世代、すなわち「GPT-5」を出すかは、1年以上前から話題となっていた。

ただ、GPT-4が公開された2023年と現在との間では、大きな変化も起きている。それが「Reasoningモデルの活用」だ。

従来型のLLMは回答を直接生成する。そのため、回答が比較的シンプルで限定的であり、「なぜその回答に至ったか」が不明確になりやすい。

一方でReasoningモデルは、思考を重ねて修正・検証しながら生成するため、複雑な課題に対応できる。また、推論のステップがより明確になり、透明性が増す、という利点もある。一方、多段的である分演算負荷は高くなり、答えが出るまでには時間がかかる。そして、その分、答えを得るために必要なコストも高くなる。

そのため、OpenAIは2024年9月にReasoningモデルである「o1」を公開した。以降、従来型LLMである「GPT-4o系統」と「o系統(o1、o3、o4-mini)」の双方を提供し、モデルバリエーションの拡大でサービスを提供してきた。

このことは、2つの面で課題を残していた。

1つは、複雑性が増していたこと。どのモデルで回答を得るべきか、モデルの特性に詳しくない人にはわかりづらい。

もう1つは、Reasoningモデルのコストの問題から、oシリーズは有料サービスの利用者にしか提供されてこなかったことだ。

OpenAIはGPT-5から、この問題に解決を図る予定でいた。モデル系統をシンプルにし、選択をある程度自動化し、さらに無料での利用者にもReasoningモデルを提供することで「より安全でより賢い」サービスにすることを目指していたのだ。

以下は、GPT-5導入前のAIモデル選択と、GPT-5導入後の選択画面の違いだ。筆者は有料版の「ChatGPT Plus」(月額20ドル)を使っているが、月額200ドルの「ChatGPT Pro」なら、もっとも賢い「GPT-5 Pro」が使える。

GPT-5導入前のChatGPT。AIモデルが多数あり、選択が複雑

GPT-5導入後のAIモデル選択。ぐっとシンプルになったし、通常は選択せず「自動」で使えばいい

切り替えはあるものの、使う際にモデル変更を意識する必要はほとんどない。より高度な思考を必要とする場合には「GPT-5 Thinking」に切り替わって動作するためだ。

無料版の場合、GPT-5の利用可能量には大きな制限がかけられているが、その場合には自動的に「GPT-5 mini」に切り替わる。

GPT-5世代でも複数のAIモデルが存在しているが、OpenAIはそれを質問の内容などに応じて自動的に切り替える方針とした……というのが正しい理解だろう。使いやすさ向上の面では大きな変化と言える。

Reasoningモデルを無料版でも使えるようにすることは、「誰もがPh.D.レベルのアシスタントを得る」(アルトマンCEO)という意味で大きな変化だ。前述のように、OpenAIがAGIを目指し、人々の助けとなるAIを目指すのであれば、これもまた必要な変化であったと言っていい。

「GPT-4o」を求める声も　賢さでバズらず「サービス」が重要に

ただ一方、GPT-5が公開されたものの、世の中が「GPT-5の凄さに話題騒然」であるか、というとそうではない。GPT-3やGPT-4が登場した時の騒ぎに比べると大人しい。

前述のように、賢さの改善という意味で、GPT-5は明確な進化を遂げている。

しかし問題は、「それをどう使うのか」という点だ。

GPT-5になっても、表面上、これまでのChatGPTとの違いは少ない。なにをするとどう変化があったのかを知るにはわかりやすい機能が必要だ。技術に詳しくない人を相手にするなら尚更である。

コーディングや複雑な課題(大学生・大学院生クラス)の解決など、GPT-5の価値が出やすいものはいくつかある。医療系などでのハルシネーションも減ったという。

そうしたものをピンポイントで使ってみる人は意外と少ないのかもしれない。

だが、いつものようにチャットしてみて「回答の印象が異なる」ことはわかりやすい。

筆者は、GPT-4oは自分を持ち上げてくれて、よりフレンドリーな回答が多かった。一方でGPT-5ではこちらに擦り寄ってくる感じは薄く、論理的かつシンプルな回答になったという印象を持っている。

このことは、ChatGPTを「道具」として使うにはプラスだと感じる。筆者もその点を高く評価する。

しかし、そう思わない人も多いようだ。

他人に相談できないことを話すなど、ChatGPTを「特別な話し相手」として使っている人の場合、回答の変化は「話し相手の個性の変化」として感じられる。

この点は、先日電通が公開した調査と合わせて考えると納得しやすい。

そのためGPT-5を公開後には、「GPT-4oを返して」という声が多数出てきた。

アルトマンCEOも「GPT-4oについて、人々が気に入っている要素を過小評価していた」と語り、GPT-5の口調を温かみのあるものに変える調整を行なうと語っている。

Wanted to provide more updates on the GPT-5 rollout and changes we are making heading into the weekend.

1. We for sure underestimated how much some of the things that people like in GPT-4o matter to them, even if GPT-5 performs better in most ways.

2. Users have very different…
— Sam Altman (@sama)August 8, 2025

なお、有料のChatGPT Pro・Plusでは、「レガシーモデルを表示」を選ぶことで、GPT-4oを使うことも可能だ。

有料のChatGPT Plus以上では、「GPT-4o」を使えるようにするモードもある

GPT-4oを使うには、設定から「レガシーモデルを表示」をオンにする

GPT-4oに感じる個性は、サービスとしてのチューニングに過ぎない。同じGPT-4oでも、サービスの変化やAIモデルのバージョンアップで変化してしまう、非常に曖昧な存在だ。そこに個性や価値を感じるのは、概ね「使っている人の思い込み」に過ぎない部分がある。

人間とはそういうものだ。AIに限らず、多くのことは「個人が相手をどう感じているか」ということで決まる。

AIは技術であるが、我々が触れているのは「AIを使ったサービス」である。

賢さを感じられるかどうかも、自分に好ましい個性を感じられるかも、結局のところは「サービスとしてどのような形に構築するか」で決まる。

特に、AIモデルが一定の賢さをすでに備えている以上、リニアな賢さの変化は感じづらく、「賢くなった結果、どのような利便性・価値を提供できるのか」という点が重要になる。ある意味、AGIであるか否かよりも大切なことだし、AGIになるなら、よりわかりやすい価値を提供できるようになるはずだ。

今回、OpenAIはGPT-5を「AIモデルの進化」として実装した。その上で、より多くの人が使えるよう、無料版への対応やAIモデル自動選択をはじめとした「シンプル化」もサービスの切り口ではあるが、筆者はこの先に「さらに消費者に有用なサービスにするには」という切り口での進化が隠れていると予測している。

GPT-5は今後への下地づくりなのだと思うが、その過程で「サービスとしてのAIモデルに愛着を感じる」ことを訴える消費者が出たことは、今後の進化の中で「サービスとしての演出とユーザー価値」を考える上で、非常に興味深い出来事でもある。

西田宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、AERA、週刊東洋経済、週刊現代、GetNavi、モノマガジンなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。近著に、「生成AIの核心」 (ＮＨＫ出版新書)、「メタバース×ビジネス革命」( SBクリエイティブ)、「デジタルトランスフォーメーションで何が起きるのか」(講談社)などがある。
　メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Xは@mnishi41