トピック

月3万円のChatGPT Pro、どれだけ役に立つ?　プログラミングで試す

日沼諭史

2025年1月28日 08:20

OpenAIはAIチャットサービス「ChatGPT」において、2024年12月から新プラン「ChatGPT Pro」の提供を開始しました。そのなかで特に注目の的となったのは、200ドル(税込220ドル)、日本円にして3万円を超える費用が毎月かかることだったのではないでしょうか。買い切りでもなく年額でもなく、月額というのがなかなかのインパクトです。

個人的には3万円の「元を取る使い方」をなんとか考えてみたいとも思いましたが、ChatGPT Proのみで利用できるAIモデル「o1 pro mode」が、従来の「GPT-4o」や「o1」と比べてどれだけ優秀なのか、まずはその実力を確かめてみることが先決でしょう。

ChatGPT Proは月額220ドル、1ドル156円で換算するとおよそ34,000円に

そこで、o1 pro modeと、GPT-4oおよびo1の3つを比較したときにどのような違いが出てくるのか、プログラミングにおける3つのユースケースからチェックしてみました。

アルゴリズムの検討が必要なファイルリネームプログラムの新規開発

1つ目は、アルゴリズムの検討が必要になるプログラムを作成するケースです。GPT-4o、o1、o1 pro modeのそれぞれに全く同じプロンプトを与えて、期待するプログラムができあがるかどうかを確かめます。

アルゴリズムと言っても大それたものではありません。筆者が日常的に手作業で行なっているファイルのリネーム操作をより簡便にする、というのを目的にした、プログラムとしてはおそらく単純なものです。ポイントとしては、プロンプトで「実現したいこと、目的としていることだけを記述」し、「こちらからコードは一切例示しない」といったあたり。実際に入力したプロンプトは以下の通りです。

プロンプト(抜粋)

パソコンのフォルダ内に保存しているJPG（拡張子jpg/jpeg/JPG/JPEG）およびPNG（拡張子png/PNG）の画像ファイルを対象に、一定ルールのもとリネーム処理を行うツールを開発します。下記の目的に合致するプログラムを提示してください。
「ツールの目的」
連番ファイル名の画像が1つもしくは複数含まれているフォルダ内で、それらの画像ファイルを整理するときに、ある1つの画像ファイルの数字を変更して並び替えたいことがある。

たとえば001.jpg～010.jpgまで10個の画像ファイルがあるとする。
仮に005.jpgを003.jpgにリネームしたいときは、005.jpgを既存の003.jpgの前に挿入したいという意図をもった操作だと想定する。
つまり、005.jpg→003.jpg、003.jpg→004.jpg、004.jpg→005.jpg、という計3ファイルのリネームが発生する。

また、仮に003.jpgを005.jpgにリネームしたいときは、003.jpg以降の全てのファイルを2つ分シフトさせたいという意図をもった操作だと想定する。
つまり、003.jpg→005.jpg、004.jpg→006.jpg、005.jpg→007.jpg……010.jpg→012.jpgというように計8ファイルのリネームが発生する（003.jpgと004.jpgはなくなる）。

こういったリネームを手作業で行う手間をなくすため、1つのファイルに対して変更後の数字（「001」や「1」など）を入力するだけで、そのファイルを変更後の数字でリネームするとともに、影響の及ぶ他のファイルの連番も自動で振り直すプログラムを作り、手間を軽減できるようにしたい。

この処理をWindowsやmacOSなどのパソコン上で正しく実行するための最適なアルゴリズムをPythonコードで提示せよ。
実際のファイルを対象に処理する必要はなく、それを検証できるようなコードであればよい。

ただし、そのアルゴリズムを実際のファイルのリネーム処理プログラムに反映することを想定しておく。
また、処理が期待通りになるか、あらゆるパターンのリネームを試したいので、それをしやすくする工夫を加えること、一連の処理がどのような手順で行われているか分かりやすいように適宜標準出力すること、といった点も考慮する。

GPT-4o

GPT-4oでは、回答が簡潔にまとめられ、コード例もステップ数30ほどのかなりシンプルな作りになりました。ただ、このコードを実行してみると下のスクリーンショットにある通り、エラー的なメッセージを1行吐いて終了してしまいます。

目的としているものからかけ離れた結果で、アルゴリズムの検証以前の問題です。これだとアルゴリズムの中身にも期待がもてません。ユーザー自らコードの中身を紐解き、具体的な改善方法をAIに対して指示していかないと、なかなか完成にはたどり着かなさそうな雰囲気です。

GPT-4oの回答

プログラムの実行結果

o1

次はo1です。こちらはどのような手順でどのような処理を行なうのかを、細かく説明したうえでコードを提示してくれました。コーディングしていくときの基本的な考え方を知ることもできるので、ユーザー自らコードを読み込んでいくときの理解が深まります。

コードを実行してみると、とりあえず結果は出力されました。プロンプトの中で例示したパターンを試すだけでなく、別パターンの例も追加しているのは気が利いています。が、出力の仕方に工夫が足りず検証内容が分かりにくいうえに、結局プログラムとしては筆者が期待する動作にはなっていません。こちらもGPT-4oの時と同様、何度か修正を指示していく必要がありそうです。

o1の回答(抜粋)

プログラムの実行結果

o1 pro mode

o1 pro modeも、o1と同じく処理の流れについて詳細に説明してくれました。そして、実行結果はほぼプロンプトで指示した内容の通り、筆者の期待するものになっているようです。

o1 pro modeの回答(抜粋)

プログラムの実行結果

実際にOS上でファイル操作した際の同名ファイルの衝突(いったん全く別のファイル名に変更してから本来あるべきファイル名に変更する)を考慮した処理が含まれていないため、完全ではありませんが、改善すべき箇所が明らかなので実用できるプログラムに仕上げていくのにも手間がかからないでしょう。

ちなみに、このようなベースとなるコードが一切なく、ゼロから生成してもらうようなケースでは、ユーザーの実現したいことを長々と文章で説明することになります。というか、むしろできるだけ詳細に説明しないと期待したものができあがりません。

ただ、文章で説明するときには、そこにユーザーの認識違いや矛盾が含まれてしまうこともよくあります。そうすると、生成されるコードも高い確率で誤ったものになってしまうことに注意が必要です。

これはどのAIモデルでも同様で、今回、プロンプトを何度か試行錯誤していくなか、ごく些細な矛盾があっただけでo1 pro modeでも期待するものとは大きく異なる結果になってしまいました。AI側が矛盾などに気付いて自ら補正しつつコーディングしていく可能性は高くない、という前提に立って、丁寧にプロンプトを作り込みたいものです。

文字起こし用コンソールプログラムのWebアプリへの移行

続いては、既存のプログラムを元にした改修です。筆者が音声ファイルの文字起こしに使用しているコンソールプログラムを、より簡便に使えるようにWebアプリ化してもらおうと考えました。Docker(仮想環境)で動作させることを前提としているため、その環境構築用の設定ファイルを過不足なく提示できるかどうかも鍵になってきます。