ニュース

ChatGPTエージェント登場 AIがスライド作成や調査を代行

OpenAIは17日、「ChatGPT Agent(ChatGPTエージェント)」を発表した。独自の仮想コンピューターを使用して作業し、推論とアクションを切り替えながら、複雑なタスクを一貫して処理できるようになる。

ChatGPT Pro(月額200ドル)、Plus(20ドル)、Team プランのユーザーを対象に段階的に提供を開始し、EnterpriseとEducationでは7月に提供開始予定。Proユーザーは、ほぼ無制限にタスクを実行可能で、その他の有料プランは月あたり50件のタスクを実行でき、必要に応じてクレジットベースで追加で使用可能とする。

ChatGPT エージェントは、PCをAIが操作する「Operator」のWebサイト対話機能、「deep research」のWeb情報統合力、ChatGPTの会話スキルを統合した一体型のエージェントシステム。金融情報の調査やオンラインフォームの入力、スライドショーの作成など、アイデアや質問を直接アクションに変えられる。

ChatGPT はユーザーの指示に応じて作業を引き受け、迅速に出力を戻すため、ユーザーはプロンプトを入力し、その過程を確認しながら成果を得られるようになる。

例えば、「カレンダーを確認して、最近のニュースに基づき今後のクライアントとの会議について説明してほしい」、「競合他社3社を分析してスライドショーを作成してほしい」といった要望に対し、ChatGPTはWebサイト内を操作し、日付の選択やフィルタリングを行なうほか、安全なログインを促してコードを実行したり、調査結果をスライドやスプレッドシートに整理して出力したりできる。

また、ログインなどの重要な操作はChatGPTがユーザーに許可を求めるため、処理をユーザーが引き継いだり、中断したりすることも可能。「ChatGPTエージェントは、エージェント機能をChatGPTに本格的に統合する第一歩」としている。

リモートブラウザーを使用してWebサイトと対話できるエージェント「Operator」と、詳細調査の「deep research」の2つの主要機能を融合し、その強みを補完することでChatGPTエージェントを実現。Webサイトとより能動的に関わりながら、正確かつ効率的に情報を取得できるようになった。

ユーザーとの対話は、ChatGPTから行なうが、ChatGPTエージェントの処理では、APIを通じて金融データやスポーツのスコアを取得したり、Webサイトと視覚的にやり取りしたりすることも可能。各ステップで最適なツールを判断し活用しながら、その結果を評価できるよう学習済みとしている。

エージェントはChatGPTコネクターを活用することで、ワークフローを介してユーザーにとって必要な情報にアクセス可能。例えば、受信トレイの要約や会議出席可能な時間の検索など、普段使っているツールの情報をChatGPTエージェントから認識・活用できるようになる。実際にアクションを実行する場合は、エージェントがサイトとやり取りするために、ユーザーがブラウザーでログインするよう求める。

ベンチマークにおいては、「Humanity’s Last Exam(人類最後の試験)」で、ChatGPTエージェント搭載モデルがスコア43.1という最高記録を出した。また、データ分析タスクでは、人間のパフォーマンスを大きく超える結果を示している。

利用例としては、職場において、スクリーンショットやダッシュボードをベクター要素の編集可能なプレゼンテーション資料に変換したり、会議の再設定やオフサイトの計画・予約、フォーマットを保持したまま財務データを更新するなど、反復的なタスクを自動化できるようになる。また、プライベートな利用シーンでも、旅程の計画・予約やディナーパーティーの企画と予約、専門家の検索と面会予約などにも活用できるという。

ChatGPTエージェントは、「エージェントモード」を選択して開始する。実行したいタスクについて「deep researchを行ないたい」「スライドショーを作成したい」「経費を提出したい」といった説明をするだけで、ChatGPTエージェントが反応し、タスクの実行中は、画面上にChatGPTの処理内容がナレーション形式で表示され、進行状況を確認できる。

なお、ChatGPT エージェントはまだ初期段階としており、「誤りを犯す可能性がある」とも説明。現時点では、スライドショーの生成機能はベータ版で、既存の資料がない状態から作成を始める場合、出力されるフォーマットや完成度がやや粗いと感じられることがあるという。また、ChatGPT上では既存のスプレッドシートをアップロードして編集したり、テンプレートとして使用できるが、スライドショー作成機能ではこれらの操作はまだ利用できない。OpenAIでは、すでに次世代のスライドショー作成機能の学習を進めており、この点も改善予定としている。今後、ChatGPTエージェントの効率性や柔軟性、対応力は順次強化していく。