ニュース

OpenAI、「Codex」を開発"全部入り”アプリに コンピュータ操作+画像

OpenAIは16日(米国時間)、コーディングエージェント「Codex」の大規模アップデートを開始した。これまでの「コーディング」だけでなく、computer use(コンピューター操作)や画像生成に対応し、より広範な開発作業を可能とする。

Codexデスクトップアプリ(Mac/Windows)から順次対応を開始するが、コンピューター操作は当初macOSからの対応となる。

新たなCodexでは、コーディングだけでなく、その前後の開発やテストを含めたソフトウェア開発ライフサイクル全体をカバーするための機能を強化。「ほぼ全部入り(almost everything)」アプリに進化させる。

最大のアップデートとなるのが、コンピューター操作への対応。Codexがコンピューターのデスクトップ操作を自動で行なうもので、独自のカーソルを使って画面を確認し、クリック、入力することで、「ほぼすべてのアプリ」を利用できるようになる。複数のエージェントがMac上で並行して作業を行なっても、他のアプリでの作業に干渉しない。これにより、フロントエンドの変更の反復、アプリのテスト、APIを公開していないアプリでの作業など、Codexの利用シーンを広げていく。

また、Webとのネイティブ連携も開始。Codexアプリにブラウザが組み込まれ、ページ上に直接コメントを書き込み、エージェントに正確な指示を行なえる。現在のフロントエンドやゲーム開発に有用としており、将来的にはCodexがlocalhost上のWebアプリケーションを超え、ブラウザを完全に制御できるよう拡張する予定としている。

画像の対応も強化し、gpt-image-1.5を使用した、画像生成や反復処理に対応。スクリーンショットやコードと組み合わせて、ワークフロー内で製品コンセプト、フロントエンドデザイン、モックアップ、ゲームのビジュアル作成などが行なえる。

90種類以上のプラグインも追加。スキルやアプリ連携、MCPサーバーと組み合わせて、Codexにコンテキストを追加できるようになり、Atlassian Rovo、CircleCI、CodeRabbit、GitLab Issues、Microsoft Suite、DatabricksのNeonなどが対応する。

また、メモリ機能のプレビュー版も開始。Codexが個人の設定や修正内容、収集した情報など、過去の経験から得た文脈を記憶して活用できるようにする。文脈に応じた提案やメモリ機能などのパーソナライズ機能は、Enterprise、EduとEU/UKのユーザー向けに提供する。