ニュース

OpenAI、次世代動画生成AI「Sora 2」 カメオ出演やiOSアプリも

OpenAIは30日(米国時間)、最新の動画生成AIモデル「Sora 2」を公開した。従来のSoraよりも生成動画を精緻に表現できるほか、対話や効果音の付与にも対応する。24年2月の初代SoraをGPT-1とすると「Sora 2はGPT-3.5相当」とOpenAIでは説明している。

Sora 2は動画・音声生成モデルとしてバージョンアップ。従来の動画生成モデルでは難しかった表現を実現し、一例として、オリンピック体操の演技や、浮力と剛性の物理特性を再現したパドルボード上でのバックフリップ、しがみつく猫を乗せたトリプルアクセルなどの動画を作成できるようになったとする。

Sora 2で生成した動画。猫とトリプルアクセルなど(OpenAIのニュースリリースから)

また、動画の制御(controllability)においても大きな進歩がなされ、複数のショットにまたがる複雑な指示に従いながら、世界の状態を正確に維持できるようになった。写実的、映画的、アニメ的スタイルに特に優れているという。

さらにSoraの生成環境内に、実際の人物を入れ込むことも可能。この機能は「まだ完璧からは程遠い」としているが、現実のシミュレーションに近づけていくという。

Sora 2の公開にあわせて、新たにiOSアプリも提供開始。アプリで動画生成したり、他のユーザーの生成物をリミックスしたり、Soraの動画を集めたフィードで動画を発見できる。また、カメオ機能で、自分や友人を動画に登場させられる。先週OpenAI社内でテスト公開したところ、社員からはカメオ機能を通じて、新たな友人関係が生まれており、この機能を各としたソーシャルアプリなどの展開が見込まれるという。

なお、依存を防ぐためにフィードの管理機能や、1日に閲覧できる時間の制限なども搭載。ChatGPTのペアレンタルコントロール機能は、Soraにも適応される。また、カメオ機能はSoraを通じて自身の肖像権をエンドツーエンドで管理できるとしている。

アプリは米国とカナダから提供を開始し、早期に他国にも拡大予定。また、ChatGPT Pro(月額200ドル)ユーザーには、高品質な実験モデル「Sora 2 Pro」を提供予定。