ニュース
Geminiが大幅進化 「見せて解決」や自分のデータで「Deep Research」
2025年5月21日 10:30
Googleは20日、Google I/O 2025にあわせて、Gemini アプリの強化を発表した。 Gemini Liveのカメラと画面共有機能をAndroidとiOSで無料で提供するほか、新たな画像生成「Imagen 4」、動画生成「Veo 3」などを導入する。加えて、AIサブスクリプションプランとして、2,900円の「Google AI Pro」と249.99ドル(約3.6万円)の「Google AI Ultra」も展開する。
Gemini アプリが大幅強化「見せて解決」
今回発表したGemini アプリの新機能は以下の通り。
- Gemini Live:スマートフォンをかざして話すだけで操作できる「Gemini Live」のカメラと画面共有機能をAndroidとiOSで無料で提供開始
- Imagen 4 : 高画質、優れたテキスト描写、処理速度の早さが特長の新しい画像生成モデルImagen 4を搭載
- Veo 3 :効果音、背景音、キャラクター間の対話をネイティブにサポートする動画生成モデル Veo 3を搭載
- Deep ResearchとCanvas:情報分析、ポッドキャスト作成、ウェブサイトやアプリのヴァイブ コーディングなどに対応
- Chome: GeminiがChrome でも利用できるようになる。ウェブ閲覧中に質問kな王
- 学生:米国、日本、米国、ブラジル、インドネシア、英国の大学生は、2025年6月30日までの申し込みで15カ月、Geminiのアップグレードを無料で利用できる
- Google AI Ultra : 新しいプレミアムプランGoogle AI Ultraを開始。Gemini アプリの利用上限の拡大や新機能をいち早く試したい先進的なユーザー向け
- 2.5 Flash : 新たな標準モデルに2.5 Flashを採用
Gemini Liveのカメラと画面共有機能は、「文字入力の代わりに、そのまま見せて」調べられる機能。Gemini Liveでカメラをかざして、壊れた家電のトラブル解決や個人的な買い物のアドバイスなどをGeminiが画像を理解して、解決策をサポートする機能となる。Googleによれば、会話の長さは平均してテキストベースの会話の5倍になっているという。
このGemini Liveのカメラと画面共有による「見せて解決」機能を、AndroidとiOS のすべてのユーザーに無料で提供開始する。
さらに今後数週間で、Gemini Liveの機能を強化していく。例えば、友達との外出の予定をたてる際に、Gemini Liveに詳細を相談すると、その内容をGoogleカレンダーの予定として作成できる。シカゴ風ピザが食べたくなった時は、Gemini Liveに尋ねるだけでGoogle マップの最新情報を提案してくれる。
Google マップ、Google カレンダー、Google ToDo リスト、Google Keepとの連携を開始しており、今後さらに多くのGoogleの連携機能を提供予定としている。
Gemini Liveの基盤となっているのが、24年に研究プロジェクトとして発表した「Project Astra」。ライブでの動画理解、画面共有、記憶を実現するものだが、その研究成果を「Gemini Live」に統合し、より多くの人々が体験できるようにした。これらの成果は、Gemini Liveだけでなく、検索の新たな体験、開発者向けのLive API、スマートグラスなどの新しい形状のデバイスなどへの導入を進める。
また、新たに画像生成の「Imagen 4」と、動画生成の「Veo 3」をサポート。Imagen 4はすべてのGeminiユーザーが利用可能。Veo 3は、米国のGemini Ultraユーザーを対象に20日から提供開始する。Veo 3では、動画シーンを生成するだけでなく、都会の喧騒、葉のそよぐ音、キャラクター同士の会話なども、文章指示から生成できるほか、音声生成も標準機能として搭載する。
詳細調査のDeep Researchは、公開情報だけでなく、自分の手持ちのPDFや画像などのプライベートデータを組み合わせたレポート作成が可能になる。これにより、独自の知識とWeb上の広範なトレンド集約させて、全体像を把握するレポートを作成できる。
PDFの読みこみにも対応するほか、近日中に、Google DriveとGmail でもリサーチが可能となる。
Gemini画面のサイドパネルなどでAIによる出力結果を確かめながら作業できる「Canvas」も強化。インタラクティブなインフォグラフィックやクイズのほか、45言語対応のポッドキャスト的な会話形式の音声概要を作成できるようになる。
また、デスクトップ版ChromeのGeminiが、WindowsとmacOSでChrome米国のGoogle AI Pro/Google AI Ultra サブスクリプション ユーザーを対象に、順次提供開始される。
初期バージョンでは、閲覧中のウェブページの複雑な情報のわかりやすい説明や要約をGeminiに依頼できる。将来的には、Geminiが複数のタブを横断して情報を処理したり、ウェブサイトの操作も行なえるようになる。
AIサブスクも刷新 250ドルのUltra登場
21日からは、「Google AI Pro」と「Google AI Ultra」の2つのサブスクリプションプランの提供を開始する。
Google AI Proは、月額2,900円でAI ツール一式を利用できるプラン。これまでのGemini Advancedを拡張し、Gemini アプリ体験をレベルアップするもの。新たなFlowツールや、NotebookLMなどの製品も含まれ、多くの機能やより高い利用上限が設定される。
Google AI Ultraは、Google AIへの「VIP パス」と位置づけられ、最も高性能なモデルへの最大の利用上限でアクセスできるほか、実験的なAI機能への早期アクセスを優先的に提供する。米国から提供開始し、月額249.99ドル(約3.6万円)。高額ではあるが学生は15カ月間無料となる。
優先機能としては、AI Ultraユーザーであれば、近日公開予定のVeo 3とGemini 2.5 Pro Deep Think モードをいち早く利用できる。また、近日中にデスクトップ向けに提供開始する新機能「Agent Mode」への早期アクセスも得られ、目的を伝えるだけで、Geminiが実現に必要な手順を自動的に組み立てて提案してくれる。
Agent Modeは、リアルタイム ウェブ検索、詳細なリサーチ、Google アプリとの連携など高度な機能を統合しており、複雑な複数ステップのタスクを最小限の指示で管理できる。
Agentモードは、24年12月に発表した、WebブラウザがAIエージェントになる「Project Mariner」によるもの。ブラウザを起点に、人間とエージェントの相互作用の未来を探る研究プロトタイプとなっており、現在、同時に最大10種類の異なるタスクを処理できるエージェント システムを搭載。情報の検索、予約、ショッピング、調査など、さまざまな作業を同時に進められる。