西田宗千佳のイマトミライ

第342回

エージェンティックAIに全振りするグーグル 検索からAIグラスまで全ての基盤に

Google I/Oの会場となるショアライン・アンフィシアター

今年もGoogle I/Oの取材に行ってきた。

同イベントはGoogleの年次開発者イベントで、毎年多くの発表がある。一方で、コンシューマ向けのハードウェアに近い発表は、近年「Android Show」というオンラインイベントに切り分けられるようになった。先週の連載で解説したのがそれだ。

だがもちろん、Google I/Oは開発者向けの話だけにフォーカスされたわけではない。

わかりやすいのは「スマートグラス」向けの展開を「インテリジェント・アイウェア」としてアピールしたことだろう。

また、検索技術の刷新・進化についても、多くの人に影響を与えることだろう。今年も検索技術責任者に単独インタビューできた。

どの変化にも「エージェンティックAI」という要素が大きく絡んでいる。

前回のテーマとも通底しているが、Google I/Oにおけるトレンドである「エージェンティックAI時代」についてまとめた。

そして、そのことが今後どう影響してくるのか、AIサービスを持つ企業にとってどれだけ重要な要素になってくるかを考えてみよう。

今後10年の軸となる「エージェンティック・トランスフォーメーション」

Googleは毎年、Google I/O最終日に、海外から来たプレス関係者を集め、トップエクゼクティブが質問に答えるセッションを行なう。

その中で、Googleのスンダー・ピチャイCEOは、「今年のGoogle I/Oの発表で、5年後・10年後に語り継がれるものはなにか?」という質問に対し、以下のように答えた。

Googleのスンダー・ピチャイCEO

「今年のGoogle I/Oでは、私たちの製品全体におけるエージェンティック・トランスフォーメーションの基盤を築いたと考えています。これまでは検索をして何らかの情報を得るという段階でしたが、そこから継続的な対話を行なえるようになり、さらには実際に意味のある行動(アクション)を起こし、それに基づいて人々の生活を楽にしてくれるようになります」

要は、情報の検索から「検索から行動する」ことを支えるインフラへと変化することを目指している……という宣言だ。

現在のLLM(大規模言語モデル)をベースとしたAIは、文章の内容を理解して回答したり、画像や音声に含まれる情報を分析したりすることを可能とした。一方、人間が生活の中で便利だと思うには、「処理の内容や回答が価値を生む」必要がある。

我々がAIに求めるのは「なにかを自分の代わりにしてくれること」でもある。1つの処理で終わるのでなく、人間の命令をAIが解析した上で、適切なAIエージェントに作業を委託、その積み重ねとして「代わりになにかをしてくれる」わけだ。これがエージェンティックAIの基本である。

Googleは今回、エージェンティックAI基盤として「Gemini Spark」を発表した。イベントの進行や参加者アンケートの回収を自動化し、受信トレイやカレンダーの情報から「その日すべきこと」「重要な情報」をまとめ直す「Daily Brief」機能を実現する。

主軸となるエージェンティックAIである「Gemini Spark」
自分が今日知るべき・気にするべき情報をまとめる「Daily Brief」

また検索においては価格や予約の変動を監視し、目的にあった状態になったら教えてくれるようにもなる。

検索はAIを軸に多数の機能を追加

そもそも、ソフトウェア開発はエージェンティックAIそのものだ。ソフト開発者は1年前から、エージェンティックAIがいかに作業の流れを変化させるか、身をもって理解しているのではないだろうか。

今回、Googleは検索の中に、「自動的にAIがソフトを作ってインタラクティブな説明をする」という、「ジェネレーティブ・ユーザーインターフェース」という要素を追加した。これも、AIエージェントを活用した付加価値追加の1つだ。

「ジェネレーティブ・ユーザーインターフェース」で生成された検索結果

Gemini SparkはGoogleのクラウド内に仮想的なPCを用意し、その上でエージェンティックAIを動かす。だから利用する側はどういう状況であるかをあまり気にすることなく、人間の手もあまりかけることなく、作業の結果や情報を得られる。

OpenClawをはじめとして、自分のPCとクラウド上のAIを連携させて動作するエージェンティックAIがまず注目を集めたが、気軽に使うならクラウドベースの方がいい。

当然それだけインフラには負担がかかるが、Googleはそちらを選択した。

おそらく大手は皆、コンシューマ向けには同じような方法論を選ぶことになるのではないだろうか。

そしてAIモデルとして、エージェンティックAIや検索を支えるのが「Gemini 3.5」。まずは速度重視の「Gemini 3.5 Flash」からの公開だが、来月には「Gemini 3.5 Pro」の提供が始まる。

Geminiの新バージョンである「3.5」は主機能だが、賢さ以外の部分がGoogle I/Oの軸であった

しかし、もはやAIモデルの賢さ自体は話題の中心ではない。必要なことだが、「AIがどう人々の生活を変えるか」の方が重要であり、そのために重要なのは「エージェンティックAIの導入を加速していく」ことだ。

今回Googleが強調したかったのはそのことであり、サービスやソフトの開発者に、エージェンティックAI基盤を使ったソフトの開発促進をする、ということだったのだろう。

Googleの親会社であるAlphabetは、4年前に比べ6倍の投資を行なって基盤整備に努めている

スマートグラスでもエージェントを動かすGoogle

そういう意味で、筆者が興味深いと思ったデモがある。

それが、Googleとサムスンが共同開発中のスマートグラスに関するものだ。

Googleは「インテリジェント・アイウェア」「オーディオグラス」と称している。カメラとマイクを搭載しているがディスプレイはなく、スマートフォンと連動して動作する。AndroidだけでなくiOSにも対応し、幅広く普及させることを目指している。発売は今秋とされているが、日本での販売時期などについてのアナウンスはない。

Googleが開発中の「インテリジェント・アイウェア」。サムスンとの共同開発

今回のデモの中で面白かったのは、AIについて「よくあるデモ」では終わらなかったことだ。

カメラを搭載したスマートグラスは、AIと連動して「目の前になにがあるか」を認識させるものが多い。要はカメラをAIの眼に、マイクをAIの耳にすることで「周囲を認識する」機能を搭載できるからだ。

カメラで捉えた内容をAIが認識

ただ、それだけではそこまで便利ではない。自分がやって欲しいことを命令すると実現してくれる、エージェンティックAI的な要素が求められる。

Googleはインテリジェント・アイウェアで、命令するとコーヒーの注文が終わる、というデモを行なった。ここまでできるなら、PCやスマホを取り出すことなく、より様々なことが可能になるだろう。

インテリジェント・アイウェアから声でコーヒーを注文

こうしたアピールをしたのは、ライバルであるMetaがこのジャンルでは先行しているためだ。2年以上前にアメリカでは発売され、日本でも先日から発売された。

Metaは「AIグラス」と呼んでおり、一般には「スマートグラス」と呼ばれることが多い。Googleの「インテリジェント・アイウェア」も、本質としては違いがない。

今後もライバルはさらに増える。その中で新しさや価値をアピールするために、エージェンティックAI的な要素を持ち出したのだろう。当然、どの企業も考えることは同じなので、AIを強化する中でエージェンティックAI的要素を搭載してくるのは間違いないが、Googleとして、今回アピールするならその部分……ということになったのだろう。

わかりにくいスマートグラス 軸は「AI機能の拡充」に

ここで、スマートグラスの位置付けを少し解説しておきたい。

メガネ型のデバイスを指す言葉だが、搭載している機能によって価格や特性は分かれる。本来、「Meta Quest」や「Apple Vision Pro」のようなヘッドマウント・ディスプレイとは形状が違うだけだが、手軽さから使われ方や価格、搭載される機能などが異なる。

現状もっとも普及しているのは、Metaの「Ray-Ban Meta」をはじめとしたAIグラスだ。日本では5月21日から販売が始まった。

エシロール・ルックスオティカと連携することで多数のデザインバリエーションがあり、多数の人の好み・利用シーンに合わせた選択ができるのが大きい。Metaが海外で成功しているのも、デザインバリエーションと価格、そしてエシロール・ルックスオティカの幅広い販路に支えられた部分が大きい。

日本で販売された「Blayzer Optics (Gen 2)」を試用目的で借りているが、ノーズパッドが交換式になり、度付きのメガネ代わりを意識したモデルで、けっこう使いやすそうだ。

MetaのRay-Ban Meta・Blayzer Optics (Gen 2)

MetaのAIグラスは、中心となる製品群の場合、ディスプレイがない。コストと開発難易度を考えてのものだろうし、元々この製品が「AIから生まれたものではない」からでもある。

現在のスマートグラスは、オーディオ再生とカメラでの撮影がもっとも実用的な要素だ。AI機能は正直発展途上なので、「カメラや音楽のため」に買うのをお勧めする。

ディスプレイ付きはまだ少ない。Metaは昨年秋に「Meta Ray-Ban Display」を発売したが、生産数に制限もあり、アメリカ以外へはまだ展開されていない。

昨年のGoogle I/Oではディスプレイ内蔵のものが発表され、実は今年の会場でも、デモの中心はディスプレイ付きだった。ディスプレイ付きは開発途上であり、デモに使っているのも「製品版の前の、量産を前提としないプロトタイプ」だ。

文字や画像を表示できた方がAI利用にはプラスだが、ディスプレイの課題は小さくない。Even Realitiesの「Even G2」やRokidの「Rokid AIグラス」は消費電力の低いマイクロLEDを採用しているが、現状緑色しか出せないため、用途は異なってくる。

マイクロOLEDを使ったXREALやVITUREの製品もあるが、こちらは基本的に「ケーブルでPCやスマホに接続して使うディスプレイ」に近い。いわゆるAIグラスとは方向性が異なる。

そんな中、GoogleとXREALは共同で「Project Aura」という製品を開発している。これは、GoogleとサムスンがVision Pro対抗として開発した「Galaxy XR」に近いデバイスで、本体を外付けにし、ディスプレイを透過型にして「メガネサイズで気軽に使えるようにする」ことを目指したものだ。筆者も体験したが、軽量でありながら体験が良い。

XREALの「Project Aura」実機を体験する筆者

一方、AIグラスやインテリジェント・アイウェアのように長時間つけ続けることは想定しないし、かけっぱなしで屋外を歩くことも推奨されない。

Metaはブランドを変えてそれぞれを作り、Googleは同じ「Android XR」ブランドで、それぞれの製品を作る。

重要なのはAIと開発プラットフォームだ。MetaはAIの強化が急務であり、現状かなり大きな課題を抱えていると認識している。Googleはまだ製品を出せておらず、これからスタートラインに立つところだ。中国系メーカーを中心に、別の軸から戦うところもある。

さて、参入が噂される「残る企業」はどうするのだろうか。

どちらにしろ、今後の展開を考えると、エージェンティックAI基盤の強化は必須。Googleとしてもそれがわかっているからこその基盤整備であり、自社の強みを活かすためのスマートグラス開発なのだろう。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、AERA、週刊東洋経済、週刊現代、GetNavi、モノマガジンなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。 近著に、「生成AIの核心」 (NHK出版新書)、「メタバース×ビジネス革命」( SBクリエイティブ)、「デジタルトランスフォーメーションで何が起きるのか」(講談社)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Xは@mnishi41