西田宗千佳のイマトミライ

第341回

「操作する」から「任せる」へ Gemini Intelligenceが狙うコンピューティング改革

Android Show I/O Editionで詳細を公開

5月12日(アメリカ時間)、Googleは、Androidの最新情報を発表するオンラインイベント「Android Show I/O Edition」を開催し、次期バージョンであるAndroid 17を軸にした進化を解説した。

ここ数年、スマートフォン向けOSは「いかにAIの機能を取り入れるのか」という点を軸に進化してきた。今回もその方針は変わらない。Googleは「Gemini Intelligence」をキーワードにする。よりスマホ自体が「利用者からの依頼に対して自律的に動作し、目的を達成する」というアプローチだ。

そして、Gemini Intelligence世代のPCとして新たに登場するのが「Googlebook」である。

また、本記事が掲載されてすぐ、Googleの年次開発者会議「Google I/O 2026」が開催される。筆者も取材するために渡米している。Google I/Oで発表されるものとどうつながってくるのか? ここも気になるところだ。

これらの機器とOSで、Googleはなにを狙っているのだろうか? 今回はその点を考えてみたい。

「スマホのAIに作業を任せる」Gemini Intelligence

まずは、今回の発表における主軸である「Gemini Intelligence」とはなにか、というところから始めよう。

これは「Geminiが3.1から3.5になる」というような話とは少し違う。内部でバージョン番号が変わったりしているのかもしれないが、そういう話はさほど重要ではない。

重要なのは、AndroidとGeminiの関係が変わってきたという点だ。

Android 16(現行バージョン)でも、AIの機能は複数ある。ただその位置付けは「スマホの中のチャットボット」であり、「電話や写真などの機能を便利にするもの」というイメージだった。個々の機能としてスマホの中にAIが入ってはいたが、OSの背骨になるような要素だったか、というと「まだ」そうではなかった。

だが今回、Gemini Intelligenceとして搭載される機能は考え方が異なる。簡単にいえば、スマホから生み出される価値を「AIに仕事を任せることによって得る」アプローチが本格的に始まる、ということだ。

Gemini Intelligenceを搭載したAndroid 17の動作イメージ

これは、いまやAIの記事を開くと必ず出て来るようになった「AIエージェント」そのものだ。

もう少し正確に説明しよう。

Gemini Intelligenceは、AIが人間の指示を理解して要素を分解、様々なAIに仕事を割り振って、結果として目的を達成する仕組みだ。こうした構造のことを「エージェンティックAI」という。そして、エージェンティックAIの中でそれぞれの作業を担当するのが「AIエージェント」だ。

日本だとこれらの概念をまとめて「AIエージェント」と呼んでしまいがちだが、一応違いは理解しておきたい。

エージェンティックAIが「人間から作業を任せてもらう存在」になるには、人間がやりたいことをAIが代わりに行なうための仕組み、具体的に言えば、アプリやウェブを人間が操作するのではなく、AIが代わりに操作する仕組みが必要になる。

こういう要素をスマホなど、Androidで動作するデバイスの中に組み込んでいくのが「Gemini Intelligence」だ。GeminiがウェブブラウザーであるChromeを操作して人間の代わりに予約や買い物をしたり、アプリから食品の発注や旅行の予約やチケットの購入をするなど、複雑な操作が必要になるものを「AIに任せられる」世界を目指す。

Gemini Intelligenceがアプリなどを自分で操作し、買い物や予約も行なう
スマホ版ChromeをGeminiが操作できるようになる

エージェンティックAIという仕組みそのものは、PCなどではすでに広がっている。それをスマホを中心とした、より幅広いデバイスに搭載していくわけだ。

Gemini Intelligenceの機能一覧

ウィジェットをAIが「作ってくれる」

もう1つ、Gemini Intelligenceの機能として注目されるのが「My Widget」だ。

これは簡単に言えば、スマホの上で使うウィジェットを、Geminiに作ってもらう機能である。

Gemini Intelligenceで作られたオリジナルのウィジェット群

AIと相談しながらソフトを作る、という行為自体は特に珍しいものでもない。ウィジェットは規模も小さく、AIで作ってもらうには良い題材だ。実際、英Nothingは「Essential Apps」の機能として、テキストからウィジェットを生成する「Playground」という機能を公開している。

スマホメーカーの英Nothingは、AIでウィジェットを作るという機能でGoogleに先行している

ソフトを作るという意味でも、ウィジェットを作るという意味でも、Gemini Intelligenceは強い新規性を持っているわけではない。

まずは今夏、GoogleのPixelとサムスンのGalaxyに搭載されることが決定しているが、その後はより幅広いAndroid搭載製品への搭載が進む予定だ。ウィジェットの自作があたりまえの存在になるわけで、インパクトはかなり大きい。

マウスカーソルまでインテリジェント化する「Googlebook」

そして、これらの機能を備え、「Gemini Intelligence前提」で作られたプラットフォームとなるのが「Googlebook」だ。

Googlebookの公式ページ。製品の詳細は秋に公開される

これはシンプルに言えば、OSとしてAndroid 17を使ったノートPCだ。GoogleにはノートPC的なプラットフォームとして「Chromebook」もあるが、あちらは学生市場をターゲットに低価格製品向け、という側面がある。それに対して、よりメインストリームのPCに近いゾーンを狙うのがGooglebookである。

GoogleでAndroidエコシステム担当プレジデントであるサマール・サミット氏は、発表後にXでの質問に答える形で、GooglebookとChromebookの違いを次のように述べている。

Androidエコシステム担当プレジデントであるサマール・サミット氏

三つの大きなポイント:

(1) 新しい技術スタック:Androidの基盤(Androidアプリをネイティブで実行;ARMシリコン+x86をサポート)で、それゆえにあなたのスマホとの優れた相互運用性も。
(2) プレミアムハードウェア:ハイエンドラップトップに期待されるもの。
(3) Geminiがユーザーエクスペリエンスに役立つ形で統合された新しい体験。

ChromeOS/Chromebookについて:教育分野(米国学校の60%以上が使用)などで驚くほど人気があり、そこでは引き続き進化させていきます!

すなわち、価格を抑えた製品ではなく一般的なノートPCと同等以上の性能を備えた「プレミアムラインのノートPC」として使える性能・機能を持ったものをGooglebookとする、ということのようだ。

ハードウェアの詳細は不明ながら、Google自身に加えてHP・Dell・Lenovo・Acer・ASUSというPC大手5社がそろって、今秋に製品を発売する。

HP・Dell・Lenovo・Acer・ASUSというPC大手5社がそろって参入

PCとの違いは「Androidアプリを使う」こと、そして「Androidスマホとの深い連携がある」ことだ。例えばMacからは、iPhoneを取り出すことなくテザリングを開始できるが、それと同じようなことがGooglebookとAndroidスマホの間で可能になる。

とはいえ、この辺はさほど意外な話でもない。すでにChromebookで実現されているからだ。

やはり重要になるのはGemini Intelligenceが搭載されているという点だ。エージェンティックAI的な動作はもちろん、My Widgetを生成してカスタマイズする要素も使える。

Googlebookの概要一覧

その上で、Googlebook独自の特徴として搭載されるのが「Magic Pointer」だ。

この技術は、「日々我々はマウスカーソルを動かしすぎている」という疑問から生まれたものだ。マウスカーソルを画面の上で少し「振る」ように動かすと、今なにをすべきなのか、どんな情報を扱うべきかをシステムが把握し、「そのマウスカーソルの位置でふさわしい機能」を提示する。

例えばスケジュールに関するメールの本文上でMagic Pointerを動かした場合、その内容を把握した上で、「スケジュールを確認する」「返答するメールを代筆する」「待ち合わせスポットを提案する」などの項目が表示される。

Magic Pointer動作中の画面

GeminiをエージェンティックAIとして使う場合、スマホでは命令を文章か音声で送る必要がある。

しかしGooglebookの場合にはMagic Pointerが長文プロンプトの入力を代替し、作業を進められるようになる。

この技術はGoogleのAI研究部門であるDeepMindの研究をもとに作られた機能。マルチモーダルAIの持つ「画像の中になにが含まれるのか」を把握する機能と、AIエージェントによる命令執行能力を組み合わせたものと考えればよい。

Reimagining a 50-year-old interface (the mouse pointer) with AI

Reimagining the mouse pointer for the AI era

課題は「作業を任せられる」かどうか

これらの共通項からお分かりのように、Gemini Intelligenceとは、「利用者が個々のアプリを使い、画面をクリックしたりタップしたりして目的を果たす」というやり方から、「AIと対話しつつ、作業の大半をAIに任せて結果だけを得る」仕組みである、と言っていい。

実現すれば素晴らしいことだが、逆に言えば、課題もシンプルである。

それは「AIに安心して任せられるのか」という点だ。

ここで指摘したいのは「AIに任せると危険」ということではない。その点は、ファイル操作や決済の最終段階などでは「人間の判断」を求めるのは当然のことで、単純な危険の多くはその過程で技術的に対応可能だ。

むしろ問題なのは、「AIのできる作業とできない作業がある」ことであり、「AIにできない作業が多すぎるので、安心して仕事を任せられない」可能性があることだ。

AIからのアプリ連動にはアプリ側の対応が必須になるし、AIがスマホ内のChromeを操作する作業も、動作の遅さが気になる場合も出てきそうだ。

Android 17の公開初日からなんでもできる、という形にはならないだろうが、早期に、例えば半年くらいで「日常的な多くの作業は任せられる」形になっていくことが望ましい。

同じく「任せられるのか」という点については「Intelligent Autofill」という要素がある。

従来はIDとパスワードを「自動入力」してくれていたし、一部のクレジットカード情報も自動入力可能だった。今回からは、パスポートや運転免許など、より複雑な入力を求めてくる要素にも対応する。

パスポートや運転免許などの複雑な情報も自動入力できるようにする「Intelligent Autofill」

「スマホに重要な情報を預けるのは大丈夫なのか」と感じる人もいそうだ。しかし、実際の使用状況としては、すでに「パスポートの写真をスマホの中に保存している人もいる」のが実情だから、預けること自体は現状追認でもある。

むしろ、Intelligent Autofillが確実に動作しないと、次の段階へ進むのは難しいだろう。

こうした部分を含め「こういう機能がある」という段階を越えて「日常の中で確実に使える」といえる時期を早期に実現するのが、Googleに課せられた最大の課題といえる。

別の言い方をすれば、「AIを信頼し、作業や情報を任せられる」だけの自信がGoogleにあるのかどうか。

その点は、今週開催の「Google I/O」で発表されるAIの進化が支えることになるのかもしれない。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、AERA、週刊東洋経済、週刊現代、GetNavi、モノマガジンなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。 近著に、「生成AIの核心」 (NHK出版新書)、「メタバース×ビジネス革命」( SBクリエイティブ)、「デジタルトランスフォーメーションで何が起きるのか」(講談社)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Xは@mnishi41