ニュース

Google Docsは自動要約、Meetsは文字起こし。「OK,Google」は消える?

Google I/Oで発表されたのは「Android」だけではない。検索やセキュリティなどの要素も含まれる。

すべての要素をカバーするのは難しいが、特に興味深いものがAIを活用したGoogle Workspaceの進化や、マップやGoogle アシスタントの機能強化。Google I/O 2022からGoogleのこれからが見えてくる。

自動要約・自動書き起こしでコミュニケーションを円滑に

まずは、GmailやGoogleドキュメントなどが含まれる「Google Workspace」の機能から解説しよう。

今年2月、Googleドキュメントには「自動要約」の機能が搭載されている。狙いは文書の流れをより短い時間で把握することだった。

・Google Workspace の新機能でコラボレーションを推進

その流れを受けて、「Gmail」をフロントとする「スペース」にも「自動要約(サマリー)」が導入される。プロジェクトごとの対話などに「サマリー」が表示され、短時間でコミュニケーションの内容を把握できる。この機能は「数カ月以内」に実装の予定だという。

要約機能のイメージ。「対話のサマリー」がまず表示されるところに注目。

また同時に、Google Meetでの会議に「自動書き起こし」機能が搭載される。これも考え方は同じである。さらに、書き起こされた議事録は「要約」も行なわれる。書き起こしは今年の後半に、要約は2023年に実装の予定だという。

Google Meetでの会議を自動書き起こし。2022年後半に実装される。その後来年には、議事録の要約機能も登場する

Google Meetに「ポートレート復元」「ポートレートライト」

Google Meetの機能として注目されるのが、会議中の不都合を解消するものだ。

ビデオ会議が増えると困るのが「照明」と「マイク」だ。結局卓上にライトやマイクを解体した人も少なくないはず。

Googleは、そこをソフトの力で解決しにきた。「ポートレート復元」機能と「ポートレートライト」機能だ。これは下の画像を見ていただくのが近道だろう。

「ポートレート復元」機能では、逆光で暗い画像を補正し、さらに解像度の低い映像を補完し、画質を上げてみやすくしてくれる。

「ポートレート復元」機能。逆光や解像度の低さなど、ビデオ会議での見づらさを解消する

「ポートレートライト」機能では、ソフトの力で擬似的なライトを作り、自分で照明の位置を変えて、自分の顔を見やすくする。

「ポートレートライト」機能。仮想的なライトを作り、顔をより見やすくしてくれる

また、マイクからの音に残る残響音を減らし、スタジオで収録した音に近い、より聴きやすいものに変える機能も搭載される。

公開時期は明らかにされていないが、多くの人にとって魅力的なものなのは間違いない。

Googleマップの「ライブビュー」がアプリ開発者に公開へ

Googleマップについては、特にARを活用した機能の搭載が目立つ。

以前よりGoogleは「地図の3D化」「空間化」を進めていた。2022年後半には、「Immersive View」と呼ばれる3D地図が、ロサンゼルス・ロンドン・ニューヨーク・サンフランシスコ・東京で使えるようになる。

ARを使った「ライブビュー」機能は、実際の風景から向かう方向を教えてくれるので、「歩き出すとき」の間違いが減るものだ。すでにGoogleマップに搭載されており、屋内・屋外で利用可能だが、今後はさらに可能性が広がる。ライブビューを使うための「ARCore Geospatial API」が開発者に公開され、アプリなどに組み込めるようになるからだ。

例えば、ドイツ・メルボルンのマーベルスタジアムでは、TelstraとAccentureが共同で、「バーコードから座席や売店を見つける」機能を開発した。

スタジアムの中で座席や売店の位置を、バーコードを手がかりに「ライブビュー」で教えてくれる

電動キックボードサービスを提供している「Lime」は、ロンドン・パリ・テルアビブ・マドリッド・サンディエゴ・ボルドーで、キックボードや電動自転車のレンタルアプリにライブビューを試験的に組み込んだという。

Limeは電動キックボードや電動自転車の貸し出しアプリに、一部都市で「ライブビュー」を試験的に組み込む

またNTTドコモはcuriosity社と共同で、ARを使って実景の中でドラゴンを倒すゲームを開発中だ。

NTTドコモとcuriosityが開発中のARゲーム

地図データを多く持つGoogleがこうした機能を提供してきたことは、ARアプリの増加に大きな影響を与えるだろうし、同様のプラットフォームを開発しているライバルにも刺激となるだろう。

Googleアシスタントから「ねえGoogle」がなくなる?

検索技術の中でも、多くの人に影響があって特に気になるのは、音声アシスタントである「Google アシスタント」の変化だ。

Google アシスタントといえば「ねえGoogle(OK,Google)」から始まるもの。もしくは、画面をタッチして操作……というのもめんどくさい。

というわけで、ここに大きな改善が加えられた。

1つ目は「クイックフレーズ」。

「電気をつけて」「10分タイマーをセットして」といった、日常よくある命令については、「ねえGoogle」なしでも認識するようになった。

「クイックフレーズ」。よくある命令は、自分の声であると認識した上で反応するようになった。利用には「Nest Hub Max」が必要

2つ目は「Look and Talk」。スマートディスプレイである「Nest Hub Max」で画面を見ながら話すことで、「ねえGoogle」なしで検索や機能の利用が可能になる。

Nest Hub Maxを見ながら話すことで「ねえGoogle」なしで検索や機能の利用が可能になる

秘密は「Nest Hub Max」を使っているという点にある。だから現状、すべてのデバイスで利用可能なわけではない。

Nest Hub Maxには、声や顔から「あなた」を見分ける機能である「Voice Match」や「Face Match」がある。これを使い、確実に持ち主が話していると認識した上で「ねえGoogle」をスキップするわけだ。また、この機能の実装は、まずは英語からとなる。

もう一つ面白いのは「言い淀み」への対応だ。

話しながら「えーっと」などといってしまうことは多いし、途中でアーティスト名などの固有名詞が出てこないこともある。人間との対話ならそうした部分もカバーできるが、音声アシスタントには難しかった。だから「正確に命令しよう」として使いづらくなっていた部分がある。

途中で言い淀んで「んーっと」という感じになっても、Googleアシスタントがちゃんと待って、意味を汲み取ってくれるようになる

今回新たに言語モデルや音声モデルを構築し、「相手がまだ話を終えていない」と理解して反応するようになったことで、「言い淀みに強い音声アシスタント」が実現できているという。