ニュース

“音”を文字にして生活をサポート。Googleのアクセシビリティ対応

Googleは28日、同社のアクセシビリティに関する取り組みについて説明会を開催。聴覚障害を持つ人のための「音検知通知」や「音声文字変換」の新機能や使い方について紹介した。

“重要な音”への対応をサポート。「音検知通知」

「音検知通知」は、聴覚障害を持つ人や耳栓を着けている場合などでも、火災報知器のアラームや赤ちゃんの鳴き声、インターホンの呼び出しなどに気づけるようにするAndroidの機能。特定のアラームや声などの音を検知すると、スマホやスマートウォッチの振動や、ライトの点滅、メッセージを表示するなどで知らせてくれる。

2020年10月から提供しており、Google Playから「音声文字変換&音検知通知」アプリをダウンロードして利用可能。自動で話し声をテキスト化して表示する「音声文字変換」と連携して動作する。検知できる音は、煙・火災報知器やサイレンなど10種類。

  1. 煙・火災警報
  2. サイレン
  3. 大声
  4. 赤ちゃんの声や音
  5. ドアホンのベルやノック
  6. グラスなどが割れる音
  7. 犬の鳴き声
  8. 家電の音
  9. 水の流れる音
  10. 固定電話の着信音

「重要な音」についてプッシュ通知でユーザーに知らせ、迅速な対応をサポートする。聴覚に障害がある場合、火災報知機の音などが認識できず、避難が遅れる危険性などがある。こうした問題を解消するだけでなく、普段の暮らしを便利にするツールとして使われるよう改善を続けている。

ただし、この「重要な音」の検出はかなり難しいという。音の検出には、自動で話し声をテキスト化する「音声文字変換」と共通の技術を用いるが、火災警報の場合、避難を促すアナウンスを“人の声”と認知してしまい、注意ひくための「警報」という情報を正しく伝えられない。

こうした問題に対し、Googleは数年前から音のデータの収集を開始し、オーディオセットとして2017年に公開。その内容を大学や研究機関と共有し、ボランティアによる作業と機械学習により、注意が必要な「音」を認知し、アナウンスの部分を含めて「警報」と扱うようにした。これにより、世界中の火災報知器などに対応。煙・火災警報などの音を認知・検知し、スマホやスマートウォッチなどに通知できるようになったという。

難聴児が過ごしやすい環境づくりを支援するデフサポの代表取締役 牧野友香子氏は、「音声文字変換」の利用例について説明。聴覚障害のある子どもの支援のため、オンラインでの講座やビデオ通話などでコミュニケーションを取るが、基本的に口の動きを読みながらの対話(読唇術)となる。しかし、ネット環境などによっては、画面が止まり口の動きが読みにくいといった課題があったという。

そこで、2019年ごろから音声文字変換を導入。採用した理由は、変換スピードが早いこと、句読点がしっかりつく、会話の方向性があっていることが多いの3点。これにより、コミュニケーションがスムーズに行なえるようになったとする。

また、コロナ禍ではマスクを着用するため読唇術が使えず、店だけでなく病院などでのコミュニケーションが困難になっているという。そこで音声文字変換で会話をすることで、スムーズにやりとりできるようになった。

また、重度難聴者である牧野氏は、スマートウォッチのおかげで朝起きられるようになった、別の部屋で子どもが泣いていることが「わかる」ようになったなど、技術の進化が生活の充実につながっていると紹介した。

ホーム画面でワンボタンで機能呼び出し「アクションブロック」

もうひとつの機能が「アクションブロック」。認知機能に障害がある人や高齢者がAndroidを使いやすくするためのサービス。

Google Play上で「アクションブロックアプリ」を提供。ユーザーや介護者が、Androidのホーム画面でカスタマイズできるウィジェットを作成し、日々の生活で必要な操作をすぐに呼び出せるよう登録できるもの。

例えば「娘に電話」「猫の動画を見る」といった機能ボタン(ウィジェット)をホーム画面に作り、ワンタップで呼び出せる。登録したタスクは、Google アシスタントが実行する。

認知機能に障害がある、あるいは認知機能が衰え、複雑な操作が困難という人に対して、シンプルな操作手段を提案するもの。例えば、とっさに声がでないときに、ボタンを押すと「私を助けてください」と表現できる。ウィジェットは位置やサイズを選び、画像やテキストなども設定可能。

また、自動字幕機能(ライブキャプション)機能についても紹介。Google ChromeやGoogle Meetの上でもライブキャプション(自動文字起こし)として実現されている。

例えば、Google Meetでの会議中に、話の内容をリアルタイムで文字起こししてくれる。現在は、英語、フランス語、ドイツ語、ポルトガル語、スペイン語に対応しており、特に先行して導入されている英語の精度が高い。今後日本語対応も予定しているが、具体的な時期などは未定。