西田宗千佳のイマトミライ

第200回

「Apple Vision Pro」へ至る空間コンピューティングの歴史

Vision Pro。米アップル本社で撮影した実機だ

先週は米・クパティーノにあるアップル本社に出張し、開発者会議「WWDC 2023」の取材をしてきた。

iOSやiPadOS、macOSなどについての発表もあったが、その詳細はまた後日としたい。今回の目玉はなんといっても「Apple Vision Pro」だ。

筆者も実機を体験することができた。実機を体験できたのは、日本でも現状、10名を超えることはないだろう。非常に貴重な経験だったと思う。

まさに「衝撃」としか言いようがなかった。これまで多数のヘッドマウント・ディスプレイ(HMD)やスマートグラスを取材してきた。研究段階のものや、高価な業務用のものも含め、最先端の体験は把握しているという自負がある。

だがそれでも、Vision Proが実現した世界は、どれとも違う、すばらしい体験だった。

しかし一方で「まったく新しい」ものか、というとそうではない。

過去に作られた幾多のデバイスが試みてきた世界を、より洗練したものとして目の前に提示した、というべきではないかと思う。

これからVision Proが生み出す世界は、いろいろ想像することができる。だがその前に、過去にどのような試みがあり、現在につながっているのかを考えてみたい。

特に紹介したいのが、マイクロソフトの「HoloLens」と、Metaの「Meta Quest Pro」だ。

これらの機器がなにを目指し、そしてその先でVision Proがどんな世界を実現しようとしているのか。そして、結果的に同じ市場で戦うことになったアップルとMetaはどうなっていくのかを考えてみよう。

「空間コンピュータ」という視覚のハック

Vision Proは自らのジャンルを「空間コンピュータ」と規定している。言葉自体は耳慣れないかもしれないが、発想自体は新しいものではない。

Vision Pro

我々が使うコンピュータのほとんどには「ディスプレイ」がある。人間との接点としては視覚情報を使うのが効率的だからだ。

ただ、世の中にあるディスプレイは、ほとんどが「平面に情報を映し出すもの」だ。その点は、スマホであろうがPCであろうが、映画館のスクリーンだろうが変わらない。3Dで表示するものもあるが、本当に空間に立体を再現しているものはほとんどなく、平面のディスプレイを活かしつつ、なんらかの方法で「見ている人の左右の目に別の映像を届ける」ことによって立体感を生み出している。

別な言い方をすれば、我々は大半の時間を「実世界の中に置かれたディスプレイを見る」形で過ごしていることになる。Vision Proっぽくいうなら「空間の一部だけコンピュータ」だ。

だが、いわゆるヘッドマウント・ディスプレイ(HMD)を使うと状況は変わる。

HMDは視界をディスプレイで覆うことで、視界全体を現実とは別の「描かれた映像」に置き換える。その結果として我々は、HMDの中に描かれた空間を「もう一つの現実」と感じられるような体験ができる。これがいわゆる「バーチャルリアリティ(VR)」だ。

本来のVRは、別に視界の入れ替えだけに関するものではない。音や触覚、味覚など、人間のあらゆる感覚の置き換えが対象となるが、人間が視覚を重視した動物なので映像が重視されている。

視界を置き換えて「ハック」すればどこにでも行ける。VRがゲームに向いているのはそのためだ。

ただ、どんな世界にも置き換えられるなら「日常」に置き換えてもいいはず。目の前の世界を自由に入れ替えられるなら、「好きなサイズのディスプレイを、好きな場所に置く」こともできる。

というわけで、VR空間内にホームシアターを作ったり、作業用に多数のディスプレイを配置したりするのは、かなり一般的なことではある。

ただしもちろん、空間をディスプレイとして活かすコンピュータとして考えるなら、どこにどう、なにを出すかが重要になってくる。

そのためには、現実との接点も重要だ。

Vision Proでは映像の中にウインドウや3Dオブジェクトを重ね、「現実の中にアプリが浮いている」世界を実現している。

基調講演動画より。Vision Proでは空間にアプリが浮いている様子がそのまま再現される

この種の技術は「Mixed Reality(複合現実)」「Augmented Reality(拡張現実」と言われてきたが、VR(仮想現実)との違いは本質的には、仮想と現実の境目をどこに置くか、という話に過ぎない。

ただ多くの人にとって、「全く未知の世界にアプリが浮かぶ」こと以上に、「見慣れた世界にアプリが浮かぶ」ことの方がインパクトは大きいかもしれない。これぞまさに視覚のハック、という印象をうけるからだ。

Vision Proの場合、デジタルクラウンを回すことで、日常の風景から未知の世界へと移れるようにもなっている。こういう仕掛けのうまさは、実にアップルらしい。

上は背景が普通の部屋だが、下では夜の森に変わっている。日常から仮想の風景への切り替えは、マジッククラウンで「連続的」に行なえる

7年前に存在した先駆者「HoloLens」

現実世界にCGを重ねるARもしくはMRという概念は、VR的な技術を研究する中では自然と存在したものだ。今も、大手メーカーからスタートアップまで、複数の企業が「AR機器」「MRデバイス」の開発に力を注いでいる。

ただ、それを明確に実現し、製品として提示したものとして、まずはマイクロソフトの「HoloLens」を挙げるべきかと思う。

マイクロソフトの「HoloLens」。日本での発売は2017年2月

以下の動画をご覧いただきたい。これは、HoloLensを使っている様子を、実際に筆者が撮影したものだ。現実空間にウインドウやオブジェクトが並び、同居している。

空間にウインドウを多数配置。中央にあるMacBook Pro以外の画面は全てHoloLensによる画像だ
HoloLens用デモアプリ「Holoflight」。机の上で飛行機の離着陸の様子が箱庭のように表示される

HoloLensが発表されたのは2016年3月。アメリカで発売されたのがその年の秋のことで、日本では2017年2月には手に入るようになっていた。ただし、開発者向けで、個人向けではなかった。アメリカでの価格は3,000ドル。日本では338,000円で売られた。

詳細は以下の記事をご覧いただきたい。

Vision Proと違い、HoloLensは「光学シースルー式」だ。Vision Proはカメラで撮影した現実の映像にCGを重ねて視界をハックするが、HoloLensは半透明なディスプレイを使い、肉眼に見える風景の中にCGを重ねる。そのため、必要とする性能は低くなり、遅延も少なく、危険性も低い。

7年前に発表された製品だが、HoloLensは今見てもその技術力に驚かされる。あの当時から、ウインドウや3Dオブジェクトを「現実の中」にピッタリと配置できた。周囲の立体構造をちゃんと把握しており、机の高さや凹凸なども勘案してCGを重ねる。

例えば、1つの部屋の机にCGを置いたとしよう。かぶったまま隣の部屋に行って別のことをして戻ってきても、机の上の同じ場所にはCGの物体が同じように置かれている。場所にずれもない。

現実世界をデータ化した上で、その中での位置を正確に把握し、CGを重ねて活用する。これはまさにMRそのものだ。Vision Proがやっていることを7年前に実現していた、ということは頭に入れておいてほしい。

ただ、前傾の動画は「実際にHoloLensから外界を見た時の見え方」とは異なる。HoloLensの使っているディスプレイの画角(FoV)は狭く、視野の中央34度しかない。現実に小さな覗き穴ができて、その中だけがMRになっている。

だから、ビデオに比べると映像は相当に違和感がある。「PVや広報画像通りではない」と非難する人もいるくらいだ。

ただ、当時のディスプレイ技術では、光学シースルー式で視野全体を覆うディスプレイを作るのは難しかった。今でも「光学式」という条件だと、難しいことに変わりはない。

初代の開発向けで34万円弱と高価でもあった。2019年に視野を広げた「HoloLens 2」が出るものの、あくまで産業用であることに変わりはなく、広く一般に売るモデルが世の中に登場することはなかった。マイクロソフトは今もHoloLens 2を業務用に販売しているが、コンシューマ向けにはMetaなど、他社と連携する道を模索しているように見える。

カラーシースルーを実現した「Quest Pro」

Mixed Reality路線で次に大きな変化が生まれたのは、つい先日、2022年のことだ。Metaが「Meta Quest Pro」を発売したのである。

Meta Quest Pro

MetaはVR用HMDである「Meta Quest」シリーズについて、発売後も積極的にソフトウェア・アップデートを行なっている。Meta Quest 2には、位置把握などを行なう「インサイド・アウト」技術のために、モノクロのカメラが4つついている。これはあくまで「センサー」であって、外界を撮影するためのカメラではない。だが、ソフト側で組み合わせることで、「モノクロ・ビデオシースルー」で外界を見る機能が追加されていた。これは、周囲の安全を確保するにはプラスの機能だった。

そこから発展し、次世代の用途を考えて開発されたのが「Meta Quest Pro」だ。発売は2022年10月。狙いはゲームだけではなく、PCのように「仮想空間を使って仕事をする」「仮想空間でコミュニケーションする」といった用途を指向していた。

そのため、Quest Proには「カラー・ビデオシースルー」が搭載された。周囲の映像をカラーのビデオ画像として捉えつつ、その上にウインドウを重ねることができる。以下の動画もご参照いただきたい。

Quest Proでのシースルーの様子をレンズ越しに接写。このように、風景の上にウインドウが重なっている
Meta Quest Proでシースルー対応のパズルゲーム「キュービズム」

ビデオシースルー、という意味ではVision Proに似ているが、Quest Proは技術的にそこまで大きなジャンプをしているわけではない。

画質はそんなに良くない。限られたハードウェア資源の中でカラーとモノクロの画像を素早く扱うため、「解像度を落としたモノクロの映像の上にカラーのフィルターをかけた」感じの映像になっていて、さほど自然な表現ではない。

また、シースルーの機能はUI上の一部で使われているだけ。あとは、アプリの中で活用するものになっている。Vision Proのように、ビデオシースルーが基本機能になり、あらゆる場面で自然に活用されているわけではない。

ただ、単純なビデオシースルーと違い、つけたまま見ている映像でも、立体感などに違和感が出にくいよう工夫されている。

そういう意味では、Quest Proも「つけたまま日常的な作業をこなす」という世界へ足を踏み入れつつあったのは間違いない。

コストと機能と市場のジレンマの中で

実のところ、Metaは研究として多数のHMDを試作している。昨年6月には、その試みの一部を公開してもいる。

昨年6月、Metaは多数の試作HMDを公開している

その中には、映像の見え方をより現実に近い解像感に近づけた「Buttorscotch」、HDR表現にこだわって日中の太陽の煌めきを再現した「Starburst」、映像内の見たい場所にピントを合わせられる「Half Dome」などがある。

Metaが試作した解像感重視HMD「Buttorscotch」のデモ。中央がQuest 2(視力では0.3相当)、右がButtorscotch(視力1.0相当の能力)での画像

これらの一部を組み合わせれば、ハードウェア的にはVision Proに近づき、追い越す可能性はある。

では、なぜMetaはそこまでやらなかったのか?

今年4月、MetaのCTOであるアンドリュー・ボスワース氏へのインタビューをお届けしているが、その中で「理想的なAR機器はいつ登場するのか」という問いに対し、彼はこう話している。

Boz:コスト的な理由から発売はできないかもしれませんが、非常に優れた内部プロトタイプに取り組んでいて、その完成度に私たちは興奮しています。

私たちにとって重要なのは、開発した技術を、消費者にとって納得のいく経済性との間を、どのように結びつけるかということです。

ですから、初期バージョンが市場に出回るようになるまでには、まだ何年もかかると思います。

とはいえ、10年以内には十分普及している。10年経てば「驚くほど進歩した場所まで到達している」ことに気づくはずです。

彼らもVision Proがやったようなやり方に気付いてはいるが、アップルほど思い切った価格設定で「最高のもの」をいきなり提示する判断はしなかった、ということなのだろう。

結果としてMetaは、今年の秋に「Meta Quest 3」を発売することになる。ビデオシースルーの画質はQuest Proより改善しているが、あくまでゲームを軸としたデバイスであり、価格は499ドル。「空間コンピュータ」的用途では、Vision Proほど飛び抜けた体験にはなっていないだろう。

6月9日にLex Fridman氏がYouTubeにアップしたロングインタビューの中で、マーク・ザッカーバーグCEOは次のように語っている。

Mark Zuckerberg: Future of AI at Meta, Facebook, Instagram, and WhatsApp | Lex Fridman Podcast #383

ザッカーバーグ:私たちは、多くの人々にこの技術をすべての人に届けたい。エリートや富裕層だけを対象にするのではなく、誰もが手にできるようにしたいんです。

私たちは非常に難しい技術的な問題を抱えています。私たちは無制限にハードウェアを使えるわけではないんです。Quest Proは当初1,500ドルでした。そして今回、価格を1,000ドルに引き下げました。

しかしQuest 3は、Mixed Realityについて、Quest Proで提供しているものより高度で、優れています。

すなわち、アップルが高価な製品を出すかたわらで低価格な製品を出すことで、「手に取ることができるMixed Reality」として差別化しようとしているわけだ。

高価な製品を出すことは明らかにリスクであり、Metaはコンシューマ向けとして、「もっとできることはわかっているが、高価な製品にはしない」選択を採るわけだ。

これは、アップルとは全く違ったやり方と言える。

アップルはOSからUI、ハードウェアまで「アクセル全開」でVision Proを作った。そうしないと「本当に価値ある体験を作れない」と思ったからだろう。

一方でMetaは「手に取れる」ことを重視する。

企業の方針・選択の違いと言っていいだろう。

どちらにしろ、技術は魔法ではない。先端を突き詰めればコストがかかり、コストで妥協すればできないことが増える。

HoloLensはある意味、Vision Proに似ている。先端を突き詰めていたが、タイミングと技術選択の問題で、7年前に「3,000ドルの高級デバイス」を作りつつも、コンシューマにも使える空間コンピュータとすることはできなかった。

Metaは普及を目指すためにコストを下げ、ゲーム的な体験に特化したが、それゆえに、空間コンピュータとしての可能性は追求しきれていない。

では、アップルの選択はどう受け入れられるのだろうか?

製品のクオリティ、体験の質がこれまでにないレベルであることは、体験した筆者が保証する。しかし、それを消費者がどう判断するかは、ここからの「アプリ開発」などにかかっている。

西田 宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
 近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本 本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」(KADOKAWA)などがある。
 メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41