レビュー
iPhoneの「Apple Intelligence」って実際なにができる? AIが“標準”になる価値
2025年3月19日 08:20
AppleのAIシステム「Apple Intelligence」が2025年4月初旬から正式に日本語対応となります。この原稿を執筆している3月半ば時点では、iPhoneの場合は、iOS 18.4の開発者向けベータ版(Developer Beta)をインストールすることで、日本語対応のApple Intelligenceが利用可能です。
スマホではAndroid(Google Gemini)が先行してOSにAIサービスを組み込んでいますが、iPhoneに本格的にAI機能が統合されることとなります。Apple Intelligenceは果たしてどのようなものになっているのでしょうか。ベータ版を利用してGeminiとの違いをチェックしてみました。ベータ版については許可を得たうえで記事化しています。
Apple Intelligenceとは?
Apple Intelligenceは、iPhone、iPad、MacのOSに組み込まれる、Appleいわく「パーソナルインテリジェンスシステム」です。同様にAIを活用したツールとして音声アシスタントのSiriもありますが、Siriはこれまで通り継続しつつ、Apple Intelligenceは日常的な作業をサポートする機能として、音声認識に留まらないより幅広い範囲で活用できます。
対応するのはiPhone 16シリーズ、iPhone 15 Pro、iPhone 15 Pro Max、iPad mini(A17 Pro搭載機種)、M1チップ以降を搭載したiPadおよびMacと、比較的新しい機種です。すでに米国(などの英語環境)では利用できましたが、2025年4月初旬に正式リリースされる予定のiOS 18.4より日本語環境でも利用可能となります。
Apple Intelligenceの機能は、アプリ内に設けられているメニューやボタンなどから利用できます。もしくは、Siriを立ち上げてApple Intelligenceの能力が必要になるアクションを要求することで呼び出すこともできます。
一方、GoogleのAIアシスタントであるGeminiは、AndroidスマホやGoogleのWebサービス上で利用できるシステムです。Androidや各種Googleサービスへの統合が進んでいるほか、Google Pixelシリーズのスマホだと「消しゴムマジック」やレコーダーアプリでの文字起こしなど、より進んだ機能を活用できるようにもなっています。
Apple IntelligenceとGoogle Geminiは、機能としては似た位置付けにあります。が、それぞれに違いや特徴となるところがあるようです。発売されて間もないiPhone 16eをお借りできたので、それとGoogle Pixel 8 Proの2台で、できることの違いを確かめてみることにしましょう。
多くのアプリで“標準機能”として使える「作文ツール」
Apple Intelligenceのなかでも最初に注目したいのが「作文ツール」です。簡単に言えば、既存のテキストの修正や要約などが可能なもの。生成AIらしいよくある機能とも言えますが、OSに統合されていることから、iOS標準のUIコンポーネントを利用しているアプリならどれでも使える、という点が大きなポイントです。
メモやPagesのようなApple純正アプリはもちろんのこと、Gmailのようなサードパーティアプリでも、テキスト入力エリアの長押しなどから「作文ツール」が呼び出せます。既存のテキストを選択後、それに対してどういう処理をしたいのかテキスト入力(または音声入力)して指示できるほか、要約・校正・書き直しを指示する専用ボタンをタップする方法もあります。
ユーザーの指示によって生成されたテキストは自動で、もしくはボタン操作で元のアプリのテキスト入力エリアに直接差し込めますし、クリップボードにコピーして他のアプリに流用するのもOKです。
また、1から文章を生成することも可能です。ここは正確にはApple Intelligenceではなく、OpenAIのChatGPTとの連携によって実現しています。ただ、これもシームレスに統合されていて、Apple Intelligenceの標準機能の延長として違和感なく使えます。
ちなみにChatGPT連携はChatGPTのユーザー登録なしに無料で使えます。使用回数については明確になっていないものの、高速な応答が得られる「1日当たりの上限」が設定されているようです。ChatGPT Plusなどの有料アカウントを所有しているなら、それを使ってサインインしておくと上限をあまり気にせず活用できるでしょう。
対してGeminiは、1からのテキスト生成も含め全てGemini自体の機能でカバーしています。ただし、「どのアプリでも使える」というレベルの統合にはまだ至っていません。基本的にはGoogleのアプリやサービス上での利用が前提となり、他のアプリでGeminiを利用できるかどうかはサードパーティの実装次第です。それを除けば、Apple IntelligenceとGmailとでテキスト生成周りの機能面の違いはあまりない印象です。
「ボイスメモ」でリアルタイム文字起こし
これまで音声を録音する機能しかなかったApple純正の「ボイスメモ」アプリには、Apple Intelligenceによる文字起こし機能が追加されました。もちろん日本語音声にも対応し、録音しながらリアルタイムで文字起こしされたものを目で追っていくことが可能です。
新たに録音する時だけでなく、過去に収録した音声データについても文字起こしできるようになっています。試してみたところ、1時間余りの音声データもわずか数分で文字起こしが完了しました。文字起こし後のテキストは選択して「作文ツール」を立ち上げれば、要約もすぐにできてしまいます。
テキスト全体をクリップボードにコピーしたり、共有機能でテキストデータや音声データで出力したりして、他のアプリで再利用するのもOK。長時間に及ぶ会議もこれで録音しておけば、いちいち最初から聞き直すことなく論点を把握できるでしょう。ただし、録音中に認識できるのは単一言語で、言語設定の途中変更はできません。
Geminiにおいては、同様のリアルタイム文字起こし機能がPixelスマホの「レコーダー」アプリで提供されています。Apple Intelligenceとの大きな違いは、やはり録音中に言語変更ができること。手動切り替えになるものの、外国語話者と日本語話者が混在するような場面ではGemini(Pixelスマホ)の方が有利です。他にも自動でクラウドにバックアップしてパソコン用のWebサイトでも文字起こしデータを参照できるなど、機能の充実度はPixelスマホに軍配が上がります。
気軽に、楽しく画像生成できる「Image Playground」
Apple Intelligenceは画像生成も可能です。「作文ツール」とは違ってアプリが個別に実装する必要があることから、今のところはAppleが提供する「Image Playground」というアプリを通じて利用する形となりますが、それでもいろいろと面白い使い方ができます。
Image Playgroundは、作りたい画像をテキストで指示する一般的なAI画像生成ツールと同じ使い方ができるほか、そこに既存の画像やアイコンタグ(キーワード)を追加して画像の見栄えなどをある程度コントロールすることもできます。
たとえば「レーサー」という既存のアイコンタグと、自撮り画像を選択すれば、それらを合成しているような演出の後、レーサーの格好をした自画像が完成します。そこに後付けで「サングラス」のタグを追加すると、サングラスをかけたレーサーの自分のイメージが簡単にできあがる、という寸法。
凝ったプロンプトを組み立てることなく、アイコンを選択して見栄えを決めていくお手軽でポップな操作感のUIは、いい意味でスマホ黎明期の画像デコレーションアプリのような趣もあります。Keynoteで作成しているプレゼン資料に差し込む画像素材も、資料内のワードをピックアップして生成すれば、それっぽい雰囲気で資料を完成させられるでしょう。
一方のGeminiも画像生成にはもちろん対応しており、プロンプトで指示することで自由度高く画像生成できます。ただし、Apple Intelligenceのように「何らかの画像を参考に生成する」ということはできません。UIもオーソドックスなチャット形式なので、Apple IntelligenceのImage Playgroundの後だとつまらなく感じてしまいます。
被写体の余計なものを消去 「クリーンアップ」ツール
Apple純正の「写真」アプリでは、画像内の余計なものを消去できる「クリーンアップ」ツールが使えるようになりました。これは、Pixelスマホで言うところの「消しゴムマジック」と似たようなものです。消去したいものを囲むようにしてなぞることで、消すべきものを自動で判定し、背景を補完して自然な見た目に仕上げます。
家族や友人らとの集合写真に無関係な人が入り込んでいたり、風景写真に邪魔な障害物があるようなときに、元からなかったように見せることができるので、役立つシーンは多いことと思います。
ただ、画像編集で使えるApple Intelligenceの機能は今のところこのクリーンアップツールのみ。Geminiでは「消しゴムマジック」以外にも、それを拡張したような「編集マジック」や「ズーム画質向上」、「ポートレートのぼかし」といったAI編集機能を実現しています。このあたりはまだApple Intelligenceの進化の余地はありそうです。
完成度は高い 今後の機能拡充にも大いに期待
Apple Intelligenceが備える4つの代表的な機能をもとに、Gemini(Pixelスマホ)と比較してできることの違いを見てきました。それぞれに一長一短あるとはいえ、Apple Intelligenceの全体的な完成度はかなり高いと感じられます。アプリによらず利用可能な作文ツールは強力で、画像生成はこれまでにない楽しさがあります。
ただ、反対にGemini(に関連するAI機能)にはあって、Apple Intelligence(Siri)にはない機能もいくつか見受けられます。たとえば、AIアシスタントとの自然なリアルタイム会話や、画面上の気になる箇所を丸で囲むだけでWeb上の画像を検索できる「かこって検索」が挙げられるでしょう。
再生中のメディア音声をリアルタイムに文字起こしして表示する「ライブキャプション」機能も、Pixelスマホなどでは利用できますが、Apple Intelligenceにおいては日本語環境だと未対応(英語環境は対応済み)です。まだ1つだけに留まっている画像編集関連の機能も含め、さらなる拡充を期待したいところです。