西田宗千佳のイマトミライ

第190回

アドビ「Firefly」とGoogle「Bard」に見る「ツールとしてのAI」の責任

西田宗千佳

2023年3月27日 08:15

Adobe Summitに登壇した、同社のシャンタヌ・ナラヤンCEO

先週は、アメリカ・ラスベガスに取材に行ってきた。目的は、アドビの年次開発者イベント「Adobe Summit」を取材するためだ。

今回の目玉は、アドビがジェネレーティブ(生成系)AIへの積極的な採用を開始したことだ。画像を作る「Adobe Firefly」に注目が集まっているが、それだけを発表したわけではない。

Adobe Fireflyのウェブ

また同じタイミングで、Googleは、かねてより開発を表明していたチャットAIサービス「Bard」について、アメリカ・イギリスでテスト公開を開始していた。

筆者はちょうどアメリカにいたので、BardとFirefly、双方をテストする機会に恵まれた。

今回は、Fireflyから見えるアドビの思惑、そして、Bardから見えるGoogleの戸惑い、それぞれについて語ってみたいと思う。

アメリカにいたせいか、Bardのテストにはすぐ参加できた

最終的には「アドビ製品全てで使われる」Firefly

先にFireflyの方から行こう。

「Adobe Firefly」は、3月21日にアドビが公開したジェネレーティブAIだ。同日より登録が開始されており、利用可能と返答があった人から順に利用できる。

現状のFireflyは、「プロンプト(命令文章)をベースに画像を生成するAI」である。対象は、画像に加え、文字に装飾を加えた「フォントエフェクト」。近日中に、ベクターベースのアートワークに対してカラーバリエーションを生成する「Recolor vectors」が追加予定だ。

ウェブからは現在、2つの機能だけが使える

また、さらに今後の予定として、以下9つが例示されている

今後追加予定の9つの機能

Inpainting

プロンプトで指定した内容で塗りつぶす

Personalized results

スタイルを指定した上で、それに合わせて生成

Text to vector

文章からベクターグラフィックスを生成

Extend image

画像の存在しない部分を生成し、アスペクト比を変更

3D to image

任意の方向から見た3Dモデルから画像を生成

Text to pattern

シームレスなタイルパターンをプロンプトから生成

Text to brush

PhotoshopやFresco用のブラシをプロンプトから生成

Sketch to image

簡単なスケッチから詳細なイメージを生成

Text to template

プロンプトから、編集可能なテンプレートを生成

9つの機能がアプリ経由での実装を検討中、と公開されている

これらは「ウェブブラウザ上でプロンプトを入力して画像を作る」ことからは大幅に離れた機能である。ようするにアドビは、Photoshopなど、同社の「Creative Cloud」に含まれるアプリのほとんどに、作業を補助するための機能としてジェネレーティブAIであるFireflyを搭載していく、ということになる。

実際に使ってみると、「ああ、今の2つはFireflyとしてはお披露目レベルなのだな」と感じる。

Fireflyでプロンプトから画像を生成

アスペクト比が指定できたり、生成した映像にテイストを指定できたり、といった自由度はアドビらしいが、まあ、そのくらいの話であり、「絵を描くジェネレーティブAI」として特筆すべきところがあるように思えない。

Text effectsは、ロゴに特化しているという意味でよりアドビらしいが、こちらも機能としては実にシンプルだ。

もう一つの生成機能「Text effects」

Fireflyは、日本語を含む多言語での対応を目指しているが、現状プロンプトとしては、英語のみが対象となっている。Text effectsでは日本語の入力もできるのだけれど、フォントの変更ができないので「とりあえずは作れる」レベルでしかない。

こういう部分も含めて、まだまだ開発途上なのだ。

日本語も入力できるが、まだフォントは選べない

「企業で安心して大量に使う」ために制限

重要なことがもう1つある。

Fireflyには制限が多い。いくつかの単語を入れると「ガイドラインに違反している」と警告が出ることもあるのだ。例えば「battle」「attack」などの単語が使えない。

「battle」などの言葉が含まれると、ガイドライン違反で画像が生成できない

詳細は以下のページに記載されているが、簡単に言えば、ポルノや差別、暴力の助長に関する内容はNGとされている。

Fireflyのガイドライン。ポルノや暴力的コンテンツへの制約がある。

Firefly Guideline

これを「つまらない」と思う人もいるだろう。

だが、それは一面的な見方に過ぎる。アドビはそもそも、「なんでも作れるAI」を作るつもりはないのだ。

アドビが作るのはアーティストを助けるAIであると同時に、「アートを使う人々」のためのものである。

次の画像を見ていただきたい。

これは、Adobe Summitの、開発途上技術を公開するイベント「Sneaks」で公開された「Project Limitless Options」という技術だ。

「Sneaks」で公開された「Project Limitless Options」。元になった画像から、キャンペーンの目的にあったコンテンツを大量に生成できる

Fireflyをベースに、コンテンツに合った画像を無限に生成するものだ。扱う食材に合わせて登場人物の服や背景、ポーズを作り変える。コアとなるコンテンツはちゃんと自分で用意した上で、それを「無数のシチュエーションに合わせる」ことが可能になってくる。

なぜこんなことをしているかというと、広告などで使う画像が爆発的に増えていくからでもある。人やメディアに合わせて画像を最適化するのは大変だ。そのためにアーティストが全部作業するのは無理がある。かといって、広告担当者が編集して素材を作るのは難しい。

だが、AIがバリエーションを短時間で作ってくれるなら、効率は上がる。ブラックな作業も減るだろう。

Fireflyはそのために作ったわけで、「企業が安心して使える」ものである必要がある。だから、問題があるキーワードで生成「できない」方がいいし、問題があるものが混ざらない方がいい。

FireflyはAdobe Stockの画像から学習している。まずStockに登録される段階で、著作権などの問題を「一応」クリアーしておき、さらに画像についたタグで精査し、その上で生成時にキーワードでもチェックする。

だから、著作権上問題がある画像が生成されることは少なくなっているし、前述のように、ポルノや暴力的な画像が生成されることも少ない。

なんでもできる、研究素材として使えるジェネレーティブAIとは別の存在を目指そうとしているのではなく、徹頭徹尾「企業が使う」「プロが使う」ことを前提としたAI基盤として自社開発しているのがFireflyであり、Adobe Senseiをベースとした「Adobe Sensei GenAI」なのである。

アドビはコンテンツ管理など、より幅広い作業に「Adobe Sensei GenAI」を導入

Googleの「Bard」は「テスト」として慎重に導入

慎重さ、という意味では、Googleの「Bard」も似たところがある。

BardはGoogleの大規模言語モデル「LaMDA」の軽量版を使っている。その上で「ジェネレーティブAIの可能性を模索するテスト版」と明確に位置付けられている。ライバルのマイクロソフトが、Bingのチャット検索を大々的に公開したのとは対照的だ。

現状、利用できるのは英語のみ。アメリカとイギリスだけで使えるのだが、これは単に言語の問題だけではない。IPアドレスで地域が判別されており、日本など対象外の地域からは利用できない。筆者はアメリカ出張中だから利用できたが、帰国後は(想定通り)利用できなくなった。

アメリカでは使えていたのだが、日本に帰国するとBardは使えなくなった

そんな事情もあり、何十時間もBardを試せているわけではない。あくまで「英語はそこそこできるレベルの人間が、数時間使ったインプレッション」とお考えいただきたい。

現状のイメージとして、Bardは「ChatGPTほどなんでもできるわけでもなく、Bing Chatほどサービスとして洗練されていないが、両方の特性を引き継いでいる」と感じる。

回答の質や内容が、ChatGPTやBingのネット検索とどう違うのか、どちらが上なのかを評価するのは難しい。回答にキャラクター性が薄いような気もするが、それは筆者の英語読解力によるものかも知れないからだ。

ChatGPTのようなシンプルな画面だが、出てくる内容はBingに近い。最新に近い情報をネット検索から引っ張ってくるし、根拠となったネットの情報の「索引」も、ウェブサイトのリンクとして表示される。

Bardの画面。シンプルで、チャット欄に英語で質問を書いて使う。

根拠となったウェブも下に提示される。また、同じ題材をネット検索する「Google It」というボタンも

さらに「Google it」というボタンがあるのもユニークだ。要は、あくまでAIの回答は「検索結果」ではないので、関連する情報をネット検索したければこのボタンを押してくださいね……ということなのだ。

また、回答については3つくらいの内容を「ドラフト」として提示する。

回答には3つの「ドラフト」が同時に提示される

すなわち、Bardが示すのは「たった1つの回答」ではなく、あくまで「利用者が回答・レポートを作るためのドラフト」という扱いなのだ。

どの企業も、ジェネレーティブAIを人間のサポート、Copilot(副操縦士)と位置付けている。それは結局、アドビもGoogleも変わらない。Adobe Summitでもそれが強調されていた。

そんな中で、「ネット検索における責任」を重視するGoogleとしては、マイクロソフトほど「ヤンチャ」な展開ができる状況にない。慎重な態度でありつつ、今できることを示さねばならない、という意味で出てきたのがBardなのだろう。

Bardの回答はかなり穏当なもので、人によっては「ChatGPTより面白くない」と思うだろう。これは、Fireflyが「穏当なジェネレーティブAI」として作られていることに似ている。

そのことを批判するのは簡単だが、今後の道具としては「倫理性の高いAI」が求められているのは間違いない。大手としてはそちらを目指さざるを得ないのだ。大手の採った手法ですら、「失敗したら誰が責任を取るのか」と言いがちな日本の常識から言えば、かなりのリスクとも言える。

GoogleはBardの履歴について、検索履歴と同様、プライバシーに配慮し、「なにを行なったか」を記録し、ユーザーが可視化できるようにした上で、消せるようにもなっている。こうした部分もまさに「倫理性の追求」だろう。

Bardの回答はGoogle側でアカウントに紐づけて記録され、いつでも消せる。

大手が「倫理性の高いAI」を作ろうとする動きが成功するかはまだわからない。そもそも、今のジェネレーティブAIは、それをうんぬんできるタイミングではないのかもしれない。

しかし、「倫理性を考えて作らねばビジネスにも生活にも使えない」のは事実。マイクロソフトもその点は否定していないし、努力している。

ツールになるということは、そういう「責任の山」を超えていくことなのだろう。

西田宗千佳

1971年福井県生まれ。フリージャーナリスト。得意ジャンルは、パソコン・デジタルAV・家電、そしてネットワーク関連など「電気かデータが流れるもの全般」。主に、取材記事と個人向け解説記事を担当。朝日新聞、読売新聞、日本経済新聞、週刊朝日、AERA、週刊東洋経済、GetNavi、デジモノステーションなどに寄稿する他、テレビ番組・雑誌などの監修も手がける。
　近著に、「顧客を売り場へ直送する」「漂流するソニーのDNAプレイステーションで世界と戦った男たち」(講談社)、「電子書籍革命の真実未来の本本のミライ」(エンターブレイン)、「ソニーとアップル」(朝日新聞出版)、「スマートテレビ」（KADOKAWA）などがある。
　メールマガジン「小寺・西田の『マンデーランチビュッフェ』」を小寺信良氏と共同で配信中。 Twitterは@mnishi41