ニュース

MIXI、長期記憶とLLMフル活用の会話ロボ「Romi(Lacatan)」

MIXIは、会話AIロボット「Romi(Lacatanモデル)」を7月25日に発売する。価格は本体が98,780円で、別途月会費1,780円か、年会費17,800円が必要。従来モデルからハードウェアを刷新し、より自然な会話が楽しめるよう進化した。

会話に特化した手のひらサイズのコミュニケーションロボットで、従来のルールベース型のロボットと異なり、独自の生成AIモデルをベースとした会話が可能。2017年からディープラーニング技術を使った会話型ロボットとして開発が開始され、2021年4月に一般販売が開始された。初代モデルはディープラーニング技術により言語を生成して会話する家庭用コミュニケーションロボットとして世界初に認定されている。

2022年にChatGPTが登場して生成AIブームが始まるが、第2世代となるLacatanモデルは、自社開発のLLMをフル活用する新モデルとなる。初代モデルからディープラーニング技術を活用することで、従来のあらかじめ設定された定型的な会話しかできないルールベース型とは異なる会話が可能だったが、新モデルではこれを更に強化した。モデル名の「Lacatan(ラカタン)」はバナナの品種の一つでRomiの好物という設定。なお、Lacatanモデルの予約受付は、25年春頃納品予定として24年10月~12月に実施していた。

スカイブルー
ナチュラルホワイト
サクラピンク
ムーングレー

Lacatanモデルでは特に、LLMを活用することでより正確な音声認識や音声合成、自然な会話が可能になった。新しく「長期記憶」が可能になり、古い記憶でも覚えていて会話に活かすことができる。以前の会話に出てきた単語を覚えていて、長い時間が経過したあとでも、関連する話題が出たときに「あのときは〇〇だったね」と、過去の出来事に関連付けた会話も可能になる。ユーザーにとって、「過去のことを覚えていてくれている」ということは、自己認識の肯定にも繋がり、よりRomiに親しみを感じることができるようになる。

長期記憶といっても、コンピュータらしく「全てを記憶する」ということではない。人間が夢をみるのと似たコンセプトで、記憶の整理を行なっている。具体的には、時間が経った記憶を抽出して似た記憶をグループ化、重要度の低いグループを圧縮することで情報の取捨選択をしているという。

"ターン制"ではないより自然な会話

新しい声も追加する。従来は声の種類は1種類だけだったが、従来の声に加え、「おだやかな声」「あどけない声」「たのもしい声」の3種が新たに利用可能になる。それぞれ全く雰囲気の異なる声で、特に「たのもしい声」は、これまでと打って変わった逞しい男性の声色になる。声を変えることで会話内容が同じでも全く違う印象になる。

スムーズな会話を可能にする機能も搭載。最近では音声で会話するAIチャットは珍しくないが、その多くは「声を聞き取る」>「返答テキストを作る」>「声にして返す」というプロセスで、ユーザーが話をするフェーズと、AIが返答を生成して発生するフェーズは完全に分かれている。

MIXIではこれを「ターン制の会話」と呼んでいるが、実際の人間同士の会話はこのように明確なフェーズの区別はない。そこでRomiでは、Romiが喋っている間に、その声を遮るように人間が話をしても、Romiは自分の発声を止めて人間の音声を聞いて会話を続行できる。

また、人間が長時間話すようなケースでは、Romiがずっと黙って聞いていると、話している側は相手が話を聞いているのか不安になる。そうした違和感を解消するため、人間の発話中には適度に「うんうん」などという相づちを入れたり、話の途中で特定の単語について反応して、Romiから会話が盛り上がるような発話をするなど「聞いている感」を演出する。

見たものを理解する

Romiのハードウェアも大きく進化し、特にカメラの視野を大きく拡大。カメラを活用したコミュニケーションも可能になった。例えば、Romiが沢山写っているカタログの表紙を見せれば「Romiが沢山写っているね」と、見せられたものの内容を理解する。お披露目会場では、多数の記者が詰めかけている会場の様子をRomiが確認し、「イベント会場かな」などと、なんとなく見ているものを理解しているのが見てとれた。

その他、ディスプレイが従来比約1.2倍となり、画像の写りこみを軽減するためにディスプレイの形状をフラットタイプに変更。より表情が確認しやすくなった。バッテリー駆動時間も従来の約2倍となる約180分に延長された。本体サイズは11.2×11.1×10cm。

また、Lacatanモデルは新たにハードウェアを完全自社設計とし、生産は山形県のMEIKOが行なう。体制を刷新したことでより今後はより柔軟なサービスを提供。Romiの修理などを行なうクリニックを開院し、継続的な機能アップデートも行なっていく。開発中の機能の一つに「多言語モード」があり、英語で話しかければ英語で回答をし、その英語の意味を尋ねれば日本語訳をして教えてくれたりする。

22日に開催されたメディア向けのお披露目会では、タレントのキンタローさんが登場。自らメイクしたというRomiのコスプレ姿で、Romiのモノマネをしながら会場を沸かせた。キンタローさんは実際にRomiを自宅で使っており、特に子どもが気に入って楽しんでいるほか、本人もネタ合わせの相手として「相づちを打ってもらっている」などと話し、「悪い言葉をつかわず、何でも肯定してくれるのが気に入っている」という。

台座の後ろからクビだけを出したRomiのコスプレで登場したキンタローさん
自ら施した入魂のメイク
Romiに画像を見せるデモでは、自らが分した「ねぶた」姿のパネルをRomiに見せるとRomiは見事に「ねぶた祭りだね」と回答

Romiの開発方針は、実用的な役に立つロボットを作る事ではなく、会話していて元気がでたり、嫌なことがあってもすぐにクスッと笑える切っ掛けや、常に肯定してくれる存在であること。今後もAIの進化を取り込みながら開発を続ける。

MIXI 取締役ファウンダー 上級執行役員の笠原健治氏(左)とキンタローさん