ニュース

リモート会議を瞬時に翻訳するPC版「ポケトーク字幕」

ソースネクストは、リモート会議を瞬時に翻訳するPC用ソフトウェア「ポケトーク字幕」と、音声を自動でテキストに変換するAIボイスレコーダーの最新モデル「AutoMemo S」を発表した。

2カ国語に同時通訳できる「ポケトーク字幕」

ポケトーク字幕は、Windows/Mac用のソフトウェア。ZoomやTeamsなどのリモート会議システム上で、自分が話した言葉を指定した最大2言語に翻訳して、瞬時に字幕でカメラ映像に合成して表示できる。

翻訳速度は、他社の一般的な自動翻訳サービスと比べて、3.2倍以上速く翻訳・表示できるとしている。たとえば、発話終了から翻訳結果が表示されるまでの速度は、音声の長さが4.89秒の場合、2.2倍以上、音声の長さが0.90秒の場合、3.2倍以上早い結果が得られたという。

翻訳はクラウド上の翻訳エンジンを使用。ポケトーク字幕の翻訳ボタンでオン・オフを制御し、翻訳したい部分だけを相手に確実に伝えることができる。

対応言語は82言語。言語の組み合わせは自由で、日本語>日本語の設定にすると、リモート会議でミュートの時などに文字のみでコミュニケーションができる。

ポケトーク字幕は、Webカメラの画像と翻訳結果を字幕のように画像合成する仮想カメラとして動作するため、多くのリモート会議システムやFacebook Messengerのビデオ通話、YouTubeのストリーミング配信など、Webカメラを使った映像なら幅広く対応する。動作確認済みの会議システムは、Zoom/Skype/Microsoft Teams/Googleハングアウト/Google Meet/LINE/Slackなど。

Windows版は2022年1月、Mac版は同2月から提供開始。利用料金は月額1,100円、年額13,200円いずれかのサブスクリプションのみ。なお、2022年3月末までは無料で利用できる。

ディスプレイ搭載・高速化した「AutoMemo S」

録音した音声を文字化するAIボイスレコーダー「AutoMemo」の新モデル。名刺サイズ本体に録音の状況や文字起こしの結果などを確認できる2.83型のフルカラー・タッチパネル・ディスプレイを搭載した。価格は24,800円で、利用時間に応じて別途月額料金が必要。

新音声認識エンジンを採用し、精度を大幅に改善。文字起こしの正確さが15%向上したほか、自然な位置に「、」や「。」が入るようになり、文字起こし後に読みやすくなった。

録音した音声は、AIによりノイズを抑え、声だけを強調しクリアな音質とした。専用スマホアプリとも連動し、スマホの画面で文字を確認できる。音声・テキストともにすべてクラウドに自動保存されるため、管理もしやすい。

料金プランは、毎月1時間までの録音データのテキスト化が無料な「ベーシックプラン」と、毎月30時間まで対応する「プレミアムプラン」が月額980円。1回のチャージで10時間利用できる「10時間チャージ」は1回1,480円。余った時間は翌月以降に繰り越せる。

BtoBには専用機。今後もニーズがある

同社のポケトークは、海外でもコロナ禍により需要が急増し、昨年11月と比較して売上は7.6倍となった。

しかし、GoogleがPixel 6等で提供している音声文字起こしアプリ「レコーダー」などは端末を持っていれば無料で利用できる。これについて同社代表取締役会長 兼 CEOの松田憲幸氏は、「今まで翻訳や文字起こしのアプリはあったが、ポケトークも後発なのに売れている。スマホが必要なのはデメリットで、個人なら自分のスマホを使えばいいが、法人では個人のスマホを使うというのは考えにくい。そのために高価なスマホを購入するよりも、BtoBでは優位性がある」という見解を示した。

また、今回は専用機ではなくソフトウェアの販売も行なうが、ハードウェアとの売り上げ比率としては「2、3年後にはソフトウェアの売上のほうが高くなると考えている」という。

しかし、「専用機は今後も必要。必ずしもスマホがいいとは限らない。単機能目的に汎用機はもったいない」とし、この後もさまざまな形態で翻訳システムを開発して「言葉の壁」をなくしていきたいと語った。