ニュース

「ええと」、「あのう」など言い淀みを除去する自然音声言語解析API。NTT com

NTTコミュニケーションズ(NTT com)は、自然言語解析技術を用いたAPIサービス「Communication Engine COTOHA API」を1月15日より強化し、新たに「言い淀み除去」などの新APIを提供開始した。言い淀み除去では、音声認識時に「ええと」などの言い淀みを特定し、処理前に除去できるようになる。これにより、音声認識結果の精度向上を図る。

今回の機能強化は、「言い淀み除去」「音声認識誤り検知」「感情分析」の3つのAPIの提供と、従来β版だった「照応解析」APIの正式版提供開始。

言い淀み除去(β)は、音声認識処理後のテキストデータの中から、「ええと」や「あのう」といった言い淀みを特定し、除去。既存の音声認識エンジンやアプリケーションにアドオンして活用することで、音声認識結果の精度向上が図れる。

音声認識誤り検知(β版)は、音声認識処理後のテキストデータの中から、認識ミスの恐れがある単語を検知・抽出する機能。「認識した文章全体における誤り度合い」と「言い間違いや音声認識間違いの可能性が高い単語」をスコア化して表示。同APIを活用することで、音声認識結果の信頼度判定や、AIが人に対して聞き返しを行なう際に、不明点のみを尋ねることが可能となるという。

加えて、今後提供予定の「音声認識誤り訂正」APIと組み合わせることで、誤りを自動で訂正。認識精度を向上できる。

感情分析は、文章が表現している感情を「ポジティブ」あるいは「ネガティブ」と判定。否定語の認識をしながら文章全体の意味を踏まえて分析するため、単語単位の判定と比べ高精度で感情を判定できます。

また、文章に含まれる「喜ぶ」「驚く」「不安」「安心」といった15種類の感情を分類・認識できる。

照応解析は、「あれ」「彼/彼女」「同〇〇」「その〇〇」などさまざまな指示語を検知し、それらが指し示す対象を特定できる。構文解析と組み合わせて利用することで、解析精度を向上させられる。

従来β版を提供していたが、今回の正式版にて、以下の例のように指示語が複数形(彼ら)の場合や、指示語のさす対象が複数の単語から成る(任期満了による知事選)場合などのさまざまな照応関係について認識できるようになった。

COTOHA APIは、開発検証向け「for Developers」は、無償で利用可能。商用の「for Enterprise」メニューは、初期費用は無料で、月額費用は13万円+APIコール数に応じた従量課金(約260万コール/月までは基本料金で利用可能)。同社窓口への問い合わせが必要。