ニュース

DNP、橋/箸を正確に発音する合成音声。文脈から誤読も防ぐ

大日本印刷及びDNPコミュニケーションデザイン(DCD)は、人が読むナレーションのイントネーションやアクセントに近い自然な音声を自動生成できるAIを活用した音声合成システムを開発した。

音声合成の制作時に起きる漢字の「誤読」や、“橋/箸/端”など同じ読み仮名で異なる「イントネーションの違い」に関して、従来の同社の音声合成の制作と比較して読み間違いを約50~70%削減する。これにより、高齢者や身体障がいの有無に関わらず、誰でも必要な情報に簡単にたどり着けるアクセシビリティの向上を図る。

DCDが保有する読み間違いのない音声データをAIに機械学習させることで、正確な読みを自動付与可能。約款や契約書、自治体・行政機関等の公式文書、製品の解説書といった正しい情報提示が必要でテキスト量が多いものへの利用に適している。

イントネーションとアクセントを文章の文脈を加味して自動生成でき、従来の方法と比較して、人が読むナレーションに近い自然な音声を生成する。特に正しい読みやナレーションを重視する学校教材や電子書籍などにも向いている。

追加学習によってデータを増やすほど、読みの正確性やイントネーションおよびアクセントの精度が向上する。複数の生命保険会社の約款で汎用性の検証を実施したところ、「読み」「アクセント」「間」について約85%以上の正確性が確認されたという。今後も追加学習を重ねることでさらなる精度の向上を目指す。