ニュース

日本テレビ、生放送のニュース字幕で精度99% 放送特化でNEC開発

NECと日本テレビは、生放送番組「ストレイトニュース」において、NEC独自のAI音声認識技術を活用して自動で字幕を付与する実証を、5月末に実施した。

放送業界では、聴覚に障がいのある人やテレビの音が聞こえにくくなった人にも必要な情報が正しく伝わるよう、テレビの字幕放送が求められている。一方で字幕放送を実現するには、人手による手打ち入力が主流になっているほか、音声認識システムを利用する場合でも、字幕内容の正確性を確保するため校正者を複数人配置する必要があり、運用負荷が大きいという課題がある。

こういった背景からNECは、AI音声認識技術を活用したDX支援サービス「NEC Enhanced Speech Analysis-高性能音声解析-」を活用し、同サービスの音声認識モデルにニュース番組でよく使用される地名や人名等の放送用語を事前に学習させることで、放送業界向けに特化した音声認識技術を開発した。

この技術を日本テレビの約15分間の生放送ニュース番組「ストレイトニュース」で実証し、99%の認識精度を確認した。従来のNECの音声認識サービスの認識精度は91.6%で、放送業界向けに特化したことで精度が7.4ポイント向上している。

また、耐騒音性が求められるスポーツ中継等での活用を視野に、周囲の雑音やBGMによる誤認識を低減するための技術を開発。NEC社内における実証では、電車内騒音や野外騒音等の騒音が加わった状態でも、一般的に騒音下で利用されている音声認識と比較し最大15.9ポイント高い88.3%の認識精度を確認したという。