ニュース

Meta、200言語対応のAI翻訳モデル「NLLB-200」

Metaは6日、単一のAIモデルとして初めて200の言語を翻訳できる「NLLB-200」の開発を発表した。Meta AIでは、NLLB-200モデルと、評価データセットFLORES-200、モデル学習コード、学習データセット再作成用コードなどをオープンソース化する。

アジア太平洋地域では、日本語を含む言語を対象に、NLLB-200プロジェクトから得たモデリングの手法や学習成果を活用。FacebookやInstagram上の翻訳の品質を改善している。

NLLB-200は、高い翻訳精度で多くの言語サポートが特徴。カンバ語やラオ語をはじめとするアフリカやアジアの多くの言語は、現存する翻訳ツールでも十分に(もしくはまったく)サポートされておらず、またその多くは翻訳品質が低いという。NLLB-200は55種類のアフリカ言語をサポートし、高品質な翻訳を生成できるという。

また、NLLP-200の翻訳精度(BLEUスコア)は、従来の最高水準のパフォーマンスを平均44%上回り、アフリカやインドの一部の言語については、最近の翻訳システムより70%以上高いパフォーマンスを記録している。

Metaでは、NLLB-200モデルのオープンソース化を推進。NLLBの研究から得られたモデリングの手法や学習成果は、Wikipedia編集者の使用している翻訳システムでも活用される予定。

200 languages within a single AI model: A breakthrough in high-quality machine translation