ニュース

NECが国産LLM 日本語“トップクラス”

NECは、生成AIにおける日本語の大規模言語モデル(LLM)を開発した。すでに社内業務で活用を始めており、文章作成、社内システム開発のソースコード作成業務など、さまざまな業務の効率化に応用していく。また新サービスを立ち上げて、顧客企業向けにカスタマイズして提供していく。

NECが開発したLLMは、独自に収集・加工した多言語データを利用し、独自の工夫も加えることで、130億パラメータと軽量でクラウド/オンプレミス環境での運用も可能にしながら、日本語性能のベンチマークテストでは世界トップクラスの日本語能力を実現するのが特徴。

NECは、既存のLLMは英語を中心に学習されており、高い日本語性能を有しながら業務向けのカスタマイズが可能なLLMはほぼない状況、と指摘。LLMの自社開発によりビジネス活用を加速させ、企業の生産性向上に寄与するとしている。

日本語能力については、自然言語処理分野で標準的なベンチマークである日本語言語理解ベンチマークJGLUEを用いて評価され、今回開発したLLMは現時点で、知識量に相当する質問応答で81.1%、推論能力に相当する文書読解で84.3%と、世界トップレベルの性能を達成。これにより、さまざまな業種の業務で、十分な機能の発揮を期待できるという。

日本語言語理解ベンチマークJGLUEによる性能評価結果

もうひとつの特徴である軽量さは、高い性能を実現しながら、NEC独自の技術で130億パラメータとモデルサイズをコンパクトに抑えている。パラメータサイズだけでなく学習に使われた高品質なデータの量や学習時間にも性能が左右されることに着目し、GPU1枚で動作する範囲にパラメータサイズを抑えた上で、多量のデータと膨大な計算時間をかけて高性能を実現した。これにより、GPU1枚を搭載する標準的なサーバーで動作が可能になり、LLMを組み込んだ業務アプリケーションがレスポンスよく動作し、電力消費やサーバーコストも抑えられるとする。

NECのLLMの出力結果例(質問応答)
NECのLLMの出力結果例(文書の理解と要約)
NECのLLMの出力結果例(文書の生成)

なおNECは、国内企業で最大というAI研究用のGPUベースのスーパーコンピューターを独自に構築して3月から全面稼働させており、これを活用して、約1カ月という短期間で高性能LLMの構築を実現したとしている。

NECは7月から新サービス「NEC Generative AI Service」を開始し、顧客企業がLLMを活用できるシステムを提供していく。企業のクローズドデータを用いた個社向けLLMの開発を推進していく方針で、基盤となるLLMの性能も改良を進めて早期の実用化を図っていく。