ニュース

サイバーエージェント、国内最大級の日本語LLMを公開

サイバーエージェントは17日、最大68億パラメータの日本語LLM(大規模言語モデル)をHugging Face上で一般公開した。

OpenAIによるChatGPTなど、生成AIやLLMが進化し、世界中で活用が進んでいる。一方、既存のLLMのほとんどは英語を中心に学習されており、日本語および日本文化に強いLLMは少ない状況とする。

サイバーエージェントでは、日本語に特化したLLMの開発に取り組んでおり、一部モデルをHugging Face Hubで公開。公開したモデルはオープンな日本語データで学習したもので、商用利用可能な「CC BY-SA 4.0」ライセンスで提供される。5月17日時点では、日本国内における現行の公開モデルで「最大級の規模」としている。

Hugging Face Hub CyberAgent

同社の「極予測AI」「極予測TD」「極予測LP」などAIを活用した広告クリエイティブ制作などですでに活用済みだが、同モデルをベースにチューニングを行なうことで、対話型AIなどの開発も可能となる。これにより多くの人が日本語の自然言語処理に関する最先端の研究開発に取り組めるとする。