ニュース

ELYZA、「GPT-3.5 TurboやGeminiに匹敵」の日本語LLM

ELYZAは12日、700億パラメータの最新モデル「ELYZA-japanese-Llama-2-70b」を開発し、グローバルモデルに匹敵する性能を達成したと発表した。提供開始にあたり、チャット形式のデモサイトも公開している。

同モデルは、ELYZAが公開している日本語ベンチマーク ELYZA Tasks 100を用いた人手によるブラインド性能評価と、Stability AIによるベンチマークJapanese MT-Benchの自動評価で、公開されている日本企業のLLMを大きく上回ったという。また、OpenAIの「GPT-3.5 Turboシリーズ」やAnthropicの「Claude 2シリーズ」、Google「Gemini 1.0 Pro」などの「グローバルモデルにも匹敵する性能を達成している」という。

ELYZAは、今後も日本語においてグローバルプレイヤーが提供するLLMに匹敵する性能を持つ汎用LLMの開発・改善を進める。汎用モデルだけでなく、業界・企業などに特化したLLMの開発も開始し、これらのLLMを「ELYZA LLM for JP」シリーズと命名。グローバルモデル以外の選択肢として、主にセキュリティやカスタマイズ性を重視する企業、自社サービスや事業にLLMを組み込みたい企業に向け、順次提供していく。

12日からは、「ELYZA LLM for JP」のデモとして、2024年3月時点で最高性能のモデル「ELYZA-japanese-Llama-2-70b」を基盤とし、対話・タスクの実行が可能なチャットサービスを公開している。

ELYZA LLM for JP|デモ版