ニュース

NVIDIA、AIエージェントが5倍高速になる「Nemotron 3 Super」

NVIDIAは、NVIDIA Blackwell向けに最適化したオープンモデル「NVIDIA Nemotron 3 Super」を発表した。1,200億パラメータを備えるモデルで、従来のNemotron Superと比べ、最大5倍のスループットと最大2倍の精度を実現するとする。

Nemotron 3 Superは、推論時に120億パラメータのみを用いることで、タスクを効率的かつ高精度に完了できるよう設計し、長時間思考やコンテキスト爆発によってAIエージェントのワークフローが遅くなる問題に対応する。

機能面では、100万トークンのコンテキストウィンドウに対応するほか、ハイブリッド型のMixture–of-Experts(MoE)アーキテクチャを採用。メモリと計算効率を4倍に高めるMambaレイヤーと、高度な推論を支えるTransformerレイヤーを組み合わせる。

また、1つの専門家モデル分の計算コストで4つの専門家モデルを活用し、トークン生成の精度向上を図る新技術「Latent MoE」や、回答時に1語ずつ生成するのではなく、複数の単語を同時に予測して推論速度を3倍に高める「マルチトークン予測」も搭載する。

同モデルはNVIDIA BlackwellプラットフォームではNVFP4精度で動作し、NVIDIA Hopper上のFP8と比べて、精度を損なうことなく最大4倍高速な推論を実現するとしている。

同モデルは、build.nvidia.com、Perplexity、OpenRouter、Hugging Faceからアクセス可能で、ワークステーションやデータセンター、クラウドに展開およびカスタマイズできる。NVIDIA NeMoプラットフォームを用いたファインチューニングや独自モデルの構築にも対応する。