ニュース
アマゾン、独自AIモデル「Nova 2」 推論やマルチモーダル、独自学習も
2025年12月3日 13:17
Amazonは3日、大規模言語モデル(LLM)「Nova」の最新バージョンとなる「Amazon Nova 2」を発表した。Nova 2 Lite、Nova 2 Pro、Nova 2 Sonic、Nova 2 Omniの4つのモデルを用意し、用途に合わせた活用を可能とする。
AWSの大規模イベント「re:Invent 2025:」で発表されたもの。Amazon Nova 2は、推論、マルチモーダル処理、対話型AI、コード生成、エージェントタスクなど、AIモデルを活用する領域や、業界、コストなどにあわせてモデル選択を可能とする。
「Nova 2 Lite」は、テキスト・画像・動画を処理してテキストを生成する日常業務向けで、高速かつコスト効率の高い推論モデル。「思考」の量を調整しながら、推論と速度・コストのバランスを最適化できる。カスタマーサービスのチャットボットや文書処理、業務自動化に最適としている。
「Nova 2 Pro」は、テキスト・画像・動画・音声から、テキストを生成できるAmazon最高の推論モデルとなる。エージェント型コーディング、長期計画、高度な問題解決など、精度が求められる複雑なタスク向けとしている。また、知識蒸留の「教師モデル」としても機能する。
性能面では、Claude Sonnet 4.5と比較して16のベンチマーク中10項目で同等以上の性能としており、対GPT-5.1では16項目中8項目で同等以上、Gemini 3 Pro Previewとの比較では18項目中8項目で同等以上としている。
また、Nova 2 LiteとNova 2 Proには、ウェブグラウンディングとコード実行機能が組み込まれており、ウェブ検索し、コードを直接実行できるため、最新の事実に基づいた結果を得られるとしている。
「Nova 2 Sonic」は、テキストと音声の理解・生成を統合した音声変換モデル。リアルタイムで動作する対話型AIを実現できる。音声の表現の選択や、多言語対応、100万トークンのコンテキストウィンドウなどにより、音声とテキストのシームレスな切り替えを実現できるという。また、タスクを非同期で処理するため、ユーザーが自然な会話を継続でき、バックグラウンドでフライト予約などのアクションを完了できるという。Amazonでは、カスタマーサービスアプリケーション、AIアシスタント、対話型音声体験に最適としている。
「Nova 2 Omni」は、テキスト・画像・動画・音声入力を処理しつつ、テキストと画像の両方を生成できるマルチモーダル推論・生成モデル。最大75万語、数時間の音声、長尺動画、数百ページに及ぶ文書を処理可能で、製品カタログ全体、顧客の声、ブランドガイドライン、動画ライブラリを同時に分析できるという。
例えばマーケティングチームが、製品詳細を分析し、見出し、コピー、ソーシャル投稿、ビジュアルを含む完全なキャンペーンをワンワークフローで即時に生成できるという。
またNova 2シリーズの大きな特徴となるのが、ユーザーが自社データなどを用いて独自に学習し、カスタマイズした基盤モデルを作成できる新サービス「Nova Forge」の対応。組織が独自のデータをNova 2の能力と組み合わせて、派生モデルを作成できるという。Amazonではこのモデルを「Novellas」と命名している。
企業は自社の知識や特定業務への深い理解を融合したカスタマイズモデルを活用可能となり、Booking.comやCosine AI、Nimbus Therapeutics、野村総研、Reddit、ソニーなどの組織がNova Forgeで自社モデルを構築している。


