ニュース

xAI、低コスト・高速な推論対応モデル「Grok 4 Fast」

xAIは19日、コスト効率のよい推論対応モデル「Grok 4 Fast」を提供開始した。高いコスト効率とともに、最新のWebやX検索機能、200万トークンのコンテキストウィンドウなどが特徴で、単一モデル内で推論モードと非推論モードを融合している。Webのgrok.comとGrokのiOS、Androidアプリ、OpenRouterなどで当面無料で利用できる。

ベンチマークでは、GPT-5 (High)やGrok 4を上回ったり、匹敵するスコアを出している一方で、「Grok 4と同等の最先端ベンチマーク性能を達成するためのコストが98%削減された」としている。

価格は入力トークン100万件で0.2ドル、出力トークン100万件で0.5ドル、キャッシュ済みの入力トークン100万件で0.05ドル。Grok 4 Fastのトークン効率が40%向上し、トークン単価が大幅に低下したため、「リアルタイムアプリケーションに最適」としている。今後は、マルチモーダル機能やエージェント機能などの強化を予定している。