ニュース
OpenAI、LLMのための新チップ「ハラペーニョ」を自社開発 年内にGW級
2026年6月24日 23:43
OpenAIは24日(米国時間)、LLM(大規模言語モデル)向けの推論プラットフォームとして設計した新チップ「Jalapeño」(ハラペーニョ)を発表した。米Broadcomとの共同開発で、26年末までにギガワット規模のデータセンター展開を開始する。
Jalapeñoは、OpenAIによるLLMの基礎原理に対する理解に基づき、「最新のLLM推論のため」に、モデル、カーネル、サービングシステム、製品ニーズに関するロードマップを反映させて、チップをゼロから設計。BroadcomとCelesticaと共同で開発し、初期設計から製造用テープアウトまで、約9カ月という短時間で到達したという。OpenAIとBroadcomは25年10月にAIアクセラレーターの共同開発で提携を発表していた。
Jalapeñoのエンジニアリングサンプルは、ラボ環境で、「GPT‑5.3‑Codex‑Spark」を含むMLワークロードを量産目標の周波数と消費電力で実行しているという。
アーキテクチャにおいては、データ移動を削減し、演算、メモリ、ネットワークリソースのバランスを最適化。理論上のピーク性能に極めて近い実利用率を実現する。
現在、Jalapeñoの最終的な性能測定を進めているが、初期テストでは、現在の最先端技術との比較でもワットあたりの性能が大幅に優れていることが確認されているという。
Jalapeñoは、OpenAIのChatGPT、Codex、APIのほか、将来のエージェンティック製品に向けて日々運用しているシステムから得た知見を反映しながら、業界全体の現在と将来のLLM向けに設計。現在の最先端AIアクセラレーターの性能とスループットを、最速の専用推論システムに近いレイテンシと組み合わせ、大規模な対話型LLM製品に最適なものにする狙いとしている。
OpenAIでは、LLMとともに基盤となるインフラや製品体験全体をカバーした「フルスタック」であることを強調し、それゆえに「モデルをより高速に、より信頼性が高く、ユーザーにとってより手頃な価格にする」という目標を実現できると説明。Jalapeñoの26年末までの初期導入では、Microsoftを含むパートナーと協力し、ギガワット(GW)規模のデータセンター展開を行ない、さらに今後数年にわたって拡張されるコンピューティング・プラットフォームへ広げていく。
