ニュース

Stable Diffusion 3、API経由で提供開始

Stability AIは23日、最新の大規模言語モデル(LLM)「Stable Diffusion 3」と「Stable Diffusion 3 Turbo」をAPI経由で提供開始した。Stability AI Developer Platform APIから利用できる。

Stable Diffusion 3では、DALL-E 3 や Midjourney v6など他のテキスト画像生成モデルに対し、タイポグラフィとプロンプトの忠実性において上回っているという。新しいMultimodal Diffusion Transformer(MMDiT)アーキテクチャでは、画像表現と言語表現に別々のウェイトセットを使用。Stable Diffusionの旧バージョンから、テキスト理解とスペリング機能が向上している。

新モデルは23日からAPI経由で利用可能で、Fireworks AIと提携し、信頼性の高いエンタープライズグレードのAPIプラットフォームとして展開。オープンなリリースに向けて、モデルを継続的に改善していく。