ニュース

テキストから音楽生成するAI「Stable Audio」 45秒まで無料

Stability AIは、音楽や効果音を生成する初のAIモデル「Stable Audio」を発表した。いくつかの制限がある無料版では1トラック45秒まで、商用可能な「Pro」サブスクリプション版(月額11.99ドル)では1トラック90秒までの音楽を作成できる。

Stable Audioは、音楽に使用するサンプルを作成しようとするミュージシャンに最適とし、ミュージシャンのためのAIと謳っている。AIの助けを借りて、ミュージシャンに新しいコンテンツを生み出す力を与えるものとしている。

テキストによるプロンプトと、希望する長さを指定すると生成される。例えばテキストプロンプトとして“Post-Rock”“Guitars”“Up-Lifting”“125 BPM”などの、ジャンルや楽器の種類、ムード、テンポなどを入力し、長さを指定すると、トラックが生成される。

Stable Audioはlatent diffusionを利用し、商用可能で、44.1kHzの音楽の生成に対応している。生成の基礎になるモデルは、音楽ライブラリ「AudioSparx」の音楽とメタデータを使用してトレーニングされており、両社のパートナーシップにより実現している。