ローカルの音楽生成AI Ace-Step1.5をインストールしてみた|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/nf82c341b37ce?app_launch=false
ACE-Step/Ace-Step1.5 · Hugging Face
https://huggingface.co/ACE-Step/Ace-Step1.5
ここで上部のFiles and versionsをクリックして下記のページへ
ACE-Step/Ace-Step1.5 at main
https://huggingface.co/ACE-Step/Ace-Step1.5/tree/main/acestep-v15-turbo
acestep-v15-turboをクリックして一番容量の大きいファイルをダウンロードする。
model.safetensors(4.79GB)をダウンロードする。結構ダウンロードに手間取りました。Chatgptにスクリーンショットを示しながら教えて貰った。手探りのとき便利ですね。
c:\genai/comfty/models/checkpoints
ここにmodel.safetensorsファイルを入れる。そしてClaudeでAce-Step1.5用のワークフローを作成してもらう。その後comftyを起動して、このワークフローをドロップアンドドロップで貼り付ける。すると歌詞を入れる欄、スタイルを入れる欄が出てくるので各々を入れて実行をクリックすると楽曲が完成する。
comftyにAce-Step1.5を導入した場合、本来は日本語を含む50か国の言語に対応しているはずがcomftyが対応していないので日本語を使うとおかしな発声になってしまう。そこで英語の歌詞にするか、ローマ字で歌詞を書く必要がある。スタイルにjaと指定する。
ということで、自前パソコンにAce-Step1.5を導入することは出来た。最初英語の歌詞、スタイル等をいろいろ工夫しながら、できた曲をSunoで日本語化して使う、繰り返しチャレンジするにはSunoは大変なので、これでやるという手はあるかもしれない。
またcomftyに導入するのではなくてGradio Web UIであれば日本語の問題も解決するようです。ゆっくりチャレンジしてみたいと思います。
導入作業で参考になるHP等を検索していたら、下記のACE-Step v1.5のデモページを見つけた。使ってみてはいかがですか?自前パソコンもいらない。ログインもいらない。
ACE-Step v1.5 - a Hugging Face Space by ACE-Step
https://huggingface.co/spaces/ACE-Step/Ace-Step-v1.5
そのサイトは、オープンソースの音楽生成AIモデル ACE-Step v1.5 を試せる デモページ(Hugging Face Space) です。ここではテキスト(曲の説明・歌詞など)を入力すると、AIがその内容に沿った楽曲をブラウザ上で生成することができます。
具体的には以下のような内容です:
• ACE-Step v1.5 は何か
AIが文章や歌詞から音楽を生成するための基盤モデルで、歌声付き楽曲の制作にも対応する、オープンソースの音楽生成モデルです。比較的高速に動作し、商用利用も可能な設計になっています。
• この Hugging Face Space の役割
このページは ACE-Step v1.5 の インタラクティブなデモ(Playground) で、ブラウザ上で実際に音楽を作成したり、プロンプトを試したりできます。入力欄に曲の説明や歌詞を入れて「生成」を押すと、AIが音楽をリアルタイムで生成します。
• Hugging Face Space とは
Hugging Face の “Space” は、機械学習モデルを簡単に試せる ウェブインターフェイス付きの公開デモサイト です。開発者がSpace上でモデルの実行環境を提供し、誰でも体験できます。
要するに、この Hugging Face Space は AIで音楽を生成して遊んだり試したりできるページ です。興味があればそこで直接プロンプトを入力して、どんな曲ができるか体験できます。
• この ACE-Step v1.5 のページは 無料で使える公開デモ
• 明確な上限曲数の表示はないが、負荷や制限により生成回数が制限される可能性あり
• 長時間使ったり大量に生成したい場合は、自分でローカル実行したり、別途サービス契約が必要になる場合あり。
ACE Step 1.5 は、中国の企業グループである Alibaba Group(アリババ)系の研究チームによって開発されています。具体的には、アリババ傘下のAI研究組織である Alibaba Cloud Tongyi Lab が中心となって公開している技術です。
つまり
開発国:中国
開発主体:アリババ系AI研究機関
ComfyUI界隈で広く使われているけれど、出どころは中国の大手テック企業研究所
ACE Step1.5の使い方【爆速生成できる!】
ComfyUI & Gradio Web UIで高品質AI音楽生成
https://www.youtube.com/watch?v=GB8xByVhw70&t=472s
ローカルの音楽生成AI Ace-Step1.5
Ace-Step1.5を調整しながら日本語でも音楽で使えるようにチャレンジしました。デモサイトでも日本語を入力はかなり間違っています。
ローカルサイトとデモサイト、Sunoを比べながら日本語でも使えないかなと試行錯誤しました。日本語を歌わせるにはローマ字(ヘボン式)が一番有効でした。
Ace-Step1.5で作った音楽を下記にアップロードしました。日本語が苦手と言われているcomftyを使っています。聴いてみてください。これがSunoのV4.5~V5レベルと言われている音だと思います。これの良いところは曲の長さを秒単位で調整できるところです。歌詞の最後にendを忘れないように、endがないと途中でも切れてしまいます。
汽車の煙に手をふって / Kisha no Kemuri ni Te wo Futte
https://pasopia.velvet.jp/2026/ongaku/enka_song.html
ACE-Step v1.5 - a Hugging Face Space by ACE-Step(デモサイト)
https://huggingface.co/spaces/ACE-Step/Ace-Step-v1.5



