ComfyUIを使ってみた|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/n501b7b2abdca
今日はComfyUIを使って画像生成を試してみた。何しろややこしくて使いこなすのは至難の業です。というのはあるサイトからモデルをダウンロードしてきてセッティングするやり方が良くわからなかった。漸くわかったモデルが置いてあるところから1つだけダウンロードすればいいと思っていたら、実行したとき作業工程をフローにした図が赤く表示されて、必要なツールがないことが分かった。それをGeminiにスクショを見せて理由を聞いて、不足しているツールのある場所を聞いて、ダウンロードして、多い場合は4個くらいは必要。その仕組みが3日目にしてようやく分かった。これからは多分大丈夫でしょう。
ComfyUIを使いこなすにはただ単にファイルをダブルクリック、ドラッグ&ドロップ (Drag & Drop)ではうまくいかない。ターミナルでコマンドで指示していく。そのためにはGeminiに随分お世話になりました。
出てきた画面に沿って個人教授してくれる。これは強力な味方です。生成AIには「小さく叩けば小さく、大きく叩けば大きく」答えてくれる。」西郷隆盛みたいな。自分の理解力と質問力、語彙など総合的な能力を評価されるような気がする。自前の生成AIにはいろいろな問題を質問したりしながら性格を変えることが出来そうです。何回か繰り返していると、過去を少しですが覚えている。したがって、ComfyUIの話をしていても、今の環境も覚えているので「このメモリでは」などの会話が出てくる。使いこなすと段々、自分の知識が移せるかもしれない。これはやってみないといけない。
Chatgpt、Geminiなんかは完全に過去のログ(ログを残すように設定している)を覚えている。ので話は早くなる。蒸し返しがなくなる。生成AIは段々性格が変化してくることが分かっている。そんなことを考えながら画像生成AIを構築してきました。使いこなすのはまだまだかな?
まだ自分の思い通りの画像を生成してくれる「プロンプト」を書く方法を探らないといけない。世の中にいっぱいある見本を収集してくることが最初かな?今年も楽しいことが見つかった。



