Gemini2.0で人の絵が描けるようになった|画像生成と会話するAIの魅力と可能性
https://note.com/chat_gpt777/n/nde1c7994ce2f
「Bard」の時代に画像生成AIを統合したものをリリースしたが、偽画像とかいろいろ問題のある画像を生成して大問題になり2023年12月以降「gemini」になっても画像生成AIはリリースされていなかった。
GoogleのAIモデル「Gemini」における画像生成機能は、2024年10月16日に最新の画像生成モデル「Imagen 3」を導入し、日本語対応を含む高品質な画像生成が可能となりました。
人物の画像生成に関しては、2024年2月に一時停止されていましたが、同年8月28日より有料ユーザー向けに再開されました。
その後、2025年3月12日にリリースされた「Gemini 2.0 Flash Experimental」の一般公開プレビューにおいて、画像生成機能がさらに強化されました。 無料版でも人物の画像を生成するとことが出来るようになっている。(枚数制限はないみたいです)勿論日本語でのプロンプトで大丈夫です。
Chatgpt(無料版)は1日3枚の制限付きで人物の画像生成が出来るようになっている。 Google AI Studioでいろいろ画像編集、加工などをやっていたら待っても待っても編集が出来なくなった。gemini2.0の凄さにアクセスが集中しているようです。動きが凄く鈍い。チャットはそれほどでもない。
そこで仕方なくGemini(無料版)を触っていたところ、簡単なプロンプトで絵を描いてと指示したところ、日本の若い女性なども生成してくれる。それも2028×2048の高解像度の画像が出力される。出来上がりは凄く綺麗です。プロンプトを細かくすればするほど思い通りの画像になってくる。きめ細かなつくりが出来るようになってきた。正面を向いた画像、横を向いた画像を作成しておいて、スタートと終点に置くことで自然な動画が作成できる。この2つの画像を背景などは一緒で、正面、横と作成するのは凄く難しかった。それが出来るなかなか優れものです。
Gemini(無料版)
https://gemini.google.com/app
Create Prompt | Google AI Studio(開発者向け無料サイト)
https://aistudio.google.com/app/prompts/new_chat?hl=ja
プロンプト
「若い日本の女性、20代、ポートレイト、イヤリング、ネックレス、明るい、髪型: ロング、笑顔、背景:自然、森、青い空、赤い服を描いてください。」
「若い日本の女性、20代、ポートレイト、イヤリング、ネックレス、明るい、髪型: ショート、笑顔、背景:自然、海岸、波、青い空、水色の服、北斎風の波で描いてください。」
アニメ風、水彩画風、油絵風、ルノアール風、セザンヌ風、北斎風などを指示するとかなり似たものを作ることが出来る。Gemini(無料版)