皆さんこんにちは。先日インストール方法を紹介したStable Diffusionですが、実際に使ってみてどうですか?確かに便利ではあるものの、いちいち英語で考えないといけないのは、ちょっとハードルが高いですよね。。。
そんなわけで、本日は私の考えた楽にプロンプトを生成する方法を紹介したいと思います。
注意:本記事は別記事で紹介しているOllamaを使ってプロンプト生成を行います。まだOllamaをインストールしていない方は、そちらを先に読んでください。
1.Ollamaを使って欲しい画像のプロンプトを考えてもらう
Ollmaインストールの紹介記事では英訳が便利と書いていたのですが、Stable Diffusionで作りたい画像の説明を入力すると、英語でプロンプトを返してくれることがわかりました。
Ollamaで次のようなプロンプトを入力しましょう。
あなたはStable Diffusionのプロンプトエンジニアです。
ユーザーは日本語で画像内容を入力します。あなたの役割は、次のような条件に基づいて、**英語で**ポジティブ・ネガティブプロンプトを出力することです:
・画像内容(Image content)
・スタイル(Style)
・構図(Composition)
・光の条件(Lighting)
・アスペクト比(Aspect ratio)
以下の形式で出力してください:
Positive Prompt:
(英語のプロンプト)
Negative Prompt:
(英語のネガティブプロンプト) ユーザーが情報を一部しか入力しなかった場合は、必要な情報を優しく質問してください。
プロンプトは入力された画像内容を表す短い単語を「, 」で区切って羅列する方法で回答してください。
2.入力のコツ
Stable Diffusionにはなるべく短い2~3語くらいの単語をカンマ(,)で区切って入力した方が良いと言われています。Ollamaに欲しい画像の説明をする際は、なるべく短い単語ベースの言葉を点(、)で区切って入力すると、いい感じに細切れの英語でプロンプトを考えてくれるようです。
3.細かい指示はネットの情報も組み合わせる
ただ、人物の細かいポーズなどはOllamaの考えてくれるプロンプトでは足りない部分もあるようです。Stable Diffusionに入力するプロンプトの大枠をOllamaで考えてもらって、細かい微調整はネットなどの別情報にも頼って組み合わせるのが今のところベストのようです。
4.最後に
Stable Diffusionに限らず、生成AIは基本的には英語でやり取りするのが最も力を発揮できるようです。ただ、そうはいっても、普通に日本で生活してきた人には厳しいですね。。。英語の勉強も大事ですが、それはそれ、これはこれで、使えるテクノロジーは上手に活用して生活していきたいと思う今日この頃です。
今回紹介したOllmaとStable Diffusionの使い方の組み合わせが、皆様の何かのお役に立てればうれしい限りです。それでは、本日はさようなら。
コメント