はじめに
なんとかStable Diffusionを使えるようにはなったけど、生成される画像がイマイチ・・・という悩みはありませんか?
クオリティの高い美少女・美女画像を生成するためには、プロンプトを使いこなす必要があります。
プロンプトとは、AIに生成してほしい画像の内容や特徴を伝えるための命令のようなもので、適切なプロンプトを入力することで、望み通りの画像を生成することができます。
プロンプトは呪文と呼ばれることも多く、まさに魔法の言葉のような役割を果たします。
この記事では、AIで美女画像を生成するためのプロンプトテクニックについて、基本から応用まで解説していきます。
Stable Diffusionで使用するプロンプトの基本とは?
美少女画像を生成するためのプロンプトのフォーマットは?
プロンプトに使える様々なキーワードを一覧表で確認できないか?
Stable Diffusionの使い方については、以下の記事を参照してみてください。
サクッと完成型のプロンプトの具体例が知りたい!という方は以下の記事まで。
プロンプト集100選を制作しました!
プロンプトの基本
プロンプトは、Stable Diffusionに生成してほしい画像の内容や特徴を伝えるための、カンマ区切りのキーワードや短い英語の文章です。良いプロンプトを作成することが、望み通りの画像を生成するための鍵となります。
プロンプトの基本的な構成要素は以下の通りです。
- 1. キーワード
-
画像の内容や特徴を表す英単語や短い語句です。キーワードは、生成したい画像の要素を具体的に表現するものを選ぶことが大切です。
例えば、日本人女性の画像を生成したい場合は、”japanese woman”や”kimono”や”black hair”などがキーワードになります。
- 2. カンマ区切り
-
キーワードとキーワードの間はカンマ(,)で区切ります。これによって、複数のキーワードを組み合わせることができます。
キーワードの順番も重要で、より重要度の高いキーワードを先に記述すると良いでしょう。
- 3. 重み付け
-
キーワードを括弧()で囲むことで、そのキーワードを強調することができます。”(kimono)”の場合、重みは通常より1.1倍となります。
また、数値を指定することで、そのキーワードの重要度を調整できます。数値は通常0.5から1.5の範囲で指定します。例えば、”(kimono:1.5)”とすると、着物の特徴がより強調されます。
以下は、着物を着た日本人女性の画像を生成するためのプロンプトの例です。
Japanese woman, (kimono:1.2), beautiful face, long black hair, traditional Japanese garden, cherry blossom, masterpiece, high quality
このように、プロンプトを作成する際は、生成したい画像の内容や雰囲気を表す英語のキーワードを選び、それらを適切な順番で配置し、必要に応じて重み付けを調整することが重要です。
プロンプトのキーワード選び
よく使われるキーワードのカテゴリー
プロンプトを作成する際に重要なのが、適切なキーワードを選ぶことです。以下は、人物の画像生成によく使われるキーワードのカテゴリーと、その基本的な並び順です。
- 人物
- ポーズ・構図
- 服装
- 髪型
- 表情
- 背景
- カメラフォーカス・光源
- クオリティ
これらのカテゴリーからキーワードを選び、組み合わせることで、望みの画像を生成することができます。
ただし、この並び順は絶対的なものではありません。生成したい画像のコンセプトや重要な要素に応じて、キーワードの順番を柔軟に変更することが重要です。
カテゴリーごとの主なキーワード
プロンプトを作成する際に使われるキーワードは、大きく以下のカテゴリーに分類されます。ここでは、各カテゴリーによく使われるキーワードと、その使い方のコツを詳しく説明します。
1. 人物
描かれている人は誰なのか?を指定します。人物を指定するキーワードには、性別、年齢、国籍などが含まれます。プロンプトのベースとなります。
少女 | 女性 | 老人 |
---|---|---|
girl | woman | elderly |
日本人 | アメリカ人 | アフリカ人 |
---|---|---|
Japanese | American | African |
アスリート | ミュージシャン | ビジネスマン |
---|---|---|
athlete | musician | business person |
これらのキーワードを組み合わせることで、様々な人物像を表現できます。
elderly Japanese man
(日本人の老人男性)
young European woman
(若いヨーロッパ人女性)
2. ポーズ・構図
ポーズと構図に関するキーワードは、人物の配置や画像の全体的な構成を決定します。
立っている | 座っている | 横たわっている |
---|---|---|
standing | sitting | lying |
全身 | 上半身 | クローズアップ |
---|---|---|
full body | half body | close-up |
正面から | 横から | 後ろから |
---|---|---|
from front | from side | from behind |
これらのキーワードを適切に組み合わせることで、ダイナミックなポーズや印象的な構図を表現できます。
running side view
(走っている横からの視点)
close up from above
(上からのクローズアップ)
3. 服装
服装に関するキーワードは、人物の衣装を指定するために使用します。
スーツ | 制服 | Tシャツ |
---|---|---|
suit | uniform | t-shirt |
フォーマル | カジュアル人 | 伝統的 |
---|---|---|
formal | casual | traditional |
赤いドレス | 青いジーンズ | 白いシャツ |
---|---|---|
red dress | blue jeans | white shirt |
服装のキーワードは、色や柄、スタイルなどを組み合わせて使うことで、より具体的な衣装を表現できます。
fashionable red suit, white shirt
(おしゃれな赤いスーツと白いシャツ)
casual blue jeans, white t-shirt
(カジュアルな青いジーンズと白いTシャツ)
4. 髪型
髪型のキーワードは、人物の髪の長さ、色、スタイルを指定するために使用します。
ロングヘア | ショートヘア | ミディアムヘア |
---|---|---|
long hair | short hair | medium hair |
黒髪 | 茶髪 | 金髪 |
---|---|---|
black hair | brown hair | blonde hair |
ポニーテール | ウェーブ | 編み込み |
---|---|---|
ponytail | wavy hair | braid |
髪型のキーワードも、長さ、色、スタイルを組み合わせて使うことで、様々な髪型を表現できます。
long straight blonde hair
(長くてストレートのブロンドの髪)
braid pink hair
(編み込みしたピンクの髪)
5. 表情
表情のキーワードは、人物の感情や雰囲気を表現するために使用します。
笑顔 | 笑っている | 真剣な |
---|---|---|
smiling | laughing | serious |
怒っている | 悲しい | 驚いた |
---|---|---|
angry | sad | surprised |
表情のキーワードは、人物の感情を直接的に表現できるため、画像の雰囲気を大きく左右します。
happy laughing
(幸せそうに笑っている)
serious thoughtful
(真剣に物思いにふける)
6. 背景
背景のキーワードは、画像の舞台となる場所や環境を指定するために使用します。
ビーチ | 森 | 都市 |
---|---|---|
beach | forest | city |
夕焼け | 夜 | 雨 |
---|---|---|
sunset | night | rainy |
春 | 夏 | 秋 |
---|---|---|
spring | summer | autumn |
背景のキーワードは、場所や環境に加えて、時間帯や天候、季節などを組み合わせることで、より具体的な背景を表現できます。
rainy night city street
(雨の夜の都会の通り)
sunny beach in summer
(夏の晴れたビーチ)
7. カメラフォーカス・光源
カメラフォーカスと光源のキーワードは、画像の技術的な側面を調整するために使用します。
浅い被写界深度 | 深い被写界深度 | 被写界深度 |
---|---|---|
shallow focus | deep focus | depth of field |
ソフトな照明 | ハードな照明 | 輪郭を強調 |
---|---|---|
soft lighting | hard lighting | rim lighting |
バックライト | サイドライト | フロントライト |
---|---|---|
backlight | sidelight | frontlight |
これらのキーワードを適切に使用することで、画像の雰囲気や印象を大きく変えることができます。
shallow focus with soft lighting
(浅い被写界深度とソフトな照明)
high contrast with rim lighting
(輪郭を強調したハイコントラストな照明)
8. クオリティ
クオリティのキーワードは、生成される画像の品質や芸術性を指定するために使用します。高品質な画像を生成するためによく使われるキーワードには以下のようなものがあります。
高品質 | 傑作 | 最高品質 |
---|---|---|
high quality | masterpiece | best quality |
非常に詳細 | 複雑な詳細 | 8k解像度 |
---|---|---|
extremely detailed | intricate details | 8k resolution |
これらのキーワードを適切に組み合わせることで、驚くほど高品質でリアルな画像を生成することができます。
例えば、夜の街並みの画像を生成する場合は、以下のようなプロンプトが効果的でしょう。
city street, night, neon lights, bokeh, depth of field, people walking, japanese woman, casual wear, long hair, smiling, high quality
街並み、夜、ネオン、ボケ、被写界深度、歩く人々、日本人女性、カジュアルウェア、ロングヘア、笑顔、高画質
このように、背景とカメラフォーカス・光源を先に記述することで、夜の街並みの雰囲気を優先的に設定しています。
また、ポートレート写真のように人物に重点を置く場合は、以下のような順番が良いかもしれません。
Japanese woman, close-up, serious expression, summer dress, elaborate hairstyle, soft lighting, high quality, blurred background
日本人女性、クローズアップ、真剣な表情、サマードレス、凝ったヘアスタイル、柔らかい照明、高画質、背景ぼかし
ここでは、人物とその表情、服装、髪型を先に指定し、背景は最後に記述しています。
以上が、プロンプトで使われるキーワードの主なカテゴリーと、その使い方のコツです。これらのキーワードを効果的に組み合わせることで、より詳細で印象的な画像を生成することができます。
ただし、キーワードの組み合わせ方には明確なルールがあるわけではありません。試行錯誤を繰り返しながら、自分なりのベストな組み合わせを見つけていくことが大切です。
また、他の人が作成したプロンプトを参考にすることも、キーワードの組み合わせ方を学ぶ上で役立つでしょう。
ネガティブプロンプト
ネガティブプロンプトは、生成された画像に含まれてほしくない要素を指定するために使用します。
つまり、通常のプロンプトが「画像にこれを含めてほしい」と指示するのに対し、ネガティブプロンプトは「画像にこれを含めないでほしい」と指示するものです。
ネガティブプロンプトを適切に使用することで、望まない要素を排除し、より意図に沿った画像を生成することができます。以下に、よく使われるネガティブプロンプトの例をいくつか紹介します。
画質に関係するもの
- “low quality”(低品質)
- “blurry”(ぼやけている)
- “noisy”(ノイズが多い)
- “pixelated”(ピクセル化されている)
- “compressed”(圧縮された)
これらのネガティブプロンプトを使用することで、低品質な画像や、ぼやけた画像、ノイズの多い画像などを排除することができます。
構図や描写に関係するもの
- “out of frame”(フレームから外れている)
- “poorly drawn”(拙い描写)
- “bad anatomy”(解剖学的に間違っている)
- “extra limbs”(余分な手足)
- “missing limbs”(手足が欠けている)
- “ugly”(醜い)
- “deformed”(変形している)
これらのネガティブプロンプトを使用することで、構図が崩れた画像や、解剖学的に不自然な画像、醜い画像などを排除することができます。
不適切なコンテンツに関係するもの
- “nsfw” (Not Safe For Work: 職場で見るには適切でない)
- “nude” (ヌード)
- “sexual” (性的な)
- “violent” (暴力的な)
- “gore” (グロテスクな)
- “disturbing” (不快な)
これらのネガティブプロンプトを使用することで、職場で見るには適切でない画像や、ヌード、性的な表現、暴力的な表現、グロテスクな表現などを含む画像を排除することができます。
ネガティブプロンプトは、通常のプロンプトとは別に指定します。例えば、以下のようにプロンプトとネガティブプロンプトを組み合わせることができます。
Japanese woman, kimono, beautiful face, high quality, masterpiece
low quality, bad anatomy, nude, disturbing, poorly drawn, out of frame, deformed, blurry, noisy, pixelated, compressed, artifacts, ugly, distorted, disfigured, mutated, abnormal proportions, unnatural poses, wrong perspective, inconsistent lighting, overexposed, underexposed, no shadows, no highlights, flat shading, extra limbs, missing limbs
ネガティブプロンプトを使いこなすことで、意図しない要素を含む画像の生成を防ぎ、より望みに沿った画像を得ることができるでしょう。
よく使うプロンプト一覧
Stable Diffusionでは、様々なカテゴリーのプロンプトを組み合わせることで、自分の理想とする画像を生成することができます。
ここでは、人物に関してよく使われるプロンプトを、カテゴリー別に一覧表で紹介します。この一覧を参考にして、自分だけのプロンプトを作成してみてください。
画質
説 明 | プロンプト |
---|---|
最高傑作 | masterpiece, best quality |
超高解像度 | ultra high res, 8K |
極めて詳細 | ultra detailed |
非常に審美的 | highly aesthetic |
極めて高解像度 | ultra absurdres |
写真のような | photorealistic |
人物
説 明 | プロンプト |
---|---|
1人の少女:イラスト系 | 1 girl |
1人の少年:イラスト系 | 1 boy |
大人の女性:実写系 | woman |
大人の男性:実写系 | man |
かわいい | cute, kawaii |
美少女を生成するためには、”idol”、”actress”、”K-pop idol”などのプロンプトも有効です。
ポーズ
説 明 | プロンプト |
---|---|
立っている | standing |
座っている | sitting |
体育座り | holding knees |
横たわる | lying, lying down |
前傾姿勢 | leaning forward |
歩いている | walking |
走っている | running |
ポーズをとる | posing |
自然な立ち姿 | contrappost |
ダンス | dancing |
ジャンプ | jumping |
見上げる | looking up |
振り向く | turn around |
見下げる | looking down |
カメラ目線 | looking at viewer |
自撮り | selfie |
手を振る | waving hands |
腕を組む | arms crossed |
正座 | seiza |
一本脚立ち | standing on one leg |
構図
説 明 | プロンプト |
---|---|
クローズアップ | close-up |
バストアップ | portrait |
上半身 | upper body |
膝から上 | thigh focus |
全身 | full body |
正面から | from front |
背後から | from behind |
横から | from side |
上から | from above |
下から | from low |
俯瞰 | bird’s eye view |
ローアングル | low angle |
服装
説 明 | プロンプト |
---|---|
ドレス | dress |
ワンピース | one-piece dress |
Tシャツ | t-shirt |
タンクトップ | tank top |
セーター | sweater |
パーカー | hoodie |
ブラウス | blouse |
シャツ | shirt |
ジャケット | jacket |
コート | coat |
水着 | swimsuit |
ビキニ | bikini |
下着 | underwear, lingerie |
ジーンズ | jeans |
ショートパンツ | shorts |
スカート | skirt |
ストッキング | stockings |
制服 | uniform |
セーラー服 | sailor uniform |
メイド服 | maid outfit |
ゴスロリ服 | gothic lolita fashion |
髪型
説 明 | プロンプト |
---|---|
ショートヘア | short hair |
ミディアムヘア | medium hair |
ロングヘア | long hair |
ボブカット | bob cut |
ツインテール | twin tails |
ポニーテール | pony tail |
編み込み | braid |
編み込み2コ | twin braids |
おさげ | pig tails |
髪留め | hair bun |
髪留め2コ | twin buns |
ウェーブヘア | wavy hair |
カーリーヘア | curly hair |
ストレートヘア | straight hair |
アップスタイル | updo |
黒髪 | black hair |
金髪 | blonde hair |
茶髪 | brown hair |
銀髪 | silver hair |
ピンク髪 | pink hair |
青髪 | blue hair |
グラデーションヘア | gradient hair |
アクセサリー、小物等
説 明 | プロンプト |
---|---|
ネックレス | necklace |
ペンダント | pendant |
イヤリング | earrings |
ピアス | piercing |
ブレスレット | bracelet |
腕時計 | wristwatch |
指輪 | ring |
眼鏡 | eyeglasses |
サングラス | sunglasses |
帽子 | hat |
キャップ | cap |
リボン | ribbon |
ヘアピン | hairpin |
カチューシャ | headband |
ベルト | belt |
サスペンダー | suspenders |
ネクタイ | necktie |
スカーフ | scarf |
グローブ | gloves |
傘 | umbrella |
扇子 | folding fan |
バッグ | bag |
リュック | backpack |
ギター | guitar |
バイオリン | violin |
剣 | sword |
盾 | shield |
杖 | staff |
ワンド | wand |
本 | book |
ぬいぐるみ | stuffed animal |
表情
説 明 | プロンプト |
---|---|
笑顔 | smile |
大きく笑う | laughing out loud |
苦笑い | bitter smile |
目を閉じた笑顔 | smile with eye closed |
悪意のある笑み | smirk |
片方の目を閉じる | one eye closed |
真剣 | serious |
怒る | angry |
悲しむ | sad |
泣く | crying |
驚く | surprised |
怖い | scared |
恥ずかしい | embarrassed |
頬を赤らめる | blush |
鼻を赤らめる | nose blush |
むすっとする | pout |
舌を出す | stick out tongue |
背景
説 明 | プロンプト |
---|---|
屋内 | indoors |
屋外 | outdoors |
都会 | city |
自然 | nature |
公園 | park |
森林 | forest |
海 | ocean, sea |
山 | mountain |
空 | sky |
夜空 | night sky |
星空 | starry sky |
夕焼け | sunset |
朝焼け | sunrise |
雨 | rain |
雪 | snow |
桜 | cherry blossom |
紅葉 | autumn leaves |
花畑 | flower field |
教室 | classroom |
居間 | living room |
寝室 | bedroom |
照明
説明 | プロンプト |
---|---|
自然光 | natural lighting |
室内光 | indoor lighting |
夕方光 | twilight lighting |
逆光 | backlighting |
ソフトライト | soft lighting |
ハードライト | hard lighting |
ローキーライト | low key lighting |
ハイキーライト | high key lighting |
ドラマチックライト | dramatic lighting |
シネマティックライト | cinematic lighting |
この一覧表を参考に、自分なりのプロンプトを組み合わせて、理想の画像を生成してみてください。また、この一覧にないキーワードを組み合わせることで、オリジナリティあふれる画像を作り出すことも可能です。
ChatGPTを利用する
プロンプトの幅を広げるために、様々なバージョンや言葉遣いに修正するのは大変です。その場合はChatGPTを利用してみましょう。
以下がそのプロンプトです。
あなたは世界最高のプロンプトエンジニアです。Stable Diffusionで画像を生成するためのプロンプトを修正してもらいます。
以下がその修正前のプロンプトです。
*****
prompt:
(masterpiece), (high resolution 8K), photo realistic, 20 years old Japanese woman, sitting, portrait, from front, t-shirt, necklace, braid, red hair, smile, looking at viewer, in the cafe, daytime, soft lighting, shallow focus, blurry, detailed eyes and face, detailed body
*****
以下の条件のもとで修正を実行してください。
*****
- プロンプトは文章ではなく、", "で単語を区切った一連のテキストとし、厳選した単語とするようにしてください。
- プロンプトは基本的に名詞と動名詞で構成され、「画像に何が見えているか?」を詳細に記述するようにします。
- 女性の人物像や舞台となるカフェの細部がより詳細になるように、プロンプトの単語を追加、入れ替えしをして膨らませます。
- 画像を見た人が感動するような、芸術的な深みがあるようになる結果につながるプロンプトとしてください。
以下のようにプロンプトを修正しました:
(masterpiece), (high resolution 8K), photo realistic, Japanese woman, 20 years old, sitting, portrait, front view, t-shirt, necklace, braid, red hair, smile, looking at viewer, cafe, daytime, soft lighting, shallow focus, blurry background, detailed eyes, detailed face, detailed body, wooden table, coffee cup, window, natural light, urban setting, vintage decor, plants, book, teacup, pastry, sunlight streaming, cozy atmosphere
このプロンプトで試してみてください。
最初のプロンプト
ChatGPTの添削後
人物や小物や背景など、それぞれのディテールが細かく描かれるようになりました。照明効果も雰囲気のあるいい感じに変更されています。
プロンプト作成ツールの紹介
プロンプトをいちいち入力するのが面倒になって、簡単にプロンプトを作成できるツールを作ってみました。
便利で楽ちんなので、使ってみてください。
画像生成サービスを使う
今すぐに画像生成を試してみたい場合は、以下のサービスを使ってみてください。
nsfw(職場閲覧注意)的なサービスですが、通常の画像も生成可能です。
コメント
コメント一覧 (1件)
[…] あわせて読みたい AI美女を生成!Stable Diffusionの呪文(プロンプト)完全ガイド 【はじめに】 なんとかStable Diffusionを使えるようにはなったけど、生成される画像がイマイチ・・・と […]