Stable Diffusionのプロンプト作成ツール! Simple Prompt

AI美女を生成!Stable Diffusionの呪文(プロンプト)完全ガイド

目次

はじめに

なんとかStable Diffusionを使えるようにはなったけど、生成される画像がイマイチ・・・という悩みはありませんか?

クオリティの高い美少女・美女画像を生成するためには、プロンプトを使いこなす必要があります。

プロンプトとは、AIに生成してほしい画像の内容や特徴を伝えるための命令のようなもので、適切なプロンプトを入力することで、望み通りの画像を生成することができます。

プロンプトは呪文と呼ばれることも多く、まさに魔法の言葉のような役割を果たします。

この記事では、AIで美女画像を生成するためのプロンプトテクニックについて、基本から応用まで解説していきます。

この記事で解決できること

Stable Diffusionで使用するプロンプトの基本とは?

美少女画像を生成するためのプロンプトのフォーマットは?

プロンプトに使える様々なキーワードを一覧表で確認できないか?

プロンプト作成ツールの紹介

プロンプトをいちいち入力するのが面倒になって、簡単にプロンプトを作成できるツールを作ってみました。

よければ使ってみてください。

プロンプトの基本

プロンプトは、Stable Diffusionに生成してほしい画像の内容や特徴を伝えるための、カンマ区切りのキーワードや短い英語の文章です。良いプロンプトを作成することが、望み通りの画像を生成するための鍵となります。

プロンプトの基本的な構成要素は以下の通りです。

1. キーワード

画像の内容や特徴を表す英単語や短い語句です。キーワードは、生成したい画像の要素を具体的に表現するものを選ぶことが大切です。

例えば、日本人女性の画像を生成したい場合は、”japanese woman”や”kimono”や”black hair”などがキーワードになります。

2. カンマ区切り

キーワードとキーワードの間はカンマ(,)で区切ります。これによって、複数のキーワードを組み合わせることができます。

キーワードの順番も重要で、より重要度の高いキーワードを先に記述すると良いでしょう。

3. 重み付け

キーワードを括弧()で囲むことで、そのキーワードを強調することができます。”(kimono)”の場合、重みは通常より1.1倍となります。

また、数値を指定することで、そのキーワードの重要度を調整できます。数値は通常0.5から1.5の範囲で指定します。例えば、”(kimono:1.5)”とすると、着物の特徴がより強調されます。

以下は、着物を着た日本人女性の画像を生成するためのプロンプトの例です。

プロンプト
Japanese woman, (kimono:1.2), beautiful face, long black hair, traditional Japanese garden, cherry blossom, masterpiece, high quality
生成結果

このように、プロンプトを作成する際は、生成したい画像の内容や雰囲気を表す英語のキーワードを選び、それらを適切な順番で配置し、必要に応じて重み付けを調整することが重要です。

プロンプトのキーワード選び

よく使われるキーワードのカテゴリー

プロンプトを作成する際に重要なのが、適切なキーワードを選ぶことです。以下は、人物の画像生成によく使われるキーワードのカテゴリーと、その基本的な並び順です。

  1. 人物
  2. ポーズ・構図
  3. 服装
  4. 髪型
  5. 表情
  6. 背景
  7. カメラフォーカス・光源
  8. クオリティ

これらのカテゴリーからキーワードを選び、組み合わせることで、望みの画像を生成することができます。

ただし、この並び順は絶対的なものではありません。生成したい画像のコンセプトや重要な要素に応じて、キーワードの順番を柔軟に変更することが重要です。

カテゴリーごとの主なキーワード

プロンプトを作成する際に使われるキーワードは、大きく以下のカテゴリーに分類されます。ここでは、各カテゴリーによく使われるキーワードと、その使い方のコツを詳しく説明します。

1. 人物

描かれている人は誰なのか?を指定します。人物を指定するキーワードには、性別、年齢、国籍などが含まれます。プロンプトのベースとなります。

少女女性老人
girlwomanelderly
日本人アメリカ人アフリカ人
JapaneseAmericanAfrican
アスリートミュージシャンビジネスマン
athletemusicianbusiness person

これらのキーワードを組み合わせることで、様々な人物像を表現できます。

elderly Japanese man
(日本人の老人男性)

young European woman
(若いヨーロッパ人女性)

2. ポーズ・構図

ポーズと構図に関するキーワードは、人物の配置や画像の全体的な構成を決定します。

立っている座っている横たわっている
standingsittinglying
全身上半身クローズアップ
full bodyhalf bodyclose-up
正面から横から後ろから
from frontfrom sidefrom behind

これらのキーワードを適切に組み合わせることで、ダイナミックなポーズや印象的な構図を表現できます。

running side view
(走っている横からの視点)

asymmetrical portrait
(非対称のポートレート)

3. 服装

服装に関するキーワードは、人物の衣装を指定するために使用します。

スーツ制服Tシャツ
suituniformt-shirt
フォーマルカジュアル人伝統的
formalcasualtraditional
赤いドレス青いジーンズ白いシャツ
red dressblue jeanswhite shirt

服装のキーワードは、色や柄、スタイルなどを組み合わせて使うことで、より具体的な衣装を表現できます。

fashionable red suit, white shirt
(おしゃれな赤いスーツと白いシャツ)

casual blue jeans, white t-shirt
(カジュアルな青いジーンズと白いTシャツ)

4. 髪型

髪型のキーワードは、人物の髪の長さ、色、スタイルを指定するために使用します。

ロングヘアショートヘアミディアムヘア
long hairshort hairmedium hair
黒髪茶髪金髪
black hairbrown hairblonde hair
ポニーテールウェーブ編み込み
ponytailwavy hairbraid

髪型のキーワードも、長さ、色、スタイルを組み合わせて使うことで、様々な髪型を表現できます。

long straight blonde hair
(長くてストレートのブロンドの髪)

braid pink hair
(編み込みしたピンクの髪)

5. 表情

表情のキーワードは、人物の感情や雰囲気を表現するために使用します。

笑顔笑っている真剣な
smilinglaughingserious
怒っている悲しい驚いた
angrysadsurprised

表情のキーワードは、人物の感情を直接的に表現できるため、画像の雰囲気を大きく左右します。

happy laughing
(幸せそうに笑っている)

serious thoughtful
(真剣に物思いにふける)

6. 背景

背景のキーワードは、画像の舞台となる場所や環境を指定するために使用します。

ビーチ都市
beachforestcity
夕焼け
sunsetnightrainy
springsummerautumn person

背景のキーワードは、場所や環境に加えて、時間帯や天候、季節などを組み合わせることで、より具体的な背景を表現できます。

rainy night city street
(雨の夜の都会の通り)

sunny beach in summer
(夏の晴れたビーチ)

7. カメラフォーカス・光源

カメラフォーカスと光源のキーワードは、画像の技術的な側面を調整するために使用します。

浅い被写界深度深い被写界深度被写界深度
girlwomandepth of field
ソフトな照明ハードな照明輪郭を強調
soft lightinghard lightingrim lighting
バックライトサイドライトフロントライト
backlightsidelightfrontlight

これらのキーワードを適切に使用することで、画像の雰囲気や印象を大きく変えることができます。

hallow focus with soft lighting
(浅い被写界深度とソフトな照明)

high contrast with rim lighting
(輪郭を強調したハイコントラストな照明)

8. クオリティ

クオリティのキーワードは、生成される画像の品質や芸術性を指定するために使用します。高品質な画像を生成するためによく使われるキーワードには以下のようなものがあります。

高品質傑作最高品質
high qualitymasterpiecebest quality
非常に詳細複雑な詳細8k解像度
extremely detailedintricate details8k resolution

これらのキーワードを適切に組み合わせることで、驚くほど高品質でリアルな画像を生成することができます。

例えば、夜の街並みの画像を生成する場合は、以下のようなプロンプトが効果的でしょう。

city street, night, neon lights, bokeh, depth of field, people walking, japanese woman, casual wear, long hair, smiling, high quality

街並み、夜、ネオン、ボケ、被写界深度、歩く人々、日本人女性、カジュアルウェア、ロングヘア、笑顔、高画質

このように、背景とカメラフォーカス・光源を先に記述することで、夜の街並みの雰囲気を優先的に設定しています。

また、ポートレート写真のように人物に重点を置く場合は、以下のような順番が良いかもしれません。

Japanese woman, close-up, serious expression, summer dress, elaborate hairstyle, soft lighting, high quality, blurred background

日本人女性、クローズアップ、真剣な表情、サマードレス、凝ったヘアスタイル、柔らかい照明、高画質、背景ぼかし

ここでは、人物とその表情、服装、髪型を先に指定し、背景は最後に記述しています。

以上が、プロンプトで使われるキーワードの主なカテゴリーと、その使い方のコツです。これらのキーワードを効果的に組み合わせることで、より詳細で印象的な画像を生成することができます。

ただし、キーワードの組み合わせ方には明確なルールがあるわけではありません。試行錯誤を繰り返しながら、自分なりのベストな組み合わせを見つけていくことが大切です。

また、他の人が作成したプロンプトを参考にすることも、キーワードの組み合わせ方を学ぶ上で役立つでしょう。

ネガティブプロンプト

ネガティブプロンプトは、生成された画像に含まれてほしくない要素を指定するために使用します。

つまり、通常のプロンプトが「画像にこれを含めてほしい」と指示するのに対し、ネガティブプロンプトは「画像にこれを含めないでほしい」と指示するものです。

ネガティブプロンプトを適切に使用することで、望まない要素を排除し、より意図に沿った画像を生成することができます。以下に、よく使われるネガティブプロンプトの例をいくつか紹介します。

画質に関係するもの

  • “low quality”(低品質)
  • “blurry”(ぼやけている)
  • “noisy”(ノイズが多い)
  • “pixelated”(ピクセル化されている)
  • “compressed”(圧縮された)

これらのネガティブプロンプトを使用することで、低品質な画像や、ぼやけた画像、ノイズの多い画像などを排除することができます。

構図や描写に関係するもの

  • “out of frame”(フレームから外れている)
  • “poorly drawn”(拙い描写)
  • “bad anatomy”(解剖学的に間違っている)
  • “extra limbs”(余分な手足)
  • “missing limbs”(手足が欠けている)
  • “ugly”(醜い)
  • “deformed”(変形している)

これらのネガティブプロンプトを使用することで、構図が崩れた画像や、解剖学的に不自然な画像、醜い画像などを排除することができます。

不適切なコンテンツに関係するもの

  • “nsfw” (Not Safe For Work: 職場で見るには適切でない)
  • “nude” (ヌード)
  • “sexual” (性的な)
  • “violent” (暴力的な)
  • “gore” (グロテスクな)
  • “disturbing” (不快な)

これらのネガティブプロンプトを使用することで、職場で見るには適切でない画像や、ヌード、性的な表現、暴力的な表現、グロテスクな表現などを含む画像を排除することができます。

ネガティブプロンプトは、通常のプロンプトとは別に指定します。例えば、以下のようにプロンプトとネガティブプロンプトを組み合わせることができます。

プロンプト
Japanese woman, kimono, beautiful face, high quality, masterpiece
ネガティブプロンプト
low quality, bad anatomy, nude, disturbing, poorly drawn, out of frame, deformed, blurry, noisy, pixelated, compressed, artifacts, ugly, distorted, disfigured, mutated, abnormal proportions, unnatural poses, wrong perspective, inconsistent lighting, overexposed, underexposed, no shadows, no highlights, flat shading, extra limbs, missing limbs

ネガティブプロンプトを使いこなすことで、意図しない要素を含む画像の生成を防ぎ、より望みに沿った画像を得ることができるでしょう。

よく使うプロンプト一覧

Stable Diffusionでは、様々なカテゴリーのプロンプトを組み合わせることで、自分の理想とする画像を生成することができます。

ここでは、人物に関してよく使われるプロンプトを、カテゴリー別に一覧表で紹介します。この一覧を参考にして、自分だけのプロンプトを作成してみてください。

画質

説 明プロンプト
最高傑作masterpiece, best quality
超高解像度ultra high res, 4K, 8K
高解像度high resolution, 2K
極めて詳細extremely detailed
写真のようなphotorealistic

人物

説 明プロンプト
1人の少女:イラスト系1 girl
1人の少年:イラスト系1 boy
大人の女性:実写系woman
大人の男性:実写系man
かわいいcute, kawaii

美少女を生成するためには、”idol”、”actress”、”K-pop idol”などのプロンプトも有効です。

ポーズ

説  明プロンプト
立っているstanding
座っているsitting
横たわるlying, lying down
歩いているwalking
走っているrunning
ポーズをとるposing
ダンスdancing
ジャンプjumping
見上げるlooking up
カメラ目線looking at viewer
手を振るwaving hands
腕を組むarms crossed

構図

説 明プロンプト
クローズアップclose-up
上半身upper body
全身full body
正面からfrom front
背後からfrom behind
横からfrom side
俯瞰bird’s eye view
ローアングルlow angle

服装

説 明プロンプト
ドレスdress
ワンピースone-piece dress
Tシャツt-shirt
タンクトップtank top
セーターsweater
パーカーhoodie
ブラウスblouse
シャツshirt
ジャケットjacket
コートcoat
水着swimsuit
ビキニbikini
下着underwear, lingerie
ジーンズjeans
ショートパンツshorts
スカートskirt
ストッキングstockings
制服uniform
セーラー服sailor uniform
メイド服maid outfit
ゴスロリ服gothic lolita fashion

髪型

説 明プロンプト
ショートヘアshort hair
ミディアムヘアmedium hair
ロングヘアlong hair
ツインテールtwin tails
ポニーテールponytail
編み込みbraid
おさげpigtails
ウェーブヘアwavy hair
カーリーヘアcurly hair
ストレートヘアstraight hair
アップスタイルupdo
黒髪black hair
金髪blonde hair
茶髪brown hair
銀髪silver hair
ピンク髪pink hair
青髪blue hair
グラデーションヘアgradient hair

アクセサリー、小物等

説 明プロンプト
ネックレスnecklace
ペンダントpendant
イヤリングearrings
ピアスpiercing
ブレスレットbracelet
腕時計wristwatch
指輪ring
眼鏡eyeglasses
サングラスsunglasses
帽子hat
キャップcap
リボンribbon
ヘアピンhairpin
カチューシャheadband
ベルトbelt
サスペンダーsuspenders
ネクタイnecktie
スカーフscarf
グローブgloves
umbrella
扇子folding fan
バッグbag
リュックbackpack
ギターguitar
バイオリンviolin
sword
shield
staff
ワンドwand
book
ぬいぐるみstuffed animal

表情

説 明プロンプト
笑顔smile
ウィンクwink
真剣serious
怒りangry
悲しみsad
驚きsurprised
恥ずかしがるembarrassed
頬を赤らめるblush
無表情expressionless

背景

説 明プロンプト
屋内indoors
屋外outdoors
都会city
自然nature
公園park
森林forest
ocean, sea
mountain
sky
夜空night sky
星空starry sky
夕焼けsunset
朝焼けsunrise
rain
snow
cherry blossom
紅葉autumn leaves
花畑flower field
教室classroom
居間living room
寝室bedroom

照明

説明プロンプト
自然光natural lighting
室内光indoor lighting
夕方光twilight lighting
逆光backlighting
ソフトライトsoft lighting
ハードライトhard lighting
ローキーライトlow key lighting
ハイキーライトhigh key lighting
ドラマチックライトdramatic lighting
シネマティックライトcinematic lighting

この一覧表を参考に、自分なりのプロンプトを組み合わせて、理想の画像を生成してみてください。また、この一覧にないキーワードを組み合わせることで、オリジナリティあふれる画像を作り出すことも可能です。

ChatGPTを利用する

プロンプトの幅を広げるために、様々なバージョンや言葉遣いに修正するのは大変です。その場合はChatGPTを利用してみましょう。

以下がそのプロンプトです。

プロンプト
あなたは世界最高のプロンプトエンジニアです。Stable Diffusionで画像を生成するためのプロンプトを修正してもらいます。
以下がその修正前のプロンプトです。
*****
prompt:
(masterpiece), (high resolution 8K), photo realistic, 20 years old Japanese woman, sitting, portrait, from front, t-shirt, necklace, braid, red hair, smile, looking at viewer, in the cafe, daytime, soft lighting, shallow focus, blurry, detailed eyes and face, detailed body
*****
以下の条件のもとで修正を実行してください。
*****
- プロンプトは文章ではなく、", "で単語を区切った一連のテキストとし、厳選した単語とするようにしてください。
- プロンプトは基本的に名詞と動名詞で構成され、「画像に何が見えているか?」を詳細に記述するようにします。
- 女性の人物像や舞台となるカフェの細部がより詳細になるように、プロンプトの単語を追加、入れ替えしをして膨らませます。
- 画像を見た人が感動するような、芸術的な深みがあるようになる結果につながるプロンプトとしてください。
出力結果

以下のようにプロンプトを修正しました:

(masterpiece), (high resolution 8K), photo realistic, Japanese woman, 20 years old, sitting, portrait, front view, t-shirt, necklace, braid, red hair, smile, looking at viewer, cafe, daytime, soft lighting, shallow focus, blurry background, detailed eyes, detailed face, detailed body, wooden table, coffee cup, window, natural light, urban setting, vintage decor, plants, book, teacup, pastry, sunlight streaming, cozy atmosphere

このプロンプトで試してみてください。

最初のプロンプト

ChatGPTの添削後

人物や小物や背景など、それぞれのディテールが細かく描かれるようになりました。照明効果も雰囲気のあるいい感じに変更されています。

画像生成サービスを使う

今すぐに画像生成を試してみたい場合は、以下のサービスを使ってみてください。

nsfw(職場閲覧注意)的なサービスですが、通常の画像も生成可能です。

コメント

コメントする

目次