電通総研 テックブログ

電通総研が運営する技術ブログ

Stable Diffusion 2.1-金髪美女写真

電通国際情報サービス、オープンイノベーションラボの比嘉康雄です。 Stable Diffusionシリーズ、今回のテーマは、Stable Diffusion 2.1-金髪美女写真です。

Stability AIPrompt Bookという呪文の解説スライドを出しているので、それを研究します。今回は、Prompt BookPhotorealism(写真のようなリアルな描写法)の金髪美女の呪文を解説します。解説スライドでは、14, 15ページの内容になります。

Prompt Bookは更新が入っているようなので、最新版では、内容が変わっている可能性もありますが、本質的な部分は変わっていないはずです。

Stable Diffusionのおすすめコンテンツはこちら。

AUTOMATIC1111のインストール

Stable Diffusion 2.1を実行する環境として、AUTOMATIC1111を使います。

AUTOMATIC1111は、Stable DiffusionGoogle Colab直接ではなく、UI経由で実行できるようにしています。似たような機能のものはいくつかありますが、AUTOMATIC1111は人気が高く、情報量も多いのでおすすめです。

Google Colabで動かすための公式のノートブックはこちらになります。

このノートブックを実行すると、下の方に

Running on public URL: https://2c76db068be0e79a.gradio.app

のようなリンクが表示されるので、クリックしましょう。

AUTOMATIC1111のセッティング

パラメータは以下のようになります。

  • Sampling Steps: 50
  • Sampling Method: DPM2
  • Width: 768
  • Height: 768
  • CFG Scale: 7.5
  • Seed: -1

Sampling Stepsは、デフォルトの20だと少ないので、50くらいにしておきましょう。

Sampling MethodはDPM2をお勧めしますが、DDIMも悪くはありません。

WidthHeight768をお勧めします。今回使っているモデルは、768用のためです。512だとかを使うと画像が崩れることがあります。

CFG Scaleは入力した呪文にどれだけ近い画像を生成するかのパラメータです。デフォルトの7でも問題ありませんが、僕はなんとなく7.5を指定しています。

金髪美女写真の出力結果

金髪美女写真の出力結果の例です。

金髪美女写真の通常呪文

金髪美女写真の通常呪文は次のようになります。

portrait of a blonde woman in a white dress posing for a picture, tumblr, digital art, glowing with colored light, ethereal lighting, forest ray light, taken in 2022, handsome girl, brooke ashling, diffused natural skin glow

見やすいように改行すると次のようになります。

portrait of a blonde woman
in a white dress
posing for a picture,
tumblr,
digital art,
glowing with colored light,
ethereal lighting,
forest ray light,
taken in 2022,
handsome girl,
brooke ashling,
diffused natural skin glow 

個々の呪文を解説しましょう。

portrait of a blonde woman

portrait of a blonde womanは、「金髪女性の肖像画」という意味です。

in a white dress

in a white dressは、「白いドレスを着て」という意味です。

posing for a picture

posing for a pictureは、「写真撮影のためにポーズを取る」という意味です。正面から撮った棒立ちの写真はつまらないので、この呪文は覚えておきましょう。

tumblr

tumblrは、SNSの一つです。指定するとなんとなくクオリティが上がる気がする呪文です。たぶん、外してもそれほど違いはないと思います。

digital art

digital artは、「デジタルアート」という意味です。たぶん、外してもそれほど違いはないと思います。

glowing with colored light

glowing with colored lightは、「色付きの光で輝く」という意味です。この効果は、金髪女性に影響します。

ethereal lighting

ethereal lightingは、「優美な照明」の意味です。

forest ray light

forest ray lightは、「森の光」という意味です。木々の間から木漏れ日が見えるような効果になることが多いです。単なるforestよりずっと美しくなるので、この呪文は覚えておきましょう。

taken in 2022

taken in 2022は、「2022年に撮られた」という意味です。たぶん、外してもそれほど違いはないと思います。

handsome girl

handsome girlは、「キリッとして目鼻立ちの整った少女」の意味です。

brooke ashling

brooke ashlingは、人の名前のような気がしますが、なんの意味があるのかわかりません。たぶん、外してもそれほど違いはないと思います。

diffused natural skin glow

diffused natural skin glowは、「分散した自然な肌の輝き」の意味です。

金髪美女写真のネガティブ呪文

通常呪文を打ち消すのがネガティブ呪文です。

金髪美女写真のネガティブ呪文は次のようになります。

gingerbread candy village, on a plate in a busy diner, ice - t, drinking beer and laughing, cartoon, 1990s cartoon, black show room, breaking bad scene, animal - shaped bread, broken down grey wall, cheese and pepperoni, black hair, duplicat

見やすいように改行すると次のようになります。

gingerbread candy village, on a plate in a busy diner,
ice - t,
drinking beer and laughing,
cartoon,
1990s cartoon,
black show room,
breaking bad scene,
animal - shaped bread,
broken down grey wall,
cheese and pepperoni,
black hair,
duplicate

個々の呪文を解説しましょう。

gingerbread candy village, on a plate in a busy diner

結構意味不明ですが、「繁盛している食堂の皿の上のお菓子」くらいの意味でしょうか。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

ice - t

これも意味不明ですが、「アイスティー」のことなのかもしれません。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

drinking beer and laughing

drinking beer and laughingは、「ビールを飲んで笑う」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

cartoon, 1990s cartoon

cartoonは、「漫画」、1990s cartoonは、「1990年代の漫画」の意味です。リアルな写真が目的なので、漫画の要素を打ち消しているのでしょう。

black show room

black show roomは、「黒い展示室」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

breaking bad scene

breaking bad sceneは、「ハメを外したシーン」の意味です。ハメを外したシーンを打ち消します。

animal

animalは、「動物」の意味です。動物を打ち消します。

shaped bread

shaped breadは、「成形されたパン」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

broken down grey wall

broken down grey wallは、「壊れた灰色の壁」の意味です。たまに、背景が灰色になってしまうことがあるので、それを打ち消しているんだと思いますが、打ち消しきれていない気がします。

cheese and pepperoni

cheese and pepperoniは、「チーズとパペロニ」の意味です。通常呪文とほとんど関係がないので、たぶん、外してもそれほど違いはないと思います。

black hair

black hairは、「黒い髪」の意味です。金髪にするために、黒い髪を打ち消します。

duplicate

duplicateは、「複製」の意味です。体のパーツが複製されるのを打ち消したいんじゃないかと思います。例えば、鼻が2つあるとか。

仲間募集

私たちは同じグループで共に働いていただける仲間を募集しています。
現在、以下のような職種を募集しています。

Stable Diffusionの全コンテンツ

執筆:@higa、レビュー:Ishizawa Kento (@kent)Shodoで執筆されました