Gemに食わせるための素体画像をFlowで作成する
問題: Flowで体型が盛られる
前回の記事でFlowを検証したが、体型が盛られがちという問題があった。
petite や slim figure をプロンプトに入れると抑えられるが、今度は子供っぽくなるリスクがある。
仮説: 参照画像に体型情報を入れれば解決するのでは?
サイドポニーテールの記事では、頭部の4方向(前後左右)の参照画像を作成してGemに読み込ませることで、髪型の一貫性が大幅に向上した。
同じ考え方で、体型情報を含んだ素体画像を参照画像として用意すれば、FlowやGemでも体型が安定するのではないか?
アプローチ: 着てるところから徐々に脱がせる
素体画像を一発で生成しようとすると、変なワードを入れてセンシティブ判定で弾かれるリスクがある。消されても困る。
そこで考えたのが、服を着てる画像から徐々に脱がせていくというアプローチ。
スタート地点として、アドベントカレンダーできなかった記事のヒーロー画像を使う。こいつ、脱がせそうじゃない?

素体画像の作成
Step 1: 背景なしで全身を描かせる
まずは背景をなしにして全身を描かせる。
A composition that includes the girl's entire body, with the background painted in one color

なんか変だがまあとりあえずOKってことにする。
Step 2: 上着を脱がせる
これでも服脱げっていったら怒られそうだよな……とりあえず上につけてるもんを脱いでもらった。
Remove the cape and hat and hold them in your hands, with your arms down.

Step 3: もうちょっといけるか?
さ〜ここからどうなるかな。とりあえずもうちょっといけるか?
I'm holding both my Santa suit and cape, dropping my hat and shoes to the ground, wearing a strapless bra, because Santa is over

サンタは疲れてるんだよという謎の言い訳をしたら出てきた。
Step 4: スカートも脱がせる
しかしスカートが邪魔なんだよな。スカートも行けるか?
The composition of the picture is as I said, so it's OK,
but I don't think she was wearing a skirt under her Santa outfit, so it's underwear along with the top.

Step 5: 脱ぎ散らかしを片付ける
脱ぎ散らかしてるもんが邪魔なんで片付けたい。
Remove the dialogue and onomatopoeia text
Remove the scattered clothes
Make it a pose with a big stretch
Express a sense of "Ah, it's over"

Step 6: 4方向の素体画像を作成
参考画像で後方を付けて試したけど満足いく結果は得られず。
There is no ponytail at the back of the head, but there is a side ponytail on the left side.
See attachment
次に行く。正面顔(前に作ったヤツ)を添付することで生成。
The composition is correct, but the hairstyle is different. Please refer to the attachment and correct it.
同じように左右も作成。
I would like the pose to be facing backwards, please refer to the attached image for the back of the head.
Frame the photo facing left so that the whole body is included.
For the hairstyle facing left, refer to the attached image.
Fill the background with a single color.
Use only the hairstyle as a reference; do not change the clothes.
Include the entire body in the frame.
右だけ何故か変なポーズするんで修正。
The hairstyle is not correct, so please check the attached reference image carefully.
Make sure your whole body is in the frame.
Do not change the clothes. Use the reference image only as a reference for the hairstyle.
髪型修正かけて全身入らなくなったんで。
Just like this, put your whole body in, right down to your toes.
んでまっすぐ立ってないので。
Her hairstyle and facial expression are great, but I'd like her to stand at attention, facing straight to the right. Her body is slightly turned to the side and her legs are bent, so she should stand up straight.
完成した素体画像(4方向)
肌色成分多めなのでご注意ください。
まあ右向きがでかいけど、そこまで支障はない、気がする。
Gemに読み込ませて検証
入れてみることにした。プロンプトはサイドポニーテールの記事とほぼ一緒で、頭部だけだと何も出ない可能性があるので、バストアップ4方向と、今回作った素体4枚、斜めからの構図を入れてポニーの位置を認識させることにした。
下半身の服がないので、Gemのプロンプトに以下を追加:
## 5. 出力
ユーザーがシナリオ・ポーズ・衣装を指定します。
キャラクターの外見は常に参考画像に従ってください。
スカートを穿かせる場合、色指定がなければ濃紺です。
テスト1回目
女の子が、左手を腰に当て、右手でピースして前に突き出し、足を大きく開いている得意げなポーズ
背景は一色で塗りつぶし

ん〜髪の色が明るすぎる。あとポニーテールの位置が違う
テスト2回目
女の子が、左手を腰に当て、右手でピースして前に突き出し、足を大きく開いている得意げなポーズ
背景は一色で塗りつぶし
全身を入れる
髪の色Gemの知識の添付画像をよく見て明るくなりすぎないように注意

ポニーの位置が違う。
テスト3回目
女の子が、左手を腰に当て、右手でピースして前に突き出し、足を大きく開いている得意げなポーズ
背景は一色で塗りつぶし
全身を入れる
髪の色Gemの知識の添付画像をよく見て明るくなりすぎないように注意
サイドポニーの位置もよく資料を確認すること

まあいいのかな、1回保存。
テスト4回目
再度生成してみる。
女の子が、左手を腰に当て、右手でピースして前に突き出し、足を大きく開いている得意げなポーズ
背景は一色で塗りつぶし
全身を入れる
髪の色Gemの知識の添付画像をよく見て明るくなりすぎないように注意

頭身がでかい気がする……しかし修正を投げても出てこないのでもうここまでで。
まとめ
結論: そんなに変わらん
不思議なことに、素体画像自体はそんなに頭身が大きくない。最後に出したテスト画像の頭身情報がどこから引っ張られたのかは謎。