技術 約5分で読めます

Gemini Gemsの画像参照が突然壊れたので別のAIに祈って直した

発端

昨日まで完璧に動いていたGemini Gemのキャラクター生成が、突然崩壊した。
同じ参照画像、同じプロンプトなのに、全く別人が出てくる。

元のGemプロンプト(要約)

- 参照画像10枚を添付(頭部・上半身の各アングル)
- 髪型:左サイドポニーテール、アホ毛あり、水色シュシュ
- 顔:参照画像の顔に従う
- 禁止:文字、コマ割り、複数キャラ

シンプルな構成で、昨日までは問題なく動いていた。

参照画像

これが本来のキャラクター「かなちゃん」。参照画像セットはこちらの記事で紹介している。

昨日まではこんな感じで、「メイド服でルンバとバトルして」だけで完璧に出ていた。

昨日までの出力例

髪色、アホ毛、シュシュ、目の形、全部合ってる。


症状

ところが今日、同じGemで「徹夜明けで疲れているところ」を生成したらこうなった。

崩壊例1

……ん?なんか違くない?
作り直してみる。

崩壊例2

崩壊例3

全部おかしい。

徹夜で疲れてるのはいいけど、キャラが違う

何もかも違う:

  • 髪色:オレンジブラウン → ダークブラウン
  • アホ毛:消失
  • シュシュ:消失
  • 目の形:別人
  • 全体的に「よくあるアニメキャラ」になってる

これはシチュエーションの問題ではない。参照画像を見ていない。


Claudeに相談

ここでClaudeに相談してみた。プロンプトを見せて、何が問題か聞いてみる。

Claudeからの指摘:

  • 髪色を「オレンジブラウン」と書くと、Geminiが「オレンジ」に引っ張られる可能性がある
  • 「茶色ベース、わずかにオレンジみ」という書き方の方が安定するかも
  • 禁止事項をもっと具体的にリスト化した方がいい

アドバイスを元にプロンプトを調整してカラー版で生成してみる。

調整後1

……ダメだ。

調整後2

いやひどいなこれは。

プロンプト調整だけでは根本的に解決しない。別のアプローチが必要。


切り分け

参照画像の問題?

10枚の参照画像セットを確認したが、全て一貫性があり問題なし。角度ごとのシュシュの見え方なども論理的に正しい。

モデルの比較

チャット側で「Gemの指示に従って」と追加指示を入れつつ、生成モードを変えて試してみた。

Pro(通常)の出力:

Pro出力

髪色がオレンジすぎる。

思考モードの出力:

思考モード出力

Proよりマシだが、まだオレンジが強い。

高速モード(Flash)の出力:

高速モード出力

一番マシ。Pro < 思考モード < 高速モード という逆転現象が起きていた。


解決の糸口

ふと、別のGem(別キャラ用)では同じ状況でもキャラクターを維持できていることに気づいた。

別Gemの出力

このGemのプロンプト構造を分析した結果、以下の違いがあった:

  1. 「プロの〇〇です」というロール設定
  2. 「完全に忠実に再現」という強い表現
  3. 具体的な禁止事項リスト

プロンプト改訂

別Gemの構造を参考に、プロンプトを書き直した。
まずモノクロGemで試す。色合いがない分、生成が楽なんじゃないかという推測。

モノクロで成功

いけた。じゃあカラーでも試してみよう。

改訂前(要約)

参照画像を見てキャラクターを生成してください。
髪型は左サイドポニーテール、アホ毛あり、シュシュあり。

改訂後

あなたはプロのアニメキャラクターイラストレーターです。ユーザーの要望に応じ、添付された参考画像(Reference Images)のキャラクターデザインを**完全に忠実に再現**した画像を生成してください。

## 1. キャラクター再現(最優先事項)
参考画像のキャラクター「かなちゃん」を**同一人物として認識できるレベル**で再現すること。
「似ている」ではなく「同じ」を目指してください。

### 髪色(厳守)
- ライトブラウン(明るい茶色)ベース
- わずかにオレンジみを帯びた茶色
- 彩度は低め
- ✗ 鮮やかなオレンジ色は不可
- ✗ ダークブラウン(暗い茶色)は不可
- ✗ 金髪・黄色系は不可

### 髪型
- 左サイドポニーテール
- 頭頂部にアホ毛(必須)
- 水色のシュシュ(右側面アングル以外は必須)

### 顔
- 目:大きく丸い琥珀色、参考画像と同じ形状
- 顔の造形:参考画像を完全にコピー、変更不可

## 4. 禁止事項
- 髪色の変更(暗く/鮮やかにしすぎ)
- 髪型の変更(ツインテール、右サイドポニー等)
- シュシュ・アホ毛の省略
- 目の形状変更
- リアル調・西洋風スタイル
- 文字、吹き出し、効果音
- 複数キャラクター

ポイント:

  • 髪色の記述から「オレンジ」という単語を極力排除(Geminiがオレンジに引っ張られるため)
  • 「茶色ベース」「彩度低め」で方向性を明確に
  • 禁止事項を具体的にリスト化

結果

改訂後、髪色の細かい調整(「オレンジ」という単語を避ける等)を経て、安定してキャラクターが出るようになった。

成功例1

成功例2

成功例3

髪色、アホ毛、シュシュ、目の形、全て維持されている。複雑なシチュエーションでも崩れなくなった。
そして当初やりたかった「徹夜明け」のシチュエーションも出せるようになった。

徹夜明け成功

疲れてないのも出してみた

かわいいポーズ

ちゃんとかなちゃんだ。
神に祈ればちゃんと出てくるんだ!


まとめ

原因(推測)

Gemini側のサイレントアップデート……なのかな?
画像参照の重み付けが変わった可能性が高い。

同じプロンプトで前日まで出てて、精度も良かったのに急に変わったので原因がそれくらいしかわからない。

対策

  1. プロンプト構造の変更

    • 「プロの〇〇です」というロール設定
    • 「完全に忠実に再現」という強い表現
    • 具体的な禁止事項リスト
  2. 髪色の記述方法

    • 「オレンジブラウン」ではなく「茶色ベース、わずかにオレンジみ」
    • 禁止色を明示
  3. モデル選択

    • Proより高速モード(Flash)の方が画像参照精度が高い場合がある

教訓

  • 生成AIは突然挙動が変わることがある
  • 「昨日まで動いてた」は何の保証にもならない
  • プロンプトの構造・言い回しで精度が大きく変わる
  • 上手くいってる別のプロンプトを参考にするのは有効

※この記事の画像は全てGeminiから出力した撮って出しで貼っています。
特に加工はしておりません。


落ち

「神様! 私はGeminiにちょっとエッチな画像を作らせようとしていました!」
「あ~はいはい、祈れば神はあなたの事をお許しになりますよ~」