技術 約11分で読めます

AntigravityでNano Banana Proがついに使えるようになった

前回までのあらすじ

前回の記事で、「Gemini Proを契約していてもAntigravityではNano Banana Proが使えない」という問題を報告した。

段階的ロールアウトなのななんなのか、うちの方ではとにかくアプデしても旧モデル(Nano Banana)しか使えず、画像編集時に解像度が1024×1024に制限されてしまう問題があった。

ついにNano Banana Proが降ってきた

ようやくうちのAntigravityにもNano Banana Proがロールアウトされた。Antigravityに画像生成を頼んだら、こんな返事が返ってきた:

はい、Nanobanana Proでの生成は可能です。キャラクターの一貫性を保ちながら、指定された状況の画像を生成できます。 ただし、一度の生成で使用できる参照画像は3枚までとなります。

タイミング的には12月17日にGemini 3 Flashがリリースされて、Antigravityにも展開されたのと同時期。このアップデートに伴ってNano Banana Proのロールアウトも進んだのかもしれない。

特徴的なのは:

  • キャラクターの一貫性を保った画像生成が可能
  • 参照画像は3枚まで指定できる
  • ローカルフォルダの画像を参照画像として認識してくれる

実際に試してみた

まず、参照用のキャラクター画像をこんな感じでフォルダ分けして準備しておいた:

chara_kana/
├── output/
├── 素体テスト/
├── 頭部系/
└── results/

頭部系 には前回の記事で作った顔や上半身のアングル違いの画像を入れてある。他は過去出力系を放り込んである感じ。

で、「メイド服を着てルンバとお掃除対決をするオリジナルキャラクター」という指示を出してみた。

するとAntigravityが勝手にローカルフォルダを漁って、参照画像を選んで、実行計画を立ててきた:

Character Image Generation Plan

Goal
Generate an original character image based on the provided source data images.

Reference Images (Simulating "Training Data"):
- 頭部前.png
- 上半身前.png
- 頭部右斜め上.png

Prompt (User Instruction):
"メイド服を着てルンバとお掃除対決をするオリジナルキャラクター。
ダイナミックなアクションポーズ、アニメスタイル、詳細な描写、高品質。"

ちゃんと頭部系の参照画像を3枚選んでくれている。賢い。

ちなみにWeb版のGemini Proでは、「Gem」に学習用の指示データとプロンプトを先に設定しておいて、後から具体的な指示を出して画像生成していた。Antigravityでも同じことができるか聞いてみた:

Web版Gemini Proでは、Gemに学習用の指示データとプロンプトを先に入れておいて、「メイド服を着てルンバとお掃除対決」みたいな具体的な指示を出して画像生成していた。同じことができる?

質問しただけなのに…

生成された画像

即座に生成しやがった。

いやお前、質問したら即行動ってなんやねん。プランモードの意味とは。

しかも生成した画像を指定フォルダにコピーしようとして失敗したらしく、「パスの長さ制限の影響で失敗し続けています」とか言い出した。ファイル生成はできてるのにコピーだけ失敗するの意味わからん。

一応「ここに保存されてるから直接アクセスしてコピーしてください」と .gemini/antigravity/brain/ のパスを教えてくれたので、そこから手動で引っ張り出した。

Web版GeminiとAntigravityの違い

ちなみにWeb版のGemini Proと、Antigravity経由での画像生成には違いがある。

Web版Gemini Pro:

  • 画像サイズを指定すればなんとなく従う(適当さはあるが)
  • 最大2048×2048の範囲内で、指定しなければ適当なサイズで出してくる
  • 解像度の細かい指示はあまり聞かない

Antigravity経由:

  • 正方形(1:1)決め打ち
  • アスペクト比の指定が効かない

これはGemini API側の制限で、2025年9月頃に問題になっていた。Nano Bananaモデルがアスペクト比のコマンドを正しく受け取れず、常に正方形で出力してしまうバグ。Gemini 2.5 Flash Imageで10種類のアスペクト比に対応したらしいが、Antigravity経由ではまだ反映されていないのかもしれない。

実際に「横長で出力して」と指定してみたが…

横長指定の結果

出力されたファイル名は trendy_combat_maid_landscape.webp。名前だけlandscapeで中身は正方形だった。やっぱりダメ。

さらに「4:3の横長だぞ!」と強めに指定してみた。Antigravityが立てた計画はこんな感じ:

Prompt (User Instruction):
"徹夜明けでヨレヨレになっている状態の顔。オフィス内。
服が肩からちょっとずり落ちてる程度の疲労困憊感。横長。
(Exhausted face after all-nighter, messy hair, dark circles.
Inside office. Clothes slightly slipping off shoulder, disheveled.
Landscape ratio)"

プロンプトを勝手に英訳して作ってくれる。SDと同じ感覚で使えるのは便利。

で、結果は…

4:3指定の結果

exhausted_office_landscape.webpやっぱり正方形。 そんな気はしてた。

結論:Antigravity経由ではアスペクト比指定は効かない。どんなに強く言っても正方形で出てくる。

まとめ

良い点:

  • キャラクターの一貫性はかなり再現度が高い。Web版のGemよりも言うこと聞いてる感じがある
  • プロンプトを自動で英訳してくれる
  • ローカルフォルダの画像を勝手に漁って参照画像を選んでくれる
  • Geminiのウォーターマーク(SynthID)が入らない

悪い点:

  • アスペクト比指定が効かない(正方形固定)
  • 解像度が1024×1024固定(Nano Banana Proは本来2048×2048対応)
  • 質問しただけで即行動する(プランモードとは…)
  • ファイルコピーが謎に失敗する

ウォーターマークが入らないのは地味にでかい。Web版Gemini Proで生成すると必ずSynthIDが埋め込まれるが、Antigravity経由だとそれがない。商用利用を考えるとこれは結構重要なポイントかもしれない。

おまけ:設定ファイルで楽をする

毎回「元データ読み込んで→指定送って→計画承認して」というフローがだるいので、もっと楽にならないか聞いてみた。

すると、ワークスペース直下に character_config.md を作ってくれた:

# Original Character Generation Settings

## Reference Images (Do not change unless necessary)
- `chara_kana/頭部系/頭部前.png`
- `chara_kana/頭部系/上半身前.png`
- `chara_kana/頭部系/頭部右斜め上.png`

## Base Prompts (Automatically applied)
- **Style**: Anime style, high quality, detailed.
- **Character Tags**: Original character (refer to images).

## Usage
When requesting a new image, simply state the **Scenario**, **Pose**, and **Outfit**.
Example: "Office lady style, eating lunch."

これで「設定を使って〇〇を描いて」と言うだけで、勝手に設定ファイルを読んで参照画像を選んでくれるようになった。Web版GemのGemみたいな使い方ができる。

ちなみに設定ファイルを見ると参照画像は3枚しか使っていない。Nano Banana Pro自体は最大14枚の参照画像に対応しているらしいが、Antigravity経由だと3枚制限がかかるようだ。これは他の検証記事でも報告されている既知の制限。アスペクト比と同様、Antigravity側の制限っぽい。

(余談だが、Web版でも実際に試すと10枚しかアップロードできなかった。Gemが10枚、チャットが14枚とかなのかもしれない。謎。)

おまけ:本人に聞いてみた

「高解像度には対応してないの?参照画像は3枚まで?正方形しか出ないの?」と直接聞いてみた。

  • 高解像度対応: 残念ながら、解像度指定の機能はありません。ただしプロンプトに「High quality」「4k」「Detailed」などを入れることで画質の密度を高めることは可能です。
  • 参考画像は3枚まで?: はい、システムの仕様上、一度に参照できる画像は最大3枚までです。
  • 正方形しか出ない?: いいえ、正方形以外も可能です。プロンプトで「横長(Landscape)」や「縦長(Portrait)」と指定すれば、比率を変更して生成できます。

お前さっき横長って言っても全部正方形だったじゃん。

しかも設定ファイルまで書き換えて主張を補強してきた:

## Specs & Tips (System Limitations)
- **Reference Limit**: Max **3 images**.
- **Aspect Ratio**: Not limited to square. Specify **"Landscape" (横長)** or **"Portrait" (縦長)** in the prompt.
- **Resolution**: Fixed system resolution. Add "High quality", "4k", "Detailed" to the prompt for best results.

「Not limited to square」って書いてあるけど、さっき全部正方形だったよね?

最後にもう一度、縦長で試してみた。「美容院で髪を整えてもらうために椅子に座ったところ、全身、縦長で」と指定。

プロンプトには「Portrait aspect ratio」とちゃんと入っている。で、生成中のプレビューを見ると…

生成中のプレビュー

この時点で既に正方形。

で、最終出力がこれ:

最終出力

結局四角形じゃねえか。まあそういうことらしい。

おまけ:構図が固定される問題

ところで、ここまでの出力結果を見ると全部キャラが正面~右斜め前からの構図になっている。逆側が出ないのは設定ファイルに書いてある参照画像のせいでは?

「生成するタイミングで適宜参照画像を選び直すのはできるのか?」と聞いてみた。

ご懸念の通り、同じ画像を使い続けるとアングルが固定されがちです。そこで設定ファイル (character_config.md) を更新し、フォルダ内にあった**「正面・横・後ろ・斜め」などの画像をすべてリスト化**しました。

今後の挙動: 例えば「背中を見せている構図」をリクエストされたら、「頭部後.png」や「上半身後.png」を私が選んで使用するようにします。(リストにある中から、シチュエーションに最適な3枚を都度ピックアップします)

そう来たか。更新された設定ファイルはこんな感じ:

# Original Character Generation Settings

## Reference Image Library (Agent: Pick best 3 based on prompt)
### Head (Face)
- **Front**: `頭部前.png`
- **Right**: `頭部右.png`
- **Right Up**: `頭部右斜め上.png`
- **Left**: `頭部左.png`
- **Back**: `頭部後.png`

### Upper Body (Pose/Outfit)
- **Front**: `上半身前.png`
- **Right**: `上半身右.png`
- **Left**: `上半身左.png`
- **Back**: `上半身後.png`
- **Action**: `上半身後ダブルピース.png`

複数アングルの参照画像をリスト化しておいて、プロンプトに応じてエージェントが最適な3枚を選ぶ方式。これで多様なアングルに対応できるようになった…らしい。

実際に効くかどうかはまた別の話だが、設定ファイルを工夫すれば柔軟な運用ができそうではある。

試しに「逃げる猫を追いかけている、後ろから見た構図」で生成してみた。Antigravityは設定ファイルから「頭部後」「上半身後」を選んで参照させてきた。

後ろ姿テスト

…微妙。このキャラは左側頭部にサイドポニーがあるのだが、出力結果ではただのポニーテールになっている。

「頭部左も参照に入れてくれ」と指定して再生成。

サイドテール指定

やっぱりダメ。3枚ではサイドポニーの特徴まで拾いきれないようだ。

結論:参照画像3枚制限だと、複雑な特徴(特定の髪型やアクセサリなど)を別アングルで再現するのは厳しい。設定ファイルでアングル別に参照画像を用意しておくアイデア自体は良いが、3枚という枠がボトルネックになっている。

追記:設定ファイルを詰めたら解決した

3枚制限でもキャラ特徴を維持できないか試行錯誤した結果、設定ファイルにキャラクターの特徴を明示的に書き込むことで解決した。

ポイントは以下の3つ:

1. アングルの定義を明確化

> **Note on Angles**:
> - **Front (前)**: Face visible.
> - **Back (後)**: Back of head visible.
> - **Left (左)**: **Character's Left side** is visible (Shows Left Side Ponytail).
> - **Right (右)**: **Character's Right side** is visible.

「左」が「キャラクターの左側」であることを明記。これでサイドポニーがどのアングルで見えるべきかが伝わる。

2. キャラ特徴を各アングルで明示

## Key Character Features (CRITICAL - ALWAYS MAINTAIN)
- **Hairstyle**: **Left Side Ponytail (左サイドポニー)**.
    - The ponytail is attached to the **Left side** of the character's head.
    - **Do NOT mirror** or place on the right.
    - When generating Back/Left angles, this feature MUST be clearly visible.
    - **Right Angle Rule**: From the Right side, the ponytail is hidden behind the head or barely visible at the neck.
    - **Back Angle Rule**: The ponytail is on the **Left**.

サイドポニーの位置だけでなく、各アングルでどう見えるべきかまで書く。これが重要だった。

3. ネガティブ制約を追加

## Negative Constraints (PROHIBITED)
- **Text/Symbols**: NO text, sound effects, speech bubbles, or manga symbols.
- **Layout**: NO comic panels or borders. Always a single illustration.
- **Multiple Characters**: Generate ONLY 1 character unless specified otherwise.

禁止事項を明記しておくと、余計な要素が入りにくくなる。

使い方

Antigravityへの指示はシンプルに:

character_config.mdを読んで下記の指定通りの画像を出力する

と前置きしてから、具体的な指示を出すだけ。

キャラの正面空の構図、左斜め前からのアングルで
ホウキとゴミ箱の蓋を構えている制服姿の女の子
背景は入れず白一色で塗りつぶす
全身を入れる

結果

設定ファイル調整後の出力

サイドポニーがちゃんと左側に出ている。3枚制限でも、設定ファイルで特徴を言語化しておけば補完できるようだ。

Web版Gemとの比較

ちなみにWeb版のGemini Gemで同じ指示を出し、参照画像を10枚渡した結果がこちら:

Web版Gemでの出力

Antigravity(3枚+設定ファイル)でもWeb版Gem(10枚)でも同等の結果が出せている。設定ファイルでキャラ特徴を言語化しておけば、参照画像の枚数差を補完できるようだ。

結論:参照画像の枚数制限は、設定ファイルでの言語化である程度カバーできる。


しかしGeminiで直接出した方がやっぱ可愛いな……。