自撮り1枚から4Kのプロフィール画像を量産できる新モデルが、
2026年2月にGeminiへ入りました。
Nano Banana 2(Gemini 3.1 Flash Image)です。
東京の30分プロ撮影が¥55,000〜のところ、
Gemini APIなら4K画像10枚で約230円。
240倍のコスト差です。
第三者の独立レビューでは「Nano Banana Proと見分けられない」レベルまで到達しているという数字も出ました。
この記事はセルフブランディング素材のコストを下げたい個人事業主・小規模スタートアップ運営者向け(プロンプト操作の経験がなくても読めます)。
そもそもNano Banana 2って何のモデル?
Nano Banana 2は、
Google DeepMindが2026年2月26日にリリースした画像生成モデルの愛称です。
正式名称はGemini 3.1 Flash Imageで、
Gemini API(Googleが開発者向けに公開している、
AIをアプリに組み込むための窓口)からはモデルID gemini-3.1-flash-image-preview で呼び出せます。
初代Nano Banana(Gemini 2.5 Flash Image)の後継で、
解像度・キャラクターの一貫性・人物リアリズムが大きく強化されました。
経済軸では240倍のコスト差、
独立検証ではブラインドテスト52%判別率という数字が出ている。
これが効きます。
主な変化を表で1枚に並べておきます。
| 項目 | 初代 Nano Banana | Nano Banana 2 |
|---|---|---|
| 最大解像度 | 2K相当 | 4K(4096px)対応 |
| キャラ一貫性 | 基本レベル | 最大5キャラ・14オブジェクト |
| Eloスコア(Arena.ai系) | Pro が 1217 | 1262(Pro超え) |
| 生成速度 | 数秒 | 約15〜20秒(公式記載) |
| リリース | 2025年 | 2026年2月26日 |
Google DeepMind公式の製品ページでは、
生成速度として「約15〜20秒」と明記されています(出典: DeepMind公式)。
なぜ個人事業主のセルフブランディングで注目しているのか
個人的に効くと感じたのは、
プロフィール画像・LP用ペルソナ画像・採用ページ素材を「自撮り1枚から4K量産できる」という経済軸です。
具体的にいくらズレるかを並べます。
| 方法 | 1セットあたりの費用目安 | 納期 |
|---|---|---|
| 東京のプロカメラマン30分セッション | ¥55,000〜(編集済み50枚以上込み) | 1〜3週間 |
| 東京の60分セッション | ¥85,000〜 | 1〜3週間 |
| Gemini API 4K画像10枚(スタンダード) | $1.51(約230円) | 数分 |
| Gemini API 4K画像10枚(バッチ半額枠) | $0.76(約115円) | 数十分 |
| Google AI Plus(コンシューマー向け) | ¥1,200/月(初回2ヶ月¥600) | 即時 |
東京プロ撮影の¥55,000〜は、
東京の写真家「Ippei and Janine Photography」の30分ソロセッション公式料金です(出典: Ippei and Janine Photography 公式)。
¥55,000 vs 230円。
約240倍のコスト差がここに乗ります。
正直、この差は無視できない。
もうひとつ無視できないのが、
第三者の独立レビューが出した「見分けられない」という数字です。
独立レビューサイト nanowow.ai が、
Nano Banana 2(NB2)と上位モデル Nano Banana Pro の生成画像を各25枚・合計50枚用意し、
20人のレビュアーに「どちらがどのモデルか」を当てさせたところ、
平均正解率は52%(ランダムなコイン投げとほぼ同等)。
シンプル〜中程度のシーン(ポートレート・商品写真)では、
上位Proと下位NB2の品質差は実質ゼロに近いという結果でした。出典: nanowow.ai レビュー(Googleの公式数字ではなく、
第三者による独立テスト)
52%という数字を直接Googleが言ったわけではないので、
あくまでnanowow.ai側の検証として読みます。
とはいえ、
上位モデルの半額帯(API比較で $67/1,000枚 vs $134/1,000枚)でこの近似度なら、
ポートレート用途に絞った個人事業主にとっては十分という見方が立ちます。
Nano Banana 2の料金プランはどう選ぶ?
選び方は「APIで自動化したいか」「Geminiアプリでぽちぽち作りたいか」でほぼ決まります。
API(開発者向け・従量課金)
1枚ごとの単価が小さく、
自動化スクリプトに組み込めるルートです。
Gemini API公式料金ページの数字(出典: Gemini API Pricing)。
| 解像度 | スタンダード/枚 | バッチ/枚(半額帯) |
|---|---|---|
| 0.5K(512px) | $0.045 | $0.022 |
| 1K(1024px) | $0.067 | $0.034 |
| 2K(2048px) | $0.101 | $0.050 |
| 4K(4096px) | $0.151 | $0.076 |
無料ティアは画像生成「Not available」(非対応)。
試したいだけでも有料登録が要ります。
コンシューマー向けサブスクリプション(日本円・公式)
Geminiアプリ(gemini.google.com)で画像をぽちぽち作るなら、
こちらのプランが選択肢になります。
プラン名はGemini公式サブスクリプションページに準拠(出典: Gemini Subscriptions 公式)。
| プラン | 月額(税込・2026年4月時点) | 画像生成の扱い |
|---|---|---|
| 無料プラン | ¥0 | 画像生成あり(具体制限の公式明示なし) |
| Google AI Plus | ¥1,200/月(初回2ヶ月¥600) | Nano Banana Pro による画像生成 |
| Google AI Pro | ¥2,900/月 | Nano Banana Pro をより多く活用 |
| Google AI Ultra | ¥36,400/月(初回3ヶ月¥18,000) | 最高ティア全機能 |
ちなみに「Gemini Advanced」というプラン名は、
2026年3月に「Google AI Pro」へ改称済みです。
古い記事で「Gemini Advanced」と書いてあったらこの新名称に置き換えて読むのが正解。
個人事業主として現実的に効くのは、
まずGoogle AI Plus(¥1,200/月)でアプリから10〜20枚試して品質を確かめる→継続するならAPIで自動化のステップが現実的です。
自撮り1枚からプロフィール素材を量産する手順は?
「自撮り1枚 → 4K高品質ポートレート × 用途別バリエ」の再現ステップを書きます。
Gemini API公式ドキュメントとモデルカードの記述を再構成した手順です(出典: Gemini API 画像生成ドキュメント / DeepMind モデルカード)。
STEP1. 自撮り素材を用意する(前提)
正面・斜め45度・横顔の3カットを、
自然光が当たる場所でスマホで撮ります。
背景はシンプルなほど良い。
顔がはっきり写っている1024px以上の画像が1枚あれば最低限スタートできます。
STEP2. Gemini APIキーを取得して有料ティアを有効化する
Google AI Studio(aistudio.google.com)にログインし、
APIキーを発行。
画像生成は無料ティア非対応のため、
課金設定が必須です。
最初は数百円のクレジットで止めても4K画像を数十枚試せます。
STEP3. 1枚目の生成プロンプトを投げる
モデルIDに gemini-3.1-flash-image-preview を指定し、
参照画像として自撮りをアップ。
プロンプト例:
「以下の参照画像と同じ人物で、
白シャツ・グレージャケット着用、
自然光のオフィス、
上半身、
4K、
フォトリアル、
LinkedInプロフィール用」
解像度は4K($0.151/枚 = 約23円)を指定。
生成は15〜20秒で返ります。
STEP4. キャラ一貫性を効かせて5シーン量産する
Nano Banana 2は同一プロンプトセッションで最大5キャラクター・14オブジェクトの一貫性を維持できます(公式モデルカード記載)。
STEP3で生成した1枚目をベースに、
シーンだけ差し替えて4枚追加します。
具体例:
- シーン1: スーツ着用・講演中・正面(イベント告知用)
- シーン2: カジュアルニット・カフェのテーブル・横顔(ブログヘッダー用)
- シーン3: Tシャツ・ホワイトボード前・笑顔(採用ページ用)
- シーン4: ジャケット・デスク前・PCに向かう斜め45度(メディア取材用)
- シーン5: 黒シャツ・グレー背景・正面真顔(名刺・証明写真用)
キャラ一貫性こそNB2の効きどころ。
1人で5用途分の素材を、
合計5枚 × $0.151 = 約115円で作れる計算になります。
プロ撮影¥55,000とは桁が3つ違う。
STEP5. バッチティアで半額にする
「即時に欲しいわけではない」案件はバッチAPIに流すと半額(4K $0.076/枚)になります。
1人分の5シーン量産なら約58円。
月10人分のペルソナ素材を作っても¥600以下です。
STEP6. SynthID不可視透かしの存在を確認する
生成画像にはSynthID(Google DeepMindの不可視透かし。
AI生成の事実をピクセルに埋め込み、
見た目には影響しない技術)が自動付与されます。
Geminiアプリ側にSynthID Detectorが2026年に提供開始済みなので、
第三者が「これAI生成?」と検証可能です(出典: Gemini SynthID 公式)。
隠して使うのは避ける前提で素材化します。
Nano Banana 2でこんな画像が作れる?プロンプト&作例で見る用途別ギャラリー
ここまで「自撮り1枚→5シーン量産」を中心に書いてきましたが、
Nano Banana 2の用途はそれだけで終わりません。
今回Aisola LabがGemini API経由で実際に生成した5パターンを、
使ったプロンプトとセットで並べます。
「自分の事業ならここに刺さりそう」のヒントとして見てください。
なお、
プロンプトは英語で書いた方が品質が一段上がりました。
日本語でも動きますが、
照明・レンズ・色味の指定は英語の方が解釈精度が高い印象です。
① プロフィール5シーン量産|LinkedIn・採用ページ・登壇資料
キャラ一貫性こそNB2の効きどころ。
使ったプロンプト(英語):
A 5-panel horizontal grid layout, 16:9 aspect ratio, 4K photorealistic. The same Japanese woman in her early 30s appears in all 5 panels with perfect facial consistency.
Panel 1 (leftmost): Business suit, mid-speech at a corporate event, frontal angle, soft stage lighting.
Panel 2: Casual knit sweater, sitting at a cafe table, side profile, warm window light, shallow depth of field.
Panel 3: White t-shirt, standing in front of a whiteboard with marker in hand, genuine smile, natural office light.
Panel 4: Navy jacket, at a clean desk facing a laptop, 45-degree angle, magazine editorial lighting.
Panel 5 (rightmost): Black collared shirt, plain gray seamless backdrop, frontal neutral expression, even studio lighting.
Each panel has a thin subtle white divider between them. No text, no logos, no watermarks. Sharp focus on faces. Shot on 50mm lens equivalent, professional headshot quality.
② LP用ヒーロー画像|デスク14オブジェクト一貫性のフル証明
LPヒーロー画像の代替として即使える。
14オブジェクト並べても崩れない。
これは効きます。
使ったプロンプト(英語):
A wide horizontal hero image for a solo entrepreneur's landing page, 16:9 aspect ratio, 4K photorealistic.
A Japanese woman in her mid 30s sits at a wide light-oak desk, slightly off-center to the right. She wears a cream knit sweater, mid-laugh while looking at a laptop screen. Shoulder-length wavy brown hair.
On the desk surface: an open silver laptop, a ceramic coffee mug with steam, a small succulent in a white pot, an open hardcover notebook with a brass pen, folded tortoiseshell glasses, a smartphone face down, a stack of three business books, a brass desk lamp, leather headphones folded, a glass tumbler with water and lemon slice, a small white card holder, a tape dispenser, a wooden ruler, a tiny bonsai plant.
Behind her: soft-focused window with sheer white curtains, one framed line-art print on the wall. Cream/wood/soft-green palette. Shot on 35mm equivalent, shallow depth of field on her face. No text, no logos, no brand names.
③ 商品スタイリング写真|EC・物販・noteカバー素材
ノート/万年筆/ラベンダー/くるみ/封蝋付き封筒を配置した俯瞰フラットレイ。
Kinfolk誌風のEC・物販素材として即使える。
プロのフードフォト(5万円〜)が約23円で出る。
使ったプロンプト(英語):
A clean overhead flat-lay product photograph, square or 4:3 aspect ratio, 4K photorealistic, soft natural daylight from above.
Centered: a single matte black ceramic coffee mug on a textured beige linen tablecloth. Around it (carefully composed):
- A small open Moleskine-style notebook with a fountain pen on top (upper-left)
- Three roasted coffee beans scattered (lower-right)
- A folded white linen napkin (upper-right)
- A small brass spoon (left of the mug)
- A sprig of dried lavender (lower-left)
- A wax-sealed paper envelope (top-center)
- Two unshelled walnuts (lower-center)
Color palette: warm beige, dark brown, brass, cream. Soft shadow under the mug. Editorial cookbook / Kinfolk magazine style. No text, no logos, no brand names visible.
④ ブログ・noteヘッダー画像|横長シネマティックシーン
ブログ・noteアイキャッチ・ストックフォト購入(1枚3,000〜10,000円)の代替として即流用できるシネマティック横長。
映画的な空気感まで一発で出る。
使ったプロンプト(英語):
A wide horizontal lifestyle photo for a blog header, 16:9 aspect ratio, 4K photorealistic, golden-hour natural light.
A Japanese man in his early 40s walking thoughtfully along a quiet Tokyo backstreet at dusk. He wears a charcoal long coat over a black turtleneck, hands in pockets, looking slightly down. Short black hair, neutral expression.
Background: narrow street with low-rise traditional wooden buildings on both sides, warm orange paper-lantern lights starting to glow, soft blur on the deep background. The street is wet from recent rain, reflecting the lanterns. Cinematic color grade: warm highlights, cool teal shadows.
Framing: subject in left third of frame, vanishing point in right third. Shot on 50mm equivalent, shallow depth of field. No text, no people in background, no brand signs visible.
⑤ 証明写真・名刺・SNSアイコン|85mm相当のフォーマルヘッドショット
写真館の証明写真撮影3,000〜8,000円相当が約23円で再現できる。
SNSアイコン・名刺・履歴書すべて流用可能。
履歴書用にも普通に通る品質。
使ったプロンプト(英語):
A professional formal headshot, square 1:1 aspect ratio, 4K photorealistic, even studio lighting.
A Japanese woman in her late 20s, head and shoulders only. She wears a crisp white collared shirt under a navy blazer. Neat shoulder-length straight black hair, light natural makeup, calm composed expression with a very subtle smile. Looking directly at the camera.
Background: solid medium gray seamless backdrop, professionally lit with soft key light from upper-left and gentle fill from the right. No harsh shadows. Sharp focus on the eyes. Color palette: navy, white, gray, natural skin tones. Shot on 85mm equivalent lens, perfect for ID photo / business card / LinkedIn icon use. No text, no logos, no jewelry visible.
5用途とも実コストは1枚$0.151(約23円)。
プロ撮影や写真館に頼んだ場合の数千〜数万円と比べて、
桁が3つ違う節約になります。
バッチAPIに流せば半額の$0.076。
月100枚生成しても$15.10(約2,300円)に収まる計算です。
商用利用と業界別の注意点はどこまで気にする必要がある?
商用利用そのものは、
Gemini APIの利用規約上は基本的にOK。
Googleは生成画像に対して所有権を主張しないと明示しています(出典: Vertex AI Responsible AI)。
ただし、業界によって踏むべき地雷が変わります。
共通NG(モデル側でブロックされる)
Google DeepMindは2026年2月のNano Banana 2リリース時点で、
以下をモデルアーキテクチャレベルでブロックすると公式に書いています。
- 実在の有名人・公人のフォトリアル生成
- フェイススワップ(他人の顔を別人に貼り替え)
- 実在人物の衣装スワップ
- 金融操作目的の画像生成
該当するとエラーコード29310472または39322892が返ります(出典: Vertex AI Responsible AI)。
「他人の顔写真を勝手にアップ」は技術的にも規約的にも完全アウト。
業界別の現実的な注意
| 業界・用途 | 気にすべきポイント |
|---|---|
| 医療系LP・採用ページ | AI生成肖像を「実際の医師」のように見せる演出は誇大広告リスク。架空ペルソナである表記を添える運用が無難 |
| 金融・投資系LP | 顧客事例風の演出は景品表示法・金融商品取引法の「優良誤認」に触れうる。実在の顧客でないなら明示 |
| 採用・HR向け素材 | AI生成ペルソナを採用選考のジャッジに使うのは差別リスク。社外向けPR素材に限定する |
| 個人プロフィール(自撮り加工) | 自分の顔をベースにした生成は公式に明示の禁止規定なし。SynthID透かしが入ることを前提に運用する |
日本の法律面では、
消費者庁による「AI生成画像の表示義務」は2026年4月時点で未制定です(出典: 文化庁 AI 関連英語版概要)。
とはいえ、
AI生成と分からないままLPに載せるのは個人的には筋が悪いと感じています。
フッターに小さく「画像はAI生成」と添えるくらいが無難。
競合モデルとどう違う?選び分けの目安は?
テキスト→画像のArena.ai系リーダーボード(出典: Artificial Analysis Leaderboard)の数字で並べると、
こんな順です。
| 順位 | モデル | Eloスコア | API価格目安(1K解像度・1,000枚) |
|---|---|---|---|
| 1位 | GPT Image 2(high) | 1332 | $133 |
| 2位 | GPT Image 1.5(high) | 1271 | — |
| 3位 | Nano Banana 2 | 1262 | $67 |
| 4位 | Nano Banana Pro | 1217 | $134 |
| 5位 | Seedream 4.0 | 1204 | — |
ポイントは3位のNano Banana 2が、
4位の上位モデルNano Banana Proを抜いていることと、
1位GPT Image 2の半額帯であることです。
用途で割り切ると4軸に分かれます。
- 9パネル絵コンテ・整理されたグラフィックデザイン・テキスト混じり画像 → GPT Image 2の方が強いという第三者評価
- フォトリアルな人物・自撮りベースの量産・速度・コスト → Nano Banana 2が刺さる帯
- 幻想的・アート寄りの画風 → Midjourney v7の領域
- 複雑なシーン・複数被写体・精細な照明 → Nano Banana Pro(ただしNB2の倍額)
個人事業主のセルフブランディング素材に絞るなら、
Nano Banana 2が一番しっくりくる帯。
既知の弱点と踏みやすい地雷は?
公式モデルカードに書かれている既知の制限を、
運用視点で見えるところに置いておきます(出典: Gemini 3.1 Flash Image モデルカード)。
- 小さいテキストの描画が不完全(1Kではぼやける。看板・名刺風の細かい文字を入れるなら4K指定)
- キャラ一貫性は完璧ではない(参照画像と出力で微妙にブレる。最終素材は人間目で必ずチェック)
- ラフスケッチ(落書き)からの編集指示は弱い(テキスト指示の方が安定)
- 方向(左右)の指示で混乱が出るケースあり
- コード実行・関数呼び出し・キャッシュ・音声生成・Live APIには非対応
地味に効くのが「キャラ一貫性が完璧ではない」点です。
同じ人物のはずが、
生成のたびに目元の印象が微妙に違う、
というケースは想定しておく方が安全。
私が運用するなら、
5シーン生成のあと「目元と肌質が一致しているカットだけ採用」というレビュー工程を1段挟みます。
FAQ
Q1. Nano Banana 2と「Nano Banana Pro」はどっちを使うべき?
個人事業主のプロフィール写真・LP用ペルソナ・名刺用素材レベルなら、
Nano Banana 2で十分という見方が立ちます。
nanowow.aiの独立ブラインドテストで「Proと品質差を見分けられない」結果が出ており、
API単価は約半額です。
複雑なシーン(複数人物・凝った照明・建築物の細部)が要るときだけProに上げる、
で実用的です。
Q2. 自分の顔写真をアップロードして加工するのは規約上OK?
Gemini APIの利用規約上、
自分の顔写真をベースに加工する行為への明示的な禁止規定は2026年4月時点で見当たりません。
一方で「他人の顔の無断使用」「実在の有名人のフォトリアル生成」「フェイススワップ」はモデル側でブロックされます。
自分の顔を入力する形なら基本的に許容範囲ですが、
SynthID不可視透かしが入ることは前提に運用してください。
Q3. 4K画像10枚で本当に約230円で済む?
Gemini API公式料金(スタンダードティア)で4K $0.151/枚 × 10枚 = $1.51(約230円)の計算です。
バッチティアなら4K $0.076/枚 × 10枚 = $0.76(約115円)まで下がります。
ただし無料ティアでは画像生成自体が「Not available」なので、
最低限の課金設定は必要です。
Q4. 商用利用でAI生成と表示する義務はある?
2026年4月時点の日本では、
消費者庁による「AI生成画像の表示義務」は法令化されていません。
Gemini APIの利用規約も表示義務は要求していません。
ただしSynthID不可視透かしはGoogle側で技術的に検出可能なので、
隠して使うメリットは薄いです。
LP・SNS素材であれば「AI生成」のクレジットを小さく添える運用が個人的にはおすすめです。
Q5. 生成にどれくらい時間がかかる?
Google DeepMind公式の製品ページによると、
生成速度は約15〜20秒。
バッチティア利用時は数十分〜のキューに入る分、
単価が半額になります。
このページに出てきた言葉
- Gemini API
- Googleの生成AI機能を、自分のアプリ・スクリプトから呼び出せるようにする窓口。従量課金制。
- Vertex AI
- Google Cloudが提供するAI開発プラットフォーム。Gemini系モデルを企業向け環境で動かす入り口。
- SynthID
- Google DeepMindの不可視透かし技術。AI生成画像のピクセルに埋め込まれ、見た目には影響しない。
- Eloスコア
- もとはチェスのレーティング指標。画像モデルの優劣をユーザー投票ベースで数値化したもの。
- Imagen
- Google系列の画像生成モデル群の名称。Nano Banana 2はこの系統の最新世代に位置する。
- アスペクト比
- 画像の縦横比。Nano Banana 2は14種類(1:1、9:16、16:9など)に対応。
- バッチティア
- 「すぐじゃなくていい」処理をまとめて流すと単価が半額になるAPIプラン。
- グラウンディング
- AIの出力を最新のWeb情報や公式データに紐づける機能。Nano Banana 2はリアルタイムWebサーチと統合可能。
- LP
- ランディングページ。サービス紹介の1枚ページ。
参考リンク
- Gemini 3.1 Flash Image モデルカード(DeepMind公式): https://deepmind.google/models/model-cards/gemini-3-1-flash-image/
- Nano Banana 2 製品ページ(DeepMind公式): https://deepmind.google/models/gemini-image/flash/
- Gemini API 料金(公式): https://ai.google.dev/gemini-api/docs/pricing
- Gemini API 画像生成ドキュメント: https://ai.google.dev/gemini-api/docs/image-generation
- Gemini API モデル仕様(3.1 Flash Image Preview): https://ai.google.dev/gemini-api/docs/models/gemini-3.1-flash-image-preview
- Gemini Subscriptions(日本語公式・料金プラン): https://gemini.google/subscriptions/
- Vertex AI Gemini Image Responsible AI(公式安全ポリシー): https://docs.cloud.google.com/vertex-ai/generative-ai/docs/multimodal/gemini-image-responsible-ai
- SynthID 透かし(Gemini Apps公式): https://support.google.com/gemini/answer/16722517?hl=en
- Artificial Analysis テキスト→画像リーダーボード: https://artificialanalysis.ai/image/leaderboard/text-to-image
- nanowow.ai レビュー(52%ブラインドテスト出典・第三者独立検証): https://nanowow.ai/nano-banana-2-review
- Ippei and Janine Photography(東京プロ撮影¥55,000〜の実勢): https://ippei-janine.com/services-and-prices/
- 文化庁 著作権 AI 関連英語版概要: https://www.bunka.go.jp/english/policy/copyright/pdf/94055801_01.pdf
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。