AI活用全般

自撮りをSNSに出すのが恥ずかしい時、GPT Image 2で顔を変えずちびキャラ5体と手書き装飾を後乗せするプロンプトと6ステップ

「SNSに手元の写真をそのまま投稿するのは恥ずかしい」を解決する角度として、海外で広がったのが「元写真は1ピクセルも触らず、ちびキャラ5体と白&ピンクのインクで手書き落書きを後乗せする」プロンプトです(公開元: @Ciri_ai、原文URLは参考リンクの末尾に記載)。

仕組みは2026年4月21日リリースのGPT Image 2が持つ画像編集モードで、OpenAI公式が推奨する「Change + Preserve + Constraints」三分割プロンプト構造の応用例です(出典: OpenAI Cookbook)。

この記事ではプロンプト原文を全文掲載し、ジム/旅行/育児/推し活/コーチプロフィールの5用途に骨格を差し替える型と、6ステップの動かし方を引用ベースで整理します。

この記事はSNS発信用に手元の写真を装飾したい個人事業主・コーチ業の方向け(ChatGPT Plusを契約済みで、画像生成を1〜2回触ったことがあれば読めます)。

そもそも「元写真を変えずに装飾だけ後乗せ」って何ができるの?

「自撮りはあるけど、そのままSNSに上げるのは恥ずかしい」。

私はこの感情を持っている読者層が、ジム通い・旅行・育児・推し活・コーチプロフィールの発信者にほぼ共通すると判断しています。

従来のGPT Image系・DALL-E 3でできたのは、写真をパーソナルカラー風に変換したり、古写真復元したり、ヴィンテージ加工したりという「変換系」が中心でした。

元の顔をいじってしまう。

これが恥ずかしさを増幅させていた一因です。

ここに新しい角度として登場したのが@Ciri_aiが公開したプロンプト。

元写真は1ピクセルも触らず、まわりに「ちびキャラ5体+白&ピンクの手書き落書き+モチベーションフレーズ6個」を後乗せする、いわば「画像合成」型の使い方です。

これ、地味にやばい。

「私自身の顔」を出さずに「私っぽさ」だけ出せる構造になっています。

なぜこのプロンプトが今バズった?仕組みの話

OpenAI公式のCookbook(プロンプトガイド)には「Change + Preserve + Constraints」という三分割構造が明記されています。

change only X, keep everything else the same(Xだけ変えて、それ以外は全部同じに保つ)

― この一文を毎反復で繰り返すことで、画像のドリフト(無関係な部分まで勝手に変わる現象)を防ぐ

出典: OpenAI Cookbook 公式プロンプトガイド

@Ciri_aiが公開したプロンプトは、この公式推奨パターンを「装飾を後乗せする」用途で組み直した実践例。

第1文に「Edit the image while keeping the original photo completely unchanged」を置き、Preserveリストに「person, face, body, pose, lighting, background」をベタ打ちしている構造です。

fal.aiのGPT Image 2プロンプトガイドにも、衣装交換の例として同じ構造が示されています。

Preserve her face, facial features, skin tone, body shape, hands, pose, hair, expression, background, camera angle, framing, and lighting exactly. Replace only the clothing.

出典: fal.ai GPT Image 2プロンプトガイド

つまり今回のプロンプトは奇をてらった独自テクではなく、公式が推す型をSNS装飾用途にカスタムした応用パターン。

これが大事なポイントです。

個人的にはここが一番熱い。

テクニックの賞味期限が短くない。

OpenAIが公式に推している構造の上に乗っているので、再現性は残る側の設計。

公式構造に乗っているぶん寿命は長い。

プロンプト原文(英語)と日本語意訳

@Ciri_aiが公開しているプロンプト全文の構造はこうなっています(原文URLは参考リンクの末尾にあり)。

Edit the image while keeping the original photo completely unchanged — including the person, face, body, pose, lighting, and gym background.

Add multiple small, cute chibi-style 'mini versions' of her around the image. Each mini character should have a big head, expressive facial features, and match her hairstyle and outfit.

Place: one cheering with arms raised, one running in running shoes, one drinking from a shaker bottle, one wearing sporty running glasses, one climbing near her leg.

Add hand-drawn doodles and handwritten notes in white and pink ink, in a scrapbook style. Include elements like arrows, stars, hearts, sparkles, and sketchy lines.

Phrases: 'lift strong', 'stronger every rep', 'no pain no gain', 'sweat now, shine later', 'progress over perfection', 'train hard, stay soft'.

Overall tone: fun, energetic, and feminine.

日本語に置くとこう読めます。

  • 第1文(Preserve): 元写真は完全に変えない。人物・顔・体・ポーズ・ライティング・ジム背景まで含めて全部そのまま
  • 第2文(Change): ちびキャラ風のミニ本人を複数体、画像のまわりに配置。頭が大きく、表情豊か、髪型と服装は本人と合わせる
  • 第3文(動作指定): 5体の動きを指定。腕を上げて応援/ランニング/シェイカーで給水/スポーツメガネ/脚にしがみつき
  • 第4文(装飾): 白&ピンクのインクで手書きの落書き・メモ。スクラップブック風。矢印・星・ハート・きらめき・ラフな線
  • 第5文(フレーズ): 6つの英文フレーズを画像内に手書き風で配置
  • 第6文(トーン): 全体のトーンは「楽しく、エネルギッシュで、フェミニン」

骨格は「Preserve(守る)→Change(足す要素)→ Detail(細部の動き・装飾・文字・トーン)」の積み重ね。

これを丸覚えするより、要素ごとに差し替える型として持っておくのが効きます。

5用途への差し替え型:ジム以外でも使えるの?

原文はジム女子用ですが、骨格を整理すると差し替えポイントは4ヶ所しかありません。

用途背景の指定ちび5体の動作フレーズ例装飾の色味
ジムgym background応援/ランニング/シェイカー/メガネ/脚にしがみつきlift strong / no pain no gain白&ピンク
旅行seaside background / temple backgroundカメラ構え/地図広げ/ジェラート/サングラス/スーツケース引きoff duty / wander more白&ターコイズ
育児park background / living room絵本読み/ベビーカー押し/おむつ持ち/ハグ/おもちゃ拾いmama mode / soft & strong白&ピーチ
推し活concert venue / poster wallうちわ振り/カメラ構え/ペンライト/双眼鏡/グッズ抱えoshi forever / stay loud白&推しカラー
コーチプロフoffice / studioノートPC/コーヒー/ヘッドセット/付箋貼り/手帳広げbook a session / show up daily白&ブランドカラー

背景・動作・フレーズ・色味の4枠を埋めるだけで個人用のテンプレが出来上がる構造です。

ここは正直、原文のオリジナリティを尊重しつつもサクッと使い回せる。

実際に動かす6ステップ(公式ガイドが示す手順)

OpenAI公式の画像生成APIガイドとCookbookを再構成すると、ChatGPT上で動かす手順はこの6ステップです(出典: OpenAI画像生成ガイド / OpenAI Cookbook)。

  1. STEP1: 元写真を準備 - 顔がはっきり写っている自撮りまたは全身写真を1枚用意。PNG/JPEG、20MB以下。背景に無関係な人物が写り込んでいないか確認
  2. STEP2: ChatGPTで画像生成チャットを開く - ChatGPT Plus/Pro/Business以上で、左下の「+」から画像をアップロード。プロンプト欄に元写真を添付
  3. STEP3: プロンプトを貼る - 上記原文をそのままコピー。背景・動作・フレーズ・色味の4箇所を個人の用途に差し替える
  4. STEP4: Thinking Modeに切り替え - Plus以上ならThinking Modeを選択。最大8枚一括生成と自己チェックが効くため、装飾要素が多いプロンプトでは精度が上がる(公式仕様)
  5. STEP5: 生成を待つ - Instant Modeなら数十秒、Thinking Modeでは最大2分かかる場合あり(出典: Phygital+ガイド
  6. STEP6: テキストのスペル確認 - 出力画像内の英文フレーズに崩れがないか目視チェック。崩れていたら同じプロンプトで再生成、または「fix the spelling of '○○' to be exactly '○○'」と追加指示で修正反復

引っかかりやすいポイントは2つ。

1つはセッション内で3〜5枚連続生成すると「画像が破壊される」バグ報告があること(出典: OpenAI Community)。

回避策はページリロード。

もう1つは反復編集で1回目88%→3回目で約半数に顔シフトが起きるという報告(出典: Oakgen.ai 500回生成レビュー)。

3回以内で気に入ったものを採用するのが現実的なラインです。

料金は?月いくら払えば動かせる?

ChatGPTのプラン別料金は2026年5月時点でこの通り(出典: ChatGPT料金ページ / Fritz AI料金比較)。

プラン月額画像生成枠Thinking Mode
Free$01日約2〜3枚(非公式・コミュニティ報告)不可
Go$8(米国)Free比10倍程度不可
Plus$20約50枚/3時間ローリング(非公式)
Pro$100〜$200無制限・優先アクセス完全版可
Business$25〜30/ユーザー実質無制限(フェアユース内)

装飾要素の多いこのプロンプトはThinking Mode推奨なので、現実的にはPlus($20/月)が下限ライン。

月3ヶ月SNS運用するなら$60、年間でも$240。

SNS用画像をプロのデザイナーに1枚5,000円で外注するのと比べると、何枚でも作れる経済性は明確で、私の見方ではこの価格差はSNS運用者にとって決定打になります。

ちなみにAPI経由(gpt-image-2エンドポイント)で動かすと、中品質1024×1024で1枚$0.053(出典: WaveSpeedAI料金解説)。

ただし編集リクエスト・再試行で実コストは公表値の2〜3倍に膨らむ可能性あり、と同記事は警告しています。

他者声:賛と批の両方を見る

賛側の評価から。

TexTech上では、gpt-image-2のテキスト精度は約99%の文字レベル精度で勝利した。

Nano Banana 2は複雑なマルチ要素構成でいまだにでたらめなテキストやスクリブル状テキストを生成することがある。

出典: MindWired AI

It works with non-Latin scripts including Japanese, Arabic, and Korean, which Image 1.5 would completely butcher.(日本語・アラビア語・韓国語にも対応。

前世代では完全に破綻していた)

出典: PixVerseレビュー

Image Arenaでリリース12時間以内に1位獲得、2位から+242ポイント差は「反復的改善ではなく世代交代レベル」とMindWired AIは評価しています。

批側の声も並行で押さえます。

Thinking modeは遅い。

90秒以上は2023年のMidjourneyみたいな感じがする。

出典: AI Video Bootcampレビュー

2行サブヘッドの精度は87%に低下。

Dense forest scenes look distinctly synthetic.(自然描写は合成感が残る)

出典: Oakgen.ai 500回生成レビュー

テキスト精度99%は1行コピーの話で、2行以上のサブヘッドだと87%まで落ちる。

今回のプロンプトは短いフレーズ6個なので影響は小さいですが、長い英文をベタ書きさせる用途には向かない、と読み取れます。

個人的には、批側のフィルタ問題も気になるポイント。

Pixnova.aiは「Hyper-aggressiveなコンテンツフィルタが著作権素材プロンプトをブロックすることがある」と報告しています(出典: Pixnovaレビュー)。

推し活用途で「○○ちゃん風うちわ」みたいな指定を入れると弾かれる確率が上がります。

注意点:SNS投稿で事故らないために

  • 肖像権リスク: 写真に本人以外の人物が写り込んでいたら、その人をちびキャラ化するのはNG。元写真の人物確認は最優先(公式利用規約準拠の運用)
  • 著作権キャラ・商標の混入禁止: ちびキャラの服装にディズニー要素やNikeロゴを意図的に入れさせると、知的財産法違反になる可能性(出典: 商用利用ガイド
  • スペルミスは目視チェック: 「Production images still need human review. Check spelling, numbers, brand names, and any small print before publishing.」(本番投稿前の目視チェックは必須・複数ソース共通の推奨)
  • 純粋AI生成は著作権保護を受けにくい: 他者に転用されても止めにくい。「実質的な人間による修正」が著作権保護の条件として推奨される(出典: 商用利用ガイド前掲)
  • 料金は変動する前提で運用: ChatGPTのプラン体系は変更頻度が高い。月初に価格チェックする習慣を

ここを雑にやると一発で炎上案件。先に潰しておきましょう。

FAQ

Q1. 日本人の顔でも崩れずに作れますか?

GPT Image 2はCJK(中国語・日本語・韓国語)テキスト精度が約95〜99%まで向上、多言語対応が大幅改善されたとMindWired AIなど複数ソースが報告しています(出典: MindWired AI)。

一方で、ちびキャラ自体の絵柄は欧米テイスト寄りになる傾向が報告されています。

日本人向けの絵柄に近づけたい場合、プロンプト内に「Japanese chibi style」「J-pop manga aesthetic」を追加する手があります。

最終的には目視チェック前提で運用するのが安全です。

Q2. 生成した画像をInstagramやXに商用利用できますか?

OpenAI利用規約上、ユーザーは生成画像の所有権を保持し、マーケティング・広告・製品設計への商用利用が許容されています(出典: OpenAI利用規約)。

ただし純粋AI生成コンテンツは著作権保護が受けられない可能性があり、他者の転用を止めにくい点に注意。

Shutterstock等の素材販売プラットフォームに出す場合は、各プラットフォームのAIコンテンツポリシーを別途確認してください。

Q3. 6つのフレーズは自由に差し替えていいですか?

骨格を示しているだけなので、フレーズは用途に合わせて差し替えて問題ありません。

テキスト精度を上げるコツとして、フレーズを引用符で囲み、配置場所も指定するのが推奨されています(fal.aiプロンプトガイド準拠)。

短い英文(1〜2語)が最も精度高く、長い文章になるほど崩れやすくなります。

Q4. Nano Banana 2やMidjourneyでも同じことができますか?

同じ「画像編集×テキスト生成」を狙う場合、テキスト精度ではGPT Image 2が優位とされています(GPT Image 2 99% vs Midjourney v8.1の71〜78%)(出典: AI Video Bootcamp)。

ただしフォトリアリズムではNano Banana Pro優位、シネマティック写真表現ではFlux.2 Pro優位という棲み分けがあります。

今回のような「手書き風文字+スクラップブック装飾」用途はテキスト精度が肝なので、現状GPT Image 2が第一候補と私は見ています。

Q5. ChatGPT Freeプランでも動きますか?

FreeプランはInstant Modeのみ、画像生成枠は1日約2〜3枚(コミュニティ報告・OpenAI非公式、出典: gptimg.co)。

装飾要素の多いこのプロンプトはThinking Mode推奨なので、Plus($20/月)以上が現実ライン。

1日2〜3枚で試すだけならFreeでもプロンプト構造の検証はできます。

このページに出てきた言葉

GPT Image 2
OpenAIが2026年4月21日にリリースした画像生成・編集モデル。ChatGPT上では「ChatGPT Images 2.0」名義
画像編集モード
既存の画像をアップロードして、プロンプトで「ここを変えて」と指示する機能。ゼロから絵を作る生成モードと別物
ちびキャラ
頭が大きく体が小さい2〜3頭身のキャラクター描画スタイル。日本のSDキャラと近い
Instant Mode
GPT Image 2の高速生成モード。Freeプランでも使える
Thinking Mode
推論・Webサーチ・最大8枚一括生成・自己チェックが効く高品質モード。ChatGPT Plus以上で利用可
Change + Preserve + Constraints
OpenAI公式が推奨する画像編集プロンプトの三分割構造。「変える要素」「守る要素」「禁止事項」を分けて書く
反復編集
同じセッションで連続して画像を生成し直すこと。3回目以降は元の顔が変わってしまうリスクが上がる
Image Arena
画像生成モデルの品質をユーザー投票でランキングする評価サイト

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , , , ,

← 戻る