AI活用全般

GPT Image 2の世界観イラストを自分用に|公式プロンプトを5箇所だけ書き換える手順

GPT Image 2(OpenAIが2026年4月21日に出した最新画像モデル)で、
ブランドの世界観を1枚にまとめる方法を整理する。

主役は@LexnLinが公開した"Moss Radio"プロンプト。
差し替えるのは5箇所だけ。

ロゴの完全再現は苦手で、
PhotoshopやFigmaで後乗せする前提で読んでほしい。

この記事は個人ブランドや小さな店、
フリーランス案件の世界観を1枚で作りたい非デザイナー
向け(HTMLやPhotoshopを触ったことがなくても読めます)。

GPT Image 2とは何か

OpenAIが2026年4月21日にリリースした新しい画像生成モデル。
モデル名はgpt-image-2(ChatGPT上では「ChatGPT Images 2.0」と呼ばれる)。
前モデルのDALL-E 2/3は2026年5月12日で廃止予定なので、
ここから先はこれが標準になる。

公式アナウンスは要点を短くこう書いている。

"designed for complex visual tasks and produces precise, usable images with stronger editing, better layouts, improved text rendering, and more reliable instruction-following"

(出典: OpenAI Developer Community 公式アナウンス

ざっくり訳すと「複雑な視覚タスク向け、
編集・レイアウト・文字描画・指示追従が前モデルより強い」。
私がここで一番効くと感じたのはレイアウトと文字描画
SNS用の宣材を1枚で作りたいときに、
これまで文字とレイアウトで毎回ハマっていた領域だから。

そこが効いてくる。

「モジュラーグリッド」というワードの正体

X上で拡散した@LexnLinのプロンプトに「modular grid(モジュラーグリッド)」という指定が入っている。
これはOpenAI公式のワードではない。
公式は同じ機能領域を"structured generation (diagrams, infographics, charts, posters, comics)"と表現している(出典: OpenAI Developer Community)。

つまり「モジュラーグリッド」はプロンプト側で指定するデザイン用語。
AI側に元々その呼び方があるわけではない。
ここを混同して書いている解説が日本語圏に既に出回っているけれど、
出典を当たると誤解だと分かる。

名前の出所はユーザー側。これは押さえておきたい。

@LexnLin "Moss Radio"プロンプトの全文

公開クリエイター@LexnLinがGitHubギャラリー経由で公開し、
GitHub wuyoscar/gpt_image_2_skillでクレジット付き収録されているプロンプトがこちら。
「モスラジオ」という架空のブランドを1枚のブランドアイデンティティ(ブランドの見た目を統一する設計図)として出力させる構造。

Create a square high-end brand identity showcase board for a fictional brand called "Moss Radio". The brand should feel analog, cultured, warm, tactile, and design-forward. It operates in independent audio hardware and café-retail and should appeal to creative professionals and music obsessives. The overall mood should be nostalgic but modern. Design a polished modular grid of multiple tiles, each showing a different application of one cohesive visual identity system. Include logo explorations, wordmarks, app icon variations, editorial posters, product cards, landing page fragments, packaging concepts, typography specimens, interface snippets, color palette presentations, sticker systems, patterns, branded mockups, and small motion-inspired compositions. Use Swiss-inspired typography, rounded industrial shapes, and a moss green / parchment / charcoal / copper palette. Dense but elegant layout, sharp alignment, strong hierarchy, premium case-study presentation.

(帰属: 公開クリエイター@LexnLinがGitHubプロフィール経由で公開。
GitHub wuyoscar/gpt_image_2_skill "Brand Systems & Identity"セクションで原文収録)

長く見えるけれど、
骨格はシンプル。
「ブランド名」「業種」「ターゲット」「ムード形容詞」「配色」の5つを差し替えるだけで、
私やみなさんのブランドにそのまま転用できる。

差し替える箇所は5つだけ

原文を読み解くと、
固有要素は次の5箇所に集中している。
それ以外("modular grid of multiple tiles"以下のタイル列挙やレイアウト指定)は触らずそのまま使うのが推奨
骨格を壊すと出力が一気に崩れる。

差し替え箇所 原文の該当部分 差し替えの考え方
① ブランド名 "Moss Radio" 読者自身のブランド名・店名・サービス名に置換
② 業種 "independent audio hardware and café-retail" 「独立系の○○と△△」の形で2業種を並べると世界観に厚みが出る
③ ターゲット "creative professionals and music obsessives" 主読者と裏読者の2層を書く(例: 個人クリエイターと長く使う愛用者)
④ ムード形容詞 "analog, cultured, warm, tactile, and design-forward" 5語並列が肝。減らすと一貫性が落ちる
⑤ 配色パレット "moss green / parchment / charcoal / copper" 4色構成が安全。ベース2色+アクセント1色+締め1色で考える

第6候補として"Swiss-inspired typography, rounded industrial shapes"のタイポ・形状指定も差し替え可能。
ただ、
ここは慣れてからで十分。

5箇所差し替えを実際にやる手順

OpenAI公式のPrompting Guideとプロンプト構造を組み合わせると、
再現手順は次の3ステップに整理できる。
私はこの順で読んでもらうのが一番ハマりにくいと思っている。

  1. STEP1: ブランド5要素を日本語で1行ずつ書き出す。①ブランド名 ②業種2つ ③ターゲット2層 ④ムード形容詞5語 ⑤配色4色。これをメモ帳に縦に並べる。ここで悩むなら、好きな雑誌・店・ブランドを参考に語を引っ張る。完璧を狙わない。
  2. STEP2: 原文の5箇所を上書きする。Moss Radioプロンプトの該当部分(前章の表の5行)だけ英語に差し替え、それ以外は1文字も変えない。骨格("polished modular grid of multiple tiles"以下のタイル列挙)を残すのが鉄則。ここを崩すと一発で世界観が散る。
  3. STEP3: ChatGPTのImage機能か、APIにそのまま投げる。Plus(月20ドル)以上のThinkingモードでは最大8枚を一括生成できる(出典: OpenAI Deployment Safety Hub)。低品質で試したいならAPIで quality=low が1枚 $0.006(約1円弱)。

引っかかりやすいのはSTEP2。
④のムード形容詞を3〜4語に減らすと出力の一貫性が崩れやすい。
原文5語並列のリズムは崩さない方が無難。
ここはケチらない。

OpenAI公式が推奨しているプロンプト書式

5箇所差し替えと別に、
Cookbookの推奨書式を踏まえると精度がもう一段上がる。
引用元はOpenAI公式のPrompting Guide
読み込むと、
骨格プロンプトが効く理由が裏側から見えてくる。

"Put literal text in quotes or ALL CAPS and specify typography details"

"State exclusions and invariants explicitly (e.g., 'no watermark,' 'no extra text,' 'no logos/trademarks')"

"Use quality='high' for small text, dense information panels, multi-font layouts"

要点は3つ。
文字を入れたいときは引用符かALL CAPS
除外指定はexclusionsで明示
細かい文字や多フォント混在はquality=high
Moss Radioプロンプトが効くのは、
暗黙的にこの3条件を満たしているから。

ここを知らずに自前プロンプトをゼロから書くと、
文字がぐにゃぐにゃで返ってきて「やっぱりAIはダメだ」と早合点する。
私はそれが一番もったいないと感じている。

3条件は順番が命。

料金はいくらかかるのか

OpenAI公式のImage Generation APIガイドに料金表が載っている(2026年4月時点)。
私が読み込んで一番効くと感じたのは、
low品質の1枚単価が約1円弱という点。
試打ちのコストがほぼゼロになる。

quality サイズ 1枚あたり単価 用途の目安
low 1024×1024 $0.006(約1円弱) 構図やレイアウトの試打ち
medium 1024×1024 $0.053(約8円) SNS投稿用途の中間品質
high 1024×1024 $0.211(約32円) ブランド宣材の本番出力
high 1024×1536 / 1536×1024 $0.165(約25円) 縦長・横長のポスター

※円換算は1USD=151円ベース。
ChatGPT側で使うならPlus(月20ドル)でInstantモードとThinkingモードが触れる。
Free枠でもInstantモードはロールアウト次第で利用可。

個人ブランド用途なら、
最初の試打ちはAPIのlowで100枚回しても1ドル弱。
そこから良かった構図だけhighで本番化、
という流れがコスパ的に効く。
私ならまずlowを20枚回す。

ロゴの完全再現は苦手——Photoshop後乗せが現実解

記事の主役プロンプトはブランド一式の世界観を出すのが得意。
一方で既存ロゴのピクセル単位の再現は今のGPT Image 2でも詰まりやすい。
あるテックメディアの検証記事でロゴ生成の精度に課題が指摘されている。

同レビュー(2026年4月21日付)では、
自社の既存ロゴ再現を3回試行して全て失敗。
修正指示を出しても、
過去ロゴを引っ張ってきたり、
文字に余計な装飾を足してきたりしたと報告されている。

OpenAI公式のCookbookも、ロゴ周りはこう推奨している。

Maintain logo consistency via "clean, vector-like shapes, a strong silhouette, and balanced negative space"

"State exclusions and invariants explicitly (e.g., 'no watermark,' 'no extra text,' 'no logos/trademarks')"

(出典: OpenAI Cookbook Prompting Guide

裏を返すと、
公式自身が「既存ロゴの再現は推奨しない、
除外指示で逃げてくれ」と書いている。
ブランド宣材の世界観だけ生成 → ロゴはPhotoshopやFigmaで後乗せ、
というワークフローを最初から想定するのが現実的。

ここを伏せて「AI1枚で完成」と書くのは嘘になる。

商用利用と商標登録の扱い

OpenAI公式の利用規約では出力の商用利用を原則許可している。原文はこう。

"As between you and OpenAI, you own the Output"

"OpenAI will not claim copyright over content generated by the API"(出典: OpenAI Help Center

つまりGPT Image 2で出した画像はSNS投稿やLP(ランディングページ。
サービス紹介の1枚ページ)に貼って良い。
一方で商標登録できるかは別問題
日本の特許庁は2024年度に「生成AIを利用したデザイン創作の意匠法上の保護の在り方に関する調査研究」を実施し、
AI生成デザインへの権利帰属について「未確定」と整理している(出典: 特許庁要約PDF)。

意匠と商標は別の制度だけれど、
AI生成物を商標出願するなら弁理士確認を挟むのが安全。
私はここをスキップして後で揉めるのが一番もったいないと思っている。

ユーザー側からの不満も出ている

OpenAI Developer Communityには制限への不満が複数投稿されている。
一例。

"prompts that used to work just fine are now being flagged or blocked"

"old prompts and reasoning logic 'poison' the session"

(出典: OpenAI Developer Community フィードバックスレッド

要約すると「以前通っていたプロンプトが新モデルで弾かれる」「セッション内で過去の指示が後の出力を縛る」という指摘。
ブランドアイデンティティ用途では大きな問題は出にくいけれど、
人物画や歴史的モチーフを混ぜる場合は引っかかりやすい。

ここは新モデル特有の慣らし期間。

FAQ

GPT Image 2はChatGPTのどのプランから使えますか?

Free枠でもInstantモード(基本品質改善版)が利用可能(ロールアウト状況次第)。
Thinkingモード(Web検索・最大8枚一括・出力検証)はPlus(月20ドル)以上が対象。
Pro(月200ドル)はフル機能。

"Moss Radio"プロンプトの5箇所以外を変えてもいいですか?

骨格("modular grid of multiple tiles"以下のタイル列挙とレイアウト指定)はそのままが推奨。
タイポ指定("Swiss-inspired typography, rounded industrial shapes")は第6候補として変更可能。
ムード形容詞は5語並列のリズムを崩さないこと。

API料金はどのくらいで何枚回せますか?

quality=lowなら1枚 $0.006(約1円弱)。
10ドルあれば1666枚回せる計算。
本番出力はhighで $0.211(約32円)。
試打ちはlow、
本番はhighのハイブリッドが現実的。

生成したロゴをそのまま自社の商標として登録できますか?

OpenAIは出力の所有権をユーザー側に渡すと明記。
ただし商標登録の可否は国・審査機関の判断次第で、
AI生成物の権利帰属は日本でも未確定(特許庁2024年度調査研究)。
商標出願を視野に入れるなら弁理士相談が前提。

「モジュラーグリッド」はOpenAI公式の機能名ですか?

違う。
プロンプト側で指定するデザイン用語。
OpenAI公式は同じ領域を"structured generation"や"better layouts"と表現している。

このページに出てきた言葉

GPT Image 2
OpenAIが2026年4月21日に出した最新画像生成モデル。モデル名はgpt-image-2。
ChatGPT Images 2.0
ChatGPT上での同モデルの呼称。中身はgpt-image-2と同じ。
ブランドアイデンティティ
ロゴ・配色・タイポなどブランドの見た目を統一する設計図のこと。
モジュラーグリッド
複数のタイル(区画)を整列させて1枚にまとめるデザイン手法。プロンプト側の用語。
Thinkingモード
GPT Image 2が推論とツール使用を加えて画像を生成する高品質モード。Plus以上で利用可。
Instantモード
GPT Image 2の基本モード。Free枠でも触れる(ロールアウト次第)。
API quality
API呼び出し時の出力品質。low/medium/highの3段階で単価が変わる。
LP
ランディングページ。サービス紹介の1枚完結ページ。
意匠と商標
意匠は製品のデザイン全般、商標はブランド名やロゴの識別標。別の制度。

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, ,

← 戻る