AI活用全般

GPT Image 2+MS Paint風スクリブルでSNSアイコン・Noteサムネ・社内ラフ図を作る|バイラルプロンプト全文と5ステップ

「綺麗に作る」AIの時代に、わざと下手に描き直すプロンプトがXで回ってます。

GPT Image 2に「MS Paintでマウス描きしたみたいに雑に描き直して」と頼むだけ。

SNSアイコンと社内ラフ図に、滑らかなAI画像が失った親しみを戻せる構図。

本記事はGizmodo、OpenAI Cookbook、lebigdata.fr、Creative Bloq の一次ソースを並べて、なぜ刺さるのかと、どう書けば再現できるかを解きほぐす内容です。

この記事はChatGPT PlusでSNSアイコン・Noteサムネ・社内ラフ図を作っている個人運用者向け(プロンプトを1行コピペできれば読めます)。

そもそも「MS Paint風スクリブル」って何が起きてるの?

2026年4月30日、Xに投稿された1本のプロンプトがバイラル化しました。

頼んでる内容はシンプルで、添付した画像を「マウスでMS Paintに描いたような、ぐちゃぐちゃで完全にダサい仕上がりに描き直してくれ」という指示。

これだけ。

起点はThreadsで「世界で最もつまらないプロンプト(The Most Trivial Prompt in the World)」と皮肉込みで投稿されたものです。

これがXに流れて爆発しました。

OpenAIの公式アカウントもこのトレンドをシェアしています。

皮肉が本気で広まる典型パターン。

このトレンドは以前の『Ghiblify』のバイラル現象と異なり、著作権の懸念がなく、特別な美術スキルも不要だ。

— Gizmodo(出典: Gizmodo記事

ジブリ風が炎上したのはスタジオの画風を直撮りしてたから。

今回はMS Paintという誰も独占してないツールの「下手さ」を真似てるだけ。

法的にクリーン。

なぜ「わざと下手」がSNSで刺さるのか

仏メディア lebigdata.fr が、このトレンドが成功した3要因を整理しています。

このトレンドが成功した理由は3つある。

①完璧さへの飽き(超滑らかなAI画像への飽きから来る新鮮さ)②アクセシビリティ(美術スキル不要)③期待の逆転(超強力なAIをわざとダサくする逆転の面白さ)。

— lebigdata.fr(出典: lebigdata.fr 記事

私は3つ目が一番効いてると見てます。

SNSのフィードはAI生成画像で埋め尽くされてて、滑らか・整い・パキッとした画は完全にコモディティ化しました。

そこに「世界最強の画像生成AIを使って、わざと小学生のラクガキみたいに描かせる」という逆転が乗ると、見た瞬間に「なんか変」と止まる。

指が止まる絵が、フィードでは勝つ展開です。

これは流行り言葉じゃなく、数字でも裏が取れています。

73%のデザイナーや制作者が、アルゴリズム的な出力との差別化のために意図的に不完全な要素を取り入れるようになっている。

— アンチエステティック lo-fi トレンド分析(出典: PodcastVideos.com

同じ調査では、TikTokの低品質な手作り感ある広告のほうが、スタジオ品質の広告より高いwatch-through rate(最後まで見られる率)を出してると報告されています。

さらに第三者ベンチマークの Image Arena では、GPT Image 2 がリリース後12時間以内に ELO 1,512 で全カテゴリ1位を取ったと記録されています。

「綺麗な絵を出す」競争で頂点に立ったモデルが「わざと下手な絵」のバイラルで二度目の話題をさらった構図です。

正直、これはもう美的好みの話じゃなくマーケティング指標の話。

OpenAI Cookbookの公式記述に「わざと下手」の根拠はあるか

気になって OpenAI Cookbook の画像生成プロンプトガイド を当たってみました。

結果から言うと、「intentionally terrible(わざとひどく)」を勧める明示記述は無い。

ただし間接的な根拠は2つ拾えます。

Be concrete about materials, shapes, textures, and the visual medium.(素材・形・質感・ビジュアルメディアを具体的に指定せよ)

For latency-sensitive or high-volume use cases, start with quality='low'.(遅延に敏感/大量生成のユースケースでは quality='low' から始めよ)

— OpenAI Cookbook 公式

「visual medium を具体的に指定」という原則を逆方向に使えば、「MS Paint」「マウス描き」という具体的な低スペックメディアの指定が、公式の推奨手順とそのまま噛み合います。

そして API では quality='low' を立てれば、生成コストが 高品質設定の約35分の1(1024×1024で1枚約$0.006) まで落ちる。

意図的に下手に描かせるなら、課金的にも噛み合います。

公式が「ダサくしろ」と書いてるわけじゃない。

だが「具体的なメディア指定 × low quality」という公式推奨の組み合わせが、結果的にこの逆張り運用を支えてるんですね。

バイラルになっているプロンプト全文

流通している原文は2系統。出典を分けて両方並べます。

バリエーション1:起点版(短い・骨太)

Redraw the attached image in the most clumsy, scribbly, and utterly pathetic way possible. Use a white background, and make it look like it was drawn in MS Paint with a mouse.

— バイラル起点プロンプト(出典: Gizmodo記事lebigdata.fr 記事

日本語訳すると「添付画像を、可能な限り雑でぐちゃぐちゃ、完全にダサい方法で描き直して。

白背景で、マウスでMS Paintに描いたように」。

バリエーション2:「intentionally terrible」入り(広く流通)

Redraw the image in an extremely clumsy, scribbly MS Paint style on a white background, with a low-quality mouse-drawn look that feels awkward, funny, and intentionally terrible.

— 海外複数メディアで流通する版(出典: Gizmodo、lebigdata.fr 各記事)

日本語訳:「画像を、ものすごく雑でぐちゃぐちゃなMS Paint風スタイルで、白背景に描き直して。

マウスで描いたみたいな低品質で、ぎこちなくて、笑える、わざとひどく描いた仕上がりで」。

こっちは指示語が多くて、AIへの「ぎこちなさ」「面白さ」「わざとひどい」の三点セットが効いてます。

私が選ぶならこの形式。

バリエーション3:lebigdata.fr が紹介する「矛盾締め」

バリエーション1の末尾に「actually, whatever, draw however you want(まあ、なんでもいいや、好きに描いて)」を足す形。

lebigdata.fr によると、この矛盾した締めがAIに予測不能な出力をさせ、コミカル度と拡散力を増幅したと分析されてます。

プロンプトを「最後だけ投げる」発想。

これは正直うまい。

このプロンプトを実際に動かす手順(公式ガイドベース)

OpenAI Cookbook と海外メディアの再現フローを整理すると、ChatGPT Plus(Web/アプリ)で動かす最短ルートは次の通りです。

  1. STEP1: ChatGPTを開いてGPT Image 2を選ぶ。Plus以上なら画像生成モデル選択で「GPT Image 2 / Images 2.0」が出る。Thinking Mode(推論あり)かInstant Mode(即時)を切り替え可能。MS Paint風はInstantで十分。
  2. STEP2: 元画像を1枚アップロードする。SNSアイコン用なら手元の似顔絵やペット写真、社内ラフ図ならホワイトボード写真や手元のスケッチ。元画像は1枚に絞る(複数だと参照が散ける)。
  3. STEP3: バリエーション2のプロンプトを英語のままコピペして送る。海外のレポートでは「英語のほうが狙ったショボさが出やすい」という報告が複数あるため、最初は英語推奨。日本語版もあるが英語先行で試すのが安全。
  4. STEP4: 出力が物足りないなら追い指示を1行。「Make it even messier, more wobbly lines, and sloppier colors.(もっとぐちゃぐちゃにして、線をもっとよろよろさせて、色も雑に)」を続けて投げる。
  5. STEP5: サイズを足す。SNSアイコンなら末尾に Square format、Noteサムネなら Landscape format、ラフ図なら Portrait format を1行付ける。

引っかかりやすいのは STEP3。

日本語で書くと「丁寧で味のある手描き」みたいな安全側に振れる出力が混じります。

これは複数のレビューで指摘されている現象。

最初は英語、決め打ち。

気に入らない場合は、同じ会話で再修正するより新規セッションで投げ直すほうが早いです。

会話履歴を引きずるとプロンプトの意図が薄まりがちだから。

3つの実用シーン別「わざと下手」の使いどころ

SNSアイコン・Noteサムネ・社内ラフ図の3つに絞って、なぜ「わざと下手」が機能するか、どう調整するかを並べます。

シーン1:SNSアイコン

整った似顔絵アイコンはもうフィードに溶けます。

スクリブル風に描き直すと「親しみ」「個人感」「マネされにくさ」が一発で乗るんですね。

調整のコツは Square format を末尾に追加。

さらに「avatar style, head and shoulders only(アバタースタイル、頭と肩まで)」を足すと顔が中心に来てくれます。

シーン2:Noteサムネ

note のおすすめ欄は AI 生成サムネが洪水状態。

クリック率を取りに行くなら、わざと下手なほうが目立ちます。

lo-fi トレンド分析の数字(73%のデザイナーが意図的不完全を取り入れてる)はSNSサムネの世界でも同じ構図。

調整のコツは記事タイトルを画像内テキストとして組み込むこと。

GPT Image 2は テキスト精度約99% を謳ってる。

手書き風文字+スクリブル絵の組み合わせはこのモデルの得意分野です。

シーン3:社内ラフ図

会議で「これは初期案です、確定じゃないです」が口頭で伝わらない問題。

MS Paint風で出すとビジュアルだけで「これは叩き台」が伝わります。

これ正直やばい。

調整のコツは diagram style, with arrows and rough boxes(図解スタイル、矢印と雑な箱) を足すこと。

整ったFigma図と並べて出すと、議論の温度が変わってきます。

賛と批 ― メディアと数字の声

立場出典
賛(バイラル分析)「完璧さへの飽き、アクセシビリティ、期待の逆転の3要因が刺さった」lebigdata.fr
賛(市場データ)「73%のデザイナーが意図的に不完全な要素を取り入れている」PodcastVideos.com
賛(性能ベンチ)「Image Arena ELO 1,512 で全カテゴリ1位(リリース後12時間以内)」Image Arena 公開ランキング
批(編集記者)「巨大なコンピューティングリソースで1985年のソフトを再現している。創造的に空虚」Gizmodo
批(デザイン誌)「Thinking modeでも、全プロンプトに対して非常に特定のスタイルを模倣し続ける」Creative Bloq

批判の核は「同じスタイルしか出ない」「文字の細部が崩れる」の2点。

MS Paint風の場合、まさにその「同じスタイル」「文字の崩れ」が逆に味になってきます。

つまり批判ポイントが、この用途では逆に味方になる構造。

料金とプラン別の使い分け

2026年5月現在の料金を整理します。

Pro は2026年4月9日に $100 プランが追加され、$100 と $200 の2段階構成になりました。

プラン月額Thinking Modeこのプロンプトで使うか
Free$0不可1日数枚の制限あり、試すだけならOK
Go$8不可Instantのみ。MS Paint風はInstantで十分なので相性は悪くない
Plus$20本命。約50枚/3時間ウィンドウで個人運用なら困らない
Pro ($100)$1002026/04/09追加の中間プラン。Plus の5倍 usage、月100〜200枚運用に届く
Pro ($200)$200大量量産・ブランド運用向け、個人にはオーバースペック
API従量対応quality='low'なら1枚約$0.006、自動化したい時だけ

個人運用なら Plus 一択。

Go の $8 でも Instant Mode が使えるのでスクリブル目的なら全然戦えます。

私の判断としては、SNS運用で月50枚以上回すなら Plus、月10枚程度のNoteサムネ運用なら Go で足りると見ています。

Pro $100 は「Plus じゃ足りないけど $200 は重すぎる」中間層向け。

競合ツールとの違いはあるのか

ツールMS Paint風の出しやすさ備考
GPT Image 2「intentionally terrible」のような人間語ニュアンスをそのまま指示できる
Midjourney「childish drawing」「crude doodle」等のキーワードで近い効果は出せる
Stable Diffusion系LoRAでlo-fiスタイルを追えるが、プロンプト1行の手軽さでは負ける
Nano BananaImage Arena 評価で GPT Image 2 に次ぐ位置、乗り換え検討に値する差

差別化要素は「自然言語のニュアンス再現」。

「ぎこちない/笑える/わざとひどい」という人間っぽい指示を、画像生成モデルがそのまま理解して出すのは GPT Image 2 が得意な領域です。

FAQ

Q1. 日本語プロンプトでも同じ結果が出ますか?

海外複数メディアでは「英語のほうが狙ったショボさが出やすい」報告があります。

日本語訳版も流通しているが、最初は英語のバリエーション2をそのままコピペするのが安全。

物足りなければ追い指示で「もっと雑に」を投げる運用がおすすめ。

Q2. ChatGPT Free でも使えますか?

使えます。

Free と Go は Instant Mode のみだが、MS Paint風は Thinking Mode が要らないのでInstantで完結する仕様。

Free は1日数枚の制限があるので、本番運用には Go ($8) か Plus ($20) を勧めます。

Q3. 商用利用や著作権は大丈夫ですか?

Gizmodo は「以前のGhiblifyのバイラルと違い、著作権の懸念がない」と整理しています。

MS Paint は誰のスタイルでもなく、ツールの低スペックさそのものを指す表現だから。

ただしOpenAIの利用規約と各プラットフォームのAI画像表記ルールは別途確認すること。

Q4. 同じ画像を何度も調整したらブレるのはなぜ?

ChatGPT のセッションは会話履歴を引きずる仕様で、同じ画像に何度も修正指示を重ねるとプロンプトの意図が薄まりがちです。

気に入らないときは新規セッションで投げ直すほうが早い。

手順セクションで触れた通り、追い指示は1〜2回で打ち切る運用が無難。

Q5. DALL-E 3 が廃止されると今までのプロンプトは使えなくなる?

2026年5月12日で DALL-E 3 は正式廃止。

ChatGPT 上では自動的に GPT Image 2 に切り替わります。

MS Paint風プロンプトは GPT Image 2 でこそ刺さる方向のものなので、移行は追い風。

Q6. Pro $100 と Pro $200 はどう違いますか?

2026年4月9日に追加された Pro $100 は、Plus の5倍の usage が割り当てられる中間プランです。

Pro $200 は usage 無制限級でブランド運用向け。

月100〜200枚を回すなら Pro $100、それ以下なら Plus、それ以上なら Pro $200 が目安。

参考リンク

このページに出てきた言葉

GPT Image 2
OpenAIが2026年4月21日に出した画像生成モデル。ChatGPT UIでは「ChatGPT Images 2.0」表記
MS Paint
Windows標準の超シンプルなお絵かきソフト。1985年から付属
プロンプト
AIに渡す指示文
スクリブル
走り書き、なぐり描きの落書き
バイラル
SNSで爆発的に広まること
Thinking Mode
GPT Image 2の推論モード。Plus/Pro/Business/Enterprise限定
Instant Mode
推論なしの即時モード。Free/Goプランでも使える
セッション
ChatGPTの1つの会話画面。会話を続けると過去指示が引きずられる
lo-fi
低品質・手作り感を意図する表現スタイル
アンチエステティック
「美しく整えること」へのアンチテーゼ
watch-through rate
動画や広告を最後まで見てもらえた割合
Image Arena
画像生成モデルを第三者が比較評価する競技サイト。ELOレーティングで順位付け

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, ,

← 戻る