Instagramのリール広告を外注すると1本数万〜数十万円。
今は文章を入れるだけで15秒の広告動画が3〜5分・1本$2以下で作れる組み合わせが出てきた。
OpenAIの画像生成「GPT Image 2」と、
ByteDance(TikTok親会社)の動画生成「Seedance 2.0」をつなぐワークフロー(作業の流れ)。
編集ソフトを触れない店舗オーナーでも、
脚本テキストを送って承認するだけで完成する仕組みです。
この記事はAI動画生成を触ったことがない個人事業主・小規模店舗オーナー・SNS運用初心者向け(ChatGPTを触ったことがあれば読めます)。
そもそもこの2つを組み合わせると何が起きるの?
仕組みはシンプルです。
GPT Image 2で「動画の設計図にあたる絵コンテ」を1枚画像として作り、
その絵をSeedance 2.0に渡すと15秒の動画になって返ってくる。
絵コンテ(動画を撮る前に作る設計図。
1コマ=1場面の絵と説明を並べた表)は、
外注すると映像クリエイターに数万円かかる工程。
これがAI画像1枚で済むようになった。
Atlas Cloud(Seedance 2.0やGPT Image 2を含む300以上のAIモデルを統一APIで再販するサードパーティ事業者)が公開したワークフロー解説によれば、
ユーザーが操作するのは「脚本の投入」と「承認」の2メッセージだけ。
3〜5分待つと、
Seedance 2.0が15秒動画を吐き出してくる。
1本あたりのコストは$1.5〜$2。
ドル円150円換算で約225〜300円です。
私の見方では、ここで広告制作の相場が壊れる。
「Brands can now create 500 custom ads for the same price as one standard video shoot(通常の動画撮影1回分と同じ金額で500本のカスタム広告を制作可能)」
出典: Atlas Cloudの公開ガイド
従来の動画制作と何が違うの?
外注の場合、
企画→撮影→編集→納品で平均13日。
社内制作はAfter Effects(Adobeの動画編集ソフト。
1人1ヶ月7,780円〜)の習得が前提で、
ベジェ曲線やキーフレームの設定で詰みます。
新ワークフローの場合、
脚本テキストを送ってから動画完成まで約27分(Atlas Cloud公開資料の比較値)。
広告1本ごとの制作時間が桁違いに圧縮される構造です。
| 項目 | 従来の外注/自社編集 | GPT Image 2 × Seedance 2.0 |
|---|---|---|
| 制作時間(1本) | 13日(外注平均) | 3〜5分(純粋な生成時間) |
| 1本あたりコスト | 数万〜数十万円 | $1.5〜$2(約225〜300円) |
| 必要スキル | 動画編集ソフト操作 | 日本語の脚本を書ける程度 |
| キャラ・背景の統一 | 絵コンテ作家に依頼 | 9パネル1枚生成で自動統一 |
| 生成本数の上限 | 予算で頭打ち | API予算次第で大量生成可 |
個人的にはここの「9パネル1枚生成」が肝で、後で詳しく書きます。
GPT Image 2って何ができるの?
OpenAIが2026年4月21日にリリースした画像生成AI。
DALL-E 3の後継で、
ChatGPTにも統合済み。
これまでのAI画像生成と決定的に違うのは日本語テキストを画像内に正確に書けること。
Microsoft公式ブログによれば、
日本語・韓国語・中国語・ヒンディー語・ベンガル語などをそのままレンダリングできるとされる。
画像内に「期間限定30%OFF」「本日10時オープン」と日本語で書いた広告画像が出せる、
ということ。
地味に革命です。
もう一つ重要なのが9パネル(3×3グリッド)出力。
1枚の大きな画像に9コマ分のカット絵を並べて生成する手法で、
漫画の1ページのような配置になる。
「A 9-panel grid naturally keeps the same character looking the same, wearing the same outfit, across all 9 panels.(9パネルグリッドにすると、同じ登場人物が同じ服装で全9コマに自然に統一される)」
出典: Atlas Cloudの公開ブログ
1枚の中で全コマを同時に描くため、
登場人物の顔・服装・背景・ライティングが全コマで自動的に揃う。
9コマを別々に生成すると顔が変わるなどの問題が起きるが、
1枚生成ならそれが消える、
という仕組みです。
料金(OpenAI公式)
| 利用形態 | 料金 |
|---|---|
| ChatGPT 無料ユーザー | Instantモードのみ利用可 |
| ChatGPT Plus | 月$20(Thinkingモード・Webサーチ統合あり) |
| API(1024×1024 高品質) | $0.211/枚 |
| API(4K相当 高品質) | $0.41/枚 |
出典: OpenAI API Pricing および Microsoft Azure AI Foundry公式ブログ
Seedance 2.0って何ができるの?
ByteDance(TikTok親会社)が2026年2月12日に公開した動画生成AI。
文章でも画像でも入力できて、
最大15秒の動画が出る。
キーになるのがI2V(Image-to-Video。
静止画→動画変換)機能。
1枚の画像をSeedance 2.0に渡すと、
その画像の人物・色・スタイルを保ったまま動きを付けて動画にしてくれる、
という仕組みです。
GPT Image 2で作った9パネル絵コンテをそのままSeedance 2.0に投入すると、
各コマが連続した動画として再構成される。
これが冒頭の「3〜5分で15秒CM」の正体。
料金(公式アナウンス)
| 提供元 | 料金(1秒あたり) | 15秒換算 |
|---|---|---|
| Volcengine(ByteDance直系の中国クラウド・公式提供元) | 約$0.14/秒(46元/100万トークン) | 約$2.1 |
| Atlas Cloud Standard(再販プラットフォーム・海外向け) | $0.127/秒 | 約$1.9 |
| Atlas Cloud Fast(再販プラットフォーム・低解像度) | $0.101/秒 | 約$1.5 |
| fal.ai(再販プラットフォーム・海外向け) | $0.24〜$0.30/秒 | 約$3.6〜$4.5 |
出典: CnTechPost報道(Volcengine公式アナウンス) および Atlas Cloudの料金詳細記事
個人事業主が一番触りやすいのはAtlas Cloud。
新規登録で$1クレジットが付くため、
Fast換算で約45秒分は無料で試せる、
と公開ページに案内があります。
なぜこの2つの組み合わせに私が注目してるのか
注目理由は3つあります。
1. キャラクター一貫性問題が「9パネル1枚生成」で解決した。
これまでAI動画生成の最大の壁は「シーンごとに登場人物の顔が変わる」「服装が勝手に変わる」「店内の背景が別の店になる」という一貫性崩壊。
9パネル1枚生成で一気に解消した、
というのが今回の本丸です。
2. 1本$2の価格帯は「広告A/Bテスト」を可能にする。
1本数万円の従来制作だと、
広告クリエイティブのバリエーション検証は不可能。
1本$2なら100本作って数値で勝ち負けを判定できる構造になる。
Atlas Cloudの公開資料では「動画のCTR(クリック率)は静的画像比で約4.8倍(1.2%→5.8%、
Shopify 2025年ベンチマーク)」と記載されている。
3. 縦型SNS(TikTok・Instagramリール・YouTubeショート)に直で使える解像度・比率がある。
Seedance 2.0は9:16縦型に対応していて、
Instagramリール広告の規定サイズで直接書き出せる。
CapCutやAfter Effectsでの再エンコード工程を1本ごとに省けます。
ただし注意点も明確にあります。
- Seedance 2.0の最大解像度は720p HD(4K非対応)。Kling 3.0はネイティブ4Kなので、超高解像度が必要な案件は別ツール
- Atlas Cloud経由の動画リンクは24時間で失効(CDNのTTL=保存期限が24時間)。生成後は必ずダウンロードして自社ストレージに保存する
- 登場人物に「20歳」「40代」など年齢を指す語句は使用不可(コンテンツポリシー上の制約)。代わりに「a young photorealistic digital character」のような機能的な書き方を使う
- 著名人・既存IPの無断使用はAtlas Cloud規約違反。ご自身の店舗の広告で他社商品の名前を入れる時は注意
整体院・カフェ・個人ECで実際にどう使うの?
Microsoft公式ブログとAtlas Cloudの公開ガイドが示すユースケースを、
店舗オーナー目線に落とし込んでみます。
ユースケース1: カフェの新メニュー15秒リール広告
9パネル例: 「①店外観で日が差す → ②店内に入る客 → ③メニューを見る → ④新作ドリンクが運ばれる → ⑤湯気が立つ → ⑥客が一口飲む → ⑦笑顔で会話 → ⑧伝票を持つ → ⑨『◯◯カフェ・本日10時OPEN』のテロップ画面」。
GPT Image 2で1枚生成した後、
Seedance 2.0でつないで15秒動画化。
コスト$2、
所要時間4分。
ユースケース2: 整体院の集客リール
9パネル例: 「①肩を押さえる女性 → ②受付で予約 → ③施術台に横になる → ④施術中の手元 → ⑤施術後の表情 → ⑥肩を回す女性 → ⑦『初回◯◯円』のテロップ → ⑧店舗外観 → ⑨予約QRコード」。
コンテンツポリシー上、
医療効果の断言は不可。
「◯日で治る」表現は避ける構成にする。
ユースケース3: 個人ECブランドの商品紹介リール
Atlas Cloudの公開するAI駆動コマース事例によれば、
「製品静止画→プロモ動画の自動変換」で「伝統的なスタジオ撮影より90%安い」とされる(出典: Atlas CloudのAI駆動コマースガイド)。
私から見るとハンドメイド作家やD2Cブランドにとっては相場破壊レベル。
同じことを読者がやる手順は?
Atlas Cloudが公開したワークフロー解説の全体フローを、
初心者向けに分解した5ステップ。
STEP1: 脚本(15秒分)を日本語で書く
まず動画で伝えたいストーリーを文章で書く。
例:「カフェの朝、
ドアが開いて客が入店。
新作ドリンクが提供され、
客が笑顔で一口飲む。
最後にお店のロゴと『本日10時OPEN』が出る」。
文章量は3〜5行で十分。
撮影用語(ズーム・パンなど)は不要、
描写文だけでOK。
STEP2: Atlas Cloudにアカウント登録(無料$1クレジット付与)
Atlas Cloud(https://www.atlascloud.ai/collections/seedance2)でアカウントを作る。
新規登録で$1クレジットが付くため、
Fast換算で約45秒分(=15秒動画3本分)は無料で試せる。
クレジットカード登録はテスト後でOK。
STEP3: GPT Image 2で9パネル絵コンテを1枚生成
ChatGPT Plus(月$20)またはAtlas CloudのAPI経由でGPT Image 2を呼び出し、
「9パネル・3×3グリッドで」と指定してSTEP1の脚本を画像化する。
プロンプト例: 「A 3×3 grid of 9 storyboard panels showing a Tokyo cafe morning scene, photorealistic, same character throughout all panels」。
1枚あたり$0.211(約32円)。
STEP4: Seedance 2.0 I2Vに9パネル画像を投入
Atlas Cloud画面でSeedance 2.0 I2Vを選び、
STEP3で作った9パネル画像をアップロード。
動画長は15秒、
アスペクト比は9:16(縦型リール用)または16:9(横型)を選ぶ。
モーション指示(カメラの動き・コマ間の切り替え)を1〜2行添えて生成ボタン。
生成時間2〜3分、
コスト約$1.5〜$1.9。
STEP5: 完成動画をダウンロードして自社ストレージに保存
生成完了後、
動画URLが発行される。
このリンクはCDN(コンテンツ配信ネットワーク)の保存期間が24時間で切れるので、
必ずローカルPCまたはGoogle Drive等にダウンロードする。
Instagram・TikTok・YouTubeショートにそのままアップロード可能。
ここで引っかかりやすいポイント。
STEP3のプロンプトで「20歳の女性」のように年齢を指定するとエラーが返る。
「a young woman」のような機能的記述に置き換える、
というルールがコンテンツポリシー上あります。
競合の動画AIと比べてどうなの?
| モデル | 料金(1秒あたり) | 15秒コスト目安 | 最大解像度 |
|---|---|---|---|
| Seedance 2.0 Fast(Atlas Cloud経由) | $0.022〜$0.101 | $0.33〜$1.52 | 720p HD |
| Seedance 2.0 Standard(Atlas Cloud経由) | $0.127 | $1.9 | 720p HD |
| Kling 3.0 Standard | $0.084〜$0.126 | $1.26〜$1.89 | 4K |
| Sora 2 | 約$0.15 | 約$2.25 | 720p HD(ChatGPT Pro月$200必要) |
| Veo 3.1 | 約$0.03〜$0.20 | $0.45〜$3.0 | 1080p |
私が気になったのはSora 2の価格構造で、
OpenAIブランドだが月$200のChatGPT Pro契約が必要。
店舗オーナー個人にはハードルが高い。
Veo 3.1は使い勝手が良いが料金幅が広く読みにくい。
Kling 3.0は4K欲しい時の選択肢になります。
1本$2・縦型対応・キャラ一貫性ありの組み合わせが揃う「Seedance 2.0 + GPT Image 2」は、
SNS広告内製化との相性が良い構成。
私ならまずここから試します。
商用利用は本当に大丈夫なの?
ツールごとの規約を整理します。
- GPT Image 2: OpenAI利用規約で「ユーザーは入力の所有権を保持し、出力も所有する。OpenAIはすべての権利・権原・利益をユーザーに譲渡する」と明記。商用利用可(コンテンツポリシー違反・第三者権利侵害がない範囲)
- Seedance 2.0(Atlas Cloud経由): 公開規約で「API call results are commercially usable per Atlas Cloud's terms of service(API生成結果はAtlas Cloud利用規約に従い商用利用可)」と明記
- Seedance 2.0(Volcengine経由): ByteDanceのVolcengine利用規約に従う(中国法準拠)。日本国内事業者は国際版のAtlas CloudまたはBytePlus経由を選ぶのが整理しやすい
規約の改定リスクは常にあるため、
本番運用前に各社の最新利用規約を確認するのが安全です。
FAQ
GPT Image 2を使うのにChatGPT Plus(月$20)の契約は必須ですか?
必須ではありません。
ChatGPT無料ユーザーもInstantモード(軽量版)でGPT Image 2を利用できる、
とMicrosoft公式ブログが案内しています。
ただしThinkingモード(レイアウト推論・マルチ画像バッチ・Webサーチ統合)はPlus以上が必要。
広告制作の精度を上げるならPlus契約またはAPI利用が現実的です。
Seedance 2.0のAPIキーはどこで取得できますか?
個人事業主が一番触りやすいのはAtlas Cloud(アクセスページ)。
2026年4月20日から一般開発者向けに提供開始、
ウェイトリストなし・地域制限なし、
新規登録で$1クレジット付与。
中国Volcengineは法人向け申し込みが必要で個人にはハードルが高い構成です。
生成した動画の解像度はどれくらいですか?
Seedance 2.0の最大解像度は720p HD。
Fastモードは480pで生成後にアップスケールされます。
InstagramリールやTikTok広告用途では720pで十分ですが、
4K必須の用途(屋外大型ビジョン等)は別ツール(Kling 3.0など)を選ぶ必要あり。
1日に何本まで作れますか?
API予算で決まります。
1本$1.5〜$2なので、
月$100の予算なら50〜67本生成可能。
Atlas Cloudの公開資料は「通常の動画撮影1回分の予算で500本のカスタム広告を制作可能」と表現しています。
実運用ではプロンプト調整やリテイクが入るため、
最初は月10〜20本ペースで始めるのが安全。
音声・BGMはどうやって入れますか?
Seedance 2.0の動画出力は基本的に映像のみ。
音声・BGMは別途、
無料素材サイト(DOVA-SYNDROME等)またはCapCut・CanvaのAI音声生成機能で後付けする構成になります。
Seedance 2.0の音声入力モダリティは音声→動画への参照用で、
出力動画への音声合成ではない点に注意。
このページに出てきた言葉
- 絵コンテ(ストーリーボード)
- 動画を撮る前に作る設計図。1コマ=1場面の絵と説明を並べた表。
- 9パネル(3×3グリッド)
- 9コマのカット絵を1枚画像に並べる手法。漫画の1ページのような配置で、登場人物の顔・服装が全コマで自動統一される。
- I2V(Image-to-Video)
- 静止画を動画に変換する機能。1枚の画像を渡すと、その画像の人物・色・雰囲気を保ったまま動く動画になる。
- T2V(Text-to-Video)
- 文章だけから動画を作る機能。Seedance 2.0はI2VとT2V両対応。
- API(Application Programming Interface)
- ソフトウェア同士をつなぐ接続口。プログラムからツールを自動操作する入り口。
- Atlas Cloud
- Seedance 2.0やGPT Image 2を含む300以上のAIモデルを統一APIで再販するサードパーティ事業者。OpenAIやByteDance自身の運営ではなく第三者プラットフォーム。
- CDN(コンテンツ配信ネットワーク)
- 動画ファイルを世界中のサーバーから高速配信する仕組み。Atlas Cloudの動画リンクは24時間で失効する。
- CTR(Click Through Rate)
- クリック率。広告が表示された回数に対して何回クリックされたかの割合。
- A/Bテスト
- 2種類の広告クリエイティブを同時配信して数値で勝ち負けを判定する手法。
- リール
- Instagramの縦型ショート動画機能。9:16の縦長比率で投稿する。
- BYOK(Bring Your Own Key)
- ユーザー本人のAPIキーを持ち込んで第三者サービスから利用する方式。fal.aiでGPT Image 2を使う時はOpenAIキーを利用者側で用意する。
参考リンク
- OpenAI公式 GPT Image 2 モデルドキュメント
- Microsoft Azure AI Foundry公式ブログ(GPT Image 2発表)
- OpenAI公式プロンプトガイド(ストーリーボード生成チュートリアル含む)
- OpenAI API料金ページ
- Atlas CloudのGPT Image 2 × Seedance 2.0統合ワークフロー解説
- Atlas Cloud Seedance 2.0 APIコレクション
- Atlas Cloudの料金詳細記事
- Atlas CloudによるSeedance 2.0グローバル提供プレスリリース
- CnTechPost報道(Volcengine公式料金アナウンス)
- fal.ai Seedance 2.0ページ
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。