OpenGame解説｜汎用LLM直書き・OSS・Rosebud AIの3軸比較、Build Health 72.4でDX担当が選ぶゲーム生成基盤

2026年5月19日

公開日: 2026年4月23日／最終更新: 2026年5月19日

この記事の結論

OpenGameは2026年4月21日に香港中文大学MMLabが公開したOSS。汎用LLMにプロンプトで頼む方式ではなく、ゲーム特化LLM「GameCoder-27B」とエージェント構成でWebゲームを丸ごと生成する
論文Table 1では、OpenGame+Claude Sonnet 4.6がBuild Health 72.4を記録。Cursor(66.8)・Claude単体(58.5)・GPT-5.1単体(57.4)を上回る
非エンジニア事業者の選択肢は「ChatGPT/Claude直書き」「OpenGame(OSS)」「Rosebud等のSaaS」の3択。用途・予算・商用利用条件で分岐する

この記事は教材担当・社内DX担当・小規模事業者でWebゲームをAIで作りたい人向け（プロンプトとは何かが分かれば読めます）。

ChatGPTにSnakeゲーム作ってと頼んだら、動くけど当たり判定がガタガタだった。

こういう経験、教材担当や社内DX担当の間で積み重なっていると思います。

その構造的な原因と、代替手段が4月21日に中国・香港の研究室から出ました。

OpenGameは汎用LLMにプロンプトを渡す方式ではなく、ゲーム開発に特化して訓練されたLLMとエージェントの連携でWebゲームを丸ごと生成するOSSです。

私は注目してます。

論文ベンチマークでCursorすら上回る数字が出ている点、そしてApache-2.0で商用利用可な点が効くからです。

この記事では、汎用LLM直書き・OpenGame・Rosebud等のSaaSを並べて、非エンジニアの実務応用層がどこで何を選ぶべきかを整理します。

OpenGameとは何なのか（公式情報の要点）

OpenGameは香港中文大学のMultimedia Laboratory（MMLab）が開発したOSSです。

2026年4月21日にGitHubとarXivで公開されました。

MMLabは過去にMMDetectionやMMPose等を公開している研究機関です。

突然現れた個人プロジェクトではありません。

論文冒頭にこう書かれています。

Game development sits at the intersection of creative design and intricate software engineering, demanding the joint orchestration of game engines, real-time loops, and tightly coupled state across many files. While Large Language Models (LLMs) and code agents now solve isolated programming tasks with ease, they consistently stumble when asked to produce a fully playable game from a high-level design, collapsing under cross-file inconsistencies, broken scene wiring, and logical incoherence.

（出典: arXiv 2604.18394）

要するに、汎用LLMはコード1ファイル単位は解けるのに、ゲームという「複数ファイルが整合を保って動き続ける」対象ではガタつく、という問題提起です。

ここに共感がある方、多いはず。

OpenGameはそこに真正面からぶつかりに来た最初のオープンソース・エージェント型フレームワークだと論文は主張しています。

私はこの問題提起の仕方に説得力を感じました。

公式スペック要点

GitHub: leigest519/OpenGame（2026年4月23日時点でスター336、フォーク28）
プロジェクトページ: opengame-project-page.com
ライセンス: Apache-2.0（商用利用可・改変可）
提供形態: npm経由のコマンドラインツール
Node.js 20以上必須（Windows/Mac/Linux対応）
メインLLM: OpenAI互換API（OPENAI_API_KEY、OPENAI_BASE_URL、OPENAI_MODELの3つの環境変数で設定）
素材生成用API: DashScope、Doubao、fal.ai、OpenRouter等を別途設定
生成コマンド: opengame -p "ゲーム説明" --yolo

対応ジャンルは公式READMEによればプラットフォーマー、サイドスクロール、ターン制カードバトル、タワーディフェンス、トップダウンアクションRPG、ツインスティックシューター、クイズ、サバイバル反射系まで。

デモではMarvel Avengers風、Squid Game風、Star Wars風などが置かれています。

汎用LLM直書き vs OpenGame vs SaaS（比較マトリクス）

非エンジニアがWebゲームを業務に組み込む場合、現時点で現実的な選択肢は3系統です。

最初に数字で並べます。

ベンチマーク比較（論文Table 1）

OpenGame-Benchは150種のゲームプロンプトをヘッドレスブラウザで実行し、視覚認識AIが判定する評価系です。

評価軸は3つ。

Build Health（ビルド正常性）、Visual Usability（視覚的使いやすさ）、Intent Alignment（意図整合性）。

モデル/ツール	Build Health	Visual Usability	Intent Alignment
OpenGame + Claude Sonnet 4.6	72.4	67.2	65.1
Cursor + Claude Sonnet 4.6	66.8	61.4	58.9
OpenGame + GameCoder-27B（自前モデル）	63.9	57.0	54.1
Claude Sonnet 4.6 直書き	58.5	50.8	50.3
GPT-5.1 直書き	57.4	52.9	49.4
Gemini 3.1 Pro 直書き	53.6	60.2	42.1

出典: arXiv 2604.18394 Table 1。

私はここで目が止まりました。

汎用LLMのままClaude Sonnet 4.6に頼むと58.5。

同じClaude Sonnet 4.6をOpenGameのエージェントに載せ替えると72.4。

差は+13.9ポイント。

Cursorと比較しても+5.6ポイント上。

モデルが同じでも、エージェント側の設計でここまで動く。

数字の重さが別物です。

同じLLMで72.4対58.5、約24%差。これは正直やばい数字。

実務3択マトリクス

観点	汎用LLM直書き (ChatGPT/Claude)	OpenGame (OSS)	Rosebud AI (SaaS)
セットアップ	ブラウザだけでOK	Node.js 20＋git clone＋API鍵	ブラウザ＋アカウント登録
技術スキル要件	プロンプトが書ければ可	コマンドライン操作と環境変数設定が必要	プロンプトが書ければ可
月額	LLM料金のみ（ChatGPT Plus 月20ドル等）	ツール無料＋API従量課金	無料〜月50ドル
商用利用	API規約に依存	Apache-2.0で可（著作権表示必要）	Indieプラン（月10〜13ドル）から可
ゲームの完成度	Build Health 53〜59（ガタつく）	Build Health 63〜72（業界最高水準）	公式ベンチスコア非公開
生成後のコード改変	自由（手元にコードが来る）	自由（手元にコードが来る）	プラットフォーム内で編集
サポート体制	なし（自己解決）	GitHub Issuesのみ	公式サポートあり

Rosebud AIの料金は無料プランが週20プロンプト・商用不可、Indieプランが月10〜13ドルで300プロンプト・商用権利付き、Proプランが月20〜50ドルで無制限プロンプトです（出典: Rosebud AI公式）。

Rosebudは収益分配ゼロ（Stripe手数料のみ）を謳っていて、ここは私の評価が高い部分。

Makko AIも競合として存在し、月20ドルの有料プラン、ベータ7ヶ月で4,500人超・4万件超のアセット生成という数字をローンチ発表で公開しています（出典: Yahoo Finance Makko正式ローンチ）。

7ヶ月で4,500人。立ち上がりは静かではない。

なぜ汎用LLM直書きはゲームでガタつくのか

OpenGameの論文はこの問題の正体を「cross-file inconsistencies, broken scene wiring, and logical incoherence」（ファイル間の不整合、シーン接続の破綻、論理の非一貫性）と整理しています。

汎用LLMは1ファイル内のコードは書けても、ファイルAで定義した変数がファイルBで使われ、ファイルCのシーン遷移と連動する、という構造を丸ごと面倒見るのは苦手だということ。

論文では汎用LLMが躓く具体パターンとして以下を挙げています。

collapsing under cross-file inconsistencies, broken scene wiring, and logical incoherence

（出典: arXiv 2604.18394 abstract）

具体的には、当たり判定の数式は1ファイルに書けてもキャラクター移動と衝突処理が別ファイルにあると整合が取れない、勝敗判定の条件分岐をUI表示と同期させ忘れる、といったケースです。

私が見てきた範囲でも、ChatGPTに「3マッチパズル作って」と頼むとブロックの落下処理は出るのに「マッチ消去後に新しいブロックが上から降ってくる」連動が抜ける、というのは典型的な詰まり方。

OpenGameの対処として導入されたのが次の3つ。

GameCoder-27B: Qwen-3.5-27Bベースのゲーム特化LLM。継続事前学習→教師ありファインチューニング→実行ベース強化学習の3段階パイプラインで訓練
Template Skill: 経験から成長するプロジェクトの骨組みライブラリ。安定したゲーム構造のひな形を再利用する仕組み
Debug Skill: 検証済み修正パッチの蓄積データベース。孤立した構文バグだけでなくファイルをまたぐ統合エラーをまとめて直す

論文Table 3によれば、hook-drivenな実装を外すだけでBuild Healthが最大10.1ポイント、Intent Alignmentが11.6ポイント落ちる、とのこと。

「LLMを賢くする」だけでは届かない部分を、エージェント側の作り込みで埋めている。

ここが面白いところ。

OpenGameは誰に向いていて、誰には向かないか

向いている層

私が公式README・論文・各種公開情報を突き合わせた範囲で整理すると、次の層に刺さります。

教材制作・社内研修で「ブラウザだけで動く短いゲーム」を量産したい教材担当
Apache-2.0で商用利用可能な状態を確保した上で、自社プロダクト（ランディングページのミニゲーム、展示会のインタラクティブ体験等）に組み込みたい事業者
生成物のソースコードを手元に置き、改変とホスティングを自社管理したい社内DX担当
すでにOpenAI互換APIの請求アカウント（OpenRouter、fal.ai、Doubao等）を持っていて、従量課金をコントロールできるチーム

向かない層

Node.jsもコマンドラインも触れないタイプの担当者単独（誰か1人はターミナルを触れる前提が必要）
サポート窓口がないと不安な大規模導入。現状はGitHub Issuesのみで、4月21〜22日にnightly buildが3件連続失敗している状況
本格商用ゲームでAAA級のカスタム描画や複雑なマルチプレイヤー通信を要求するプロジェクト。Makko AI公式も「Not suited for engine-level customization or large-scale production.」（エンジンレベルのカスタマイズや大規模生産には向かない）と、このレンジのAI生成ゲーム全般について明言しています
プロンプト画面1枚で完結させたい非エンジニア1人チーム。この層はRosebudやMakkoの方が実務導線が短い

この切り分けは重要だと思う。

「AIでゲーム作れる」の粒度がバラバラすぎるからです。

私は教材担当ならOpenGameの月10ドル程度のAPI従量で十分元が取れる、1人チームならRosebud月13ドルの方が早い、と見ています。

教材担当なら月10ドル、1人チームなら月13ドル。これが私の現実ラインです。

商用利用まわりの注意点（Apache-2.0）

OpenGame本体はApache-2.0ライセンスです。

商用利用は可能で、義務は2つ。

バイナリ配布時も含め、著作権表示とライセンス文書を同梱すること
コードを変更した場合は変更した旨を通知すること

コピーレフトではないので、自社の改変コードをオープンソースにする義務はありません（出典: FOSSA Apache License 2.0 解説、Apache License 2.0 原文）。

ただし注意点が1つ。

Apache-2.0は「ツール本体」のライセンスです。

「生成された出力ゲームコード」の著作権帰属は、ユーザーが投げたプロンプトと、裏で使ったAPIプロバイダ（OpenAI、Anthropic、Doubao等）の利用規約にも依存します。

ここはグレーゾーンなので、商用配布前に法務確認を挟んだ方が安全だと私は判断しています。

セキュリティと運用面の現実

中国発のOSSという点、事業導入側は気にする方もいるはず。

GitHubのIssues欄を見ると、2026年4月21〜22日にかけてnightly releaseが3件連続失敗（#2、#4、#6）しており、エラー詳細は「N/A」のみです（OpenGame Issues）。

リリース直後の初期不安定期に入っています。

Issue #5ではGameCoder-27BとOpenGame-BenchのHuggingFace公開を求めるリクエストが出ており、4月23日時点でモデル本体はまだ未公開です。

運用観点としては次の3点を押さえておくのが無難。

社内導入前にClaude Code等でコードの静的スキャンを通す（npm依存ツリー含む）
APIキーは最初は検証用サブアカウントで切る。素材生成4プロバイダ分のキーが必要なため、権限の最小化を徹底
本番機能組み込みは数バージョン様子を見る。4月末〜5月の安定化を待ってから

ここを踏んだ上で試す分には、Apache-2.0＋OSS＋論文ベンチ業界最高水準という組み合わせは、2026年前半のAIゲーム生成領域でかなり強いカードです。

私は夏までにいくつか日本語デモが出てくると予想します。

FAQ

Q. OpenGameを使うのに必要な費用は月いくらですか

A. OpenGameツール本体は無料（OSS）です。

実費はバックエンドで使うOpenAI互換APIの従量課金のみ。

1ゲーム生成あたりの概算は公式から明示されていません。

Claude Sonnet 4.6を使えばベンチ数値（72.4）に届きますが、その分APIコストは高め。

予算優先ならGameCoder-27B（BH 63.9）で運用する選択肢もあります。

ただし4月23日時点でモデル本体はHuggingFace未公開。

Q. Rosebud AIやMakko AIと比べてOpenGameの強みは何ですか

A. 生成されたゲームのソースコードを手元のファイルシステムに落とせる点、Apache-2.0で改変・再配布が可能な点、そして論文ベンチでCursorを上回るスコアを出している点。

SaaS系はプラットフォーム上で完結する代わりに、コードのポータビリティやカスタマイズ深度で制約が出ます。

逆にブラウザだけで完結させたいならRosebudやMakkoの方が導線が短いです。

Q. 生成されたゲームを自社サイトに組み込んで商用配布できますか

A. OpenGame本体はApache-2.0なのでツール自体の商用利用は可能です。

ただし「生成されたゲームコード」の著作権帰属は、裏で使ったAPIプロバイダの利用規約に依存する部分があります（OpenAI、Anthropic、Doubao等それぞれ規定が異なる）。

商用配布前にAPIプロバイダの利用規約を確認し、法務レビューを挟むことを推奨します。

Q. プログラミング未経験でも使えますか

A. 正直、単独では厳しい。

Node.js 20以上の環境構築、gitコマンド、環境変数の設定、npm link等のコマンドライン操作が前提です。

社内に1人ターミナルを触れる人がいれば成立します。

完全にブラウザ完結でやりたいならRosebud AI（無料プランで週20プロンプト）かMakko AIから試す方が現実的。

Q. ChatGPTやClaudeに直接お願いするのとどう違うんですか

A. 論文Table 1ではClaude Sonnet 4.6を同じ素材として使っても、直書きではBuild Health 58.5、OpenGameのエージェント経由では72.4と14ポイント近い差が出ています。

原因はファイル間整合性・シーン接続・論理一貫性を管理するエージェント側の設計（Template Skill / Debug Skill / hook-driven実装）。

同じLLMでも「周辺の作り込みの有無」でここまで変わる、というのが論文の主張です。

このページに出てきた言葉

OSS（オープンソースソフトウェア）: ソースコードが公開され、誰でも閲覧・改変・再配布できるソフトウェアの総称
LLM（大規模言語モデル）: ChatGPTやClaudeのような大規模言語AIモデル。Large Language Modelの略
エージェント: AIに目的を伝えると、AI自身が手順を分解して順に実行してくれる仕組み
Apache-2.0: オープンソースのライセンスの1つ。著作権表示と変更通知を守れば商用利用・改変・再配布が自由
Build Health: OpenGame論文の評価指標。生成ゲームが起動エラーなく動き、見た目が崩れていないかを測る
環境変数: パソコンが起動時に覚えてる設定値。echo $XXX で中身が見られる
ファインチューニング: 既存AIモデルに追加データで再学習させ、特定用途向けに性能を上げる作業
強化学習: 試行錯誤の結果にスコアを返して、AIがみずから改善するように学習する方式
hook-driven: ゲームの各処理に「ここで割り込んでね」という差し込み口を埋めて、エージェントが順に修正していく設計

関連リンク

OpenGame GitHubリポジトリ: github.com/leigest519/OpenGame
OpenGame公式プロジェクトページ: opengame-project-page.com
論文 (arXiv): arXiv 2604.18394
論文 (Hugging Face): huggingface.co/papers/2604.18394
CUHK MMLab公式: mmlab.ie.cuhk.edu.hk
Rosebud AI公式: rosebud.ai
Makko AI正式ローンチ発表: Yahoo Finance
Apache-2.0ライセンス解説: FOSSA
Apache License 2.0 原文: apache.org

この記事を書いた人

aisola

Aisola Lab 運営者

AIツールを使ったコンテンツ制作・リサーチ・WordPress運用を日常的にやっています。自分で動かせるものは実際に触って書き、触っていないものは公式ドキュメントと一次情報をもとに書き分けています。

運営者情報 X（@ai_sola27）note

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-AI選び, OpenGame

AI活用全般

2026/7/15

ChatGPT Sitesで家計簿・進捗ボードを作ってURLで配る手順｜サーバー契約もコードも不要

課金中のChatGPTに、プロンプトからWebサイトを作ってURLで配れる「ChatGPT Sites」が入り始めました。サーバー契約もコードも要らず、家計簿・進捗ボード・イベント案内級の小さいサイトを作って共有できるのが売りです。ただしパブリックベータで、容量やデータの保存地域など公式が数字を出していない部分もあります。この記事は課金中のChatGPTで小さなWebサイトを作って誰かに配りたい非エンジニア向け（HTMLを触ったことがなくても読めます）。 ChatGPT Sitesとは？プロンプトか ...

AI活用全般

2026/7/15

ChatGPTに絵コンテを頼むと文字の表しか出ない時｜GPT Image 2で12コマ・秒数つきの撮影設計図を画像1枚で出すプロンプト全文

ChatGPTに「絵コンテを作って」と頼むと、返ってくるのは文字だけの表がほとんどです。でも海外で拡散したあるプロンプトを貼ると、12コマ・秒数つきの撮影設計図が画像1枚で出てきます。 GPT Image 2なら無料プランでも試せて、書き換えるのは商品名の1箇所だけ。この記事は短尺動画を1人で撮っている非エンジニア向け（英語のプロンプトはコピペで大丈夫です）。そもそもこの「12コマ絵コンテ」プロンプトって何？ TikTokやInstagramの短尺動画を撮るとき、多くの人は段取りを頭の中だけで組みま ...

AI活用全般

2026/7/14

Gemini 3.5 Flashは本当に安いのか｜「Proより安い」の裏で前のFlashは3〜6倍値上げ、自分が損か得か見極める

Gemini 3.5 Flashは「3.1 Proより40%安い」も「前のFlashより3〜6倍高い」も、両方ほんとです。無料のGeminiアプリで使う人は前と同じ月額で性能アップ、APIで使う開発者は同じ処理で請求が跳ね上がる。同じモデルなのに損得が逆になります。飛びつく前に、手元の使い方が「無料アプリ側」か「API課金側」かだけは確認しといた方がいい。この記事はGeminiを業務で使い、ChatGPTやClaudeと使い分けているAPIコストが気になる人向け（モデルの料金とトークンの基本が分かれ ...

AI活用全般

2026/7/14

Perplexity ComputerがWord・Excel・Outlookに対応｜会社員の調べ物コピペ往復が消える（月20ドルProから）

WordやExcelの横で調べ物が完結する仕組みが、2026年5月29日に動き出しました。資料を別タブで調べてコピペで戻す、あの往復が消えるという話です。月20ドルのProプランから使えると、Perplexity公式が発表しました。この記事はWord・Excel・Outlookを毎日触る事務・営業・企画職の人向け（関数やプログラミングが分からなくても読めます）。 Perplexity Computerという調べ物AIが、Microsoftのオフィスソフトの中に入りました。Word、Excel、Pow ...

AI活用全般

2026/7/14

Gemini 3.5 Live Translateで旅行・接客・家族の会話を画面見せ合いなしで進める｜Google翻訳に無料で入った同時通訳

スマホの画面を相手に見せ合って、打ち込んで、また見せて。あのもどかしいやり取りが、会話のまま進むようになりました。 Gemini 3.5 Live Translate は、いつものGoogle翻訳アプリに無料で追加された同時通訳機能です。70以上の言語に対応し、サインアップも新アプリも要りません。ただし、契約や医療みたいに誤訳が命取りになる場面では、まだ人の通訳を残したほうがいい。旅行・接客・家族との会話で使い倒すのが、いまの正解だと私は思っています。この記事は英語が苦手で、海外旅行や外国人の接客に不 ...

Adobe CX Enterprise Coworker解剖｜30社AI連携の内訳とSalesforce Agentforceとの選択軸をマーケ責任者・情シス向けに整理

Aadit Sheth氏のFortune 500 AI発信まとめ｜80%稼働・33%スケール・6%成果の一次データをDX提案に使う視点