AI活用全般

GPT-5.5漏洩47分の時系列整理|arcanine・glacier-alpha・HeisenbergでOpenAIの特化モデル路線と個人開発者が今日やる準備5つ

この記事の結論

2026年4月22日、OpenAI Codexのモデル選択画面が47分だけ社内テスト用モデル群を露出させた(出典: StartupFortune)。

見えた名前は「GPT-5.5 / arcanine / glacier-alpha / Heisenberg / oai-2.1」など、用途別の社内コードネーム群。

汎用1本から用途別の並列展開へ、OpenAIの舵切りが47分の画面越しに透けた。

これが今回の論点です。

この記事はChatGPT PlusやProを払いながらClaude Codeも横で使っている開発者・個人ユーザー向け(モデル名・サブスクの仕組みが分かる前提で読めます)。

ChatGPT PlusやProを払いながら、Claude Codeも横に開く人が今いちばん気にしているのは「次のOpenAIモデルは、Codex軸の作業に刺さるのか」だと思います。

4月22日の漏洩事件は、その答えの前半を47分だけ見せました。

ただし公式声明は一切出ていない(出典: DeepInsightAI)。

ここが今回の記事のトーンを決めます。

なので本稿は、漏れた一次ソースの原文・スクショ報道・OpenAI幹部の公開発言を引きながら、時系列で何が起きたかと、個人開発者が今日やれる準備5つを並べます。

推量は最低限です。

47分で何が起きたのか

事件の骨格はシンプルです。

ルーティング設定のミスで、本来アクセス制限されている社内テスト用の通信窓口が本番環境に露出しました(出典: AIBase)。

an internal testing environment was mistakenly deployed to production(AIBase 報道より)

露出したのはChatGPT本体ではなくCodexアプリ側。

コマンドライン版とデスクトップ版のモデル選択画面に、ラインナップされるはずのない名前が並びました。

私はここがこの事件の本質だと思います。

StartupFortuneによると、OpenAIのエンジニアリングチームは気づいた直後に通信窓口を閉じ、開発者向けAPIを止め、関連スレッドの削除も行いました。

とはいえ動画とスクショは拡散済み。

videos were already cached, mirrored, and dissected across a dozen forums(出典: StartupFortune

開発者コミュニティ側でも複数環境での同症状を確認する投稿が並びました(出典: Hacker News thread)。

単発の幻ではない。

ここまでが事実部分。

47分という数字は、StartupFortune・AIBase・PiunikaWeb・DeepInsightAIの複数ソースで一致しており、日付とルーティングエラーの発生原因はほぼ固まっています。

漏洩したコードネーム群はどう並んでいたか

報道を突き合わせると、モデル選択画面に出てきた名前はこのあたりです。

表示名報道上の説明出典
GPT-5.5「エージェント型プログラミング特化」。セッションメタデータに「GPT-5.5」と識別StartupFortune
arcanine「ツール使用・複数ステップ作業・自律タスク向けに調整されたエージェント実行モデル」との解釈DeepInsightAI
glacier-alpha「メモリ拡張モデル。会話をまたいだ記憶と長時間タスクの継続ができる」と解釈DeepInsightAI
Heisenberg用途は公式未確認。ライフサイエンス向けとの推測が一部報道にあるが裏付けなしAIBase
oai-2.1OpenAIの社内番号体系の新系列と見られるPiunikaWeb
GPT-5.3-Codex-Spark既に公式リリース済み。1000トークン/秒以上、リアルタイムコーディング向けの軽量版OpenAI公式
GPT-Rosalind4/16に公式リリース済みのライフサイエンス特化モデル。漏洩リストにも存在OpenAI公式

StartupFortuneが引用したセッションメタデータの記述はこうなっていたとされます。

build identified in session metadata as GPT-5.5, running under a framework labeled Glacier-alpha, codename Arcanine(StartupFortune)

つまり名前は3層。

表示上は「GPT-5.5」、動作する仕組みの名前が「Glacier-alpha」、社内コードネームが「Arcanine」。

一般ユーザーの目に触れるのはGPT-5.5のラベルだけで、他は本来隠れる層。

そこが全部見えた。

これは事故としてなかなかえぐい。

ただ、Coaley Peakは冷静にこう付け加えています。

Experimental codenames including arcanine, glacier-alpha, heisenberg, and oai-2.1 may never reach general availability, may be renamed, or may not exist as described(出典: Coaley Peak

製品化されるとは限らないし、名前が変わる可能性もある。

コードネームはあくまでコードネーム。

私はここを押さえずに断言している記事は警戒した方がいいと思います。

「GPT-5.5」という名称自体の怪しさ

webiano.digitalは、そもそも「GPT-5.5」という名称に公式の足跡が無いと指摘しています。

'ChatGPT 5.5' is not an official OpenAI product name I could confirm in current public materials. GPT-4.5 has that trail. GPT-5 has that trail. GPT-5.4 has that trail. GPT-5.5 does not.(出典: webiano.digital

ユーザーが「5.1→5.3→5.4と来たから次は5.5だろう」とバージョン推測で期待値を作ってしまう、という分析です。

ここ地味だけど重要です。

つまり、漏洩で見えた「GPT-5.5」という文字列が、正式リリース時にそのまま製品名として残る保証はない。

コードネームと製品名は別物として扱うべきだと思います。

漏洩中に観察された挙動(公式未確認)

47分の間にアクセスできたPro課金ユーザーの一部が、挙動をスクリーンショットと動画で記録しました。

以下は報道ベースで、いずれも公式確認なしです。

  • 「4時間詰まっていたバグを3分で解決した」との開発者報告(出典: PiunikaWeb/AIBase/StartupFortuneの複数媒体)
  • 「the model felt much faster and significantly more token-efficient」「a clear step up for front-end development tasks」(出典: PiunikaWeb)
  • 1つの自然言語プロンプトから動くPythonコードベースを自律生成。疑似コードではなく動くアプリとして出力(出典: StartupFortune)
  • リアルタイム株式市場データを統合したマルチモーダル推論。モックトレーディング戦略の構築・実行を含む(出典: StartupFortune)
  • WebGLによるインタラクティブ3D環境のリアルタイム描画(出典: StartupFortune)

ベンチマーク系の数字もスクショで漏れました。

ただしこれは漏洩中のサンプルで、公式開示ではありません。

指標報告値扱い
推論速度改善18%(対GPT-5.5 Turbo比)漏洩中のベンチマークスクショ由来。公式未確認
ハルシネーション率削減40%同上。公式未確認

Geeky Gadgetsはこう釘を刺しています。

official performance metrics remain undisclosed(出典: Geeky Gadgets

「18%高速化」「40%削減」という数字を、そのまま確定事実として持ち回らないこと。

私の見方も同じです。

一次ソース付きの引用形式で運ぶのが無難。

OpenAI幹部の発言と「Spud」の位置

事件の文脈を補強する発言がふたつあります。

ひとつめ。

PiunikaWebによると、あるユーザーが「OpenAIが木曜日にGPT-5.5かGPT-6をリリースするなら即サブスクを買う」と投げたXポストに対し、OpenAI CEOは敬礼絵文字(🫡)で返しました(出典: PiunikaWeb)。

「Thursday drop」というシグナルとして広く解釈されています。

ふたつめ。

OpenAI社長はBig Technology Podcast(4/7)でこう語っています。

It's not just incremental. It's a significant change in the way we think about model development.(出典: atalupadhyay.wordpress.com

We're 70 to 80% of the way to AGI.(同)

ついでに「two years worth of research」「big model smell」というOpenAI社長コメントもあります(出典: PrimeAICenter)。

ここで「Spud」の話が絡んできます。

Spudは2026年3月24日にプレトレーニング完了が報告された次世代主力モデルのコードネーム。

テキサス州AbileneのStargate施設、10万台以上のGPU、500億ドル投資で訓練されました(出典: atalupadhyay.wordpress.com)。

同じソースは「GPT-5.5 codename Spud」「Polymarketは80%の確率」「プレトレ完了は3月24日」「2年分の研究が中に入っている」とまとめています。

ただし、Spud(3月24日プレトレ完了・4月中旬の噂)と、Arcanine(4月22日Codex漏洩)は別の情報経路です。

StartupFortuneの「arcanine has a legendary appetite for starchy foods」という一節が「starchy foods = Spud(ジャガイモ)」の隠語だと指摘する声はあるものの、同一モデルかどうかの公式確認はない。

同一視すると一部の日本語記事と同じ誤読をなぞる形になります。

ここは分けて扱うのが正解だと私は思います。

Anthropic(Claude陣営)との構図変化

漏洩で並んだモデル群を俯瞰すると、OpenAIの舵の向きがなんとなく見えます。

ライフサイエンスのGPT-Rosalind、コーディング速度のCodex-Spark、エージェント実行のarcanine、メモリ特化のglacier-alpha、汎用の5.xライン。

用途別に並列展開する路線です。

DeepInsightAIはこう書いています。

Codex is transitioning from a code generator to an AI operating layer for task execution(出典: DeepInsightAI

Codexはコード生成器ではなく、タスク実行のOS層に変わりつつある、という解釈。

これが合っているなら、個人開発者から見た「Codex」の意味合いも変わってきます。

一方のAnthropicはどうか。

項目OpenAI陣営Anthropic陣営
モデル構成汎用GPT-5.x+特化モデル群(Rosalind/Codex-Spark/arcanine等)Haiku/Sonnet/Opusの3層+Claude Mythos(企業限定プレビュー)
会話の保持長さGPT-5.4で27.2万トークンClaude Opus 4.6で100万トークン(約4倍)
SWE-bench ProGPT-5.4: 57.70%Claude Mythos Preview: 77.80%(20ポイント差)
戦略思想「速度と広さ」志向「深さと正確さ」志向
推定収益/損益2026年損失推定140億ドル年間売上推定25億ドル

出典: tech-insider.org / adam.holter.com / aifire.co

Anthropic CEOはClaude Mythosをこう表現しています。

larger and more intelligent than our Opus models(出典: befreed.ai

OpenAIが「用途別に広げる」なら、Anthropicは「一軸を深く伸ばす」。

個人開発者がCodex中心の作業に倒れているならarcanine/glacier-alpha群の成熟を待つ選択肢、長文の会話と精度重視ならClaude Mythos/Opus系の継続、というざっくりの分岐になります。

私は正直、どっちに振るかはここ数週間の正式発表を見るまで決めないつもりです。

正式発表前に個人開発者が今日やれる5つの準備

漏洩事件の一番もったいない受け取り方は、「すごい」で止めることです。

47分は過ぎたけど、正式ローンチ前にやれる下準備はあります。

  1. Codexアプリを今のうちに入れておく:コマンドライン版とデスクトップ版の両方。インストール作業は5〜10分。モデル選択画面で新モデルが降ってきたとき、画面の場所を知ってるだけで初動が違う。
    具体手順: 公式サイト(openai.com/codex/)からダウンロード→ChatGPTアカウントでログイン→モデル選択画面が出ることを確認。詰まりやすいのはログイン直後の認証で、Pro/Plusの契約が紐づいていないと選択肢が出ない。
  2. 現行モデルでベースラインを取る:GPT-5.4・Claude Opus 4.6・Gemini 3.1で、私の定番タスクを5〜10本走らせて記録しておく。1モデル30分、3モデルで90分くらい。新モデル降ってきた日に比較が一瞬で終わる。
    具体手順: 普段の質問テンプレ5本を用意→各モデルに同じプロンプトを投げる→結果をスプレッドシートに貼る。詰まりやすいのは「定番タスクって何だっけ」で、過去1週間のチャット履歴を眺めるのが早い。
  3. 課金プランの「解約→再加入」ルールを把握:Plus/Proの月次切り替え、Claude Proの休止ポリシー。Plusは月20ドル、Proは月200ドル、Claude Proは月20ドル。漏洩事件でサブスクを乗り換える人が増える局面は、契約を迷う前に手元で仕様を確認しておく。
    具体手順: 各サービスのアカウント設定→billing→解約後の再加入時の請求日がどうなるかを確認。詰まりやすいのは「途中解約しても日割り返金は無い」点で、月初に判断しないと損する。
  4. ベンチ情報を一次ソースで追う口を決めておく:OpenAI公式blog、Anthropicのresearchページ、Hacker News、OpenAI幹部のXアカウント。RSSかTwitterリストでまとめておくと、正式ドロップの瞬間を逃しにくい。準備は30分くらい。
    具体手順: RSSリーダー(Feedlyなど)に公式ブログ2本を登録→Xでリストを作って3〜5アカウント追加→通知をオンにしておく。詰まりやすいのはX側の通知が多すぎて埋もれる点で、リスト単位で開く運用にすると見やすい。
  5. 「18%」「40%」の数字に飛びつかない癖をつける:漏洩ベンチは公式未確認。出典URL付きで引用するだけにして、手元の運用判断は正式ベンチ公開後にやる。ここ、地味だけど効く。
    具体手順: 数字を見たら「公式か、漏洩か、第三者ベンチか」を出典欄に1行メモする→正式発表が出てから乗り換え判断。詰まりやすいのは「みんな乗り換えてる感」のFOMO(取り残される不安)で、私の業務の数字で確かめるまで動かないのが安全。

5つ目、しつこく言いたい。数字ひとり歩きが一番危ない。

FAQ

Q. 「GPT-5.5」と「Spud」と「Arcanine」は同じモデルですか?

公式確認はありません。

Spudは3月24日にプレトレーニング完了が報告された次世代主力モデルのコードネーム(atalupadhyay.wordpress.com)。

Arcanineは4/22 Codex漏洩時にセッションメタデータで識別された別コードネーム(StartupFortune)。

GPT-5.5は漏洩モデル選択画面上の表示名です。

「arcanine has a legendary appetite for starchy foods」という表現がSpudとのリンクを示唆するとの声はありますが、同一性は確認されていません。

Q. 漏洩した「18%高速化」「40%ハルシネーション削減」は信じていい数字ですか?

漏洩中のベンチマークスクリーンショットからの引用で、OpenAIの公式開示ではありません。

Geeky Gadgetsも「official performance metrics remain undisclosed」と明記しています。

記事や会話で引く際は「〜と報告されている(出典: StartupFortune)」の引用形式を崩さないのが安全です。

Q. 正式リリースはいつの見込みですか?

OpenAI CEOは3月時点で「a few weeks away」とコメント(atalupadhyay.wordpress.com)。

4/22にユーザーの「木曜リリースなら即サブスク」というXポストに対して敬礼絵文字で応答(PiunikaWeb)。

PolymarketとManifoldの確率は2026年中旬以前で75%超とされ、tokenmix.aiは「May-June rather than April」の可能性を示唆しています。

確定情報ではありません。

Q. Codex中心の作業なら、Claudeから乗り換えた方がいいですか?

arcanine/glacier-alpha/GPT-5.5が正式に出て、SWE-bench Proなどの公式ベンチが公開されてから判断するのが無難です。

現時点(2026-04-23)ではClaude Mythos PreviewがSWE-bench Pro 77.80%、GPT-5.4が57.70%でAnthropic側が20ポイントリード(adam.holter.com)。

逆転するかどうかは正式発表次第です。

Q. 4/22の漏洩事件を日本語で先に取り上げている記事はありますか?

2026-04-23時点で、4/22のArcanine/Glacier-alpha漏洩事件を主題にした日本語一次記事はほぼ空白状態です。

日本語圏の既存記事はSpud(3月24日プレトレ完了・4月中旬リーク)ベースの展望型が中心で、47分事件そのものの時系列整理はまだ手薄。

本稿はこの空白部分に引用ベースで入り込んでいます。

Q. arcanineとglacier-alphaは何が違いますか?

DeepInsightAIの解釈ベースだと、arcanineは「ツール使用・複数ステップ作業・自律タスク向け」のエージェント実行モデル、glacier-alphaは「会話をまたいだ記憶・長時間タスクの継続」を担当する仕組み。

StartupFortuneのメタデータ引用では「GPT-5.5がGlacier-alphaという仕組みの上で動き、コードネームはArcanine」となっており、3層が重なった構造です。

ただし公式定義はなく、すべて漏洩スクショと報道の解釈なので、正式発表で別の説明に置き換わる可能性は十分あります。

このページに出てきた言葉

Codex
OpenAIが提供するコーディング支援アプリ。コマンドライン版とデスクトップ版がある
モデル選択画面(モデルピッカー)
ChatGPT・Codexの中で「どのAIモデルで応答させるか」を選ぶドロップダウン
コードネーム
製品リリース前に社内で使う仮の呼び名。本番リリース時に別名になることが多い
セッションメタデータ
AIとの1回のやりとりに紐づく裏側の情報。どのモデルが応答したか等が記録されている
ルーティング
通信を「どの行き先に流すか」を決める設定
API
プログラム同士が会話するための窓口
ハルシネーション
AIがそれっぽいけど事実と違う内容を自信満々で出す現象
ベンチマーク
モデルの性能を一定の問題セットで測定して比較する評価
プレトレーニング
AIに大量データを最初に学ばせる段階
トークン
AIが文章を処理する最小単位。日本語だと1文字〜数文字で1トークン
SWE-bench Pro
実際のソフトウェア開発タスクでAIの実力を測るベンチマーク
エージェント
1つの指示で複数のステップを自律的にこなすAI
AGI
人間と同等以上の汎用的な知能を持つAI

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-,

← 戻る