AI活用全般

Google社員『Claudeが欲しい』告発の一次ソース整理|40,000人数字の真偽と個人・中小企業のAI選び3アクション

この記事の結論(3行)

  • 元Google社員Steve Yeggeが「Google社内ではClaude Codeが事実上使えない」と友人伝で主張、Demis Hassabisが「clickbait」と反論、Gergely Oroszが「複数筋でほぼ事実」と追い打ち。
  • 「40,000人が週次でagentic codingを使っている」という数字はGoogle Cloudディレクター Addy OsmaniのX個人投稿が出所で、Google公式プレスリリースではない。
  • 自社AIを持つGoogleの現場が他社のClaudeを欲しがっているという逆説は、AIツールを1本絞るか使い分けるかの判断材料として効く。私はこの件を「使える」と「使いたい」は別物だと読み解く一次シグナルとして見ている。

2026年4月13日、
元Google社員のSteve YeggeがXで「Google社内のAI採用状況はJohn Deere(トラクター会社)並みだ」と投稿した。
この一言から1週間、
Google DeepMind CEOのDemis Hassabisが「絶対にナンセンス」と反論し、
The Pragmatic Engineerの Gergely Orosz が「複数の情報源からほぼ事実と聞いた」と追い打ちを入れる騒動に発展している。

この記事は、
その騒動そのものを追うゴシップではない。
ChatGPT / Claude / Gemini のどれをメインにするかで迷っている個人や、
社内導入を検討している中小企業の情シスにとって、
この一件がどんな「購買判断シグナル」になるのかを整理する。

結論だけ先に置いておく。
AI選びの一本化は早計で、
用途別の使い分けが現実解。
そして「自社AIを作っている会社の社員が他社AIを欲しがる」という逆説は、
ベンチマーク表より雄弁だ。

Google社内で何が起きた?時系列で追う

まず事実関係を日付順に並べる。
Xやメディア記事で断片的に流通しているが、
5日間で3つのフェーズがあった。

2026年4月13日:Yeggeの元投稿

I was chatting with my buddy at Google, who's been a tech director there for about 20 years, about their AI adoption. Craziest convo I've had all year. The TL;DR is that Google engineering appears to have the same AI adoption footprint as John Deere, the tractor company.

— Steve Yegge(出典: X投稿Simon Willison解説

ここで押さえておきたいのは、
Yegge本人がGoogle社内で検証したわけではない点。
情報源は「Googleで20年テックディレクターを務める友人1名」の伝聞で、
Business Insiderも「独立検証はされていない」と注記している(出典: AOL記事)。
伝聞であることを隠さず、
ここは必ずワンクッション置いて読む。

投稿の具体内容としては、
Googleのエンジニア分布を「20%がagenticパワーユーザー、
20%は完全拒否、
残り60%はCursorや類似のチャットツールを使っている」という3層構造で描写。
1.9 million views、
引用RT 205件、
4,500いいねまで伸びた(出典: VentureBeat)。
バズったのは「自社AIを作っている会社がこれか」という意外性だろう。

2026年4月14日:Hassabisの一撃

Maybe tell your buddy to do some actual work and to stop spreading absolute nonsense. This post is completely false and just pure clickbait.

— Demis Hassabis(Google DeepMind CEO、
出典: VentureBeat
AOL

CEO自らが「お前の友人にちゃんと仕事しろと伝えておけ」と返したわけで、
普通のPR反応ではない。
温度が高い。
普段は公式広報ルートで処理される話を、
CEOが直接殴り返した事実そのものが、
この投稿を無視できないと判断された証左にも読める。

2026年4月20日:Oroszの追い打ち

1週間後、
The Pragmatic Engineerで知られるGergely OroszがXで「複数の情報源から、
だいたい本当だったという話が聞こえてきている。
Googleにとって悪い見た目」と続報を投下(出典: X投稿)。
27.6万インプレッション、
1,173いいねまで伸びた。

Yeggeは同日、
「DeepMindエンジニアはClaudeを日常ツールとして使っている。
それ以外のGoogleの大半はそうではない」というフォローアップも出している(出典: AOL記事)。
「Google全社がClaude禁止」という二次情報が国内で出ているが、
これは誤り。
二層構造だというのがYegge自身の主張だ。

Google側の反論はどこまで成立している?

反論の主役として流通している「40,000人が週次でagentic codingを使っている」という数字。
これ、
出所を確認すると少しニュアンスが変わる。

On behalf of @Google, this post doesn't match the state of agentic coding at our company. Over 40K SWEs use agentic coding weekly here. Googlers have access to our own versions of @antigravity, @geminicli, custom models, skills, CLIs and MCPs for…

— Addy Osmani(Google Cloudディレクター、
出典: X投稿

注意点が2つある。

1つ目、
この「40,000人」はGoogle公式プレスリリースでもブログ記事でもない。
Addy Osmani個人のXポストが一次ソース。
「On behalf of @Google」という表現を使っているが、
形式的には個人アカウントからの発信だ。
VentureBeatも同ポストを出所として引用している。
「Google公式発表」と書いている日本語要約記事は、
ここでひと段低い粒度の話を一段階盛っている。

2つ目、Yegge側の再反論がそこそこ鋭い。

Weekly use of a thin tool is precisely the box-checking I described in the original post. Volume of opens isn't adoption — and 'weekly' is a low bar that includes a lot of people who tried it once and went back to writing code by hand.

— Steve Yegge(出典: AOL記事

「週1回使う」は採用率の定義として甘すぎる、
一度試して元の手書きコードに戻った人を含んでしまう、
という指摘。
これは現場運用者の感覚としてかなり正しい。
個人的にも、
SaaSの「MAU」と実稼働ユーザーの乖離は身に覚えがある人も多い。

Yeggeは続けて「もしGoogleが『エンジニアの半分が1日4Mトークンを燃やしている』と証明してくれるなら謝罪する」と条件付き謝罪まで提示した。
「weeklyで使った回数」ではなく「1日のトークン消費量」こそが真の採用の指標だ、
というわけだ。
歯切れがいい。

なぜこの騒動がAI選びの「一次シグナル」なのか

ここからが本題。
読者にとって本当に効くのは、
誰がケンカしているかではない。
何を選べばいいかだ。

私はこの騒動の核を「使える」と「使いたい」は別物だと読んでいる。
Googleは自社でGemini、
Antigravity、
gemini-cli、
カスタムモデルを開発している。
社員は業務上、
それらを「使える」環境にいる。
にもかかわらず、
少なくとも一部の現場から「Claudeを使いたい」という声が漏れている、
とYeggeは伝聞で主張している。

これは「自社製品より他社製品が現場で選ばれている」という、
企業にとって最も触れられたくないタイプのシグナル。
もちろんGoogle側は全否定しているし、
伝聞なので確証はない。
ただ、
否定の温度と追い打ちの早さを見ると、
完全にデマで片付けるのも難しい。
この温度差こそが、
ベンチマーク表より雄弁な「現場プロの選好」だ。

では、
この選好はどこから来ているのか。
SWE-bench Verifiedという、
コーディングエージェントを評価する標準ベンチマークの最新数値を見ておく。

モデルSWE-bench Verifiedリリース/測定
Claude Mythos Preview(Anthropic)93.9%1位
Claude Opus 4.7(Anthropic)87.6%2026年4月16日リリース
GPT-5.3 Codex(OpenAI)85%3位
Claude Opus 4.5(Anthropic)80.9%4位
Gemini 2.5 Pro(Google)63.8%29位相当

出典: SWE-bench Verifiedリーダーボード(2026年4月20日測定)。

Claude Opus 4.7(87.6%)とGemini 2.5 Pro(63.8%)の差は約24ポイント。
SWE-benchは「GitHub上の実際のissueをどれだけ自律的に解決できたか」を測る、
つまり業務コーディングの実用評価に近い指標だ。
24ポイント差はちょっと大きい。
なお、
Gemini 3.1 Proはこのリストには掲載されていないので、
最新Geminiとの差はこの数字とは別枠で評価する必要がある。

数字だけを見ても、
Yeggeが「現場はClaudeを欲しがっている」と主張する根拠として弱くはない。
ベンチマークで2割以上の性能差があれば、
日常のコーディング現場で体感差が出るのは自然な話。

用途別にどのAIを選ぶべきか

とはいえコーディングだけがAIの仕事ではない。
ChatGPT / Claude / Gemini のどれを「1本」に絞るかで悩んでいる人が多いが、
用途によって強みが違いすぎるので、
私は「1本化は無理、
使い分けが現実解」という立場。
具体的に並べる。

用途強い候補根拠
コーディング / エージェント開発Claude(Opus 4.7)SWE-bench Verified 87.6%、Gemini 2.5 Pro比+24pt(benchlm.ai
長文資料の読み込み・要約Claude(Opus 4.7以降)1Mトークンコンテキストを標準価格で提供(morphllm
Google Workspace業務(Gmail/Docs/Sheets)GeminiBusiness Standard以上に追加費用なしで統合、ネイティブ連携(Workspace公式
検索連携 / 最新情報アクセスGeminiGoogle Search直結、MAU 7億5000万の規模(TechCrunch
Microsoft 365業務(Word/Excel/Teams)ChatGPT / CopilotCopilot CoworkがWord/Excel/PowerPoint/Teams/Outlookにネイティブ統合(Microsoft公式
マルチモーダル(画像・音声・動画)Gemini / ChatGPTGemini Liveの音声対話、ChatGPT Voice含む幅広い入出力

この表を見たうえで、
Google社員の「Claudeを使いたい」という声を重ねると、
騒動の合理性が見えてくる。
コーディング用途に限れば、
Claudeの優位は数字で説明できる。
GoogleのエンジニアがAI開発のプロとして「業務上使うべき最適解」を選ぶなら、
Anthropicの製品に手が伸びても不思議ではない。

一方、
読者がGoogle Workspaceで日々メール・ドキュメント・スプレッドシートを回しているなら、
Gemini一択になる場面が必ず出る。
「Claudeが強い」は事実、
「だからGeminiは要らない」は飛躍。
これを混同しないのが、
個人としてのAIリテラシーの分かれ目だと思う。

個人・中小企業が今日から取る3アクション

騒動を眺めるだけでは何も変わらない。
読者の立場別に、
具体的な行動を3つに絞って提示する。

アクション1:「業務の中核」と「周辺作業」を分ける

月額予算が1ツール分しか取れない場合、
中核業務に強いAIを1つ選ぶ。
コーディング・技術ドキュメント作成が中核ならClaude Pro($20/月、
Claude Code込み、
出典: claude.com/pricing)。
Google Workspaceが中核ならGemini(Business Standard以上のWorkspaceプランに追加費用なしで含まれる)。
Microsoft 365が中核ならCopilot。
この順番を間違えると、
せっかく課金してもフィットしない。

アクション2:公式数字を「そのまま」信じない癖をつける

今回の「40,000人が週次でagentic codingを使っている」も、
よく見るとGoogle Cloudディレクター個人のXポストが出所。
「公式発表」と二次メディアが書いていても、
一次ソースまで辿る習慣をつけると、
ベンダーの主張と現場の実態のズレが見えるようになる。
これはAI選びに限らず、
SaaS選定全般に効く基礎体力だと思う。

アクション3:中小企業の情シスは「ベンダーロックイン前提」で契約しない

GoogleもMicrosoftも「自社エコシステムで完結」を売り込んでくる。
ただ今回の騒動が示すように、
現場のエンジニアはベンチマークと作業体験で他社製品を選ぶ。
1社に全工程を預ける契約より、
中核ツール+補完ツール+API利用の3点セットで契約する方が、
最新モデルの出入りに追従しやすい。
Claude Teamスタンダードは$25/座席/月、
Gemini Business Standardは追加費用なしで統合。
組み合わせても月額の合計は読める範囲に収まる。

結局、
どのAIが「正解」ではない。
業務の形に合わせて組み合わせる、
それだけの話だ。

よくある疑問

Q. Google社員はClaude Codeを使えないのですか?

Yeggeの元投稿は「Google社内のAI採用状況はJohn Deere並み」という表現で、
Google全社でClaude Codeが禁止されているとは書いていません。
4月20日のフォローアップで、
Yegge自身が「DeepMindエンジニアはClaudeを日常ツールとして使っている。
それ以外のGoogleエンジニアはそうではない」という二層構造を明示しています(出典: AOL記事)。
Google側はHassabis CEOが全面否定。
「社員全員が禁止されている」という二次情報は誤りです。

Q. 「40,000人が週次でagentic codingを使っている」はGoogle公式発表ですか?

Google公式プレスリリースやブログ記事ではありません。
Google CloudディレクターのAddy Osmaniが個人Xアカウントで発信したポスト(該当ポスト)が一次ソースです。
「On behalf of @Google」という表現は使われていますが、
形式上は個人発信です。
VentureBeatも同ポストを出所として報道しています。

Q. ChatGPT / Claude / Gemini のうち、1本だけ選ぶならどれがいいですか?

業務の中核によって変わります。
コーディング・技術文書中心ならClaude(SWE-bench Verified 87.6%、
1Mトークンコンテキスト)。
Google Workspace中心ならGemini(Business Standard以上に追加費用なしで統合)。
Microsoft 365中心ならChatGPT / Copilot(Word/Excel/Teamsにネイティブ統合)。
1本化が難しければ、
中核1つ+補完1つの2本立てが現実的です。

Q. SWE-benchの数字だけでAIを選んでいいですか?

コーディング用途なら有力な参考値ですが、
Gemini 3.1 Proはリーダーボードに未掲載など、
最新モデルが全て載っているわけではありません(出典: benchlm.ai)。
また、
Workspace連携や検索連動、
音声・画像マルチモーダル用途はSWE-benchでは測れません。
ベンチマーク数値と自分の業務フィットを両輪で見るのがおすすめです。

Q. 中小企業がAIを導入する場合、1社完結と複数使い分けのどちらがいいですか?

「中核業務ツール+補完ツール」の2本立てが現実的です。
理由は、
AIモデルの更新速度が速く、
1社完結だと最新モデル(例えばClaude Opus 4.7のSWE-benchが87.6%まで伸びた)の恩恵を受け損ねるからです。
Gemini Business Standardは既存Workspaceに追加費用なしで統合、
Claude Teamスタンダードは$25/座席/月。
組み合わせても月額は読めます。

関連リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-,

← 戻る