AI活用全般

Google Deep Research Max実態整理|夜間バッチで朝レポ納品・$3〜$7で93.3%精度、非エンジニア実務者の使い分け判断軸

この記事の結論(3行)

Google Deep Research Maxは「夜中に走らせて朝レポートが置いてある」用途に振り切った非同期リサーチAIで、
Gemini API経由でしか叩けない。

DeepSearchQA 93.3%・HLE 54.6%と数字は強いが、
料金は「preview rates基準・変更予定」と公式が明言しており、
1レポートあたり$3〜$7が目安。

Gemini App内蔵の旧Deep Research(無料月5回)とは完全に別物。
中小の企画・マーケ層は「旧版で十分な案件」と「Maxに投げるべき案件」を切り分けるほうが現実的。

Googleが2026年4月21日に「Deep Research」と「Deep Research Max」という2種類のAIリサーチエージェントをGemini APIで公開した。
これがなかなか興味深い。
旧Gemini Deep Research(Gemini App内蔵・月5回無料のあれ)を触ったことがある人なら、
Max版の話は「あの延長線の重厚版」で通じます。

公式ブログの表現を借りると、
Max版は「夜間の定期実行で、
朝には分析チーム向けに徹底的なデューデリジェンスレポートが仕上がっている」
という使い方を想定している。
これ、
発想がだいぶ違う。

リサーチに半日取られていた非エンジニア実務者の視点で、
公式ブログ・APIドキュメント・VentureBeat・the-decoderの一次二次ソースをAIO骨格で整理していきます。

Google Deep Research Maxとは何か(公式発表の要点)

まず一次ソースから。
Sundar Pichai氏のXポスト(2026年4月21日)はこう書いている。

「We are launching two powerful updates to Deep Research in the Gemini API, now with better quality, MCP support, and native chart/infographics generation. Use Deep Research when you want speed and efficiency, and use Max when you want the highest quality context gathering」

出典: Sundar Pichai X(2026-04-21)

要点はこの3つです。

  • Gemini API経由のDeep Researchエージェントが標準版とMax版の2系統に分かれた
  • MCP(Model Context Protocol)対応で外部データソースに繋げるようになった
  • 出力内にチャート・インフォグラフィックをネイティブ生成するようになった

ベースモデルはGemini 3.1 Pro。
モデルIDはdeep-research-max-preview-04-2026(Max版)とdeep-research-preview-04-2026(標準版)。
提供形態はGemini APIのpaid tierでのpublic preview、
Interactions API経由でのみ叩ける仕様です(出典: Gemini API Deep Research公式ドキュメント)。

ちなみにInteractions APIというのは2025年12月に先行導入された長時間タスク用API。
Deep ResearchエージェントはこのInteractions API専用です。

Deep Research Maxと標準版は何が違うのか

公式ブログ・APIドキュメントから数字を拾うと、規模感がけっこう違う。

項目Deep Research(標準版)Deep Research Max
最適化軸速度・効率・低レイテンシ反復推論・extended test-time compute
用途インタラクティブUI向け非同期バックグラウンドワークフロー向け
典型の検索回数約80回約160回
典型の入力トークン約25万最大90万
典型の出力トークン約6万約8万
1タスクあたり推計コスト$1.00〜$3.00$3.00〜$7.00
最大リサーチ時間60分(通常20分以内)

表だけ見ると「Maxは標準版の2〜3倍くらい重たい」という印象ですが、
公式ブログの言葉を借りるとニュアンスが変わる。

「It is the perfect engine for asynchronous, background workflows such as a nightly cron job triggering the generation of exhaustive due diligence reports for an analyst team by morning.」

出典: Google公式ブログ

「夜中にcronで走らせて、
朝までに分析チーム向けのデューデリジェンスレポートが置いてある」
という使い方。
これ、
今までのリサーチAIと思想が違いますね。
ChatGPTやPerplexityは「聞いたら数十秒〜数分で答えが返ってくる同期型」だが、
Max版は「寝てる間に1時間がっつり調べさせる非同期型」。

個人的には、ここが一番の発想転換ポイント。私はここに一番惹かれてます。

APIドキュメントにも明記されていて、
「Best suited for workloads that require an 'analyst-in-a-box' approach rather than low-latency chat」と書かれている(出典: Gemini API Deep Research)。
「アナリスト・イン・ア・ボックス」という表現が公式から出ているのがおもしろい。

ベンチマーク数字はどれくらい強いのか

OfficeChai・VentureBeat・公式ブログで共通して出ている数字がこれ。

ベンチDeep Research Max標準版前バージョン(2025年12月)他社
DeepSearchQA93.3%81.8%66.1%GPT 5.4 Thinking: 88.5%
Humanity's Last Exam(HLE)54.6%50.4%46.4%GPT 5.4: 53.4%
BrowseComp85.9%61.9%59.2%GPT-5.4 Pro: 89.3%/Claude Opus 4.6: 84%

4ヶ月でDeepSearchQAが27.2ポイント、
BrowseCompが26.7ポイント上昇
している。
これは正直やばい。
前バージョン(2025年12月)の66.1%→93.3%は、
単世代でのジャンプとしてはかなり大きい。

ただ、the-decoderが冷静な留保を入れている。

「benchmark comparisons aren't quite apples to apples—OpenAI's comparison model and Anthropic's methodology differ from Google's testing approach」

出典: The Decoder

BrowseCompはGPT-5.4 Proのほうが上(89.3% vs 85.9%)。
ベンチだけで「Google Max全勝」と読むのは雑です。

さらにVentureBeatは内部評価の揺れも報じている。
Max版は旧バージョンに対してほぼ全方位で上回るものの、
「internal consistency and faithfulness」(内部整合性・忠実性)では旧版がわずかに上だった、
と(出典: VentureBeat)。

ベンチ数値は強い。トレードオフはある。両方セットで読むのが筋です。

MCP対応で何が繋がるのか(金融3社提携の中身)

Max版の目玉機能のひとつがMCP(Model Context Protocol)対応。
公式ブログにはっきり書いてある。

「Google collaborates with FactSet, S&P Global, and PitchBook for MCP server design」

出典: Google公式ブログ

3社の役割分担はこう。

  • FactSet:金融・投資データ(SEC filings、earnings transcriptsと組み合わせて参照)
  • S&P Global:格付け・金融情報
  • PitchBook:プライベートエクイティ・VC・未上場企業データ

VentureBeatが活用イメージを具体化していて、
これがわかりやすい。
「金融アナリストがDeep Research Maxに『2026年第1四半期の銀行セクターリスクに関するレポートを作って』と頼めば、
エージェントがパブリックWebとFactSetの独自データを混ぜて両方を引用する。
従来3つのツールと人間の1日分の作業が必要だった」
(同上)。

ここで注意点がひとつ。
公式ブログの英文は「for MCP server design」
つまり「設計段階での協業」と読める。
「既にFactSetやS&P Globalに繋ぎ込み済みで今日から使える」わけではない可能性が高い。
断定表現は避けたほうが安全です。

では中小・個人事業主に何の関係があるのか。
私が注目しているのはここ。
MCPは特定3社専用の仕様ではなく、
仕様自体はオープン。
Notion・Google Sheets・Slackなど、
自社の業務データに繋ぐMCPサーバーを自前で立てればMax版から参照できる世界線が見えてきます。

海外メディアはエンタープライズ前提で書いてますが、
小回りの効く個人・中小のほうが実験は早いはず。

料金はいくらなのか(preview rates基準で要注意)

ここは歯切れよく書きにくいゾーン。
公式Pricingページの表現を素直に引くとこう。

「These figures are estimates based on preview rates and are subject to change.」

出典: Gemini API Pricing

要するに「preview段階の目安で、
確定価格は出していない」。
その上での参考値はこうです。

項目単価
Gemini 3.1 Pro 入力(200kトークン以下)$2.00 / 1Mトークン
Gemini 3.1 Pro 出力(200kトークン以下)$12.00 / 1Mトークン(thinking token含む)
Gemini 3.1 Pro 入力(200kトークン超)$4.00 / 1Mトークン
Gemini 3.1 Pro 出力(200kトークン超)$18.00 / 1Mトークン
Deep Research Max 1タスクあたり目安$3.00〜$7.00
Deep Research 標準版 1タスクあたり目安$1.00〜$3.00
Max版典型例(入力90万+出力8万トークン)約$4.80/レポート

比較参考として、
Artificial AnalysisはOpenAIのDeep Research APIについて「up to ~$30 per API call!」と報告している(出典: Artificial Analysis X)。
GoogleのMaxが$3〜$7、
OpenAIが最大$30。
この差は正直でかい。

とはいえ、
先ほど書いた通り「preview rates、
subject to change」の注記付き。
本番導入を検討するなら、
価格確定前提での試算は危険です。
公式Pricingページで最新の単価を確認してから動いたほうがいい。

Gemini App内蔵の旧Deep Researchとの関係は?

ここが一番混乱しやすいポイント。並べるとこうです。

  • Gemini App内蔵のDeep Research(一般ユーザー向け):無料プラン月5回/Pro日20回/Ultra日200回。Gmail・Drive・Chat連携可能、45言語・150カ国対応
  • Deep Research Max(API専用):Gemini APIのpaid tier経由でのみアクセス可能。Gemini Appからは使えない

VentureBeatが拾っているX上の不満も象徴的。

「Not on Gemini app」「Google keeps punishing Gemini App Pro subscribers for some reason」

出典: VentureBeat記事内引用

Gemini App Proを契約していてもMax版は付いてこない。
ここは期待値調整が必要です。

個人的には、
「普段のリサーチは旧Deep Research、
腰を据えて深掘りする時だけMax」
という使い分けが、
中小の企画・マーケ層には現実的だと思ってます。
毎回Maxに投げるのは金額的にもオーバーキル。
私ならそう組み立てます。

「夜間バッチ運用」は本当に現実的なのか

公式が推す「nightly cron job」という使い方。
日本語に訳すと「夜中に自動で走らせる定期実行」です。
寝る前にAPIを叩いて、
朝起きたらレポートが出来ている。

これは業務時間の使い方そのものが変わる可能性がある。
VentureBeatの書き方が刺さります。

「In financial services, where analysts routinely spend hours assembling due diligence reports from scattered sources — SEC filings, earnings transcripts, market data terminals, internal deal memos — Deep Research Max offers the possibility of automating the initial research phase entirely.」

出典: VentureBeat

金融アナリストの話として書かれているが、
構造は中小のマーケ・企画職にもそのまま当てはまる。
競合調査・業界動向・新市場のリサーチで「半日潰れる」やつ。
あれを夜間バッチに回せるなら、
日中は意思決定と実行に集中できる。

ただし、Redditの冷静な声も無視できない。

「a huge number of products labeled 'AI agents' in 2025-2026 marketing are just automation workflows with a chatbot interface that do not reason, do not adapt when plans fail, and do not complete tasks end-to-end」

出典: r/ArtificialIntelligence(RAND 2025調査引用/AIエージェントプロジェクトの80〜90%が本番環境で失敗)

RAND 2025の調査ではAIエージェントプロジェクトの80〜90%が本番で失敗している、
という数字も出回っている。
Max版が「勝手に調べて朝にレポート」までやり切れるのか、
ここは時間をかけて検証される必要があるゾーン。

公式ドキュメント自身が「The Interactions API is in public beta. Features and schemas may change.」と書いているので(出典: Gemini API Deep Research)、
本番ワークフローに組み込むのはもう少し様子を見てからが無難です。

他のリサーチAIとの棲み分け

比較軸を整理するとこう。

ツール強み向いている使い方
Google Deep Research Max非同期・長時間・大量トークン・MCP対応夜間バッチで重厚なレポートを仕上げる
Google Deep Research(標準版)低レイテンシ・対話向きインタラクティブUIに組み込む
旧Gemini Deep Research(App内蔵)無料枠あり・Gmail/Drive連携日常の軽めのリサーチ
OpenAI Deep Research API文章品質の評価が高い最終レポートの文章完成度重視
Perplexity Deep Researchブラウザ型・即答性その場で要点を掴みたい時
Claude Opus 4.6BrowseComp 84%(推論無効時)・バランス型長文整理と推論を一緒にやりたい時

Reddit(r/ArtificialIntelligence)にこんな観測もある。
「ChatGPT Deep Researchは文章品質が良く、
Gemini Deep Researchは技術トピックのソース網羅性が良い」

どちらかが絶対的に上というより、
文章が欲しいのかソース網羅が欲しいのかで選び分けるのが筋ですね。

直接比較というより補完。ここは大事。

中小・個人がまず何をすべきか

副業・個人事業主〜中小の企画・マーケ層の目線で、
現実的な導入ステップを組むとこう。

  1. まず旧Gemini Deep Research(App内蔵)で「非同期リサーチの感触」を掴む。無料プランで月5回試せる。Max版の$3〜$7を払う前にここが先
  2. Max版が必要かを「所要時間×頻度」で判断する。週1回・半日潰れるリサーチが10本あるなら、$3〜$7×10 = 月$30〜$70の投資で日中時間が買える計算
  3. Interactions APIの仕様を公式ドキュメントで確認するagentbackground=trueagent_config.type="deep-research"等の必須パラメータ)
  4. MCP接続は後回しでいい。まずWeb検索オンリーでの出力品質を確認する。MCPは自社データソースを足す段階で考える
  5. 価格確定まで本番ワークフロー組み込みは保留。preview rates変更リスクは公式明記

特に2が現実解。
日中3時間のリサーチを週2本やってる人なら、
月$30前後で24時間分が戻ってくる試算になる。
時給換算すると余裕で元が取れるライン。

FAQ

Q1. Gemini App Pro契約していれば、Deep Research Maxも使えますか?

使えません。
Max版はGemini APIのpaid tier経由でのみアクセスできる仕様です(出典: Gemini API Deep Research公式ドキュメント)。
Gemini App内蔵の通常Deep Research(無料月5回/Pro日20回/Ultra日200回)とは別建てです。

Q2. 1レポートあたりの料金は本当に$3〜$7で済みますか?

公式は「preview ratesに基づく目安で、
変更される可能性がある」と明記しています(「These figures are estimates based on preview rates and are subject to change.」
Gemini API Pricing)。
Max版の典型例(入力90万+出力8万トークン)で約$4.80/レポートという試算も出ていますが、
本番導入前に最新のPricingページで確認することが必要です。

Q3. MCP対応で、自社のNotionやGoogle Sheetsにも繋げますか?

MCP(Model Context Protocol)自体はオープン仕様です。
公式が提携として明示しているのはFactSet・S&P Global・PitchBookの3社で、
これは「MCPサーバー設計での協業」と書かれています(「Google collaborates with FactSet, S&P Global, and PitchBook for MCP server design」
Google公式ブログ)。
自社データ接続は自前のMCPサーバー実装が必要です。

Q4. 標準版のDeep ResearchとMax、どちらを選ぶべきですか?

Sundar Pichai氏のX投稿の言葉がそのまま答えです。
「Use Deep Research when you want speed and efficiency, and use Max when you want the highest quality context gathering」(出典: Sundar Pichai X)。
低レイテンシの対話UIに組み込むなら標準版、
夜間バッチで1時間かけて深掘りしたいならMax版です。

Q5. ベンチマークでGoogle Maxが全部勝っているように見えますが?

BrowseCompはGPT-5.4 Proが89.3%でGoogle Max 85.9%を上回っています。
また、
the-decoderは「benchmark comparisons aren't quite apples to apples」とテスト手法の違いに留保を入れています(出典: The Decoder)。
VentureBeatも「内部整合性・faithfulnessは旧版がわずかに上」と報じています。
数値の強さとトレードオフをセットで読む必要があります。

Q6. public betaと書かれていますが、本番業務で使っても大丈夫ですか?

公式ドキュメントは「The Interactions API is in public beta. Features and schemas may change.」と明記しています(Gemini API Deep Research)。
仕様変更のリスクがあるため、
ミッションクリティカルなワークフローに直結させるより、
まずは単発タスク・社内検証から始めるのが現実的です。

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, ,

← 戻る