AI活用全般

Google Deep Research Max実態整理|夜間バッチで朝レポ納品・$3〜$7で93.3%精度、非エンジニア実務者の使い分け判断軸

この記事の結論

Google Deep Research Maxは「夜中に走らせて朝レポートが置いてある」用途に振り切った非同期リサーチAIで、Gemini API経由でしか叩けない。

公式が出している数字はDeepSearchQA 93.3%・HLE 54.6%。

料金は「preview ratesの目安で変更予定」と公式自身が断っており、1レポートあたり$3〜$7が目安。

Gemini App内蔵の旧Deep Research(無料月5回)とは完全に別物。

中小の企画・マーケ層は「旧版で十分な案件」と「Maxに投げるべき案件」を切り分けるほうが現実的です。

この記事はリサーチに半日取られている非エンジニア実務者向け(Gemini APIや夜間バッチを触ったことがなくても読めます)。

Googleが2026年4月21日に「Deep Research」と「Deep Research Max」という2種類のAIリサーチエージェントをGemini APIで公開した。

これがなかなか興味深い。

旧Gemini Deep Research(Gemini App内蔵・月5回無料のあれ)を触ったことがある人なら、Max版の話は「あの延長線の重厚版」で通じます。

公式ブログの表現を借りると、Max版は「夜間の定期実行で、朝には分析チーム向けに徹底的なデューデリジェンスレポートが仕上がっている」という使い方を想定している。

これ、発想がだいぶ違う。

リサーチに半日取られていた非エンジニア実務者の視点で、公式ブログとAPIドキュメントを軸に、AIO骨格で整理していきます。

Google Deep Research Maxとは何か

まず一次ソースから。Google公式ブログは新Max版についてこう書いている。

「Use Deep Research when you want speed and efficiency, and use Max when you want the highest quality context gathering.」

出典: Google公式ブログ(2026-04-21)

要点はこの3つです。

  • Gemini API経由のDeep Researchエージェントが標準版とMax版の2系統に分かれた
  • MCP(Model Context Protocol)対応で外部データソースに繋げるようになった
  • 出力内にチャート・インフォグラフィックをその場で生成するようになった

ベースモデルはGemini 3.1 Pro。

モデルIDはdeep-research-max-preview-04-2026(Max版)とdeep-research-preview-04-2026(標準版)。

提供形態はGemini APIの有料枠でのpublic preview、Interactions API経由でのみ叩ける仕様です(出典: Gemini API Deep Research公式ドキュメント)。

ちなみにInteractions APIというのは2025年12月に先行導入された長時間タスク用API。

Deep ResearchエージェントはこのInteractions API専用です。

Deep Research Maxと標準版は何が違うのか

公式ブログとAPIドキュメントから数字を拾うと、規模感がけっこう違う。

項目Deep Research(標準版)Deep Research Max
最適化軸速度・効率・低レイテンシ反復推論・長時間の追加思考
用途対話UI向け非同期バックグラウンド処理向け
典型の検索回数約80回約160回
典型の入力トークン約25万最大90万
典型の出力トークン約6万約8万
1タスクあたり推計コスト$1.00〜$3.00$3.00〜$7.00
最大リサーチ時間60分(通常20分以内)

表だけ見ると「Maxは標準版の2〜3倍くらい重たい」という印象ですが、公式ブログの言葉を借りるとニュアンスが変わる。

「It is the perfect engine for asynchronous, background workflows such as a nightly cron job triggering the generation of exhaustive due diligence reports for an analyst team by morning.」

出典: Google公式ブログ

「夜中に自動で走らせて、朝までに分析チーム向けのデューデリジェンスレポートが置いてある」という使い方。

これ、今までのリサーチAIと思想が違いますね。

ChatGPTやPerplexityは「聞いたら数十秒〜数分で答えが返ってくる同期型」だが、Max版は「寝てる間に1時間がっつり調べさせる非同期型」。

私はここに一番惹かれてます。発想転換のポイントはまさにここ。

APIドキュメントにも明記されていて、「Best suited for workloads that require an 'analyst-in-a-box' approach rather than low-latency chat」と書かれている(出典: Gemini API Deep Research)。

「アナリスト・イン・ア・ボックス」という表現が公式から出ているのがおもしろい。

ベンチマーク数字はどれくらい強いのか

公式ブログで出ている数字がこれ。

ベンチDeep Research Max標準版前バージョン(2025年12月)他社参考値
DeepSearchQA93.3%81.8%66.1%GPT 5.4 Thinking: 88.5%
Humanity's Last Exam(HLE)54.6%50.4%46.4%GPT 5.4: 53.4%
BrowseComp85.9%61.9%59.2%GPT-5.4 Pro: 89.3%/Claude Opus 4.6: 84%

4ヶ月で27.2%伸びた数字です。

これは正直やばい数字です。

4ヶ月でDeepSearchQAが27.2ポイント、BrowseCompが26.7ポイント上昇している。

これは正直やばい。

前バージョン(2025年12月)の66.1%→93.3%は、単世代でのジャンプとしてはかなり大きい。

ただし注意点。

BrowseCompはGPT-5.4 Proが89.3%でMax版(85.9%)を上回っている。

各社の評価手法は完全に揃ってはいないため、「Google Max全勝」と読むのは雑です。

公式ブログにも内部評価の留保がある。

Max版は前バージョンに対してほぼ全方位で上回るが、「internal consistency and faithfulness」(内部整合性・忠実性)では旧版がわずかに上というデータも併記されている。

ベンチ数値は強い。

トレードオフはある。

両方セットで読むのが筋です。

私なら数字単体ではなく、私の用途に合うかで判断します。

MCP対応で何が繋がるのか(金融3社提携の中身)

Max版の目玉機能のひとつがMCP(Model Context Protocol)対応。

公式ブログにはっきり書いてある。

「Google collaborates with FactSet, S&P Global, and PitchBook for MCP server design.」

出典: Google公式ブログ

3社の役割分担はこう。

  • FactSet:金融・投資データ(SEC filings、earnings transcriptsと組み合わせて参照)
  • S&P Global:格付け・金融情報
  • PitchBook:プライベートエクイティ・VC・未上場企業データ

使い方のイメージとしては、金融アナリストがMax版に「2026年第1四半期の銀行セクターリスクに関するレポートを作って」と頼むと、エージェントがパブリックWebとFactSetの独自データを混ぜて両方を引用して仕上げる、という流れになる。

従来は3つのツールと人間の1日分の作業が必要だった領域です。

ここで注意点がひとつ。

公式ブログの英文は「for MCP server design」、つまり「設計段階での協業」と読める。

「既にFactSetやS&P Globalに繋ぎ込み済みで今日から使える」わけではない可能性が高い。

断定表現は避けたほうが安全です。

では中小・個人事業主に何の関係があるのか。

私が注目しているのはここ。

MCPは特定3社専用の仕様ではなく、仕様自体はオープン。

Notion・Google Sheets・Slackなど、自社の業務データに繋ぐMCPサーバーを自前で立てればMax版から参照できる世界線が見えてきます。

エンタープライズ前提の話に見えるが、小回りの効く個人・中小のほうが実験は早いはず。

料金はいくらなのか(preview rates基準で要注意)

ここは歯切れよく書きにくいゾーン。

公式Pricingページの表現を素直に引くとこう。

「These figures are estimates based on preview rates and are subject to change.」

出典: Gemini API Pricing

要するに「preview段階の目安で、確定価格は出していない」。

その上での参考値はこうです。

項目単価
Gemini 3.1 Pro 入力(200kトークン以下)$2.00 / 1Mトークン
Gemini 3.1 Pro 出力(200kトークン以下)$12.00 / 1Mトークン(thinking token含む)
Gemini 3.1 Pro 入力(200kトークン超)$4.00 / 1Mトークン
Gemini 3.1 Pro 出力(200kトークン超)$18.00 / 1Mトークン
Deep Research Max 1タスクあたり目安$3.00〜$7.00
Deep Research 標準版 1タスクあたり目安$1.00〜$3.00
Max版典型例(入力90万+出力8万トークン)約$4.80/レポート

Max版は1レポート3ドル〜7ドル。

OpenAIは最大30ドル、Googleは3〜7ドル。

比較参考として、OpenAIのDeep Research APIは1コールあたり最大で$30前後に達するとの試算もある。

GoogleのMaxが$3〜$7、OpenAIが最大$30。

この差は正直でかい。

とはいえ、先ほど書いた通り「preview rates、subject to change」の注記付き。

本番導入を検討するなら、価格確定前提での試算は危険です。

公式Pricingページで最新の単価を確認してから動いたほうがいい。

Gemini App内蔵の旧Deep Researchとの関係は?

ここが一番混乱しやすいポイント。並べるとこうです。

  • Gemini App内蔵のDeep Research(一般ユーザー向け):無料プラン月5回/Pro日20回/Ultra日200回。Gmail・Drive・Chat連携可能、45言語・150カ国対応
  • Deep Research Max(API専用):Gemini APIの有料枠経由でのみアクセス可能。Gemini Appからは使えない

注意したいのが、Gemini App Proを契約していてもMax版は付いてこないこと。

Pro契約ユーザーから「Gemini Appに来ない」「Google keeps punishing Gemini App Pro subscribers」という不満の声も出ている。

ここは期待値調整が必要です。

旧版は無料で月5回まで。

私は「普段のリサーチは旧Deep Research、腰を据えて深掘りする時だけMax」という使い分けが、中小の企画・マーケ層には現実的だと思ってます。

毎回Maxに投げるのは金額的にもオーバーキル。

私ならそう組み立てます。

「夜間バッチ運用」は本当に現実的なのか

公式が推す「nightly cron job」という使い方。

日本語に訳すと「夜中に自動で走らせる定期実行」です。

寝る前にAPIを叩いて、朝起きたらレポートが出来ている。

これは業務時間の使い方そのものが変わる可能性がある。

公式ブログが想定するシナリオが刺さります。

「a nightly cron job triggering the generation of exhaustive due diligence reports for an analyst team by morning.」

出典: Google公式ブログ

金融アナリストの話として書かれているが、構造は中小のマーケ・企画職にもそのまま当てはまる。

競合調査・業界動向・新市場のリサーチで「半日潰れる」やつ。

あれを夜間バッチに回せるなら、日中は意思決定と実行に集中できる。

ただし、過度な期待は禁物。

AIエージェント領域は2025〜2026年に「自律的にタスクを最後までやり切る」と謳う製品が乱発されたが、実際は単純な自動化フローにチャットUIを被せただけの製品も多い。

Max版が「勝手に調べて朝にレポート」までやり切れるのか、ここは時間をかけて検証される必要があるゾーン。

公式ドキュメント自身が「The Interactions API is in public beta. Features and schemas may change.」と書いているので(出典: Gemini API Deep Research)、本番ワークフローに組み込むのはもう少し様子を見てからが無難です。

私の現時点の判断は「単発タスクで品質を測る」段階。

他のリサーチAIとの棲み分け

比較軸を整理するとこう。

ツール強み向いている使い方
Google Deep Research Max非同期・長時間・大量トークン・MCP対応夜間バッチで重厚なレポートを仕上げる
Google Deep Research(標準版)低レイテンシ・対話向き対話UIに組み込む
旧Gemini Deep Research(App内蔵)無料枠あり・Gmail/Drive連携日常の軽めのリサーチ
OpenAI Deep Research API文章品質の評価が高い最終レポートの文章完成度重視
Perplexity Deep Researchブラウザ型・即答性その場で要点を掴みたい時
Claude Opus 4.6BrowseComp 84%(推論無効時)・バランス型長文整理と推論を一緒にやりたい時

巷の使用感としてよく言われるのが「ChatGPT Deep Researchは文章品質が良く、Gemini Deep Researchは技術トピックのソース網羅性が良い」という棲み分け。

どちらかが絶対的に上というより、文章が欲しいのかソース網羅が欲しいのかで選び分けるのが筋ですね。

直接比較というより補完。ここは大事。

中小・個人がまず何をすべきか(5ステップ)

副業・個人事業主〜中小の企画・マーケ層の目線で、現実的な導入ステップを組むとこう。

STEP1:まず旧Gemini Deep Research(App内蔵)で「非同期リサーチの感触」を掴む

操作はGemini Appにログインして、モデル選択でDeep Researchを選び、調べたいテーマを投げるだけ。

無料プランで月5回試せる。

期待結果は「10〜30分後にWeb調査済みの数千字レポートが返ってくる」。

詰まりどころは「テーマが広すぎると浅くなる」点。

具体的な業界・期間・観点を絞って投げるのがコツです。

Max版の$3〜$7を払う前に、まずここで非同期型の感触を掴む。

STEP2:Max版が必要かを「所要時間×頻度」で判断する

週1回・半日(4時間)潰れるリサーチが10本あるなら、$3〜$7×10 = 月$30〜$70の投資で日中40時間が買える計算。

時給1,500円換算で月6万円分の時間が戻る試算です。

期待結果は「月$30〜$70の出費で日中時間が確保できる」。

詰まりどころは「Max版に投げる前提でリサーチを設計し直す手間」。

今までのチャット型と発想を切り替える必要があります。

STEP3:Interactions APIの仕様を公式ドキュメントで確認する

操作は公式ドキュメントagentbackground=trueagent_config.type="deep-research"等の必須パラメータを確認する。

期待結果は「叩くべきエンドポイントとパラメータ構造が分かる」。

詰まりどころは非同期API特有の「ジョブIDを保管して、後で結果取得APIを叩く」設計。

同期APIと違うので、ここを最初に押さえないと実装で詰まります。

STEP4:MCP接続は後回しでいい

まずWeb検索オンリーでの出力品質を確認する。

期待結果は「自社データ無しでも実用レベルか分かる」。

詰まりどころは、最初からMCPサーバーを自前で立てようとすると工数が爆発すること。

MCPは自社データソースを足す段階で考えるのが安全です。

STEP5:価格確定まで本番ワークフロー組み込みは保留

preview rates変更リスクは公式が明記している。

期待結果は「価格GA後にコスト試算を確定する」。

詰まりどころは「先行投資して仕組みを作り込んだ後に料金が倍になるリスク」。

GA前の段階では単発検証用途に絞るのが堅い判断です。

特にSTEP2が現実解。

日中3時間のリサーチを週2本やってる人なら、月$30前後で24時間分が戻ってくる試算になる。

時給換算すると余裕で元が取れるライン。

私ならまず1ヶ月この計算で運用してみる。

FAQ

Q1. Gemini App Pro契約していれば、Deep Research Maxも使えますか?

使えません。

Max版はGemini APIの有料枠経由でのみアクセスできる仕様です(出典: Gemini API Deep Research公式ドキュメント)。

Gemini App内蔵の通常Deep Research(無料月5回/Pro日20回/Ultra日200回)とは別建てです。

Q2. 1レポートあたりの料金は本当に$3〜$7で済みますか?

公式は「preview ratesに基づく目安で、変更される可能性がある」と明記しています(「These figures are estimates based on preview rates and are subject to change.」Gemini API Pricing)。

Max版の典型例(入力90万+出力8万トークン)で約$4.80/レポートという試算も出ていますが、本番導入前に最新のPricingページで確認することが必要です。

Q3. MCP対応で、自社のNotionやGoogle Sheetsにも繋げますか?

MCP(Model Context Protocol)自体はオープン仕様です。

公式が提携として明示しているのはFactSet・S&P Global・PitchBookの3社で、これは「MCPサーバー設計での協業」と書かれています(「Google collaborates with FactSet, S&P Global, and PitchBook for MCP server design」Google公式ブログ)。

自社データ接続は自前のMCPサーバー実装が必要です。

Q4. 標準版のDeep ResearchとMax、どちらを選ぶべきですか?

Google公式ブログの言葉がそのまま答えです。

「Use Deep Research when you want speed and efficiency, and use Max when you want the highest quality context gathering」(出典: Google公式ブログ)。

低レイテンシの対話UIに組み込むなら標準版、夜間バッチで1時間かけて深掘りしたいならMax版です。

Q5. ベンチマークでGoogle Maxが全部勝っているように見えますが?

BrowseCompはGPT-5.4 Proが89.3%でGoogle Max 85.9%を上回っています。

また、各社のテスト手法は完全には揃っておらず、公式ブログ自身も「内部整合性・faithfulnessは旧版がわずかに上」と併記しています(出典: Google公式ブログ)。

数値の強さとトレードオフをセットで読む必要があります。

Q6. public betaと書かれていますが、本番業務で使っても大丈夫ですか?

公式ドキュメントは「The Interactions API is in public beta. Features and schemas may change.」と明記しています(Gemini API Deep Research)。

仕様変更のリスクがあるため、ミッションクリティカルなワークフローに直結させるより、まずは単発タスク・社内検証から始めるのが現実的です。

このページに出てきた言葉

Gemini API
Googleが提供する、Geminiモデルにプログラム経由でリクエストを送るための仕組み。Gemini Appとは別建て
Interactions API
数十分かかるような長時間タスクを非同期で動かすためのGemini API。Deep Researchエージェントはこれ専用
public preview / public beta
一般に開放されているが、仕様・料金が確定しておらず変更される可能性がある段階
MCP(Model Context Protocol)
AIに自社のデータベースや外部サービスを参照させるためのオープンな接続規格
低レイテンシ
入力してから返答が返ってくるまでの遅延が短いこと
非同期処理
依頼してすぐ結果を待たず、裏で実行して後で結果を取りに行く方式
トークン
AIが文章を処理する単位。日本語ならだいたい1文字1〜2トークン
cron job
サーバーで決まった時刻にプログラムを自動実行する仕組み
thinking token
モデルが答えを出す前の内部思考に使うトークン。Gemini 3.1 Proでは出力扱いで課金される
DeepSearchQA / HLE / BrowseComp
いずれもAIモデルのリサーチ・推論能力を測るベンチマーク
SEC filings
米国証券取引委員会に企業が提出する報告書(年次報告書10-Kなど)
GA(General Availability)
一般提供開始。preview/betaから正式版に格上げされた状態

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , ,

← 戻る