Perplexity Computer 音声モードは、
声で話しかけるだけで19種類のAIモデル(中核はAnthropic Opus 4.6、
音声認識はOpenAI GPT Realtime 1.5)が連携し、
調査・資料作成・サイト構築まで自動実行してくれるMaxプラン(月$200、
約30,000円、
月10,000クレジット)限定の機能です。
Siriは「答える」、
ChatGPTは「会話する」、
Perplexity Computerは「作業する」——音声が検索のきっかけではなく仕事のスタートボタンになります。
この記事では、
クレジット消費の実態、
Maxプラン($200)とPro($20)の使い分け判断、
$200/月の元が取れる人・取れない人の基準、
音声モードが便利な場面と不便な場面を整理しています。
Perplexity Computer 音声モードとは?19モデル連携の自律型AI
中核推論
深いリサーチ
軽量処理
画像生成
音声認識
Perplexity Computerは、
2026年2月25日にリリースされた「自律型デジタルワーカー」です。
声で指示を出すと、
クラウド上のサンドボックス環境でAIが実際に作業を実行し、
完成品(ファイル、
スプレッドシート、
Webサイト等)を返してくれます。
まず、AIへの指示方法がどう変わるかを比較します。
| サービス | 指示方法 | AIがやること | 成果物 | モデル構成 |
|---|---|---|---|---|
| Siri / Alexa | 声 | 質問に答える | 音声回答のみ | 1モデル |
| ChatGPT(音声) | 声 | 会話する | テキスト | 1モデル(GPT) |
| Perplexity Computer | 声 | 作業を自動実行する | ファイル、サイト、表等 | 19モデル自動振り分け |
Perplexity Computerの裏側では19種類のAIモデルが動いています。
中核の推論エンジンはAnthropic Opus 4.6で、
タスクの種類に応じてClaudeがコーディング、
Geminiが深いリサーチ、
Grokが軽量処理、
Nano Bananaが画像生成といった形で自動的に最適なモデルに振り分けられます。
音声の認識にはOpenAI GPT Realtime 1.5が使われており、
従来比25%以上の精度向上が実現されています。
声をリアルタイムでテキストに変換し、
Computerに指示を渡す仕組みです。
どのモデルに振り分けるかはAIが自動判断するので、
ユーザーは意識する必要がありません。
「日本のAI市場について調べて、
スプレッドシートにまとめて」と声で言えば、
AIがリサーチして、
スプレッドシートを作って、
完成品を渡してくれます。
ブラウザを閉じても作業はバックグラウンドで継続します。
音声モードの料金は?クレジット消費の実態を数字で整理
| 項目 | 内容 |
|---|---|
| プラン名 | Perplexity Max |
| 月額 | $200(約30,000円)/ 年払い$2,000(約300,000円) |
| 月間クレジット | 10,000クレジット |
| 通常のPerplexity検索 | 無制限(クレジット消費なし) |
| 音声モード対応言語 | 36言語(日本語含む) |
| 含まれるもの | Computer、無制限Pro検索、全AIモデル、Sora 2 Pro動画、Cometブラウザ |
ここで一番重要なのが、クレジットの消費量です。
「月10,000クレジット」と言われても、
それがどれくらい持つのかイメージしにくい。
公開されている実績データから目安をまとめます。
| タスクの種類 | 消費クレジット(目安) | 月10,000で何回できるか |
|---|---|---|
| 簡単な処理(画像ALTテキスト生成等) | 約30 | 約333回 |
| 中程度のリサーチ | 約100〜300 | 約33〜100回 |
| 重い調査+資料作成 | 約1,000〜3,000 | 約3〜10回 |
| サイト構築等の大規模タスク | 数千〜 | 月に数回 |
つまり、軽い作業だけなら月300回以上使えます。毎日10回以上のペースです。
ただし、
複雑な作業を連続で投げると話が変わります。
あるユーザーは、
サイト1ページを作るのに2日かけて追加$200(月額とは別に)使ったと報告しています。
クレジット消費の目安がPerplexity公式に明示されていないのも厄介です。
「やってみないとわからない」のが現状で、
コスト予測が難しい点は頭に入れておく必要があります。
Perplexity Max($200)とPro($20)、どちらを選ぶべき?
AIモデル選択
ファイル分析
会話・質問応答
Computer(作業自動実行)
音声モード
バックグラウンド並列処理
Sora 2 Pro動画生成
「Maxは高いから、
まずProでいいんじゃないか」と考える人が多いはずです。
結論から言うと、
大半の人はProで足ります。
MaxとProの境界線を整理します。
| やりたいこと | Proで可能か | Maxが必要か |
|---|---|---|
| AI検索(Web検索+回答生成) | 可能(無制限) | 不要 |
| AIモデル選択(Claude, GPT, Gemini等) | 可能 | 不要 |
| ファイルアップロード+分析 | 可能 | 不要 |
| AIにリサーチ→スプレッドシート作成まで自動実行 | 不可 | 必要(Computer機能) |
| サイト構築・デプロイまで自動 | 不可 | 必要(Computer機能) |
| 複数タスクをバックグラウンドで並列処理 | 不可 | 必要(Computer機能) |
| 音声でComputer作業に指示を出す | 不可 | 必要(音声モード) |
| Sora 2 Proで動画生成 | 不可 | 必要(Max付属) |
境界線は明確です。
「AIに質問して、
答えを得る」までならProで十分。
「AIに作業を丸投げして、
完成品を受け取る」ならMaxが必要です。
なお、
ProプランへのComputer開放は「ロードマップにはある」とPerplexityが発表していますが、
時期は未定です(2026年4月時点)。
現時点ではComputer=Max限定です。
$200/月の元が取れる人・取れない人
月$200(約30,000円)は高いです。
正直に言って、
ほとんどの人には高すぎます。
でも「高い」で終わると判断材料にならないので、
どんな場合に元が取れるかを具体的に計算します。
元が取れるケース: 週5時間以上の調査・資料作成をAIに委託できる人
時給3,000円換算で、
週5時間 = 月20時間 = 月60,000円分の労働です。
$200(約30,000円)で月60,000円分の作業が自動化されるなら、
ROIは2倍。
十分元が取れます。
たとえば、
毎週の競合調査、
ニュースの収集・整理、
クライアント向け資料の下準備をPerplexity Computerに任せられるフリーランスや事業主。
Perplexity社内でも、
4,000行のスプレッドシートを一晩で作成した実績が報告されています(通常1週間かかる作業)。
微妙なケース: AIは使うけど、主に検索と会話で足りてる人
ChatGPTやPerplexity Proで日常的にAI検索を使っているが、
「ファイルを作らせる」「サイトを構築させる」ようなタスクはほとんどない人。
この場合、
Pro($20/月)で十分で、
+$180の価値は薄い。
Perplexityの幹部も「Maxは"GDPを動かすような意思決定"をする人向け」と位置づけています。
元が取れないケース: たまに検索で使う程度の人
月に数回AIに質問する程度なら、
Perplexity無料版かPro($20)で十分です。
$200は過剰投資です。
レビューでも「80%の人はPro($20)で十分」と評価されています。
Maxは残り20%——AIに日常的に複雑な作業を自動実行させたい人——のためのプランです。
音声モードが便利な場面と不便な場面
🚶 移動中(電車・車内・歩行中)
🔄 複数タスクを口頭で連続投入
💬 AIからの質問に声で即答
☕ 騒がしいカフェ(認識精度低下)
🚃 公共交通機関(周囲に聞こえる)
🔢 URL・コード等の複雑な条件指定
音声モードは万能ではありません。
便利なケースと、
むしろ打った方が速いケースがあります。
| 場面 | 音声モード | テキスト入力 |
|---|---|---|
| 両手がふさがってる(料理、家事、運動中) | 便利 | 不可能 |
| 移動中(電車、車内、歩行中) | 便利 | 不便 |
| 複数タスクを次々に投げたい | 便利(口頭で連続指示) | 普通 |
| 作業中にAIから質問が来た時の応答 | 便利(声で即答) | 普通 |
| 静かなオフィスや図書館 | 不便(声が出せない) | 便利 |
| 騒がしいカフェや街中 | 不便(認識精度低下) | 便利 |
| 公共交通機関 | 不便(周囲に内容が聞こえる) | 便利 |
| 複雑な条件指定(数値、URL、コード等) | 不便(口頭では伝えにくい) | 便利 |
音声モードが真価を発揮するのは「ハンズフリーが必要な場面」と「タスクを次々に投げる場面」です。
逆に、
静かな環境、
公共の場、
複雑な条件指定が必要なタスクでは、
テキスト入力の方が確実です。
音声モードは「常にオン」にするものではなく、
場面に応じて切り替えるものです。
使い終わったら音声モードを必ず終了してください。
終了しないとバックグラウンドで起動し続けます。
Perplexity Computer 音声モードの注意点
料金以外で押さえておくべき点を整理します。
まず、
外部サービス連携は完璧ではありません。
400以上の連携先があるとされていますが、
OAuth認証が切れたり、
一部のサービスでデータ取得が不安定になる報告があります。
「接続したら100%うまくいく」とは限りません。
次に、
クレジット消費が予測しにくい点。
タスクごとの消費量が公式に明示されていないため、
複雑な作業を投げたら想定以上にクレジットが減ることがあります。
重要な作業を連続で投げる前に、
残クレジットを確認する習慣をつけるのが安全です。
音声モードの認識精度は、
静かな環境かイヤホン使用が前提です。
騒がしい場所では聞き取りミスが起きやすい。
イヤホンのマイクを使うか、
テキスト入力に切り替えてください。
よくある疑問
Q. 日本語で音声指示を出せますか?
出せます。
音声モードは36言語に対応しており、
日本語も含まれています。
音声パネルの設定アイコンから言語を変更するだけです。
Q. 声で指示を出したら、画面を見てないとダメですか?
いいえ。
Perplexity Computerはバックグラウンドで動作します。
指示を出したらブラウザを閉じてOK。
完了したら通知が届くか、
戻った時に完成品が待っています。
Q. ChatGPTの音声モードとの違いは?
根本的な違いは「AIが実際に作業するかどうか」です。
ChatGPTの音声は「会話」で、
テキストで回答が返ってきます。
Perplexity Computerは「作業員」で、
声の指示に基づいてファイル作成、
サイト構築、
デプロイまで実行します。
Q. $200/月の価値はありますか?
人によります。
AIに毎日複雑な作業を自動実行させたい人には価値があります。
レビューでも「80%の人はPro($20)で十分」と評価されています。
まずPro($20)で使ってみて、
「もっとAIに任せたい」と感じた時に検討するのが合理的です。
Q. Proプラン($20)でもComputer機能は使えますか?
2026年4月時点では使えません。
Perplexityは「ProとEnterpriseへのComputer開放はロードマップにある」と発表していますが、
具体的な時期は未定です。
現時点ではMax($200/月)限定です。
まとめ
Perplexity Computer音声モードは、
19のAIモデルが連携して声の指示だけで複雑な作業を自動実行してくれる機能です。
月$200のMaxプラン限定。
大半の人にはPro($20/月)で十分です。
Maxが必要なのは「AIにリサーチ→資料作成→公開まで丸投げしたい」人だけ。
判断基準は、
週5時間以上の作業をAIに委託できるかどうかです。
音声モードは「ハンズフリーで作業を投げたい場面」で便利ですが、
静かな場所や公共の場では不向きです。
場面に応じてテキスト入力と使い分けてください。
参考リンク
Perplexity Computer 公式: https://www.perplexity.ai/hub/blog/introducing-perplexity-computer
Perplexity Max プラン: https://www.perplexity.ai/help-center/en/articles/11680686-perplexity-max
Perplexity Computer Review(MakerStack): https://makerstack.co/reviews/perplexity-computer-review/
Perplexity Computer Voice Mode(Julian Goldie): https://juliangoldie.com/perplexity-computer-voice-mode/
OpenAI Developers - Realtime API × Perplexity: https://developers.openai.com/blog/realtime-perplexity-computer
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。