Claudeに「原始人みたいに喋って」と指示するだけで、トークン使用量が75%減る。同じ作業でも制限到達までの時間が約4倍に伸びる。
仕組みはシンプルで、Claudeの「丁寧すぎる出力」をカットするだけ。通常180トークンかかるウェブ検索1回が、原始人モードだと45トークンで済む。
この記事では、原始人モードの仕組み・設定方法・実際の節約効果を解説する。Claudeの使用制限にすぐ引っかかる人、API経由でコストを下げたい人向け。
私の使い方: Claude Codeで長時間作業する時に原始人モードをCLAUDE.mdに仕込んでおき、/compactで会話を圧縮、必要に応じてSonnetに切り替える3点セット。これで1セッションの寿命がかなり延びた。
原始人モードはどういう仕組みか?
そもそもなんですけど。
Claudeに何か頼むと、めっちゃ丁寧に返ってきますよね。
「もちろんです!お手伝いさせていただきます。ウェブ検索ツールを実行いたしましたので、以下の結果をご確認ください。」
……長い。
やってほしかったのは検索結果だけなんですよ。「もちろんです」も「お手伝い」も「ご確認ください」もいらない。でもClaudeは親切だから、全部つけてくる。
この「親切」が、トークンを食ってるんです。
トークンっていうのは、AIが文章を処理する時の単位です。ざっくり言うと、日本語だと1文字が1〜2トークンくらい。英語だと1単語が1〜2トークン。
で、Claudeの使用制限って、このトークンの量で決まってるんですよ。つまり、Claudeが丁寧にしゃべればしゃべるほど、自分の制限を食いつぶしてる。
| 比較項目 | 通常モード | 原始人モード | 削減率 |
|---|---|---|---|
| ウェブ検索1回のトークン消費 | 約180トークン | 約45トークン | 75%カット |
| ツール実行報告の表現 | 「I executed the web search tool」(8トークン) | 「Tool work」(2トークン) | 75%カット |
| 同じ制限枠でできる作業量 | 1倍(基準) | 2〜4倍 | — |
これが10回、20回、100回と積み重なると? 同じ制限枠で、2倍〜4倍の量の仕事ができるようになるんです。
なぜChatGPTではなくClaudeで特に効くのか?
ここ、ちょっと面白い話なんですけど。ChatGPTとかGrokとか、他のAIにも「短く喋って」って言えば短くなりますよね。
でも原始人モードがClaudeで特に効果的なのには理由がある。
Claudeって、他のAIと比べてめちゃくちゃ丁寧なんですよ。これ、Anthropicが意図的にそう作ってるんです。Anthropicって「安全なAI」を最重要視してる会社で、Claudeには「ユーザーに対して誠実で、丁寧で、役に立つ存在であれ」っていう設計思想が根っこにある。
だから「もちろんです!」「お手伝いします!」がデフォルトで入ってくる。ChatGPTも丁寧だけど、Claudeのほうが「報告」が長い傾向がある。特にツールを使った後の説明が丁寧すぎるんですよね。
この「丁寧さのコスト」が、Claudeでは特に大きい。だから原始人モードの効果も、Claudeで一番効くっていう話なんです。
で、大事なのは。原始人モードって、Claudeの喋り方を変えてるだけなんですよ。考え方は変わってない。
たとえて言うと、会社で超優秀な先輩がいるとして。その先輩が毎回メールで「お疲れ様です。先日ご依頼いただいた件について……」って書くタイプだったとする。それを「結果だけ3行で教えてください」ってお願いしたら? 先輩の能力は変わらないですよね。調べてくれる内容も、判断の質も同じ。ただ報告がコンパクトになるだけ。
Claudeの原始人モードも全く同じです。Anthropicが「安全に丁寧に」と設計した部分を、ユーザー側から「でも今は結果だけでいい」って上書きしてる。設計思想は尊重しつつ、無駄な装飾だけ剥がす。
Anthropicの社員も確認していて、「指示はClaudeの喋り方を変えるだけで、思考プロセスには影響しない」とコメントしている。
この手法が広まるとどうなるか。今まで「Claudeは制限がキツい」って理由でChatGPTに逃げてた人が、Claudeに戻ってくる流れが出てきます。同じ月額で使える量が体感で2〜4倍になるわけですからね。
Anthropicとしても、ユーザーが離れるよりは原始人モードで使い続けてくれたほうがいいはず。そのうち、公式で「省エネモード」みたいなのが実装される可能性は高いです。
原始人モードはどんな場面で使えるか?
Claudeチャットで何回もやりとりする時
リサーチとか、アイデア出しとか。1回のやりとりは短くても、20往復とかすると一気にトークンが溜まる。毎回「もちろんです!」がつくのとつかないの、20回分の差はでかいです。
Proプランだと5時間で約45回のOpusメッセージが目安。原始人モードでClaudeの返答を短くすれば、同じ枠内でもっとやりとりできます。
Claude Codeで長時間作業する時
Claude Codeって、ファイル読んだり、ツール使ったり、結果を報告したりで、トークンがめっちゃ飛ぶんですよ。Anthropicの公式データだと、平均で1日6ドル(約900円)くらい使う。
自分もClaude Codeをガッツリ使う日は、半日で制限に引っかかることがあって。原始人モードにすると、ツール実行の報告とか中間説明が全部短くなるので、同じセッションがかなり長持ちします。
APIでClaudeを呼び出してる人は直接お金が減る
APIっていうのは、自分のアプリやツールからClaudeを呼び出す仕組みです。実はClaude Codeを使ってる人は、裏側でAPIを使ってるんですよ。
API経由だとトークン量=そのままお金なので、節約効果がダイレクトに財布に来る。Opus(一番賢いモデル)だと、出力100万トークンで25ドル(約3,750円)。75%カットできたら、同じ仕事を6ドルちょっとでできる計算です。
APIの詳しい設定がわからなくても大丈夫。Claude Codeに「APIのコストを確認して」って聞けば、今のセッションでいくら使ったか教えてくれます。
原始人モードに必要なものは?
特別なツールは何もいりません。Claudeのアカウントがあれば、無料プランでも使えます。Claude(チャット)でもClaude Codeでも、どっちでもOK。やることは「プロンプト(指示文)を送るだけ」です。
原始人モードはどうやって設定するか?(3ステップ)
ステップ1:最初にこのプロンプトを送る
Claudeとの会話の一番最初に、こう送ってください。英語のほうが効きがいいので、そのままコピペで大丈夫です。
「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」
日本語に訳すと「短く喋れ。説明するな。ツールが先。結果が先。余計な言葉なし。丁寧語なし。やるだけ。」
原始人っぽいですよね。主語もあやしいし、文法もめちゃくちゃ。でも、これが効くんです。
ステップ2:普通に指示を出す
あとはいつも通り使うだけ。「○○を調べて」「○○のコードを書いて」「○○をまとめて」。
Claudeの返答が、ガッツリ短くなってるはずです。「もちろんです!」が消えてる。「以下にまとめました」が消えてる。結果だけ、ポンと出てくる。
ステップ3:もっとカスタマイズしたい人向け
基本のプロンプトだけでも十分なんですけど。もうちょっと細かく指定したい人は、こういうのも追加できます。
「Max 3 sentences per response.」(1回の返答は最大3文まで)
「Code only, no comments.」(コードだけ。コメントなし)
「Skip intro and summary.」(前置きとまとめを省略)
自分の使い方に合わせて、足したり引いたりしてみてください。
Claude Codeで使う場合
Claude Codeだと、CLAUDE.mdっていう設定ファイルに書いておけます。プロジェクトのフォルダに「CLAUDE.md」ってファイルを作って、中にさっきのプロンプトを書くだけ。
そうすると、そのプロジェクトでClaude Codeを使うたびに自動で原始人モードになります。毎回手打ちしなくていいので楽です。
CLAUDE.mdの作り方がわからない人は、Claude Codeに「CLAUDE.mdファイルを作って、原始人モードの設定を入れて」って頼めばやってくれます。
よくある疑問
Q. 返答が短くなりすぎて、必要な情報まで省略されない?
されることもあります。そういう時は「もう少し詳しく」って追加で聞けばOKです。最初から全部詳しく出すより、「短い返答→必要な部分だけ深掘り」のほうがトータルのトークンは少なくなります。必要なところだけ掘る。これが一番効率いい。
Q. 日本語で「短く喋って」じゃダメなの?
日本語でも効きます。ただ、英語のほうがトークン効率がいいんですよ。日本語の「短く喋ってください」は約15トークン。英語の「Me talk short」は3トークン。指示自体のトークンも節約できるので、英語がおすすめです。Claudeは英語で指示しても日本語で返してくれるので、心配いりません。
Q. 原始人モードにしたら、Claudeが雑な回答になったりしない?
ならないです。変わるのは「喋り方」だけ。コードの品質も、検索の精度も、分析の深さも同じです。ただし、Claudeの思考プロセス(Extended Thinking)はトークンを使います。原始人モードで節約できるのは「出力トークン」、つまりClaudeが表に出す言葉の部分。内部で考えてる部分は変わらないので、考える力は保たれたまま、表現だけ圧縮される感じです。
Q. どのプランで一番効果がある?
どのプランでも効果はあるんですけど。一番「ありがたみ」を感じるのは、Proプラン(月20ドル)の人だと思います。Proだと5時間でOpus約45回、Sonnet約225回が目安。ここが上限なので、1回あたりのトークン消費を減らせば、もっと多くのやりとりができる。Maxプラン(月100ドル/200ドル)の人も、最近「制限が早すぎる」って声がかなり出てる。Anthropicも「想定より早く制限に達してる」って認めてるくらいなので。プランに関係なく、やっておいて損はないです。
原始人モードの注意点と限界は?
正直に言うと、万能ではないです。
まず、節約できるのは「出力トークン」だけ。Claudeに長い文章を送ったり、大きなファイルを読ませたりする「入力トークン」は、原始人モードでは減りません。Claude Codeの場合、ファイルの読み込みとかツール定義とか、入力側のトークンがかなりの割合を占めてます。
Anthropicの社員が実際にテストした結果も紹介しておくと。「エージェント的な使い方(ツールを何回も呼ぶような作業)だと、ツールの呼び出し自体のトークンが大きくて、出力の短縮による節約はそこまで劇的じゃない」とのこと。
つまり、チャットでの質問応答みたいな「Claudeの返答が長い」場面では効果大。Claude Codeでの自動作業みたいな「ツール呼び出しが多い」場面では、効果はあるけど75%カットとまではいかない場合があります。
あと、レポートや記事を書いてもらう時は原始人モードにしないでください。短く喋れって指示してるのに、長い文章を頼むのは矛盾するので。作業系は原始人モード、文章作成は通常モードって使い分けるのがベストです。
原始人モード + /compact の合わせ技でさらに節約できるか?
自分がよくやってるのが、原始人モード+「/compact」の組み合わせです。
Claude Codeで作業してると、会話が長くなるにつれてトークンがどんどん溜まるんですよ。で、途中で「/compact」って打つと、それまでの会話を要約して圧縮してくれる。これだけでコンテキスト(Claudeが覚えてる情報量)がかなりスリムになります。
原始人モードで毎回の返答を短くして、/compactで全体を圧縮する。このコンボで、1セッションの寿命がかなり延びました。
Claudeチャットの場合も同じ考え方で、タスクが変わったら新しい会話を始めるのがおすすめ。古い会話を引きずると、過去のやりとりが全部トークンとして積み重なるので。
あとは、モデルの使い分けも地味に効きます。Claude Codeだと「/model」コマンドで、作業の途中からSonnet(安くて速いモデル)に切り替えられる。難しい設計判断はOpusで、単純な作業はSonnetで。
原始人モード+/compact+モデル切り替えの3つを組み合わせると、トークン節約の効果はかなり大きくなります。
まとめ
やることは、最初に英語で「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」って送るだけ。
Claudeの頭の良さはそのまま、余計な言葉だけが消える。結果、同じ制限枠でもっと多くの仕事ができるようになる。
まずは次にClaudeを開いた時に、1回だけ試してみてください。
参考リンク
- Anthropic公式 Claudeプラン一覧: https://www.anthropic.com/pricing
- Claude Code 公式ドキュメント: https://docs.anthropic.com/en/docs/claude-code
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。