Claudeに「原始人みたいに喋って」と指示するだけで、トークン(AIが文章を処理する単位)の使用量が75%減ります。
同じ作業でも制限到達までの時間が約4倍に伸びます。
仕組みはClaudeの「丁寧すぎる出力」をカットするだけ。
通常180トークンかかるウェブ検索1回が、原始人モードだと45トークンで済みます。
この記事はClaudeの使用制限にすぐ引っかかる人、API経由でコストを下げたい人向け(Claudeを触ったことがあれば読めます)。
私の使い方: Claude Codeで長時間作業する時に、原始人モードをCLAUDE.md(プロジェクト固有の指示を書いておく設定ファイル)に仕込んでおきます。
あとは/compactで会話を圧縮、必要に応じてSonnetに切り替える3点セット。
これで1セッションの寿命がかなり延びました。
原始人モードはどういう仕組みか?
Claudeに何か頼むと、めっちゃ丁寧に返ってきますよね。
「もちろんです!お手伝いさせていただきます。
ウェブ検索ツールを実行いたしましたので、以下の結果をご確認ください。
」
……長い。
こっちが欲しかったのは検索結果だけ。
「もちろんです」も「お手伝い」も「ご確認ください」もいらないわけです。
でもClaudeは親切なので、全部つけてきます。
この「親切」が、トークンを食ってるんですよ。
トークンというのは、AIが文章を処理する時の単位です。
ざっくり言うと、日本語だと1文字が1〜2トークンくらい。
英語だと1単語が1〜2トークンになります。
で、Claudeの使用制限はこのトークンの量で決まってるんです。
つまりClaudeが丁寧にしゃべればしゃべるほど、私の制限を食いつぶしていく。
| 比較項目 | 通常モード | 原始人モード | 削減率 |
|---|---|---|---|
| ウェブ検索1回のトークン消費 | 約180トークン | 約45トークン | 75%カット |
| ツール実行報告の表現 | 「I executed the web search tool」(8トークン) | 「Tool work」(2トークン) | 75%カット |
| 同じ制限枠でできる作業量 | 1倍(基準) | 2〜4倍 | — |
これが10回、20回、100回と積み重なるとどうなるか。
同じ制限枠で2倍〜4倍の量の仕事ができるようになります。
これ正直やばい。
なぜChatGPTではなくClaudeで特に効くのか?
ここはちょっと面白い話です。
ChatGPTやGrokなど他のAIにも「短く喋って」と言えば短くなりますよね。
ただ、原始人モードがClaudeで特に効果的なのには理由があります。
Claudeは他のAIと比べて、めちゃくちゃ丁寧なんですよ。
これはAnthropic(Claudeを作っている会社)が意図的にそう作っています。
Anthropicは「安全なAI」を最重要視している会社で、Claudeには「ユーザーに対して誠実で、丁寧で、役に立つ存在であれ」という設計思想が根っこにあります。
だから「もちろんです!」「お手伝いします!」がデフォルトで入ってきます。
ChatGPTも丁寧な部類ですが、Claudeのほうが「報告」が長い傾向です。
特にツールを使った後の説明が丁寧すぎる感じ。
この「丁寧さのコスト」が、Claudeでは特に大きい。
だから原始人モードの効果も、Claudeで一番効くという話になります。
大事なのは、原始人モードはClaudeの喋り方を変えてるだけで、考え方は変わってないという点。
たとえば会社で超優秀な先輩がいるとします。
その先輩が毎回メールで「お疲れ様です。
先日ご依頼いただいた件について……」と書くタイプだったとして。
それを「結果だけ3行で教えてください」とお願いしたら? 先輩の能力は変わらないですよね。
調べてくれる内容も、判断の質も同じです。
報告がコンパクトになるだけ。
Claudeの原始人モードもこれと同じです。
Anthropicが「安全に丁寧に」と設計した部分を、ユーザー側から「でも今は結果だけでいい」と上書きしている。
設計思想は尊重しつつ、無駄な装飾だけ剥がす感じ。
Anthropic公式の見解としても「指示はClaudeの喋り方を変えるだけで、思考プロセスには影響しない」と確認されています。
この手法が広まるとどうなるか。
今まで「Claudeは制限がキツい」という理由でChatGPTに逃げてた人が、Claudeに戻ってくる流れが出てきます。
同じ月額で使える量が体感で2〜4倍になるわけなので。
Anthropicとしても、ユーザーが離れるよりは原始人モードで使い続けてくれたほうが嬉しいと思います。
そのうち公式で「省エネモード」みたいなのが実装される可能性は高いです。
原始人モードはどんな場面で使えるか?
Claudeチャットで何回もやりとりする時
リサーチやアイデア出しなど。
1回のやりとりは短くても、20往復もすると一気にトークンが溜まります。
毎回「もちろんです!」がつくのとつかないので、20回分の差はかなりでかい。
Proプランだと5時間で約45回のOpus(一番賢いモデル)メッセージが目安です。
原始人モードでClaudeの返答を短くすれば、同じ枠内でもっとやりとりできるようになります。
Claude Codeで長時間作業する時
Claude Codeは、ファイル読んだり、ツール使ったり、結果を報告したりで、トークンがめっちゃ飛ぶ仕組みです。
Anthropic公式データだと、平均で1日6ドル(約900円)くらい使うとされています。
私もClaude Codeをガッツリ使う日は、半日で制限に引っかかることがあります。
原始人モードにすると、ツール実行の報告とか中間説明が全部短くなるので、同じセッションがかなり長持ちします。
APIでClaudeを呼び出してる人は直接お金が減る
API(Application Programming Interface、手元のアプリやツールからClaudeを呼び出す仕組み)経由だとトークン量=そのままお金になります。
実はClaude Codeを使っている人は、裏側でこのAPIを使っているんですよ。
だから節約効果がダイレクトに財布に来ます。
Opusだと、出力100万トークンで25ドル(約3,750円)。
75%カットできたら、同じ仕事を6ドルちょっとでできる計算です。
APIの細かい設定が分からなくても大丈夫。
Claude Codeに「APIのコストを確認して」と聞けば、今のセッションでいくら使ったか教えてくれます。
原始人モードに必要なものは?
特別なツールは何もいりません。
Claudeのアカウントがあれば、無料プランでも使えます。
Claude(チャット版)でもClaude Codeでも、どっちでもOK。
やることは「プロンプト(Claudeへの指示文)を送るだけ」です。
原始人モードはどうやって設定するか?(3ステップ)
ステップ1:最初にこのプロンプトを送る
Claudeとの会話の一番最初に、こう送ります。
英語のほうが効きがいいので、そのままコピペで大丈夫です。
「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」
日本語に訳すと「短く喋れ。
説明するな。
ツールが先。
結果が先。
余計な言葉なし。
丁寧語なし。
やるだけ。
」になります。
めっちゃ原始人っぽい。
主語もあやしいし、文法もめちゃくちゃ。
でも、これが効くんです。
期待結果: 送信直後にClaudeが「Got it. Short. No filler.」のような短い返答を返してきます。
普段の「承知しました!それでは〜」が消えていれば成功。
詰まりどころ: 日本語と英語を混ぜて送ると効きが弱くなることがあります。
最初の1通は英語だけで送るのがコツ。
ステップ2:普通に指示を出す
あとはいつも通り使うだけです。
「○○を調べて」「○○のコードを書いて」「○○をまとめて」。
Claudeの返答が、ガッツリ短くなります。
「もちろんです!」が消えてる。
「以下にまとめました」が消えてる。
結果だけ、ポンと出てくる。
期待結果: 通常モードで5〜6行の前置きが入っていた返答が、いきなり結論や検索結果から始まるようになります。
詰まりどころ: 途中で「もう少し丁寧に説明して」と指示すると、原始人モードが解除されることがあります。
その時は最初のプロンプトをもう一度送り直してください。
ステップ3:もっとカスタマイズしたい人向け
基本のプロンプトだけでも十分です。
ただ、もうちょっと細かく指定したい人は、こういうのも追加できます。
「Max 3 sentences per response.」(1回の返答は最大3文まで)
「Code only, no comments.」(コードだけ。コメントなし)
「Skip intro and summary.」(前置きとまとめを省略)
使い方に合わせて、足したり引いたりしてみてください。
私はClaude Codeでは「Code only, no comments.」を入れることが多いです。
期待結果: 1文ずつ確認しながら追加していくと、自分好みの「短さ」に調整できます。
Claude Codeで使う場合
Claude Codeだと、CLAUDE.mdという設定ファイルに書いておけます。
プロジェクトのフォルダに「CLAUDE.md」というファイルを作って、中にさっきのプロンプトを書くだけ。
そうすると、そのプロジェクトでClaude Codeを使うたびに自動で原始人モードになります。
毎回手打ちしなくていいので楽。
CLAUDE.mdの作り方が分からない人は、Claude Codeに「CLAUDE.mdファイルを作って、原始人モードの設定を入れて」と頼めばやってくれます。
よくある疑問
Q. 返答が短くなりすぎて、必要な情報まで省略されない?
されることもあります。
そういう時は「もう少し詳しく」と追加で聞けばOK。
最初から全部詳しく出すより、「短い返答→必要な部分だけ深掘り」のほうがトータルのトークンは少なくなります。
必要なところだけ掘る。
これが一番効率いい。
Q. 日本語で「短く喋って」じゃダメなの?
日本語でも効きます。
ただ、英語のほうがトークン効率がいいんですよ。
日本語の「短く喋ってください」は約15トークン。
英語の「Me talk short」は3トークン。
指示自体のトークンも節約できるので、英語がおすすめです。
Claudeは英語で指示しても日本語で返してくれるので、心配いりません。
Q. 原始人モードにしたら、Claudeが雑な回答になったりしない?
ならないです。
変わるのは「喋り方」だけ。
コードの品質も、検索の精度も、分析の深さも同じです。
ただし、Claudeの思考プロセス(Extended Thinking、Claudeが回答前に内部で考える機能)はトークンを使います。
原始人モードで節約できるのは「出力トークン」、つまりClaudeが表に出す言葉の部分。
内部で考えてる部分は変わらないので、考える力は保たれたまま、表現だけ圧縮される感じ。
Q. どのプランで一番効果がある?
どのプランでも効果はありますが、一番「ありがたみ」を感じるのはProプラン(月20ドル)の人だと思います。
Proだと5時間でOpus約45回、Sonnet(Opusより安くて速いモデル)約225回が目安。
ここが上限なので、1回あたりのトークン消費を減らせば、もっと多くのやりとりができます。
Maxプラン(月100ドル/200ドル)の人も、最近「制限が早すぎる」という声がかなり出てる。
Anthropicも「想定より早く制限に達してる」と認めているくらいなので、プランに関係なくやっておいて損はないです。
原始人モードの注意点と限界は?
万能ではないです。
まず、節約できるのは「出力トークン」だけ。
Claudeに長い文章を送ったり、大きなファイルを読ませたりする「入力トークン」は、原始人モードでは減りません。
Claude Codeの場合、ファイルの読み込みやツール定義など、入力側のトークンがかなりの割合を占めています。
Anthropic公式のテスト結果も紹介しておくと「エージェント(AIが自律的にツールを使って作業する仕組み)的な使い方、つまりツールを何回も呼ぶような作業では、ツールの呼び出し自体のトークンが大きくて、出力の短縮による節約はそこまで劇的じゃない」とのこと。
つまりチャットでの質問応答みたいな「Claudeの返答が長い」場面では効果大。
Claude Codeでの自動作業のように「ツール呼び出しが多い」場面では、効果はあるけど75%カットとまではいかない場合もあります。
あと、レポートや記事を書いてもらう時は原始人モードにしないでください。
短く喋れと指示してるのに、長い文章を頼むのは矛盾するので。
作業系は原始人モード、文章作成は通常モードという使い分けがベストです。
原始人モード + /compact の合わせ技でさらに節約できるか?
私がよくやってるのが、原始人モード+「/compact」の組み合わせです。
Claude Codeで作業してると、会話が長くなるにつれてトークンがどんどん溜まります。
途中で「/compact」と打つと、それまでの会話を要約して圧縮してくれる。
これだけでコンテキスト(Claudeが覚えている会話の情報量)がかなりスリムになります。
原始人モードで毎回の返答を短くして、/compactで全体を圧縮する。
このコンボで、1セッションの寿命がかなり延びました。
Claudeチャットの場合も同じ考え方で、タスクが変わったら新しい会話を始めるのがおすすめ。
古い会話を引きずると、過去のやりとりが全部トークンとして積み重なるので。
あとはモデルの使い分けも地味に効きます。
Claude Codeだと「/model」コマンドで、作業の途中からSonnetに切り替えられる。
難しい設計判断はOpusで、単純な作業はSonnetで。
原始人モード+/compact+モデル切り替えの3つを組み合わせると、トークン節約の効果はかなり大きくなります。
私はこの3点セットで、半日で枯れていたセッションが1日もつようになりました。
まとめ
やることは、最初に英語で「Me talk short. No explain. Tool first. Result first. No filler. No polite. Just do.」と送るだけ。
Claudeの頭の良さはそのまま、余計な言葉だけが消える。
結果、同じ制限枠でもっと多くの仕事ができるようになります。
まずは次にClaudeを開いた時に、1回だけ試してみてください。
私はもう手放せない。
このページに出てきた言葉
- トークン
- AIが文章を処理する単位。日本語1文字=1〜2トークン、英語1単語=1〜2トークンが目安。
- API
- Application Programming Interfaceの略。手元のアプリやツールからClaudeなどのAIを呼び出す仕組み。
- CLAUDE.md
- Claude Codeで使う設定ファイル。プロジェクト固有の指示(口調・ルール・参照情報)を書いておくと、毎回自動で読み込まれる。
- プロンプト
- AIに送る指示文のこと。質問や命令の本体。
- Opus / Sonnet
- Claudeのモデル名。Opusが一番賢いがコスト高、Sonnetは安くて速い中堅モデル。
- Extended Thinking
- Claudeが回答する前に内部で考える機能。表に出ない思考プロセスでもトークンを消費する。
- コンテキスト
- AIが今の会話で覚えている情報量。長い会話を続けると膨らみ、性能や速度に影響する。
- エージェント
- AIが自律的にツールを使って作業する仕組み。Claude Codeはエージェント的な動きをする。
参考リンク
- Anthropic公式 Claudeプラン一覧: https://www.anthropic.com/pricing
- Claude Code 公式ドキュメント: https://docs.anthropic.com/en/docs/claude-code
※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。