AI活用全般

Claudeに同じ依頼で毎回違う答えが返る原因は型|公式6要素プロンプトの順番・XMLタグ・Opus 4.7対応テンプレ

Claude(Anthropic社のAIアシスタント)に同じ依頼をしているのに、
毎回違う答えが返ってきて困った経験はありませんか。

原因はAIの気まぐれではなく、依頼文の「書き方の型」が決まっていないこと。

Anthropic監修のAWSワークショップが、
回答が安定する6要素の順番を公開しています。

2026年4月リリースのClaude Opus 4.7(Anthropic社の最新主力AIモデル)は「指示を文字通り読む」と公式が明言。

曖昧さを排除する6要素の型が、これまでより強く効くようになりました。

この記事はClaudeに同じ依頼を出しても答えが毎回違って困っている人向け(プログラミング未経験でも読めます)。

そもそもなぜ毎回違う答えが返ってくるの?

同じ「メールの返信を書いて」とClaudeに頼んでも、
丁寧すぎたり、
長すぎたり、
勝手に箇条書きにしたり、
毎回バラつきます。

原因は単純で、依頼文に「役割・前提・指示・例・形式」が揃っていないからです。

AIは足りない情報を毎回違う想像で埋めるので、結果も毎回違ってしまう。

例で並べてみます。

型なしのプロンプト(毎回違う答えが返るパターン)

このメールにいい感じの返信を書いて。

「来週のミーティング、
議題を共有してください」

「いい感じ」が毎回違う方向に解釈される。
敬語の濃さも、
長さも、
署名の有無も、
その時々で変わります。

型ありのプロンプト(同じ依頼で同じ答えが返るパターン)

<role>あなたは社内向けの返信メールを書く事業企画担当です。
</role> <tone>敬語、
簡潔、
結論先行。
3文以内。
</tone> <rules> - 件名は変更しない - 末尾に署名「事業企画部 田中」をつける - 添付や参考URLは追加しない </rules> <input> 来週のミーティング、
議題を共有してください </input>

役割・トーン・ルール・入力をXMLタグ(<tag>〜</tag>の形で内容を囲む書式)で区切ると、
Claudeは何をすべきか迷わなくなります。

これが「6要素プロンプト」の最小形です。

正式な6つの要素と並び順を、次のセクションから順に見ていきます。

Claude公式の6要素はどこに書かれているの?

「Anthropic公式の6要素プロンプト」と紹介する日本語記事は多いですが、
Anthropic(Claudeを開発している米国のAI企業)の現行ドキュメントを開いても、
その見出しは出てきません。

確認先はplatform.claude.com/docs(Anthropicが公式に運営する開発者向けドキュメントサイト)。

「6 elements」というセクション名は存在しません。

正確な出典は次の3つです。

  • AWSブログのAnthropic監修コンテンツ「Prompt engineering techniques and best practices」
  • Anthropic Applied AIチームの公開ワークショップ動画「Prompting 101」(AnthropicのAI応用研究チームによる教材)
  • Anthropic公式 Interactive Prompt Engineering Tutorial(GitHubで配布されている公式ノートブック教材)

このうち、6要素の英語名と順番が明文化されているのはAWSブログ。

Anthropicが提供・監修したコンテンツなので、
Anthropic純正と見て差し支えありません。

これを最初にハッキリさせておかないと、後で出典を聞かれた時に詰まります。

Assign the LLM a role or persona and broadly define the task it is expected to perform.(Task contextの定義)

出典: aws.amazon.com/blogs/machine-learning

一方、
現行のplatform.claude.com/docsは別の構成になっています。

「Golden rule」「examples」「XML tags」「role」「long context」のような個別技法のセクション集です。

「AWSワークショップ版の6要素」と「現行docsの個別技法」は別物として読み分けます。

同じ思想で書かれていますが、構成が違うだけ。

本記事は前者の6要素フレームを軸に進めます。

Anthropicが示す6要素の正式名称と順番

AWSワークショップ(Anthropic監修)が示している順序はこうです。

表で整理します。

順番要素名(英語正式名)役割(日本語)
1Task contextClaudeに役割を渡し、タスクの大枠を伝える
2Tone context会話のトーン・口調を指定する
3Background data, documents, and images判断に必要な参考資料・前提情報をまとめて渡す
4Detailed task description and rules具体的な指示と禁止事項・制約ルールを書く
5Examples望ましい出力サンプルを示す(few-shot=AIにお手本を見せて型を学ばせる手法)
6Output formatting出力の形式・体裁を指定する

拡張版になると、この6つの後ろに4つが追加されて10要素になります。

追加分は4つ。

Conversation history(会話履歴)。

Immediate task description(直近の依頼1文)。

Step-by-step thinking(段階的に考えさせる指示)。

Prefilled response(最初の回答冒頭をこちらで埋める手法)。

まず6要素を確実に押さえれば実用上は十分です。

私はこの並び、暗記する価値ありと思います。

順番にも意味があります(次のh2で説明します)。

なぜこの順番なのか?「情報を指示より先に置く」公式ルール

6要素は「役割→トーン→資料→指示→例→出力形式」と進みます。

資料(3番目)が指示(4番目)より先にきている点が重要です。

これはAnthropic公式ドキュメントが繰り返し強調しているルール。

Put longform data at the top. Queries at the end can improve response quality by up to 30% in tests, especially with complex, multi-document inputs.

出典: Anthropic公式 Prompting best practices

長い資料を先に渡し、依頼文を最後に置く。

これだけで複数ドキュメントを扱う場合に応答品質が最大30%向上する、
とAnthropicがテストで確認しているという公式記述です。

そのまま6要素の3→4の順番に反映されています。

Anthropic Applied AIチームの公開ワークショップでも同じ趣旨を断言しています。

Put the information above the instructions.

出典: AI Engineer World's Fair 2024 ワークショップ(YouTube

この30%は、
要素を増やしたり長く書いたりして稼ぐのではなく、
要素の置き方の順番を変えるだけで出ている数字です。

Claudeは「最後に読んだ指示」を最重要として処理する傾向があります。

だから資料を先に流し込み、
最後に「これを使ってこうしてください」と頼む構造が一番素直に効く。

逆に依頼を冒頭に書いて参考資料を後ろに続けるとどうなるか。

Claudeは資料を読んでいる途中で初期の指示を忘れがちになります。

一般的なメールのような書き方が裏目に出るパターンです。

6要素にXMLタグを噛ませると何が起きるか

6要素を並べただけでは効きが弱い。

AnthropicはClaudeの学習データでXMLタグを多用しているからです。

そのため、
Claudeは要素ごとにXMLで括ってあげると区切りを正確に認識します。

XML tags help Claude parse complex prompts unambiguously, especially when your prompt mixes instructions, context, examples, and variable inputs. Wrapping each type of content in its own tag (e.g. <instructions>, <context>, <input>) reduces misinterpretation.

出典: Anthropic公式 XMLタグ使用ガイド

同じワークショップではこう説明されています。

「ClaudeはXMLで大量に学習されているので、
Markdownなど他フォーマットよりわずかに効きが良い」。

XMLは「最重要」と表現されています。

Anthropic公式が示すXMLタグの効果はこう整理できます。

項目Anthropic公式の記述
誤解釈の削減指示・資料・例・入力をタグで分離すると誤読が減る(出典: platform.claude.com/docs (XML)
複雑なプロンプトに有効命令・文脈・例・変数入力が混ざる長いプロンプトほど効く(同上)
推奨タグ例<instructions>/<context>/<input>/<example>/<documents>(同上)

ここで気をつけたいのは、XMLタグは「複雑なプロンプトほど効く」点。

短い1行依頼にXMLを巻いても効果は薄い。

つまり6要素フル装備のような長いプロンプトでこそ威力が出ます。

短文には不要、長文には必須。

Opus 4.7の「文字通り読み」で6要素の効きが変わった

2026年4月16日にリリースされたClaude Opus 4.7は、
プロンプトの読み方が変わりました。

Anthropicが公式ブログで明言しています。

Where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally. Users should re-tune their prompts and harnesses accordingly.

出典: Introducing Claude Opus 4.7

literal(指示を文字通り受け取って解釈する特性)が強化された、
ということです。

公式ドキュメントはさらに具体例を3つ挙げています。

If you said 'don't use TypeScript' to Opus 4.6, it would sometimes still use TypeScript if the task seemed to benefit. 4.7 will refuse even when it notices the task would be easier with TypeScript.

If you said 'respond in JSON', 4.6 might add a prose preamble before the JSON. 4.7 returns JSON, period.

If you said 'write exactly 3 functions', 4.6 would sometimes write 2 or 4 if that fit the task better. 4.7 will write 3.

出典: Introducing Claude Opus 4.7

これが何を意味するか。

指示が曖昧だと曖昧なまま実行される確率が上がった、ということです。

「いい感じにまとめて」と頼んでもOpus 4.7は「いい感じ」をいい感じに解釈してくれません。

逆に「役割・前提・指示・例・形式」を明示する6要素構造で書くと、
4.6時代よりも素直に通ります。

私はここが今回6要素を取り上げる最大の理由だと思います。

注意点も公式が添えています。

条件付きで「particularly at lower effort levels」(特に低いeffort設定で顕著)と添えられている。

effort(思考の深さを段階指定する公式パラメータ。
low/medium/high/xhighの4段階)はモデル動作の重要スイッチです。

Claude.aiやClaude Code(Anthropic公式のターミナル=黒い画面で動くコーディング支援AI)のデフォルトはmedium effort前後で動作。

そのため業務文書での体感差は十分大きい。

6要素プロンプトをClaude Codeで動かす再現手順

Claude Codeで6要素プロンプトを使う流れを示します。

ベースはAnthropic公式チュートリアル、
追加でAWSワークショップ Chapter 09「Building Complex Prompts from Scratch」も参照します。

STEP1: プロジェクトのルートに`CLAUDE.md`(Claude Codeがプロジェクトのルートに置くと自動で読み込んでくれる指示書ファイル)を作る。

Claude Code起動時に自動で読み込まれる、
システムプロンプト(会話の最初にAIに渡される土台の指示)用のファイルです。

STEP2: `CLAUDE.md` に1番目「Task context」を書く。

STEP3: 2番目「Tone context」と3番目「Background data」を続ける。
プロジェクトの全体構造・依存ライブラリ・コーディング規約をまとめます。

STEP4: 4番目「Detailed task description and rules」を<rules>タグで列挙。
「DO」と「DO NOT」を分けて書きます。
Opus 4.7は文字通り読むので、
ぼかさず歯切れよく書く。

例:「avoid TypeScript when possible」より「DO NOT use TypeScript. Use Python only.」。

STEP5: 5番目「Examples」を<examples>タグで囲む。
Anthropic公式チュートリアルは3〜5個を推奨。

Include 3–5 examples for best results.

出典: Anthropic公式 Prompting best practices

STEP6: 6番目「Output formatting」を<format>タグで指定。
例:「Return your review as a JSON array of objects with keys 'file', 'line', 'severity', 'comment'.」

STEP7: ターミナルで `claude` を起動。
実際の依頼(pull requestのdiffを貼る等)はその場のhuman turn(ユーザーの入力ターン)で投げます。

Anthropicの公開ワークショップはこう説明しています。

「システムプロンプトは高レベルの場面設定だけにし、
具体依頼はhuman turnに置いた方が従いやすい」(出典: AI Engineer World's Fair 2024)。

そのままコピペして使えるCLAUDE.mdの完成例

<role>
You are a senior backend engineer specializing in Python and TypeScript.
Your job is to review pull requests and suggest improvements.
</role>

<tone>
Concise. Technical. No emojis. English only.
</tone>

<context>
This project uses FastAPI 0.110, SQLAlchemy 2.0, and Pydantic v2.
We follow PEP8 with line length 100.
Tests are in `/tests` using pytest.
</context>

<rules>
- DO point out missing type hints
- DO point out missing tests
- DO NOT suggest TypeScript-related changes
- DO NOT rewrite the whole function; only suggest line-level edits
</rules>

<examples>
<example>
Input: def add(a, b): return a + b
Output: [{"line": 1, "severity": "low", "comment": "Add type hints: def add(a: int, b: int) -> int"}]
</example>
<example>
Input: def get_user(id): return db.query(...)
Output: [{"line": 1, "severity": "high", "comment": "Missing test case in /tests/test_users.py"}]
</example>
</examples>

<format>
Return your review as a JSON array of objects with keys 'file', 'line', 'severity', 'comment'.
Severity must be one of: low, medium, high.
</format>

引っかかりやすいポイント。

`CLAUDE.md` に詰め込みすぎるのは禁物。

書いた指示が無視される事例が公式GitHubで継続的に報告されています。

参考: Claude Code GitHub Issue #17097

要素ごとに必要最小限。

業務文書(メール・レポート)に6要素を当てる再現手順

非エンジニアの業務シーンでも同じ型で組めます。

社内向けレポート作成を例に手順化します。

STEP1: Claude.ai(ブラウザ版のClaude)の新規チャットを開いて、
メッセージ入力欄に直接6要素を順番に書きます。
Claude.aiにはシステムプロンプト欄がないので、
最初の1メッセージで全部組み込む。

STEP2: 1番目「Task context」をXMLタグで囲んで先頭に。

STEP3: 2番目「Tone context」を続ける。
「丁寧な敬体、
結論先行、
感情語禁止」のように指定。

STEP4: 3番目「Background data」を<documents>タグで囲む。
Anthropic公式が示す書式はネスト構造です。

STEP5: 4番目「Detailed task description and rules」を<instructions>タグで囲む。
「箇条書き禁止」「数字は必ず単位付き」のような禁止・必須ルールを並べる。

STEP6: 5番目「Examples」で過去の良い社内レポート1〜2本を貼る。
<example>タグで囲む。

Anthropic公開ワークショップはこう発言しています。

Picking the perfect examples is often more important than all other prompt engineering combined.

例の質が他全部より重要、というのが公式スタンス。

STEP7: 6番目「Output formatting」で形式を指定して送信。
例:「見出し3つ・各300字以内・末尾に箇条書きの次アクション」。

そのままコピペして使える業務レポート用プロンプトの完成例

<role>
あなたは社内向けレポートを書く事業企画担当です。
読み手は決裁役員(50代、
技術には詳しくない)です。 </role> <tone> 丁寧な敬体。
結論先行。
感情語・誇張語は使わない。 </tone> <documents> <document index="1"> <source>quarterly_sales_2026Q1.pdf</source> <document_content> (ここに四半期売上データ本文を貼り付け) </document_content> </document> </documents> <instructions> - 上記資料をもとに、
決裁役員向けの社内レポートを作成 - 数字は必ず単位付き(例: 1.2億円、
前年比+15%) - 推測ではなく資料に書かれた事実のみ使用 - 箇条書きは禁止(散文で書く) </instructions> <example> (過去の良い社内レポート全文を1本ここに貼る) </example> <format> 見出しは3つ:「1. 今期サマリー」「2. 主要トピック」「3. 次四半期アクション」 各300字以内 末尾に「次アクション」を箇条書きで3〜5個 </format>

引っかかりやすいポイント。

社内資料を貼る時は機密情報の扱いに注意。

Claude.aiの無料・Pro・Teamで学習利用ポリシーが異なります。

企業の情報管理ガイドラインを先に確認してから貼ること。

6要素の限界・効かないケース

万能ではありません。

Anthropic公式が指摘している弱点もあります。

1つ目。ロール(Task context)の過剰指定はかえって柔軟性を奪う。

Anthropic公式ドキュメント自体が注意を入れています。

Overly specific roles can limit the AI's helpfulness.

出典: Anthropic公式 System prompts

2つ目。プロンプトを長くしただけでは精度は上がらない。

Anthropic公式は「言葉数より具体性」と書いています。

3つ目。世代変更でプロンプトが壊れる事例。

Opus 4.7は前世代より文字通りの読みが強い世代です。

「ALWAYS」「MUST」「!!!」を連打して効かせるテクは旧世代の遺物。

Where previous models interpreted instructions loosely or skipped parts entirely, Opus 4.7 takes the instructions literally.

出典: Introducing Claude Opus 4.7

強調語ではなく具体的なルールで縛る方向にシフトする必要があります。

4つ目。
Claude Codeの`CLAUDE.md`に何でも詰め込む運用は副作用が出る。

実際にGitHub IssueでもClaude Codeが指示を無視する報告が継続的に出ています。

参考: issue #17097

6要素は「整理して書く」ためのフレームであって、
「書けば書くほど効く」ものではありません。

個人的にはここが一番大事。

私は、型を覚えるのは入口で、引き算で磨くのが本番だと思っています。

FAQ(よくある質問)

Q1. 6要素は全部書かないとダメ?短い依頼にも必要?

不要です。

Anthropic公式チュートリアルもBeginner(入門)章では基本構造のみを扱います。

6要素フル装備はAdvanced(上級)章で初めて登場します。

該当章名はBuilding Complex Prompts。

短い依頼はTask contextとDetailed task descriptionの2要素で十分。

複雑なタスク・繰り返し使うテンプレで真価が出るフレームです。

Q2. ChatGPT用のプロンプトをClaudeにそのまま使うとなぜズレる?

ChatGPTはJSON形式やMarkdownの構造化に強く反応する設計。

ClaudeはXMLタグ区切りに特に強く反応する設計です。

これはAnthropicがClaudeの学習段階でXMLを多用しているためで、
Anthropic自身が公開ワークショップで述べています。

さらにOpus 4.7は文字通り読みが強化されました。

ChatGPT流の「いい感じに〜してね」が以前より通らなくなった、
ということです。

Q3. Claude Opus 4.7の料金はいくら?6要素を使うとトークン消費が増えそうで不安。

2026年4月16日時点で入力5ドル/Mトークン、
出力25ドル/Mトークン(Mトークン=100万トークン)。

コンテキストウィンドウ(モデルが一度に扱える文字量の上限)は1Mトークンで追加料金なし。

6要素プロンプトは数百〜数千トークン程度。

出力品質が安定することによる「修正の往復削減」のほうが効果として大きい。

これがAnthropic公式の立場です。

Q4. Conversation history(会話履歴)など拡張4要素も最初から覚えるべき?

後回しでOK。

AWSワークショップ(Anthropic監修)の構成も「まず6要素、
その後10要素に拡張」の二段構え。

基本6要素で書いたプロンプトが安定して通るようになってから、
拡張要素に進むのが公式の推奨フロー。

拡張側はStep-by-step thinkingやPrefilled responseです。

Q5. XMLタグを使うと回答にもXMLが混ざってしまわない?

Output formattingで形式を指定すれば、
Claudeは指示通りに返します。

「JSONで返してください」「プレーンテキストで返してください」のように書く。

Opus 4.7は特にこの種の指示を文字通り守るため、
混入の心配は4.6以前より小さくなっています。

Anthropic公式ブログが具体例で明言しています。

「'respond in JSON' と書けばJSONで返す」。

このページに出てきた言葉

Anthropic(アンソロピック)
Claudeを開発している米国のAI企業。元OpenAIメンバーが創業。AI安全研究で知られる
Claude Opus 4.7
Anthropic社が2026年4月16日にリリースした最新の主力AIモデル。指示を文字通りに読む特性が強化されている
Claude.ai
ブラウザで使えるClaudeのチャットUI。無料プランとPro(月20ドル)プランがある
Claude Code
Anthropic公式のターミナル(黒い画面)で動くコーディング支援AI。プロジェクトのコードを読んで修正・追加してくれる
CLAUDE.md
Claude Codeがプロジェクトのルートに置くと自動で読み込んでくれる指示書ファイル。プロジェクト固有のルールを書いておく
platform.claude.com/docs
Anthropicが運営する公式の開発者向けドキュメントサイト。プロンプト技法やAPIの仕様が載っている
システムプロンプト
会話の最初にAIに渡される土台の指示。役割や前提条件を設定する。Claude.aiの一般UIには無いが、Claude CodeやAPIにはある
XMLタグ
<tag>〜</tag>の形で内容を囲む書式。Claudeは学習段階でXMLを大量に読んでいるため、指示と資料の境目をXMLで囲むと正確に区別する
Few-shot / Examples
プロンプトに「お手本となる出力例」を3〜5個添える書き方。AIが例を見て出力の型を学習する
literal読み(文字通り読み)
指示を文字通り受け取って解釈する特性。Opus 4.7で強化され、曖昧な指示は曖昧なまま実行されやすくなった
トークン
AIが文章を扱う最小単位。日本語1文字で約2〜3トークン、英単語1個で約1〜2トークン
コンテキストウィンドウ
AIが一度の会話で扱える最大トークン数。Opus 4.7は1Mトークン(日本語で約30〜50万字相当)
effort(エフォート)
Opus 4.7で導入された推論の深さ設定。low/medium/high/xhighの4段階。低いほど高速・安価で、文字通り読み傾向が強い
Mトークン
100万トークンのこと。料金表記でよく使う単位(例: 入力5ドル/Mトークン)

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , ,

← 戻る