AI活用全般

Claudeに指示が通らない原因はプロンプトの骨格|Anthropic公式10要素を6分類で読み解く設計図

Claudeに指示が通らない原因はプロンプトの骨格|Anthropic公式10要素を6分類で読み解く設計図

この記事の結論

  • Anthropic公式「Prompting 101」は10要素でプロンプトを解剖している。Xで広がった「6要素フレーム」は、その10要素を業務向けに6つへ束ね直したコミュニティ版。
  • Claudeの出力が毎回ブレるのは、6要素のどこかが抜けているから。特に成功条件(Success Criteria)を書いていない人が一番多い。
  • Claude Opus 4.7は「より文字通りに」プロンプトを読む方向に振れた。6要素で骨格を埋める価値はむしろ上がった。

この記事はClaudeを日常で使っていて出力のブレに困っている人向け(プロンプトを少し書いたことがあれば読めます)。

Claudeに同じ質問をしても、毎回違う角度の答えが返ってきてイラッとする。

原因はモデルではなく、プロンプトの骨格にある。

Anthropic公式の10要素を業務向けに6分類へ束ね直した「6要素フレーム」が、その骨格にあたる。

私はこのフレームを日常のプロンプト設計に組み込む価値があると見ていて、その理由を公式ドキュメントを引きながら整理する。

そもそも「6要素フレームワーク」は公式の正式名称ではない

先に出典の精度を詰めておく。

Anthropic公式のプロンプトエンジニアリング概要ページや、インタラクティブチュートリアル(GitHub公開)のどこにも「6要素フレームワーク」というラベルは出てこない。

公式が示しているのは10要素の解剖構造。

Anthropic公式の「Prompting 101」ワークショップ(YouTube・Code w/ Claude)で applied-ai チームが提示した内訳がこれです。

  1. Task context(タスクの文脈)
  2. Tone context(口調・性格の指定)
  3. Background data, documents, and images(参照素材)
  4. Detailed task description & rules(詳細な指示とルール)
  5. Examples(良例)
  6. Conversation history(会話履歴)
  7. Immediate task description or request(今この瞬間の依頼)
  8. Thinking step by step(推論プロセスの指示)
  9. Output formatting(出力形式)
  10. Prefilled response(応答の先頭文字列)

Xで広がった「6要素整理」は、この10要素を業務で扱いやすいサイズに束ね直したコミュニティ版というのが正確な読み方。

ここは厳密にいきます。

Anthropic公式の一次ソースは10要素、6要素は二次整理。

Anthropic公式10要素を6分類で読む設計図

コミュニティが整理した6要素と、公式10要素の対応はこう読める。

6要素(コミュニティ整理)対応する公式10要素役割
Role(役割)Task context / Tone contextモデルに誰として答えさせるかを先に決める
Task(タスク)Immediate task description or request今この瞬間にやらせたい具体アクション
Input Context(入力文脈)Background data / Conversation history参照素材と過去のやりとり
Success Criteria(成功条件)Detailed task description & rules「良い出力」の定義を先に書く
Output Format(出力形式)Output formatting / Prefilled response構造・長さ・先頭文字列の固定
Alignment(整合)Examples / Thinking step by step良例の提示と推論プロセスの指示

Claude中級者の多くは、Role・Task・Output Formatの3つで止まる。

ここから差がつく。

私が一番注目しているのは「成功条件」の独立要素化

6要素のうち、私が特に注目しているのがSuccess Criteria(成功条件)。

Anthropic公式ドキュメントに独立ページがあるほど扱いが重い。

Building a successful LLM-based application starts with clearly defining your success criteria and then designing evaluations to measure performance against them.
(出典: Anthropic Docs「Define your success criteria」

公式は成功条件の4要件として Specific / Measurable / Achievable / Relevant を挙げている。

「good performance」ではなく「accurate sentiment classification」と書け、というレベルの具体性を要求している。

ここ地味にきつい。

でも、これを書かないから出力が毎回ブレる。

私は成功条件を1行書き足すだけで、同じプロンプトでも出力のブレが目に見えて減ると判断しています。

具体的には3行ぐらいの定義文を先頭に置くだけで体感が変わる。

なぜ今この整理が効くのか:Claude Opus 4.7の仕様変更

6要素を骨格として持つ意義は、最新モデルの仕様変更で一段強まった。

Claude Opus 4.7 interprets prompts more literally and explicitly than Claude Opus 4.6, particularly at lower effort levels. It will not silently generalize an instruction from one item to another, and it will not infer requests you didn't make.
(出典: Anthropic公式「Prompting best practices」

「書いてないことは推測しない」方向へモデルが振れた。

つまり、6要素のうち欠けた要素はそのまま出力のブレに直結する。

私は曖昧なプロンプトで何となく良い答えを返してくれた時代はもう終わった。

ここは明確に潮目。

Opus 4.7以降で「以前と同じプロンプトなのに答えが薄くなった」と感じるなら、骨格の不足を疑う側が早い。

私の体感だと、6要素を埋め直すのに3分で済むケースが多い。

6要素の効果を裏付ける実測データ

構造化プロンプトの効果は複数のソースで数字が出ている。

項目数値出典
XMLタグ付きプロンプトによる事実エラー削減37%減Chen et al., 2025(DreamHost引用
コンテキスト先置き(長文→クエリ順)の回答品質向上最大30%DreamHost実測
例付きプロンプトの成功率例なし比で大幅向上Anthropic公式「Use examples」(multishot prompting
Fortune 500企業の税務チャットボットの精度向上20%Anthropic公式ケース
構造化プロンプトの効果(Extended Thinking併用)計画タスクで顕著Anthropic公式「Extended Thinking」

37%減、30%向上、20%向上。

どれも「構造を持たせるだけでこれだけ変わる」という数字。

Anthropic自身が20%の精度向上を公式事例として出している点は重い。

私はこの数字を見て、6要素を入れずにプロンプトを書き続ける選択肢は無いと判断しています。

Anthropic公式の実践指針は「反復」を前提にしている

Anthropic公式の「Prompting best practices」は、プロンプトを一発で決め切らず、テストを回しながら磨くことを前提にしている。

Before optimizing a prompt, develop a test set of inputs and a clear definition of what success looks like. Iteration is the heart of prompt engineering.
(出典: Anthropic Docs「Prompt engineering overview」

私はこれをプロンプトを診断ツールとして使う動きだと読んでいる。

6要素があるとどこが原因でズレたかを指差しできる。

「Role足りない?」「Success Criteria書いた?」「Examples入れた?」と骨格で潰しにいける。

骨格なしの反復は運試し。骨格ありの反復は実験になる。

6要素の扱いに対する批判・限界の声

一方で、構造化プロンプトに冷めた見方もある。両論入れておく。

Modern models understand vague, informal instructions with robustness that makes expert prompt crafting mostly unnecessary for standard use cases.
(出典: Lakera 2026年ガイド

「最近のモデルは雑な指示でも十分に動く」という指摘です。

Anthropic公式も同じ趣旨で「over-engineering simple tasks」(簡単なタスクに対する過剰設計)を避けるよう案内している。

For straightforward tasks, do the simplest thing that works. Add complexity only when you observe specific failure modes.
(出典: Anthropic Docs「Prompt engineering overview」

私は日常業務レベルなら6要素で十分で、6要素を全部書くべきタスクと、3要素で止めるべきタスクは別だと整理している。

判断ラインは「同じプロンプトで2回連続ズレたら骨格を埋める」あたり。

競合フレームとの違いはどこにあるか

プロンプト設計のフレームは他にもある。比較しておく。

フレーム構成Anthropic6要素との差分
RTFRole / Task / Format最軽量3要素。成功条件とAlignmentが丸ごと欠ける
CRISPECapacity/Role, Insight, Statement, Personality, Experimentロールプレイ寄り。タスク明示・成功条件の独立要素が薄い
ReActReasoning + Actingエージェント用途の動的パターン。静的プロンプト設計とは別レイヤー
Anthropic6要素Role / Task / Input Context / Success Criteria / Output Format / Alignment成功条件が独立要素、XMLタグで入力区切りを推奨

Anthropic固有の強みは2点。

成功条件を独立要素として立てる点と、XMLタグで入力を明示区切りする点。

特に後者はClaude系での推奨として公式が一貫して挙げている。

私ならこう使う:6要素を診断ツールとして運用する

6要素をプロンプトの記入テンプレとしてだけ使うのはもったいない。

診断ツールとして使うと真価が出る。

出力がズレた時、6要素のチェックリストを順に当てる。

  • Role:誰として答えさせたか明示したか
  • Task:今この瞬間の具体アクションが1つに絞れているか
  • Input Context:参照素材を先に置いたか(クエリ先置きは品質が落ちる)
  • Success Criteria:「良い出力」の定義を Specific / Measurable で書いたか
  • Output Format:構造・長さ・先頭文字列を指定したか
  • Alignment:例を3〜5個提示したか、推論プロセスを指示したか

ズレの原因が1つに特定できれば、プロンプト全体を書き直さずにその要素だけ補強すればいい。

私の感覚だと、修正にかかる時間が3分の1ぐらいに減る。

ここが一番効くポイント。

FAQ

Q1. 6要素フレームはAnthropic公式の正式名称ですか?

いいえ。

公式は「Prompting 101」(Code w/ Claudeワークショップ)で10要素の解剖構造を示しており、「6要素フレームワーク」という公式ラベルは存在しません。

コミュニティが10要素を業務向けに6分類へ束ね直したものです。

Q2. まず1つだけ取り入れるならどの要素ですか?

Success Criteria(成功条件)です。

Anthropic公式ドキュメントが独立ページで強調している要素で、Specific / Measurable / Achievable / Relevant の4要件で書くのが公式推奨です。

「良い出力の定義」を先頭に3行置くだけで、同じプロンプトでも出力のバラつきが目に見えて減ります。

Q3. Claude Opus 4.7でプロンプトの書き方は変わりますか?

変わります。

公式ドキュメントによると、Opus 4.7は4.6よりも「より文字通りに」プロンプトを解釈し、書かれていないことを勝手に推測しません。

6要素のうち欠けた要素はそのまま出力のブレに直結するため、明示的な構造化プロンプトの重要性は増しています。

Q4. XMLタグは必須ですか?

必須ではありませんが、Anthropic公式と複数のサードパーティが一貫して推奨しています。

XMLタグ付きプロンプトが事実エラーを37%削減したという測定も報告されています(DreamHost引用のChen et al., 2025)。

Claude系ではmarkdownよりXMLタグが効きやすい領域です。

Q5. 6要素を全部書くとプロンプトが長くなりすぎませんか?

Anthropic公式が「over-engineering simple tasks」を避けるよう明記しており、シンプルなタスクでは「do the simplest thing that works」を推奨しています。

6要素は骨格であって、常に全部書く必要はありません。

出力がズレた時に6要素のどこが欠けたかを診断する使い方が実務的です。

このページに出てきた言葉

プロンプト
AIに渡す指示文。質問・依頼・前提条件・例示などを文章で書いて渡すもの
Prompting 101
Anthropicが「Code w/ Claude」イベントで公開したワークショップ動画。applied-ai チームが発表
Role / Task / Output Format
プロンプト設計の入口3要素。「あなたは〇〇です」「△△してください」「□□形式で出力してください」
Success Criteria(成功条件)
「どうなったら正解か」をプロンプト側で先に定義する要素。公式は Specific / Measurable / Achievable / Relevant の4要件で書けと案内している
XMLタグ
プロンプト内で `<context>...</context>` のように区切りを明示する書き方。Claudeはこの形式を学習段階で多く見ているため反応が良い
Extended Thinking
Claude Sonnet/Opusの一部モデルに搭載された、回答前に内部で長く思考できるモード。複雑な計画タスクで効く
LLM
Large Language Model(大規模言語モデル)。Claude、ChatGPT、Geminiなどの文章生成AIの総称
over-engineering
過剰設計。簡単なタスクに対して必要以上に長く詳細なプロンプトを書いてしまう状態。Anthropic公式が避けるよう案内している

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , , ,

← 戻る