AI活用全般

NotebookLMで下書き→Claude skill-creatorで仕上げる|SKILL.md 5〜10本を分野別に作る6手順と16,000文字の天井

SKILL.mdを1本30分かけて手書きしてる人は、Claude本人より先にNotebookLMに下書きを作らせた方が早い。

ただし量産すると壊れる。

available_skillsの文字数上限は約16,000文字、description130文字以内なら最大67件までという公式由来の天井がある。

NotebookLMを下書き工場、Claudeのskill-creatorを仕上げ工場にする二段構えで、無料枠でも分野別に5〜10本のSKILL.mdをまとめて生やせる。

この記事はClaude Code・Claude SkillsでSKILL.mdを1本書いた経験はあるが、業務全体に展開しきれていない人向け(Claude Codeを起動してSKILL.mdを置いたことがある前提で読めます)。

そもそもSKILL.mdの量産って、何が問題なの?

Claude SkillsはAnthropicが2025年10月16日に公式発表した機能で、`~/.claude/skills/<スキル名>/SKILL.md` を置けばClaude Codeが自動で読みに行ってくれる仕組みです(出典: claude.com/blog/skills)。

1本書くだけでも便利。

ただ、業務全体に広げようとすると手書きが間に合わない。

会計、ライティング、SEO、議事録、提案書、社内ナレッジ整理、それぞれにSKILL.mdが要るとなると、1本30分でも10本で5時間。

これがまずキツい。

もう1つ厄介なのが、量産したSKILL.mdが「全部まとめて壊れる」現象です。

Claude Codeのドキュメントとコミュニティ調査で確定している制約は次の通り。

制約項目数字出典
available_skillsセクション全体の文字数上限約15,500〜16,000文字GitHub Issue #13099
スキル1件の固定オーバーヘッド約109文字研究Gist
description + when_to_useの上限1,536文字公式ドキュメント
auto-compaction後の再付与各スキル5,000トークン、合算25,000トークン公式ドキュメント
SKILL.md本体の推奨上限500行以内公式ドキュメント

GitHub Issue #13099の実例では、63件のスキルを登録したら42件しか表示されず、21件(33%)はシステムプロンプトに「Showing 42 of 63 skills due to token limits」のコメント付きで黙殺されていた。

これ正直やばい。

つまり「量産すれば便利」は半分しか正しくなくて、上限を踏むと残りは存在しないことになる。

私が注目してるのは、ここに天井があると分かっているからこそ「下書きを安く作る工程」と「最終的な圧縮で1件130文字以内に収める工程」を分業させる動線です。

NotebookLMを「下書き工場」に置くと、なぜ早くなる?

NotebookLMはGoogleが運営するソース読み込み型のAIノート。

会計マニュアル、議事録、過去の提案書、SEOガイド、社内Wiki、こういう資料をまとめて食わせると、その内容に紐づいた要約・質問応答・マインドマップを返してくれる仕組みです(出典: notebooklm.google.com)。

料金体系も確認しました。

プラン月額ノートブック数ソース数/ノートブック
Standard(無料)$010050
Plus$7.99/月200100
Pro$19.99/月500300
Ultra$249.99/月500600

1ソースあたりの上限は500,000語または200MB(全プラン共通、出典: 公式FAQ)。

500,000語というのは新書5冊分くらい。

普通のマニュアルや議事録なら余裕で1ソースに収まります。

「下書き工場」として置く理由は3つ。

1つ目は、NotebookLMがソース内の事実だけを参照する設計になっていること。

公式FAQはこの仕様を明示している(出典: 公式FAQ)。

アップした資料の外側にある一般知識を勝手に混ぜないので、SKILL.mdに必要な「具体的な手順・固有名詞・数字」をハルシネーション少なく拾えます。

2つ目は、Mind Map機能(2025年3月19日リリース、出典: 9to5google)でソースを階層化してくれること。

これが「分野ごとに分けたSKILL.md」の骨格になります。

3つ目は、Audio Overview(2024年9月11日リリース)で素材を耳から確認できること。

私の見方では、これは「私が書いたつもりの手順が抜けてないか」のチェック機構として効きます。

下書き工場、これがハマる構造。

Claudeのskill-creatorは何が変わった?

2026年3月初旬の更新で、Anthropic公式のskill-creatorが大きく強化されました(出典: claude.com/plugins/skill-creator)。

コードを書かずに「evals(評価)」「blind A/B比較」「自動テスト生成」が回せるようになった。

4つのモードがあります。

  • CREATE: 対話形式でSKILL.mdをゼロから生成
  • EVAL: テストケースをJSONで定義し、with-skill / baselineの並列サブエージェントで定量評価
  • IMPROVE: evalフィードバックをもとにSKILL.mdを書き直し
  • BENCHMARK: 発動精度を最適化(should-trigger 10件 / should-not-trigger 10件、合計20件のクエリを自動生成)

公式skill-creator SKILL.md自身が、評価モードの位置づけをこう書いている。

EVAL mode runs test cases through with-skill and baseline subagents in parallel for quantitative evaluation. (出典: 公式skill-creator SKILL.md

つまり「動いてそう」という感覚で済ませず、テスト集で発動精度を数で測る環境が公式から提供されたわけです。

もう1つ、skill-creator自身の公式SKILL.mdに書かれている注意点が重要です。

Claudeはスキルをunder-triggerしがち。

descriptionは少し"pushy"に書くべき。

(出典: github.com/anthropics/skills

「お願いベース」の弱いdescriptionだと発動してくれない。

これがNotebookLMで下書きを作る時の文体指針になります。

NotebookLM × Claude Skillsで分野別に量産する手順

公式情報と一次ソースから組み立てた手順を順に書きます。

NotebookLM公式ドキュメント、Claude Skills公式ドキュメント、skill-creator公式SKILL.mdを根拠にしています。

前提: Claude Pro/Max契約、NotebookLM無料アカウント以上、対象業務の参考資料(PDF・テキスト・既存マニュアル等)が手元にある状態。

STEP1. 量産する分野を分ける(無料枠なら最大10本)

available_skillsの上限から逆算します。

description 130文字以内なら最大67件入るが、現実的にはdescription263文字(観測平均)で42件が妥当ライン。

私の判断では、最初の量産は「分野5〜10本」で止めるのが安全寄り。

分野例: 「会計仕訳」「議事録要約」「提案書ドラフト」「SEO記事構成」「社内FAQ応答」「ブログ校正」「メール返信」「Slack要約」など。

1分野=1スキル=1NotebookLMノートブックの対応で揃えます。

STEP2. NotebookLMで分野ごとにノートブックを作り、ソースを統合

無料プランは1ノートブックあたり50ソースまで。

ただ、NotebookLM Tools拡張やノート集約トリックを使うと実質的にもっと詰めます(出典: nlmtools.com)。

具体的には、関連PDFをPDFエディタで1ファイルに結合してからアップする方法と、複数ソースの要点をノートにまとめて「Convert all notes to source」で1ソース化する方法の2通り。

後者は5,000語上限の制約あり。

50ソースが心もとない人はProプランで300ソース/ノートブックに増やせる。

月$19.99。

STEP3. NotebookLMでSKILL.mdの下書きを生成させる

分野ごとのノートブックが揃ったら、各ノートブック内でこういうプロンプトを投げる。

このノートブックの内容をもとに、Claude CodeのSKILL.md下書きを作って。

先頭にYAMLフロントマター(name、description、when_to_use)、本文に手順を箇条書きで。

description はトリガーフレーズを含めて少しpushyに、150文字以内で。

本文は500行以内に収める。

NotebookLMはソース内の事実を引きながら下書きを返す。

SKILL.mdのフロントマター仕様(name最大64文字、description推奨、when_to_useはトリガーフレーズ)は公式ドキュメントの通り(出典: code.claude.com/docs/en/skills)。

STEP4. Claude Codeでskill-creatorを呼び、CREATEモードで仕上げる

NotebookLMの下書きをコピーして、Claude Codeでskill-creatorを起動します。

CREATEモードに「この下書きをベースにSKILL.mdを完成させて。

descriptionは130文字以内、when_to_useと合わせて1,536文字以内」と指示。

skill-creator公式SKILL.mdの推奨に沿うかたちです。

このタイミングで保存パスを決める。

個人スキルなら `~/.claude/skills/<スキル名>/SKILL.md`、プロジェクト用なら `.claude/skills/<スキル名>/SKILL.md`。

STEP5. skill-creatorのBENCHMARKモードで発動精度を測る

BENCHMARKモードを呼ぶと、should-trigger 10件 / should-not-trigger 10件、合計20件のテストクエリを自動生成して発動精度を数値化してくれる(出典: 公式skill-creator SKILL.md)。

under-trigger(発動しない)が多ければ、descriptionを"pushy"に書き直す。

over-triggerが多ければ、when_to_useでトリガー条件を絞る。

STEP6. 全スキルのdescription合計が16,000文字以内に収まるか確認

分野5〜10本ぶんのSKILL.mdが揃ったら、各スキルのdescription文字数を合算して `(description文字数 + 109) × スキル数` が16,000を超えないかチェック。

超えそうならdescriptionを130文字以内に圧縮する。

ここで超えると、登録しても黙殺される。

GitHub Issue #13099の63件中21件非表示は、まさにこの圧縮を怠った結果。

量産で壊れる典型パターンと、避け方

批判側の声も拾っておきます。MindStudio(2026年)はこう書いてる。

Context rot(コンテキスト腐敗)とは、スキルファイルが大きく密になりすぎ、エージェントのコンテキストウィンドウを圧迫して起きる性能劣化。

Attentionが薄まり、モデルは特定の指示を無視してデフォルト応答に戻る。

(出典: MindStudio

同種の警告は他にも出ている。

「新しいClaude Skillを追加し続けるな。

壊れた既存のスキルを先に直せ」というシンプルな主張は、量産型運用へのカウンターとしてコミュニティで繰り返されてます。

これは正しい警告。

私の見方では、量産そのものが悪いんじゃなくて、「壊れた状態を放置したまま量産する」のが悪い。

だからskill-creatorのEVAL/BENCHMARKを各SKILL.mdに必ず通す手順をSTEP5に組み込んだわけです。

もう1つ、モデル更新時の劣化問題。

スキルはモデルが上がると静かに壊れることがあって、先週動いていた発動条件が今日サイレントに失敗するケースが報告されています。

skill-creator公式SKILL.mdが「定期的なEVAL再実行」を推奨してる根拠もここ(出典: 公式skill-creator SKILL.md)。

これに対しては、NotebookLM側にソースをそのまま残しておくのが効きます。

モデル更新でスキルが壊れた時、元のソースが残ってれば再生成のコストがほぼゼロ。

手書きで書き直すよりはるかに安い。

ここはNotebookLMを使う最大の保険ポイント。

プライバシーで気をつけること

NotebookLMの個人アカウントについて、Googleは「アップしたデータはAIモデルの訓練に使わない」と公式FAQで明言している(出典: workspaceupdates公式ブログ 2025/2)。

2025年2月にはNotebookLMとNotebookLM PlusがGoogle Workspaceのコアサービス認定を受けて、Gmail・Driveと同等の企業データ保護レベルに格上げされた。

ただ、プライバシー重視のコミュニティでは依然として懐疑的な声が多い。

「機密ドキュメントはどのGoogleプラットフォームにもアップするな」という助言が継続して出回ってます。

これはNotebookLM固有の話というより、クラウドサービス全般への態度の延長線。

私は社外秘の契約書・顧客情報・社内人事資料を無料アカウントに入れない派。

SKILL.md量産用に使うソースは、汎用的なマニュアル・公開可能な業務手順・手元の記事ストック、このあたりに絞るのが現実ライン。

料金とコスパの結論

構成月額合計用途目安
Claude Pro + NotebookLM無料約$20SKILL.md 5〜10本の量産・個人運用
Claude Pro + NotebookLM Plus約$28SKILL.md 10〜20本、複数プロジェクト並行
Claude Max + NotebookLM Pro約$120〜分野30本以上、チーム運用、ソース300個まで

個人事業主や複業エンジニアなら、まずClaude Pro + NotebookLM無料で十分回せる。

月20ドルでSKILL.mdが5〜10本生えれば、手書きで5時間かかる作業が1時間以下になる計算。

私ならここから始める。

FAQ

Q. NotebookLMが書いた下書きをそのままSKILL.mdとして置いて動きますか?

A. 公式ドキュメントの仕様(フロントマターのname、description、when_to_use)を満たしていれば構文上は動く。

ただ、skill-creatorのBENCHMARKモードで発動精度を測ると、descriptionが弱くてunder-triggerになるケースが多い。

CREATEモードを通して仕上げる工程を入れるのが推奨です。

Q. 何個までSKILL.mdを量産できますか?

A. description 130文字以内なら最大約67件、263文字(観測平均)なら最大約42件(出典: GitHub Issue #13099)。

実用ラインは「分野別5〜10本」から始めて、上限の手前で止めるのが安全。

63件登録時に21件が黙殺された実例があります。

Q. NotebookLMの無料プランで足りますか?

A. ノートブック100個、ソース50個/ノートブック、Audio Overview 3回/日、Deep Research 10回/月。

SKILL.md量産の下書き工程に限れば、無料プランで個人事業主レベルは十分回せる。

複数プロジェクト同時運用ならPlus($7.99/月)以上を推奨。

Q. 機密情報を含むマニュアルもNotebookLMに入れていいですか?

A. 個人アカウントは「学習に使わない」と公式が明言しているが、プライバシー重視のコミュニティでは懐疑的な声が継続している。

社外秘の契約書・顧客情報・人事資料は避けて、汎用マニュアル・公開可能な手順・手元の記事ストックに絞るのが現実的。

Q. skill-creatorは無料で使えますか?

A. skill-creator自体はAnthropicが無料公開しているClaude Codeプラグイン。

ただしClaude Code本体(Pro $20/月、Max $100〜/月)の契約が必要です。

EVAL/BENCHMARKモードは並列サブエージェント実行のためトークン消費が増える点に注意。

Q. モデル更新でSKILL.mdが壊れた時はどうすればいいですか?

A. NotebookLM側に元ソースを残しておけば、再生成のコストがほぼゼロ。

skill-creatorのEVALモードで定期的に発動精度を測って、しきい値を下回ったら同じソースから再ドラフトを作り直す運用が現実ライン。

手書きでメンテするよりはるかに安いです。

このページに出てきた言葉

SKILL.md
Claudeに「こういう作業のときはこの手順で動け」と覚えさせるテキストファイル
フロントマター
ファイルの先頭の「---」で囲む設定ブロック。description等のメタ情報を書く
available_skills
セッション起動時にClaudeが読み込む「使えるスキル一覧」のこと
description
スキルが何をするか・いつ使うかをClaudeに伝える短い説明文
when_to_use
スキルを発動すべき追加コンテキストやトリガーフレーズを書く欄
auto-compaction
会話が長くなった時にClaude Codeが過去ログを自動圧縮する機能
ソース
NotebookLMに読み込ませる元資料。PDF、URL、テキスト、Googleドキュメント等
ノートブック
NotebookLM内でソースをひとまとめにする箱
ハルシネーション
AIが事実にない情報を作り出してしまう現象
Mind Map
NotebookLMがソースのキーコンセプトをツリー状の図に変換する機能
Audio Overview
NotebookLMがアップした資料を2人のAIホスト対話形式の音声に変換する機能
skill-creator
Anthropic公式のスキル作成支援スキル。CREATE/EVAL/IMPROVE/BENCHMARKの4モードを持つ
evals
スキルが意図通り動くかをテストケース集で測定すること
blind A/B比較
スキルあり版となし版の出力を、どちらか分からない状態で比較採点する評価方式
under-trigger
スキルが発動すべき場面で発動しない状態。逆はover-trigger
YAMLフロントマター
ファイル先頭の設定ブロック。SKILL.mdではnameやdescription等をここに書く
トリガーフレーズ
Claudeにスキル使用を気づかせるキーワード(「会計仕訳」「議事録要約」など)
pushy
skill-creator公式が使う表現で、descriptionを「強めに」「押しの強く」書くこと
個人スキル/プロジェクトスキル
個人スキルは `~/.claude/skills/`、プロジェクトスキルは `.claude/skills/` に置く
Context rot
スキルファイルが膨張してコンテキストを圧迫し、性能劣化を起こす現象

参考リンク

※この記事の内容は執筆時点のものです。AIは進化が速い分野のため、最新の仕様は公式サイトでご確認ください。

-AI活用全般
-, , , ,

← 戻る