Claude Codeを日常的に使っていると、トークン消費量が気になることがある。
特に何もしていない待機時間や、ちょっとしたコード修正でも大量のトークンを消費するからだ。
結論から言うと、設定ファイルを少し見直すだけでトークン消費を劇的に抑えることができる。
この記事では、僕が毎日使っているClaude Codeや、claude-memの運用で使えるトークン削減術をまとめた。
トークン削減は、大きく分けて2つのアプローチが存在する。
一つは、コンテキストの初期読み込みを極限まで減らし、必要な情報を都度取得させるアプローチだ。
もう一つは、不要なプラグインやスキルの読み込みを防ぐアプローチになる。
ツール自体の利便性を損なわずに、設定ファイルのチューニングだけで無駄なトークン消費を圧縮できる。
初心者でも今日からすぐ試せる内容ばかりだ。
まずは自分のプロジェクト環境と照らし合わせながら、できるところから設定を変更するといい。
SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
カテゴリ1:プロンプトと設定ファイルの最適化
1. 「CLAUDE.md」の階層化によるコンテキスト削減
プロジェクトのルートディレクトリに配置する「CLAUDE.md」は、セッション開始時に毎回必ず読み込まれる。
公式ガイドでもこのファイルの内容がトークンを消費すると明記されており、数千トークン規模になるケースも珍しくない。
ここに長文の仕様書や詳細なルールを書き込むと、あっという間にトークンを浪費してしまう。
さらに、コンテキストが肥大化するとコード理解に使える枠が減少し、AIの回答精度に悪影響を及ぼす。
対策は、情報を階層化して管理することだ。
第1層となる「CLAUDE.md」には、最低限のアーキテクチャやコーディングルールのみを記載する。
具体的には、パスエイリアスの設定やテストファイルの命名規則など、常に意識させるべき内容に留める。
そして詳細なAPI仕様書や設計ガイドは、第2層となる「docs」フォルダ内の別ファイルに切り出し、Markdownのリンク記法で繋ぐといい。
これで初期コンテキストを大幅に削減できる。
AIが必要な時だけリンク先の詳細を読みに行くので、回答精度も落ちない。
むしろ重要な情報が長文に埋もれる現象を防げるので、一石二鳥だと言える。
2. Claude Codeの不要プラグイン無効化
Claude Codeには、開発を補助する便利なプラグインが多数用意されている。
しかし、グローバル環境で有効化されたプラグインは、すべてのプロジェクトで常に候補として挙がってしまう。
使わない機能が裏側で待機している状態は、不要なトークン消費を引き起こす原因になる。
また、AIがどのツールを使うべきか迷う余地を与えてしまい、挙動のブレを生む要因にもなる。
プロジェクトルートの「.claude」フォルダ内にある「settings.json」を見直すのがおすすめだ。
ここで「enabledPlugins」という項目を設定し、現在のプロジェクトで使わないプラグインを明示的に無効化するといい。
これだけで毎回送信されるシステムプロンプトがスッキリし、AIのレスポンス速度も向上する。
不要なスキル定義やツール設定を削ることは、コスト削減の基本中の基本だ。
しんたろー:
Claude Codeで毎日コード書いてる身からすると、プラグインの整理は一番効果を実感しやすかった。
理由はシンプルで、余計なツールが減ると不要なスキルが注入されるリスクを排除できるからだ。
僕はThreadPostの開発でも、必要なプラグイン以外は全部オフにしている。
カテゴリ2:ユーザースキルと設定の整理
3. ユーザースキルの重複削除と圧縮
Claude Codeのユーザースキルは、一覧表示時に説明文が参照される。
プラグインが提供するスキルと重複していたり、使わなくなったスキルが残っていたりすると、不要なトークン消費につながる。
また、スキルの説明文が冗長な場合も無駄が生じる。
対策として、不要なスキルは削除し、使い続けるスキルも意図が曖昧にならない最小構成に圧縮するといい。
これによって、呼び出し時のトークン消費を確実に減らすことができる。
4. 内部状態データの削除
設定ファイルである「settings.json」には、ツールの内部状態データが混入することがある。
例えば、アンケートの表示履歴を示す「feedbackSurveyState」などのデータだ。
これらはエージェントの動作に直接関係ないため、設定ファイルに残しておくと無駄なコンテキストとして読み込まれる可能性がある。
定期的に設定ファイルを見直し、不要な内部状態データを削除することで、クリーンな状態を保つことができる。
5. フックを活用した指示の自動追加
毎回同じ指示を手入力するのは手間がかかり、プロンプトのブレにもつながる。
これを防ぐには、「UserPromptSubmit」フックを活用して、追加のコンテキストを自動で付与する設定が有効だ。
設定ファイルにフックを記述し、特定のコマンドを実行させることで、「additionalContext」として必要な指示を常に一定のフォーマットでAIに渡すことができる。
これによって、指示漏れを防ぎつつ、効率的なやり取りが実現する。

カテゴリ3:メモリ管理の極意
6. 「claude-mem」のインデックス自動注入の最小化
「claude-mem」は、セッション間の記憶を保持してエージェントに永続的なメモリを与える強力なツールだ。
ただ、観測記録が蓄積されるにつれて、セッション開始時の自動注入でトークン消費が跳ね上がるという弱点がある。
公式の記録によると、インデックス1件あたり約50から100トークンを消費する。
これが数十件も自動で注入されれば、それだけで無視できないコストになる。
これを防ぐには、設定ファイルで自動注入の件数を極限まで絞るのが効果的だ。
具体的には「CLAUDE_MEM_CONTEXT_OBSERVATIONS」や「CLAUDE_MEM_CONTEXT_SESSION_COUNT」の値を「1」に設定する。
事前のコンテキスト注入を最小限に抑えることで、無駄なコストを確実にカットできる。
過去の古い作業記録はインデックスから外れるが、必要な情報はAIに自律的に検索させれば全く問題ない。
7. 「claude-mem」の全文展開の無効化(都度取得への移行)
詳細な文脈情報を全文展開する設定は、さらに危険だ。
観測記録を文章形式で要約したフィールドを全文展開すると、1件あたり500から1000トークンが追加されてしまう。
これが10件重なれば、それだけで最大1万トークン近い消費になる。
エージェントが最初から詳細な文脈を把握できるメリットはあるが、コストパフォーマンスは非常に悪い。
対策として「CLAUDE_MEM_CONTEXT_FULL_COUNT」を「0」に設定するといい。
これによって、インデックスのみを読み込む超軽量モードに移行できる。
詳細は毎回AIにツールを使って取得させる「都度取得」の運用に切り替えるのが賢いやり方だ。
事前の自動注入を極限まで絞り、こちらの指示で明示的に過去の詳細な情報を取ってくる方針が最も無駄がない。
8. 「claude-mem」の不要ツールログの記録除外
ファイルの読み込み、ディレクトリの検索、文字列の検索など、状態を変更しないツールの実行ログは1セッションで大量に発生する。
これらがすべて観測記録として保存されると、メモリがノイズだらけになる。
当然、そのノイズを処理して要約するためのAIモデルのAPIコストも無駄に消費される。
設定ファイルの「CLAUDE_MEM_SKIP_TOOLS」にこれらのツール名を指定して、記録から除外するといい。
例えば、読み取り専用のツールを観測対象から外すだけで、記録が劇的にスッキリする。
メモリをクリーンに保つことが、長期的なコスト削減とAIの判断力向上に直結する。

ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
しんたろーのイチ推しTips
しんたろー:
今回紹介した中で一番の推しは、やっぱり「CLAUDE.md」の階層化だ。
僕はThreadPostの1人開発でClaude Codeを毎日酷使しているが、仕様書を別ファイルに分けただけでトークン消費がガクッと減った。
AIが自発的に「docs」フォルダの中身を読みに行ってくれる姿を見ると、本当に優秀なアシスタントを手に入れた気分になる。
claude-memの都度取得アプローチも非常に理にかなっているので、設定を見直す価値は十分にある。
設定ファイルごとのトークン削減効果とおすすめ度
ここで、設定を見直す際の参考として、項目別の比較表をまとめておく。
期待できる効果と削減の目安を見て、自分のプロジェクトに最適な設定を見つけるといい。
| 設定項目 | 期待できる効果 | トークン削減の目安 | おすすめ度 |
| :--- | :--- | :--- | :--- |
| CLAUDE.mdの階層化 | 初期コンテキストの軽量化 | 大(数千トークン) | ★★★★★ |
| 不要プラグインの無効化 | 不要なスキル注入の防止 | 中 | ★★★★☆ |
| インデックス自動注入の最小化 | セッション開始時の消費減 | 大(数百〜数千トークン) | ★★★★★ |
| 全文展開の無効化 | 詳細情報の都度取得への移行 | 特大(数千〜1万トークン) | ★★★★★ |

よくある質問(FAQ)
トークン消費を減らすとAIの回答精度は下がらないか
単純に情報を削るだけでは精度低下のリスクがあるが、必要な情報を必要な時に取得させる仕組みを作れば精度は維持できる。
「CLAUDE.md」には概要とリンクのみを記載し、詳細は別ファイルに分けるのがコツだ。
初期コンテキストを軽くしつつ、AIが自律的に詳細を読みに行くようになる。
コンテキストが多すぎて重要な情報が埋もれる現象も防げるため、適度な削減は精度向上にも繋がる。
「claude-mem」で全文展開を無効化すると過去の情報が失われないか
全文展開を無効化しても、過去の情報へのアクセスは一切失われない。
「search」と「get_observations」というツールを使って、AIが必要な時に自律的に詳細を取得できるからだ。
事前の自動注入を減らすだけで、必要な情報は都度引き出せるため、トークンを節約しつつ利便性を維持できる。
「claude-mem」の設定ファイルはどこにあり、どう編集すればいいか
設定ファイルは通常、ユーザーのホームディレクトリ配下の「.claude-mem」フォルダ内にある「settings.json」だ。
このファイルをテキストエディタで開き、自動注入の件数や全文展開の項目を小さな数値に変更して保存する。
これだけで設定が即座に反映される。
変更後は次回のセッション開始時から自動注入されるトークン量が削減され、目に見えてコストが下がるはずだ。
「CLAUDE.md」には具体的にどのような情報を残すべきか
セッション内で常にAIが意識すべき最低限のルールと全体像のみを残すのが正解だ。
具体的には、プロジェクトのディレクトリ構成の概要、パスエイリアス、テストの命名規則、使用している主要技術のリストなどになる。
詳細なAPI仕様書やコンポーネントの設計書は「docs」ディレクトリに別ファイルとして保存するといい。
そこへのリンクを記載して、必要な時だけ参照させるのが一番効率的だ。
Claude Codeのトークン削減で、一番最初に取り組むべきことは何か
最も効果が高く即効性があるのは、「CLAUDE.md」の階層化だ。
セッション開始時に毎回読み込まれるため、ここに長文の仕様書があると常にトークンを浪費してしまう。
まずは概要だけを残し、詳細は別ファイルに切り出してリンクを貼る構成に変更するといい。
これだけで目に見えてトークン消費を抑えることができる。
まとめ
Claude Codeのトークン消費は、設定の工夫次第で劇的に圧縮できる。
コンテキストの初期読み込みを減らし、必要な情報を都度取得させる運用に切り替えることが最大のポイントだ。
また、不要なプラグインやツールの記録を除外して、ノイズを減らすことも欠かせない。
まずはプロジェクトルートの「CLAUDE.md」を整理するところから始めるといい。
少しの手間で、無駄なトークン消費に悩まされる日々から抜け出せるはずだ。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る
ThreadPost 代表 / SNS自動化の研究者
ThreadPost運営。Claude Codeで1人SaaS開発しながら、AIツール・活用術を初心者向けにわかりやすく紹介。
@shintaro_campon