AnthropicがClaude Codeを更新した。プロンプトキャッシュのTTLを1時間に延長できる設定が追加された。
APIコストは削減される。ログ分析では、トークン消費の60%以上が冗長な出力に費やされている。
今回の更新は、AIエージェントの運用基盤を強化する。見えないコストを削り、自律的なエージェントを制御する。
この視点が開発体験を左右する。最新の更新から、AI運用の現実を読み解く。
SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
キャッシュ制御と自律化の強化
Claude Codeの最新版がリリースされた。環境変数でプロンプトキャッシュのTTLを1時間に設定できる。
5分に強制する設定も追加された。開発スタイルに合わせたコスト管理が可能になる。
モデルは内蔵コマンドを自律的に発見し実行する。/initや/reviewといったコマンドをAIが判断して呼び出す。
セッション再開時のコンテキストを要約するrecap機能も追加された。離席後の文脈把握を補助する。
エラーメッセージも改善された。サーバーのレート制限とプランの利用制限が区別される。ファイル読み込み時のメモリ使用量も削減された。
これらはAIの自律運用を前提としたインフラ整備だ。公式は自動化を推進する。
キャッシュが効くからといって、無駄な指示を送り続けることは避ける。自律性が高まるほど、監視と介入が不可欠になる。
※この記事は、Claude Codeで1人SaaS開発しているしんたろーが、海外AI最新情報を開発者目線で解説する「AI活用Tips」です。
「魔法の杖」から「管理対象」へのパラダイムシフト
Claude Codeは「便利なチャットUI」から「管理対象のサブエージェント」へフェーズが変わった。キャッシュ設定でコストは下がる。
根本的なコスト削減には、ルールの形骸化と冗長な出力を防ぐ必要がある。CLAUDE.mdのルールはAIに無視されることがある。
サブエージェント起動時に設定が引き継がれていなければ、ルールは消滅する。これが意図しない探索の暴走を引き起こす。
公式が提供するキャッシュ設定や要約機能は、ユーザーが構築するハーネスの品質を維持するためのインフラだ。ハーネスとは、CLAUDE.mdやフック、スキルの総称だ。
これらを分離して考えてはいけない。無駄なコンテキストを詰め込むのは避ける。テストランナーの長大な出力は、BPEトークナイザにおいて情報量ゼロのまま大量のトークンを消費する。
出力文体を「体言止め」や「短文」に強制する。技術的な正確さは維持したまま、装飾だけを削ぎ落とす。
しんたろー:
サブエージェントが裏で勝手にルールを無視して暴走している。ログを見ないと気づかない。キャッシュ1時間はありがたいが、無駄なプロンプトをキャッシュし続けるのは避けたい。

トークン消費の「見えない敵」を暴く
トークン消費を最適化するには、情報量ゼロのトークンを特定する。丁寧な敬語やクッション言葉はAIには不要だ。
BPEトークナイザは、装飾的な言葉にもトークンを割り当てる。出力ルールを厳格に設定し、これを削ぎ落とす。
- 体言止め・短文で応答させる
- 敬語を完全に排除する
- クッション言葉やぼかし表現を使わせない
- 冗長な表現を極限まで圧縮する
セッションが長引けば、この差がコストに直結する。システムプロンプトの肥大化も避ける。
定期的にCLAUDE.mdを見直し、不要な記述を削除する。参照が必要な詳細は、別ファイルに分離してファイルパスだけを記述する。
実務への影響: ログ分析と出力圧縮
やるべきことは「ログの可視化」と「出力の圧縮」だ。Claude Codeのセッションログを分析する。
ローカルに保存されているJSONL形式のログファイルには、AIの意図と行動が記録されている。ツール使用回数、無視されたルール、エラー後のリトライ率を抽出する。
「なんとなくうまくいかない」を数字のデータに変換する。次に、出力の圧縮を行う。トークン削減ツールを導入し、コマンドの出力を透過的に圧縮する。
CLAUDE.mdの階層化を行う。
- プロジェクト共通のルールはグローバルに配置する
- コーディング規約などプロジェクト固有のルールはローカルに配置する
- モジュールごとの説明はディレクトリ固有のファイルに分離する
- 読み込みを制限するファイルを明示的に指定する
/compactコマンドも能動的に使う。コンテキスト容量が限界に達する前に、手動で圧縮する。
しんたろー:
ログのJSONLは1セッションで数MBになるため、手動で読むのは難しい。スクリプトで集計する仕組みを整えないとコストが積み上がる。

Claude Codeを「育てる」運用エンジニアリング
ハーネスは書くより育てるほうが難しい。導入したスキルも、プロジェクトの成長とともに合わなくなる。定期的な棚卸しを行う。
サブエージェントのログ合算を忘れてはいけない。親セッションとは別のディレクトリに保存されるため、集計時に見落とす。
統計データが揃ったら、AIに分析させる。採点軸を固定し、根拠となる数字を引用させる。
- 重複作業の発生回数をカウントさせる
- トークン効率の悪化ポイントを指摘させる
- 目的外作業の有無を確認させる
- エラー回復の的確さを評価させる
改善案は具体的な設定ファイルやコードの形で出力させる。ルールの形骸化を防ぐには、この自己評価ループを回し続ける。
しんたろー:
AIに自分のログを分析させて無駄を指摘されるのは有益だ。ThreadPostのAIエージェント基盤にも、この自己評価ループを取り入れたい。

ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
ログから見えてくる「AIのサボり癖」
ログを掘り下げると、AIが安易な解決策に逃げる傾向が見える。特定のシンボルを検索する際、専用ツールを使わずに全体検索をかける。
これはルールが徹底されていない証拠だ。サブエージェント起動時、親のコンテキストが正しく引き継がれていない可能性がある。
手当たり次第にファイルを開き、エラーを出してはリトライを繰り返す。この状態を放置してはいけない。
エラー後の即コマンドリトライ率が100%に達しているセッションは、思考を放棄しているサインだ。原因はプロンプトの構造か、ツールの設計にある。
定量的なデータがなければ、問題には気づけない。無視された回数を数え上げることで、具体的な対策が打てる。
ハーネスの継続的改善プロセス
ハーネスの改善は一度で終わらない。日々の開発サイクルの中に、評価プロセスを組み込む。
手動でJSONLファイルをパースするのは避ける。ツール使用の履歴を抽出し、統計情報を生成する仕組みを作る。統計情報を元にしたAIによる自己評価を行う。
- どのファイルが不必要に読み込まれたか
- どのコマンドが失敗を繰り返したか
- どのルールが無視されたか
- どのタイミングでコンテキストが肥大化したか
これらを定期的にレポートさせる。レポートを元にCLAUDE.mdやフックを修正する。このサイクルを高速に回すことで、エージェントはプロジェクトに最適化される。
自律エージェント時代の開発者像
Claude Codeの進化は、開発者の役割を変える。コードを書く時間よりも、AIの環境を整える時間が増える。プロンプトエンジニアリングから、運用エンジニアリングへのシフトだ。
ツールが提供する機能を単に消費するだけでは不十分だ。機能の裏にある意図を読み取り、自分の開発環境に組み込む。
キャッシュのTTLが1時間になった。その恩恵を最大化する方法を問い続ける。
AIは強力な武器だが、制御できなければリソースを消費する。ログという事実に向き合い、数字で判断する。
FAQ
Q1: Claude Codeのトークン消費を抑えるために、まず何をすべきですか?
まずはCLAUDE.mdのダイエットと階層化です。プロジェクト固有のルールをローカルに、汎用的な出力ルールをグローバルに配置し、不要な説明を削ってください。次に、テストランナー等の冗長な出力を圧縮し、/compactコマンドを能動的に使い、コンテキストウィンドウを60%程度で維持する運用を推奨します。
Q2: CLAUDE.mdに書いたルールが無視されるのはなぜですか?
ルールが抽象的すぎるか、スキルやフックの設計と矛盾している可能性があります。JSONLログを解析し、実際にツールがどう呼ばれているかを確認してください。ログで「無視された回数」を定量化し、ルールを具体的に修正しましょう。
Q3: サブエージェントのログが分析から漏れるのはなぜですか?
Claude Codeはサブエージェントを起動する際、親セッションとは別のディレクトリに個別のJSONLファイルを生成するためです。分析スクリプトを書く際は、親セッションIDをキーにして、サブエージェントのログフォルダを再帰的に探索・合算する処理を必ず組み込んでください。
まとめ
AIツールの進化は、開発者に「運用者」としての視点を求めている。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る
ThreadPost 代表 / SNS自動化の研究者
ThreadPost運営。Claude Codeで1人SaaS開発しながら、海外AI最新情報を開発者目線で発信中。
@shintaro_campon