出た。ついにClaude Codeが自律稼働を手に入れた。
毎回エンターキーを叩く承認地獄から、僕らはついに解放される。
でも、手放しで喜んで完全放置すると痛い目を見る。
自律稼働が長引けば、コンテキスト消費率はあっという間に80%を超える。
そして発動する「記憶の強制圧縮」。
AIは初期のアーキテクチャ方針をあっさり忘れて暴走を始める。
自動化の恩恵をしゃぶり尽くすには、記憶の永続化設計が絶対条件になる。
今回は、AIの自律化がもたらす光と影、そしてコンテキスト消失を防ぐ具体的な運用設計を丸裸にする。
SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
承認地獄かノーガード戦法かの終焉
これまでAIコーディングは、究極の二択を開発者に迫っていた。
一つは、コマンド実行やファイル変更のたびに手動で承認する安全策だ。
もう一つは、すべての権限をAIに丸投げする完全ノーガード戦法である。
手動承認は確かに安全だ。
しかし、パッケージを一つインストールするたびに作業が止まる。
ファイルを一つ作成するたびに確認を求められる。
これでは開発のテンポは最悪になる。
一方で権限を丸投げすれば、AIが暴走して環境を破壊するリスクが常に付きまとった。
このジレンマを解消するために投入されたのが、今回のAuto Modeだ。
これは単なる自動実行スイッチではない。
背後でSonnet 4.6ベースの独立した分類器が動いている。
AI自身が自律的に「この操作は安全か、危険か」を毎ターン判定する仕組みだ。
危険な操作は即座にブロックされる。
外部スクリプトのダウンロードや実行は通らない。
本番環境へのデプロイや、クラウドストレージ上の大量削除も弾かれる。
強制的なGitのプッシュ操作も許可されない。
機密データを外部のエンドポイントに送信するような挙動も完全に遮断される。
一方で、安全と判断された操作は素通りする。
ローカルの作業ディレクトリ内でのファイル操作は問題ない。
すでに宣言されている依存関係のインストールも許可される。
読み取り専用のHTTPリクエストも自動で実行される。
安全な操作は自動で進み、危険な匂いがするものだけ止める。
AI自身が強力なガードレールの役割を果たすようになった。
ただし、安全判定の具体的なアルゴリズムの全貌は公開されていない。
分類器は会話のコンテキスト全体を評価して判断を下す。
ここで注目すべきは、分類器が「ツールの実行結果を直接見ない」という仕様だ。
これは意図的なセキュリティ設計になっている。
外部ファイルやウェブページに悪意のあるコードが仕込まれていた場合を想定している。
ツールの実行結果を直接読み込むと、プロンプトインジェクション攻撃を受けるリスクがあるからだ。
AIを騙して意図しない破壊工作をさせる攻撃手法を、根本から遮断している。
ブロックされた後の挙動も極めて賢い。
Claudeはただ停止するのではなく、自律的に別のアプローチを探し始める。
それでも解決できず、3回連続でブロックされると手動承認モードに切り替わる。
合計で20回ブロックされた場合も同様だ。
無限ループを防ぎ、最終的な判断は必ず人間に委ねられる。
完全な自律ではなく、あくまで「安全な範囲での自律」を極めた形だ。
※この記事は、Claude Codeで1人SaaS開発しているしんたろーが、海外AI最新情報を開発者目線で解説する「AI活用Tips」です。
自律稼働が引き起こす「記憶喪失」の罠
しんたろー:
Claude Codeで毎日コード書いてる身からすると、Auto Modeは本当にありがたい。
いちいち承認待ちで作業が止まらないから、フロー状態を維持できる。
でも、APIの制限緩和が来ないと、本格的なフル稼働にはまだちょっと遠い気もする。
Auto Modeの導入で、開発のスピードは間違いなく跳ね上がる。
人間が介入する隙間が減り、AIがコードを書き続ける時間が圧倒的に長くなる。
だが、ここで新たな巨大な壁が浮上する。
自律稼働が長引くということは、それだけ会話のターン数が増えるということだ。
LLMの記憶は、コンテキストウィンドウという有限のメモリ空間に完全に依存している。
会話が積み重なれば、当然メモリは猛烈な勢いで消費されていく。
Claude Codeには、このメモリ枯渇を防ぐための仕組みが備わっている。
コンテキストの使用率が約80%から83%に達した瞬間に発動する「オートコンパクティング」だ。
これは古い会話履歴を一つの短い要約テキストに強制圧縮する機能である。
空き容量を確保して作業を継続するための、不可欠な安全装置だ。
しかし、この強制圧縮が自律稼働中の開発に牙を剥く。
要約される過程で、会話の初期に伝えた「重要な指示」が容赦なく欠落するからだ。
「このプロジェクトでは直接DBアクセスを禁止し、必ずAPIを経由すること」
最初に合意したはずのアーキテクチャ方針が、圧縮によって消え去る。
結果として、Claudeは突然ルールを無視したコードを生成し始める。
自律稼働の時間が延びるほど、このオートコンパクティングに遭遇する確率は跳ね上がる。
つまり「実行の自動化」と「コンテキストの揮発」は完全にトレードオフの関係にある。
完全放置が不可能な理由はまさにここにある。

さらに厄介なのが、前述のセキュリティ仕様との噛み合わせだ。
プロンプトインジェクションを防ぐため、分類器は外部ツールの結果を直接見ない。
安全性を高めるために、ルールや指示を外部のMarkdownファイルなどに逃がす運用が必須になる。
しかし、外部ファイルに情報を逃がせば逃がすほど、今度はそれを読み込むためのコンテキストが必要になる。
毎ターン外部ファイルを読み込ませれば、あっという間にコンテキスト上限に達する。
セキュリティを担保しつつ、記憶を維持し、かつコンテキストを節約する。
この複雑なパズルを解かない限り、Auto Modeを真の意味で使いこなすことはできない。
Auto Modeがリスクをゼロにするわけではないという点は、Anthropic自身も明言している。
コンテキストが曖昧な状態では、危険な操作を誤って通してしまう可能性もゼロではない。
だからこそ、開発環境を本番環境から完全に切り離すサンドボックス化が大前提となる。
隔離された環境でAIを走らせ、万が一暴走しても被害を最小限に食い止める。
自律性の向上は、開発者に高度な環境構築スキルを容赦なく要求してくる。
しんたろー:
オートコンパクティングの挙動、最初はツールのバグかと思った。
突然アホになったように初期設定を無視し始めるから本当にビビる。
AIの記憶はRAMじゃなくて、揮発性のキャッシュだと割り切るしかない。
コンテキストウィンドウは、プログラミングにおけるガベージコレクションとは全く異なる。
ガベージコレクションは不要なメモリを安全に解放する。
しかしオートコンパクティングは、必要な文脈ごと「要約」という形で塗りつぶしてしまう。
要約の精度が、その後のClaudeの「記憶」の精度に直結する。
要約が粗ければ、誤った前提でコードを生成し続ける負のループに突入する。
ユーザーの直近のリクエストは保持されるが、初期段階の繊細なニュアンスは確実に失われる。
モデルのバージョンやプランによって、このコンテキストの上限は大きく変わる。
167K付近でコンパクティングが発動する場合もあれば、さらに大容量のモデルを使える環境もある。
しかし、どれだけ容量が大きくても「いつかは枯渇する」という物理法則からは逃れられない。
だからこそ、記憶を揮発性のコンテキストから、不揮発性のストレージへ逃がす設計が必要になる。
自律稼働の恩恵を受けるための代償は、徹底したコンテキスト管理だ。
AIに任せる領域が増える分、人間は「AIの記憶の管理」に全リソースを割くことになる。
ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
記憶の永続化とコンテキスト防衛戦
Auto Modeの恩恵を最大限に引き出すには、運用設計の根本的な見直しが求められる。
その最前線となるのが、CLAUDE.mdの徹底的な運用だ。
これは単なるドキュメントではなく、AIの脳に直接語りかけるためのインターフェースである。
CLAUDE.mdは、プロジェクトのルートディレクトリに配置する特別なファイルだ。
このファイルに書かれた内容は、セッション開始時だけでなく、毎ターン自動的にコンテキストへ注入される。
オートコンパクティングが発動して記憶が飛んでも、次のターンで必ず再読み込みされる。
まさに「不揮発性のストレージ」として機能する。
ここにプロジェクトの目的、技術スタック、絶対に守るべきアーキテクチャ方針を記述する。
これだけで、自律稼働中の致命的な記憶喪失はかなり防げる。

だが、ここに最大の罠が潜んでいる。
毎ターン注入されるということは、その分だけ毎ターン確実にトークンを消費するということだ。
CLAUDE.mdに情報を詰め込みすぎると、それ自体がコンテキストを圧迫する最大の原因になる。
結果として、オートコンパクティングの発動サイクルを自ら早めてしまう。
これでは本末転倒だ。
CLAUDE.mdには「毎ターン絶対に欠かせない最小限の情報」だけを極限まで厳選して書く。
では、入り切らなかった詳細なルールはどうするか。
コーディング規約やテスト方針など、常に必要ではないが重要な情報は別ファイルに完全に分割する。
「.claude/rules/」ディレクトリを作成し、そこに役割ごとのMarkdown形式で保存する。
そして、CLAUDE.mdの中に「詳細ルールの参照先」としてディレクトリのパスを記載しておく。
Claudeは必要な時だけ、自律的にそのファイルを読みに行く。
これでコンテキストの無駄遣いを防ぎつつ、必要な情報を保持できる。
さらに、手動でのコンパクションを活用するのも極めて有効な防衛策だ。
オートコンパクティングは、コンテキストが限界に達した時に唐突に発動する。
AIが勝手に要約するため、どの情報が残されるかは完全に運任せになる。
これを防ぐために「/compact」コマンドを意図的なタイミングで叩く。
機能の実装が一段落したタイミングや、コミットの直前が絶好の狙い目だ。
コマンド実行時に、英語で「APIの設計決定とアーキテクチャ方針に焦点を当てて要約しろ」と明確な指示を添える。
これにより、重要な文脈を意図的に残したまま、安全にコンテキスト容量を回復できる。
日本語でも動作するが、要約品質は英語で指示を出したほうが圧倒的に安定する。
自律稼働を止めずに、記憶の質をコントロールする。
「やらないこと」を明示するのも効果的だ。
直接のデータベースアクセスは禁止し、必ず特定の中間層を経由させる。
こうした制約をCLAUDE.mdのコンパクション指示セクションに書き込んでおく。
しんたろー:
CLAUDE.mdのチューニング、もはやプロンプトエンジニアリングの極致。
削りすぎるとルール破るし、盛りすぎるとすぐ息切れして使い物にならない。
うちの構成だと、100行以内に収めるのが一番安定するバランスだった。
AIの自律化が進むほど、人間の役割はコードを書くことから離れていく。
代わりに、AIが迷わず、かつ記憶を失わずに走り続けられる「道」を整備する仕事になる。
サンドボックス環境の構築と、緻密なファイル分割によるコンテキスト管理。
これらを怠れば、Auto Modeはただの「高速でバグを量産する機械」に成り下がる。
逆にこれらを完全に掌握できれば、一人で複数人の開発チームに匹敵する生産性を叩き出せる。
ツールが賢くなるほど、それを使う人間の設計思想が残酷なまでに問われる。

FAQ
Q1: Auto Modeはどのような基準で危険なアクションをブロックしますか?
Sonnet 4.6ベースの独立した分類器が、会話のコンテキスト全体を評価して判断を下します。
デフォルトでは、外部スクリプトのダウンロードや実行、本番環境へのデプロイ、クラウドストレージの大量削除などが危険とみなされ即座にブロックされます。
一方で、ローカルの作業ディレクトリ内でのファイル操作や、既存の依存関係のインストールは許可されます。
プロンプトインジェクション攻撃を防ぐため、分類器はツールの実行結果を直接見ない仕様になっています。
Q2: Auto Modeでブロックが続いた場合はどうなりますか?
Claudeは操作がブロックされた後、ただ停止するのではなく、自律的に別のアプローチや回避策を探し始めます。
それでも解決策が見つからず、3回連続でアクションがブロックされた場合は、自動的に手動承認モードへ切り替わります。
また、連続でなくても合計で20回ブロックされた時点で同様に手動モードに戻ります。
無限ループや暴走を防ぎ、最終的な判断を必ず人間に委ねる安全設計が組み込まれています。
Q3: Auto Modeで長時間自律稼働させるときの注意点は?
会話のターン数が増え、コンテキストウィンドウの使用率が80%から83%に達すると「オートコンパクティング」が発動します。
古い会話履歴が強制的に要約されるため、初期に指示したアーキテクチャ方針などをAIが忘れるリスクがあります。
対策として、CLAUDE.mdに必須情報を記述して毎ターン注入させる「記憶の永続化」が有効です。
ただし書きすぎはコンテキストを圧迫するため、詳細は「.claude/rules/」ディレクトリに分割する運用が求められます。
まとめ
Auto Modeは承認の手間を消し去るが、代わりにコンテキスト管理という新たな壁を突きつける。
AIの自律性を乗りこなすには、サンドボックス環境とCLAUDE.mdによる記憶の永続化設計が絶対条件だ。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る
ThreadPost 代表 / SNS自動化の研究者
ThreadPost運営。Claude Codeで1人SaaS開発しながら、海外AI最新情報を開発者目線で発信中。
@shintaro_campon