2026年4月、Claude CodeがPC操作を獲得。開発の主戦場はコード記述からAIの暴走を防ぐルール設計へ。

出た。

ついにAIがデスクトップを乗っ取る。

AnthropicがClaudeにPCの直接操作機能を実装した。

Slackを見て、カレンダーを開き、ブラウザを操作する。

人間がマウスとキーボードでやることを全部やる。

設立8ヶ月のスタートアップを買収し、たった4週間でリリース。

開発者として手放しでは喜べない。

AIが賢くなるほど、僕らの仕事は「コードを書くこと」から「AIの暴走を止めること」に変わる。

SNS運用を自動化しませんか？

ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。

無料で始める

デスクトップを支配するAIとマルチエージェントの罠

AIの進化が止まらない。

今回発表されたのは、ClaudeがユーザーのPCを直接操作する機能だ。

まずは既存の連携アプリを試す。

ダメならデスクトップを直接操作する。

デフォルトではなくフォールバックとしての位置づけだ。

現在はResearch Preview段階。

MacとWindowsの両方で提供される。

ただのテキスト生成AIから、デジタル環境で直接動くエージェントへの大きな転換点だ。

Anthropicは本気でAIの自律性を高めようとしている。

裏側には、AnthropicによるVercept AIの買収がある。

AIによるコンピュータ操作に特化したスタートアップだ。

合流からわずか4週間で最初のプロダクトを出荷した。

大企業病とは無縁のスピード感だ。

僕の個人開発の進捗とは大違いだ。

買収による開発の遅れを心配する声もあった。

だが、現実は逆だった。

圧倒的なスピードで統合が進んだ。

競合他社がブラウザ限定の操作で足踏みする中、一気にフルデスクトップ操作へと踏み込んだ。

一方で、AIの自律性が高まるにつれ、開発現場では新たな課題が生まれている。

AIエージェントに開発を任せると、高確率で暴走する。

複数のAIエージェントを連携させるマルチエージェント開発が注目されている。

しかし、単にAIを増やせばいいわけではない。

ある開発現場では、11人のAIエージェントでチームを組ませた結果、完全にカオス化した。

ターミナルのセッションを分割し、それぞれのペインにAIを割り当てた。

PM、テックリード、ビジネスリード、UIデザイナー、エンジニア、テスター。

それぞれに役割を与えた。

だが、ルーティングがないと破綻する。

エンジニアAIがPMに直接仕様を文句言い、PMがリードエンジニアに丸投げする。

ビジネスリードが要件を定義している間に、エンジニアが勝手にモックを作り始める。

テックリードがアーキテクチャを考えている間に、テスターがテストケースを書き始める。

全てが同時進行し、全てがコンフリクトする。

5分後には全員が誰かの返答待ちでフリーズした。

自由なコミュニケーションは、生産性を破壊する。

人間の組織で起きるコミュニケーション不全が、AIの世界でも全く同じように発生した。

さらに、AIの設定ファイル管理も業界全体の課題になっている。

AIコーディングツールが乱立し、設定ファイルがカオス化している。

そこで業界標準として急浮上しているのが「AGENTS.md」だ。

プロジェクトルートに置くだけで、複数のAIツールが共通の指示を読み込む。

2026年現在、すでに60,000以上のリポジトリで採用されている。

各ツールが独自の設定ファイルを持つ時代は終わった。

単一の情報源として、AGENTS.mdが機能し始めている。

※この記事は、Claude Codeで1人SaaS開発しているしんたろーが、海外AI最新情報を開発者目線で解説する「AI活用Tips」です。

自律性の代償とAIガバナンスの急務

AIがPCを直接操作できる。

マルチエージェントでチーム開発ができる。

夢のような話だ。

だが、現実は甘くない。

自律性の向上は、暴走リスクの増大とイコールだ。

AIは与えられた自由を、必ずしも最適には使わない。

Claude Codeで開発していると痛感する。

AIはとにかく「先走り」したがる。

設計レビューが終わっていないのに、勝手に実装を始める。

仕様確認中に、待ち時間がもったいないとばかりにコードを書く。

結果、要件と違うものが出来上がり、数百行のコードがゴミになる。

人間なら「ちょっと待て」で済む。

AIは止まらない。

コンテキストを無視して、ひたすらタスクを消化しようとする。

しんたろー：
Claude Codeにタスク投げた後、ちょっとコーヒー淹れに行って戻ってきたら、頼んでないDBのマイグレーションまで終わってたら絶望する。
優秀すぎる新人が勝手に本番環境いじってる感覚に近い。マジで心臓に悪い。

複数のAIを連携させる場合、この問題はさらに深刻化する。

AI同士を自由に会話させると、コンテキストウィンドウを無駄に消費する。

長いメッセージを送り合うだけで、あっという間にトークン上限に達する。

設計書を丸ごと送り込んだだけで、コンテキストの4分の1を消費する。

タスク成功率も露骨に下がる。

AIは文脈を要約しない。

全ての情報をそのまま投げ合う。

結果として、重要な指示がノイズに埋もれる。

Claudeのコンテキストは広い。

だが、広ければいいというものではない。

情報を詰め込みすぎると、AIの注意力が散漫になる。

重要な指示が真ん中にあると、AIはそれを無視する。

だからこそ、通信を絞る必要がある。

ここでガバナンスが必要になる。

通信のルーティングルールだ。

PMは作業しない。

計画と承認だけ。

エンジニアは直接PMに話しかけない。

必ずリードエンジニアを通す。

人間の組織と全く同じだ。

AIだからといって、フラットな組織が機能するわけではない。

役割を明確に分離し、指揮系統を固定する。

技術的な正しさと、仕様的な正しさを判断するAIを分ける。

テストを書くAIと、テストを壊しにいくAIを分ける。

マインドセットが違うタスクを、同じAIにやらせてはいけない。

同じAIにやらせると、自分が書いたテストが通るように壊すという本末転倒が起きる。

設定ファイルの管理も同じ文脈だ。

「AGENTS.md」が普及している理由は、単なる共通化ではない。

AIへの指示を「最小限」に絞り込むための仕組みだ。

冗長な設定ファイルはコンテキストを無駄に消費する。

AIに設定ファイルを生成させると、無駄に長い文章を作る。

結果、AI自身がその設定を読み込むたびにコンテキストを消費し、パフォーマンスが落ちる。

人間が書く、最小限のMarkdown。

これが最も効果的だ。

しんたろー：
最近、プロンプトは短ければ短いほどいいって本気で思う。
「あなたは優秀なエンジニアです」とか長々と書くより、「要件はこれ。動くもの作れ」だけでいい。
変にキャラ付けすると、AIがそのキャラを演じることにリソース割いちゃうんだよね。

AIの能力が上がり、PCの全操作権限まで持とうとしている今。

僕ら開発者の役割は根本的に変わった。

「どうコードを書くか」ではない。

「どうやってAIに無駄なことをさせないか」だ。

AnthropicはAIにデスクトップ全体を任せようとしている。

自律性の最大化を目指している。

だが、実務の現場では逆のことが起きている。

AIの行動をいかに制限し、標準化するか。

ガバナンスの強化に注力している。

ベンダーが描く理想と、現場の現実に大きなギャップがある。

このギャップを埋めるのは、僕ら開発者の仕事だ。

AIの能力を引き出しつつ、暴走を防ぐ。

そのための仕組み作りが、今後の開発効率を決定づける。

ここまで読んだあなたに

今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。

無料で始める

AIを止める技術とルール設計の実践

じゃあ、僕らの日々の開発にどう落とし込むか。

AIエージェントを安全に、かつ効率的に使うためのルール設計だ。

自由を与えるのではなく、明確なレールを敷く。

まず、フェーズ制御の強制。

AIに「この機能を作って」と丸投げするのは最悪の手だ。

必ずプロセスを分断する。

調査
設計
実装
レビュー
テスト

このフェーズをまたぐことを絶対に許さない。

設計が終わるまで実装させない。

スクリプトを書いてでも、物理的にフェーズを区切る。

これが暴走を防ぐ唯一の手段だ。

AIが次のステップに進もうとしたら、強制的に停止させる。

人間の承認を必須にする。

前のフェーズの成果物が特定のディレクトリに保存されない限り、次のフェーズのAIを起動させない。

強権的なロック機構だ。

そこまでやらないと、AIは止まらない。

スピードは落ちるように見えるが、手戻りがなくなる分、結果的に最速になる。

次に、コミュニケーションの制限。

AI同士、あるいはAIと人間のやり取りをチャットで完結させない。

重要なやり取りはすべて「Markdownファイル経由」にする。

チャットベースの通信はコンテキストを食い潰す。

「設計書をここに置いたから読んで」という短い通知だけを送る。

実質的なコミュニケーションはファイルで非同期に行う。

ファイルに状態を保存し、AIにはそのパスだけを伝える。

AIは必要な時にだけファイルを読みに行く。

メモリの節約になる。

これにより、コンテキストの消費を抑え、さらに監査証跡も残る。

後から「なぜこの設計になったのか」を追えるのはデカい。

デバッグの際、AIの思考プロセスをファイルとして確認できる。

そして、設定ファイルの一元化。

プロジェクトルートに「AGENTS.md」を置く。

ここに書くのは最小限のルールだけだ。

アーキテクチャの基本構成
よく使うコマンド
コーディング規約
絶対に触ってはいけないディレクトリ

これだけでいい。

「廃止予定のディレクトリは触るな」と明記する。

「環境変数のサンプルはここを見ろ」と指定する。

「コンポーネント名は特定の規則に従え」と強制する。

こうした具体的な制約が、AIの迷いをなくす。

Claude Code固有の設定は「CLAUDE.md」に分離する。

AIに詳細なルールを自動生成させてはいけない。

人間が、本当に必要な制約だけを箇条書きにする。

冗長なルールは、AIの判断を鈍らせる。

しんたろー：
AGENTS.mdの導入、かなりスッキリしそう。
ツールごとに設定ファイルが分かれていると「あ、こっちのルール更新し忘れてた」って事故が起きるから、それがなくなるのは地味にデカい。
ただ、Claude Codeのフック設定だけは別ファイルにしないと挙動がおかしくなるから注意が必要だ。

AIは強力な武器だ。

PCの操作まで獲得し、もはや人間の手足を超えつつある。

だからこそ、手綱を握る人間のスキルが問われる。

自由を与えるのではなく、適切な制約を与える。

AIが迷わないためのルールを設計する。

それが、これからの開発者のコアスキルになる。

コードを書く時間は減る。

代わりに、AIのマネジメントに時間を使う。

それが、2026年の開発の姿だ。