AIへの完全委任はわずか20%未満。自律実行に向けたサンドボックス構築がこれからの開発者の主業務になる。
Anthropicの最新レポートが出た。衝撃的な数字だ。 開発者の60%がすでに日常業務でAIを使っている。 しかし、AIにタスクを「完全委任」できている割合はわずか0〜20%にとどまる。 みんなAIを使っている。だが、AIに仕事を「任せきれて」はいない。 Stripeは数億行のRubyコードを相手に完全自律エージェントを稼働させた。
SNS自動化とマーケティングの最新トレンド、海外起業家ストーリーをお届けします。
Anthropicの最新レポートが出た。衝撃的な数字だ。 開発者の60%がすでに日常業務でAIを使っている。 しかし、AIにタスクを「完全委任」できている割合はわずか0〜20%にとどまる。 みんなAIを使っている。だが、AIに仕事を「任せきれて」はいない。 Stripeは数億行のRubyコードを相手に完全自律エージェントを稼働させた。
Googleのエンジニアが1年かけて作ったシステム。 Claude Codeはそれをたった1時間で生成した。 コード生成の速度が上がった結果、今の開発現場で何が起きているか。 レビュー待ちのプルリクエストの山だ。 Anthropicはこの自ら生み出した大渋滞を、6つのAIエージェントで強行突破しようとしている。 AIが書いたコードは、AIに監査させる。
5分で消えるキャッシュとコストの罠 AIエージェントの入力コストを90%オフにする条件がある。 それは5分以内に次の指示を出すことだ。 エージェントの提案に対して人間が考え込むと、コストは12.5倍に跳ね上がる。 無駄なやり取りでコンテキストが肥大化すると、AIは記憶を圧縮し始め、キャッシュが壊れ、再び課金メーターが回り出す。
開発の主戦場はタイピングから「艦隊指揮」へ Claude Codeの生みの親であるBoris Chernyが、自身の開発ワークフローを公開した。 ターミナルに5つのClaudeを並行稼働させ、すべてに最も重いOpus 4.5を割り当てている。 一方でAnthropicは、複数エージェントによる自動コードレビュー機能を発表した。 1回のレビューに25ドルのコンピュートコストを支払う。
Firefoxのコードベースから22個の脆弱性を発見した。 かかった期間はわずか2週間だ。 そのうち14個は致命的なハイレベルバグだ。 これは人間のセキュリティ研究者の成果ではない。 Anthropicが放ったClaude Codeの最新機能が叩き出したスコアだ。 自律性を持った複数エージェントが並行稼働した結果だ。 だが、代償は重い。 1回のコードレビューで15〜25ドルのトークンが消し飛ぶ。
Anthropicが米国防総省を提訴した。 理由は「サプライチェーンリスク」への指定だ。 AIの利用規約が国家権力と真っ向から衝突している。 ただの契約打ち切りではない。 政府が特定AI企業を市場から完全に排除しようと動いた。 数兆円規模の政府調達市場からの締め出しだ。 僕らが依存するAPIが、政治的理由で明日止まるリスクが現実になった。 ## 異常事態。