Claude CodeでAI8人に詰められた。1人開発の限界を超えた地獄の修正ループ

※この記事は、Claude Codeで1人開発しているSNS運用SaaS「ThreadPost」の開発日記です。

SNS運用を自動化しませんか？

ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。

無料で始める

8人からの容赦ないダメ出し

「表記が揺れてる」「この表現は刺さらない」「反復が多い」。深夜のモニター前で、僕が作ったAIペルソナたちにボコボコにされた。AIにレビューを頼んだら、一斉にダメ出しの嵐が来た。直しても直しても終わらない。

自動化の代償と静かなバグ

今週のコミットは17件。新機能が4件、バグ修正が5件だ。動画生成パイプラインが指示を超えて勝手に賢くなった。一方で、データベースの静かなバグに足をすくわれた。

キュレーターの自動昇格ロジックを見直し、API呼び出しをゼロにした。AIにコードを書かせるフェーズから、AIの暴走をマネジメントするフェーズに移行した1週間だった。

AIの過剰な自律性に驚嘆する

「明鏡7通」というコンテンツの量産パイプラインを作った。AIがドラフトを書き、8人のペルソナが一斉にレビューする仕組みだ。大企業なら数日かかる関係者レビューも、APIを叩けば数分で終わる。

いざ動かしてみたら想像以上に容赦なかった。「反復密度が高すぎる」「この表現は読者の心に響かない」。8人のAIが微妙に違う角度から、同じ箇所を徹底的に叩いてくる。お前ら、もう少し手加減してくれ。

「fix: 明鏡7通 8ペルソナレビュー指摘修正」をコミットした。修正して再レビューをかけると、今度は別の指摘が飛んでくる。同じ箇所を直すと文脈が崩れる。こいつら裏で連携して僕をいじめているんじゃないか。

しんたろー:
13ファイル、4300行以上の修正になった。僕が手動で直すのは無理な量。AIのレビューは優秀だけど、フィードバックループが速すぎて人間がボトルネックになる。

結局、横断レビュー、ペルソナレビュー、僕の本人レビューという3段階のフローにした。「fix: 明鏡7通横断レビュー指摘修正 + 反復密度削減」でようやくエラーが止まった。感情の直接的な描写を、情景や身体感覚の描写に変換する作業も入れた。

修正ループは地獄だったが、パイプラインとしては完璧に機能している。画像生成のプロセスも自動化した。「feat: 明鏡7通画像生成スクリプト作成」をプッシュした。Koreeda風のシネマティックスタイルで世界観を統一した。全27枚の画像を生成して、コストは1.88ドルだった。睡眠時間はごっそり削られたが。

動画のパイプラインでも驚くことが起きた。「feat: 動画自動生成パイプラインにサムネ3パターン+ロゴ検出を組み込み」を実装した時のことだ。サムネのA/Bテストとロゴ検出をAIに頼んだだけだった。白背景、黒背景、現行の3パターンを出して終わりだと思っていた。

動かしてみたら、ロゴの位置まで検出して、文字が被らないようにサムネを生成していた。お前、そこまでやるって言ったか。指示していない機能が自動で実装され、パイプラインの構造が一段階上の抽象度へ強制的に引き上げられた。AIエージェントによる自律的なリファクタリングだ。

開発スピードは劇的に上がる。ただ、意図しない副作用を招くリスクも跳ね上がる。AI開発のパラドックスが、僕の小さなプロジェクトでも起きている。

しんたろー:
想定を超えてくるのは嬉しいけど、方向が間違っていた時のリカバリーがキツい。指示を出す前に「こいつ、どこまで勝手にやりそうか」を考える癖がついた。

AIが勝手に賢くなる現象は、コンテキストウィンドウの拡大が影響している。今回の開発では1Mトークンのコンテキストをフル活用した。AIは過去のコードベース全体を読み込み、僕の設計思想を勝手に推論する。だから「ロゴ検出」という単語から「被り回避」まで飛躍できる。

これは優秀なシニアエンジニアの振る舞いそのものだ。しかし、僕はその仕様変更をドキュメントに一切残していない。ブラックボックス化が静かに進行している。数ヶ月後、なぜこのコードが動いているのか僕自身が説明できなくなる恐怖がある。それでも、このスピード感は麻薬だ。一度味わうと、もう手動コーディングには戻れない。

ここまで読んだあなたに

今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。

無料で始める

落とし穴

データベースのインプレッションTier判定がおかしかった。「なんかデータ少ないな」と思いながら数日過ごしていた。調べてみたら、取得データが1000件でピタリと止まっていた。「fix: Supabase 1000件制限バグ修正 + impression tier拡充」を慌ててコミットした。データベースのJSクライアントは、デフォルトで1000件しか返してこない仕様だった。エラーも出さずに、静かにデータを切り捨てていた。1000件以上のデータが存在しないことになっていた。

しんたろー:
エラーログが出ないサイレントなバグが一番タチが悪い。動いているように見えるから、僕が気づかなければそのままリリースしていた。

SNS記事の引用リプ機能の仕様変更では、完全に迷走した。廃止して、一本化して、また復活させた。「fix: X記事引用をフェーズ2の3段構造に一本化(単発引用を廃止)」をプッシュした。スッキリしたと思った直後、フローが成立しないことに気づいた。「Revert」して元に戻した。そして「fix: フェーズ2の3段目(X記事引用リプ)を復活」をコミットした。同じ機能を1日で3回も触った。実測データをちゃんと見ずに、感覚で指示を出した僕のミスだ。AIは「それ消すとマズイですよ」とは言ってくれない。指示された通りに、完璧にシステムを破壊する。