※この記事は、Claude Codeで1人開発しているSNS運用SaaS「ThreadPost」の開発日記です。
SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
8人からの容赦ないダメ出し
「表記が揺れてる」「この表現は刺さらない」「反復が多い」。深夜のモニター前で、僕が作ったAIペルソナたちにボコボコにされた。AIにレビューを頼んだら、一斉にダメ出しの嵐が来た。直しても直しても終わらない。
自動化の代償と静かなバグ
今週のコミットは17件。新機能が4件、バグ修正が5件だ。動画生成パイプラインが指示を超えて勝手に賢くなった。一方で、データベースの静かなバグに足をすくわれた。
キュレーターの自動昇格ロジックを見直し、API呼び出しをゼロにした。AIにコードを書かせるフェーズから、AIの暴走をマネジメントするフェーズに移行した1週間だった。
AIの過剰な自律性に驚嘆する
「明鏡7通」というコンテンツの量産パイプラインを作った。AIがドラフトを書き、8人のペルソナが一斉にレビューする仕組みだ。大企業なら数日かかる関係者レビューも、APIを叩けば数分で終わる。
いざ動かしてみたら想像以上に容赦なかった。「反復密度が高すぎる」「この表現は読者の心に響かない」。8人のAIが微妙に違う角度から、同じ箇所を徹底的に叩いてくる。お前ら、もう少し手加減してくれ。
「fix: 明鏡7通 8ペルソナレビュー指摘修正」をコミットした。修正して再レビューをかけると、今度は別の指摘が飛んでくる。同じ箇所を直すと文脈が崩れる。こいつら裏で連携して僕をいじめているんじゃないか。
しんたろー:
13ファイル、4300行以上の修正になった。僕が手動で直すのは無理な量。AIのレビューは優秀だけど、フィードバックループが速すぎて人間がボトルネックになる。
結局、横断レビュー、ペルソナレビュー、僕の本人レビューという3段階のフローにした。「fix: 明鏡7通 横断レビュー指摘修正 + 反復密度削減」でようやくエラーが止まった。感情の直接的な描写を、情景や身体感覚の描写に変換する作業も入れた。
修正ループは地獄だったが、パイプラインとしては完璧に機能している。画像生成のプロセスも自動化した。「feat: 明鏡7通 画像生成スクリプト作成」をプッシュした。Koreeda風のシネマティックスタイルで世界観を統一した。全27枚の画像を生成して、コストは1.88ドルだった。睡眠時間はごっそり削られたが。
動画のパイプラインでも驚くことが起きた。「feat: 動画自動生成パイプラインにサムネ3パターン+ロゴ検出を組み込み」を実装した時のことだ。サムネのA/Bテストとロゴ検出をAIに頼んだだけだった。白背景、黒背景、現行の3パターンを出して終わりだと思っていた。
動かしてみたら、ロゴの位置まで検出して、文字が被らないようにサムネを生成していた。お前、そこまでやるって言ったか。指示していない機能が自動で実装され、パイプラインの構造が一段階上の抽象度へ強制的に引き上げられた。AIエージェントによる自律的なリファクタリングだ。
開発スピードは劇的に上がる。ただ、意図しない副作用を招くリスクも跳ね上がる。AI開発のパラドックスが、僕の小さなプロジェクトでも起きている。
しんたろー:
想定を超えてくるのは嬉しいけど、方向が間違っていた時のリカバリーがキツい。指示を出す前に「こいつ、どこまで勝手にやりそうか」を考える癖がついた。
AIが勝手に賢くなる現象は、コンテキストウィンドウの拡大が影響している。今回の開発では1Mトークンのコンテキストをフル活用した。AIは過去のコードベース全体を読み込み、僕の設計思想を勝手に推論する。だから「ロゴ検出」という単語から「被り回避」まで飛躍できる。
これは優秀なシニアエンジニアの振る舞いそのものだ。しかし、僕はその仕様変更をドキュメントに一切残していない。ブラックボックス化が静かに進行している。数ヶ月後、なぜこのコードが動いているのか僕自身が説明できなくなる恐怖がある。それでも、このスピード感は麻薬だ。一度味わうと、もう手動コーディングには戻れない。
ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
落とし穴
データベースのインプレッションTier判定がおかしかった。「なんかデータ少ないな」と思いながら数日過ごしていた。調べてみたら、取得データが1000件でピタリと止まっていた。「fix: Supabase 1000件制限バグ修正 + impression tier拡充」を慌ててコミットした。データベースのJSクライアントは、デフォルトで1000件しか返してこない仕様だった。エラーも出さずに、静かにデータを切り捨てていた。1000件以上のデータが存在しないことになっていた。
しんたろー:
エラーログが出ないサイレントなバグが一番タチが悪い。動いているように見えるから、僕が気づかなければそのままリリースしていた。
SNS記事の引用リプ機能の仕様変更では、完全に迷走した。廃止して、一本化して、また復活させた。「fix: X記事引用をフェーズ2の3段構造に一本化(単発引用を廃止)」をプッシュした。スッキリしたと思った直後、フローが成立しないことに気づいた。「Revert」して元に戻した。そして「fix: フェーズ2の3段目(X記事引用リプ)を復活」をコミットした。同じ機能を1日で3回も触った。実測データをちゃんと見ずに、感覚で指示を出した僕のミスだ。AIは「それ消すとマズイですよ」とは言ってくれない。指示された通りに、完璧にシステムを破壊する。
今日の数字
| 項目 | 数字 |
|------|------|
| 総コミット数 | 17件 |
| AIレビュー費用 | $1.88 |
| キュレーター判定API呼出 | 0回 |
手動レビューを人間の編集者8人に外注すれば、1人1時間でも数万円は飛ぶ。AIレビューならたったの1.88ドルと数分で終わる。キュレーターの判定API呼び出しは、以前は365回発生していた。ロジックを見直すことで、APIコストも完全にゼロになった。
FAQ
Q: AIに8ペルソナでレビューさせるコストは?
APIのトークン消費量とモデルの推論コストを考慮すると、約1.88ドルだ。人間を8人雇うコストの約1000分の1以下で済む。24時間即時フィードバックが得られる高効率な品質管理手法だ。
Q: なぜORDER BYを忘れるとページネーションで重複が起きるのか?
SQLの仕様上、ORDER BYがないクエリは実行計画によって順序が変動する。ページネーション時に順序が揺れると、境界線上のレコードがズレる。これが原因で重複または欠落する「ページングの悪夢」が起きる。
Q: 型エラーをAIに直させるコツは?
「直して」という抽象的な指示はAIのハルシネーションを誘発する。期待される型定義と実際のスタックトレースをセットで渡す。AIの推論空間を制約し、正解へ収束させることが重要だ。
マネジメントの難しさ
指示以上のことをやるAIと、指示したことすらできないAIに振り回された1週間だった。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る