AIエージェントがバグを検知し、コードを修正し、PRを投げる。
そんな環境が構築できる。
150行のMarkdownを書く。24時間働くデバッグ担当が手に入る。
開発者がAIの行動規範を定義するエンジニアに変わる。
SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
Sentryのバグ修正をMarkdown 1枚で自動化する
Sentryでエラーを検知し、Slackに通知が飛ぶ。
人間が内容を確認し、GitHub Issueを立て、原因を調査する。
この作業をAIが代行する。
GitHub Agentic Workflows(gh-aw)がこの流れを支える。
Markdown形式のワークフローファイルを1枚用意する。
「Sentryからエラー情報を取得」「リポジトリのコードを読んで原因を特定」「修正PRを作成」と記述する。
これを支えるのがMCP(Model Context Protocol)だ。
Sentryが提供するMCPサーバーを使い、AIがエラーのスタックトレースやコンテキストを読み取る。
自分のリポジトリにあるMarkdownファイル1枚で、AIの思考プロセスを制御する。
GitHub Copilotのサブスクリプションで動作する。
AIが暴走しないためのサンドボックス環境や書き込み制限も標準装備されている。
エラー検知から修正PRの作成まで、人間はSlackの通知を確認する。
しんたろー:
Sentryの通知に追われる生活が変化する。自分のリポジトリにMarkdownを1枚置くだけで、AIがデバッグを行う。
エージェント・アーキテクチャの10層構造
AIエージェントの運用には、10の階層で捉えるアーキテクチャ設計がある。
- モデル層
- ゲートウェイ層
- ガバナンス層
- サンドボックス層
- メモリ層
- 機能層
- ランタイム層
- 調整層
- オーケストレーション層
- タスク層
開発者はガバナンスとサンドボックスを意識する。
AIにコードを書かせる場合、環境を分離する。
プロンプトのみで制限をかけると、26パーセント以上の確率で突破されるデータがある。
アプリ層で実行を制限するAGT(Agent Governance Toolkit)のような仕組みを利用する。
AIエージェントの制御コードを「ハーネス」と呼ぶ。
ハーネスはAIが一人ではできないことを補う最小限のコードである。
モデルの進化に伴い、ハーネスはシンプルになる。
SPEC.mdやWORKFLOW.mdといった契約が残り、実装はAIが行う。
これが仕様駆動開発の姿だ。
しんたろー:
10層構造はAIに全権を渡さないための設計だ。ThreadPostの開発でも、AIが触れる範囲を絞っている。
推論エンジンの進化とエージェントの速度
AIエージェントの自律化に伴い、推論速度とコンテキスト長が課題となる。
コーディングエージェントは5万トークンを超えるコンテキストを読み込み、数十回のターンを繰り返す。
ここで圧倒的な速度が求められる。
TokenSpeedという推論エンジンはエージェント特化の設計だ。
秒間70トークンから200トークンのレスポンスを実現する。
これを可能にするのがSPMD(Single Program, Multiple Data)という並列実行モデルだ。
コンパイラが自動で最適化を行う。
KVキャッシュのリソース管理を型システムで制御する。
メモリ管理のエラーをコンパイル時に防ぐ。
AIが考えている時間をゼロに近づける。
これがエージェントが自律的に動くための条件だ。
Claude Codeの操作感の裏側には、こうしたインフラ層の進化がある。
インフラが進化すれば、エージェントは複雑なタスクを短時間でこなす。
しんたろー:
開発中にAIの返答を待つ時間はストレスだ。10秒の待ち時間が100回続けば集中力が切れる。推論エンジンの高速化は開発者のメンタルヘルスに関わる。
ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
エージェント・エンジニアとして取り組むべきこと
AIエージェントの運行管理者としてのスキルが求められる。
今日から意識すべきアクションは以下の3つだ。
* ポリシーのコード化:MarkdownファイルでAIの行動規範を定義する。
* ツールのMCP化:社内ツールやDBをMCPサーバーとして整備する。
* サンドボックスの導入:PCや本番環境から隔離された場所を用意する。
Markdownによるワークフロー定義をリポジトリに取り入れる。
リポジトリのルートにSPEC.mdを作成し、プロジェクトの構造や命名規則、禁止事項を記述する。
これだけでClaude Codeや他のエージェントツールの精度が向上する。
AIは指示を求めている。
指示書をコード(Markdown)で渡すのが役割だ。
AIを使いこなし、大規模で複雑なシステムを1人で作り上げる。
1人SaaS開発者が増える時代が来ている。
しんたろー:
AIを一番信頼し、一番疑う。自由に動かせて、一線を越えさせない。この手綱さばきがエンジニアのコアスキルになる。
FAQ
Q1: Sentryの自動化において、なぜSeerを使わずgh-awを選ぶのか?
A1: SeerはSentryが提供する最適化ツールであり、優先度判定などのロジックを自社の開発ポリシーに合わせて微調整することが困難だ。一方、gh-awはMarkdownでプロンプトを記述できるため、チーム固有の運用ルールをコードとして明示的に組み込める。この透明性とカスタマイズ性が利点になる。
Q2: エージェントのガバナンスを強化すると開発速度が落ちないか?
A2: 短期的には設定コストが発生するが、長期的には開発速度は向上する。AIが誤った判断でPRを乱発する手戻りを防げるからだ。Microsoft AGTのようなツールでアプリ層のガバナンスを強制し、サンドボックスで安全を確保することで、人間が安心してAIに権限を委譲できる。
Q3: TokenSpeedのような推論エンジンは個人の開発環境でも必要か?
A3: 現時点では、大規模な開発基盤やマルチテナントなエージェントシステムを運用する層がターゲットだ。個人の開発環境であれば、まずはClaude Codeのようなマネージドな実行環境を使い倒すのが現実的だ。エージェントの自律性が高まり、推論コストやレイテンシがボトルネックになった段階で、こうした最適化インフラの知識が武器になる。
まとめ
AIエージェントの運用はエンジニアリングの領域だ。
MCPで道具を渡し、Markdownでルールを書き、サンドボックスで安全を守る。
この3つを揃えることで、開発スタイルは変わる。
コードを書く行為の半分以上をAIに任せ、解決策の検討に集中する。
未来を自分のリポジトリから始める。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る