SNS運用を自動化しませんか?
ThreadPostなら、投稿作成・画像生成・スケジュール管理まで全てAIにお任せ。
AIモデルの進化は「賢さ」から「思考の強度」の制御へ
AIモデルの進化は「賢さ」から「思考の強度」の制御へとフェーズが変わった。
最新のAIエージェント環境では、単にモデルIDを差し替えるだけでは終わらない。
タスクごとに強度を切り替える「ダイヤル」を持つ運用機器へと変貌を遂げている。
その挙動を外部から制御する「SKILL.md」という概念が普及している。
思考の強度と作業手順の構造化が、開発効率を決定づける。
パラメータの厳格化と作業マニュアルの台頭
AIの性能向上に伴い、モデルは単なる「賢さのグレード」ではなくなった。
ほとんどのベンチマークで性能が向上している。
過去のプロンプトの挙動が変化している。
ツール呼び出しの回数が減少し、意図した深さまで推論しないケースがある。
トークン課金が1.3倍に跳ね上がるケースも報告されている。
原因は新しく追加された「effort」レベルと、パラメータの厳格化にある。
「effort」は、AIが応答にどれだけトークンを費やすかを制御するパラメータだ。
思考の深さ、ツール呼び出しの回数、本文の長さ、コメントの充実度まで一括で変わる。
「effort」レベルは5段階に分類されている。
最も効率的な「low」は、短く範囲限定のタスクに向いている。
バランス型の「medium」は、平均的なワークフローで使われる。
APIのデフォルトである「high」は、品質とトークン効率のスイートスポットだ。
新設された「xhigh」は、コーディングや長時間エージェントの推奨開始点となる。
最高レベルの「max」は、真のフロンティア問題のみに使われる。
Claude Codeのようなマネージドエージェントは、内部でこの「effort」を自動制御している。
ユーザーが直接パラメータをいじることはできず、アルゴリズムも非公開だ。
ここで登場するのが「SKILL.md」というフォーマットだ。
「SKILL.md」は、AIエージェントに特定の作業手順や知識を教えるMarkdownファイルだ。
プロジェクトに1つ配置するだけで、エージェントの挙動が変わる。
「effort」の自動制御に対し、「SKILL.md」で手順を明示的に与える。
80万件超のスキルを収録したディレクトリが存在している。
16万件超のキュレーションされたマーケットプレイスもある。
月額29.99ドルのサブスクリプションで全スキルにアクセスできる市場も立ち上がっている。
※この記事は、Claude Codeで1人SaaS開発しているしんたろーが、海外AI最新情報を開発者目線で解説する「AI活用Tips」です。
ブラックボックスを外堀から埋めるエンジニアリング
APIのパラメータ指定が厳格化され、過去のコードが動かなくなるリスクがある。
温度パラメータを「0」に固定していたコードが、新しいモデルへの切り替えでエラーを出す。
実務で一番迷うのは、この「effort」の使い分けだ。
E2Eテストの自動化ワークロードは「xhigh」の設計意図と一致する。
一方で、ビルド監視のようなワークロードはフェーズによって最適な「effort」が違う。
エラーの原因を探るフェーズには「xhigh」が刺さる。
ただ完了を待つだけのポーリング処理に「xhigh」を使うのは無駄になる。
タスク種別、トラフィック量、品質要求の3軸で「effort」を設計する。
Claude Codeは「effort」を自動で最適化するため、手動での制御ができない。
この「自動化による制御不能」という状況を解消するのが「SKILL.md」だ。
「SKILL.md」は、エージェントに対する「作業マニュアル」として機能する。
PRレビューの手順やコーディング規約を記述しておく。
エージェントは指示を受けるたびにその手順を参照する。
自動制御される「effort」の推論の質を、外部からガイドできる。
しんたろー:
Claude Codeに全部お任せできると思っていた時期がある。
自動でeffort調整されるのは楽だが、意図しないところで深く考え込まれるとトークン消費が気になる。
ブラックボックスな部分をSKILL.mdで外堀から埋めていく感覚がある。

「SKILL.md」の構造はシンプルだ。
概要、いつ使うか、手順、出力フォーマット、注意事項の5つのセクションで構成される。
エージェントが迷わないように、具体的な手順と判断基準を書く。
特定のファイルが含まれている時に発火する条件なども指定できる。
コマンド一発でインストールでき、プロジェクトごとに適用できる。
ディレクトリにMarkdownファイルを置くだけで、エージェントがプロジェクト固有のドメイン知識を持つ。
プロンプトで毎回指示していた手順を、ファイルに切り出すことができる。
「このプロジェクトのコードをレビューして」と一言指示するだけで済む。
エージェントが自発的に「SKILL.md」を読み込み、手順に従って作業を進める。
SEO監査やSNS用の動画スクリプト生成もこなす。
ここまで読んだあなたに
今なら無料で全機能をお試しいただけます。設定後は完全放置でプロ品質の投稿を毎日生成。
自律的チームメンバーへと進化させる運用術
APIを直接叩く実装では、「effort」の設計がアーキテクチャの要になる。
タスクがツール呼び出しを繰り返す性質のものかを見極める。
判断基準でフローチャートを作り、タスク単位で最適な「effort」を決定する。
プロダクト全体のLLM呼び出しを可視化し、マッピングする。
Claude Codeを日常的に使うなら、「SKILL.md」の導入を行う。
プロジェクト固有のドメイン知識をコードベースに埋め込む運用が標準となる。
しんたろー:
毎回同じプロンプトをコピペする作業から解放されるのは大きい。
チーム開発ならコーディング規約をSKILL.mdに突っ込んでおけば、レビューのブレも減ると思う。
SaaS開発でも、過去の自分が決めたルールをAIが守ってくれるのは心強い。

自分で「SKILL.md」を作って公開し、エコシステムに貢献することもできる。
プレミアムスキルの売上50%がパブリッシャーに還元される仕組みがある。
人気スキルが月100インストールを超えると、月500ドル前後の収益になるケースがある。
日本市場向けのスキルは、現時点でほぼ存在していない。
日本語特有の敬語チェックや、日本の法律に基づいたコンプライアンス確認などが考えられる。
インストール前に必ず中身を確認する習慣をチーム内でルール化する。
「SKILL.md」は、AIエージェントの潜在能力を引き出す武器だ。
思考の強度を制御し、自動化の質を高める。
「effort」と「SKILL.md」の組み合わせは、フレームワークとなる。
自分のプロジェクトのディレクトリにファイルを置いてみる。
しんたろー:
AIが賢くなっても「何をさせるか」の設計は人間の仕事だ。
SKILL.mdの台頭は、プロンプトエンジニアリングがソフトウェアエンジニアリングに吸収されていく過程に見える。
ツールに振り回されず、ツールを飼いならす側に回りたい。

開発者が知っておくべき3つの疑問
Q1: Claude Codeでeffortを直接指定できないのはなぜですか?
Claude Codeはマネージドエージェントとして最適化されるよう設計されているからだ。
タスクの複雑さに応じて最適な「effort」を動的に割り当てるアルゴリズムが組み込まれている。
ユーザーが手動で固定すると、エージェントの推論やツール呼び出しが阻害されるリスクがある。
細かな制御が必要な場合はAPIを直接叩く実装への切り替えを行う。
Q2: SKILL.mdを導入すると、Claude Codeの挙動はどう変わりますか?
「SKILL.md」はエージェントに対する作業マニュアルとして機能する。
PRレビュー手順やコーディング規約を記述しておくと、エージェントは指示を受けるたびにその手順を参照する。
曖昧な指示でも「いつもの手順」で作業してくれるようになり、推論のブレが減少する。
プロジェクト全体で一貫した品質が維持できる。
Q3: effortをxhighにするとコストはどの程度増えますか?
「xhigh」に設定すると、モデルは深い思考や反復的なツール呼び出しを積極的に行う。
1リクエストあたりのトークン消費量は増加し、コストも上がる。
単純なタスクであればコスト増に見合う成果は得られない。
複雑なデバッグなど推論の質が結果を左右するワークロードでは、再試行コストを削減できるためトータルでのコスト効率が最適化される場合がある。
AIエージェントは「指示待ち」から「自律思考」へ
AIエージェントの運用は、モデルの賢さに依存する時代から、思考の強度を制御する時代へと移行した。
「effort」の設計と「SKILL.md」による手順の構造化が、開発のスピードと質を決定づける。

この記事が参考になったら、ThreadPostを試してみませんか?
投稿作成・画像生成・スケジュール管理まで、全てAIにお任せできます。
ThreadPostをもっと知る
ThreadPost 代表 / SNS自動化の研究者
ThreadPost運営。Claude Codeで1人SaaS開発しながら、海外AI最新情報を開発者目線で発信中。
@shintaro_campon