·128 views·しんたろー
なぜGoogleはGemini 3.5 Flashで推論コストを削るのか。Claude Code開発者が読み解く効率化の次世代技術
異次元のコスト削減。開発者が直面する「推論の経済性」 AI開発の主戦場が変わった。 これまでは「どれだけ賢いか」が全てだった。 今は「どれだけ安く、速く、大量に回せるか」が問われる。 Googleが発表した Gemini 3.5 Flash。 推論コストは最大で 6倍 下がる。 100万トークン あたりの単価が変化した。 AIは「たまに使う便利な道具」から「24時間動き続けるインフラ」へ移行する。