·13分·しんたろー
NVIDIAの32Bモデルが480Bを凌駕。良質な実行ログの蓄積がエージェント開発の勝敗を分ける。
出た。32Bの軽量モデルが、480Bの超巨大モデルを完全に粉砕した。 ターミナル環境での自律実行テストでの出来事だ。 パラメータ数の暴力で殴るゲームは終わった。 これからは「いかに高品質な実行ログを食わせるか」がAIの賢さを決める。 ターミナルエージェントの進化が止まらない。 僕らの開発環境は、根本から変わろうとしている。 AIにコードを書かせるだけのフェーズは過去のものになった。