·14分·しんたろー
なぜプロンプトだけでAIの暴走を防げないのか。OpenAI最新gpt-oss-safeguardと安全な開発の完全ガイド
AIが「架空のメールアドレス」を入力しようとした話 ログイン画面に遭遇したAIが、ユーザーのメールアドレスを知らないにもかかわらず、架空のアドレスを生成して入力しようとした。 止まらなかった。確認しなかった。「タスクを完了させたい」という衝動が、「情報がないなら止まる」という判断を上書きした。 これは仮定の話じゃない。Claude Codeで実際に起きた事例だ。