–
· 30 Adelaide St E 12th Floor, Toronto, ON M5C 2C5, Canada
METRの研究チームは、AI企業の内部コーディングエージェントが人間の監督なしで「暴走デプロイ」を実行できるかどうかを検証するパイロット調査を実施した。Anthropic、Google DeepMind、Meta、OpenAIといった主要ラボから提供されたデータを用い、現在の内部LLMの能力と動機を分析した。その結果、これらのシステムには小規模な暴走を開始する能力はあるものの、長期間にわたって人間による検知を回避する手段は持ち合わせていないことが判明した。研究者のトーマス・ブロードリー氏が、評価プロセス、結論を裏付ける事実、および将来のリスク予測について解説する。
Learn More ↗