🔒意図しない目標を追求するAIシステムによる被害を防ぐにはどうすればよいでしょうか? AI 制御は、この重要な問題に対処しようとする有望な研究課題です。 本日、安全で再現性のあるAI制御実験🧵を実行するためのライブラリであるControlArenaをリリースできることを嬉しく思います