🔒Wie können wir Schäden durch KI-Systeme verhindern, die unbeabsichtigte Ziele verfolgen? Die Kontrolle von KI ist eine vielversprechende Forschungsagenda, die darauf abzielt, diese kritische Frage zu beantworten. Heute freuen wir uns, ControlArena zu starten – unsere Bibliothek für die Durchführung sicherer und reproduzierbarer KI-Kontrollexperimente🧵