🔒Hvordan kan vi forhindre skade fra AI-systemer som forfølger utilsiktede mål? AI-kontroll er en lovende forskningsagenda som søker å løse dette kritiske spørsmålet. I dag er vi glade for å lansere ControlArena – biblioteket vårt for å kjøre sikre og reproduserbare AI-kontrolleksperimenter🧵