x
Gradient hacking via actual hacking — AI Alignment Forum