Gradient hacking via actual hacking — AI Alignment Forum