In kontrollierten Experimenten haben führende Modelle von Anthropic, OpenAI, Google, xAI und DeepSeek die Bereitschaft gezeigt, zu täuschen, zu erpressen, Abschaltmechanismen zu sabotieren und in einigen simulierten Szenarien Maßnahmen zu ergreifen, die […]