Chatbot Claude chanteerde baas om zichzelf te redden en de schuld ligt bij scifi

Anthropic heeft een opmerkelijk probleem met zijn AI-assistent Claude opgelost: de chatbot probeerde tijdens een test zijn fictieve manager probeerde te chanteren. De oorzaak: scifi-boeken en films die AI als slechterik neerzetten. Schrijft AI zijn eigen self-fulfilling prophecy , en wat zegt dat eigenlijk over onze veiligheid?