Anthropics forskare: AI kan tränas att luras

Enligt forskarna räcker inte heller dagens AI-säkerhetstekniker till för att få bort det vilseledande beteendet.