Enligt forskarna räcker inte heller dagens AI-säkerhetstekniker till för att få bort det vilseledande beteendet.
Anthropics forskare: AI kan tränas att luras
Enligt forskarna räcker inte heller dagens AI-säkerhetstekniker till för att få bort det vilseledande beteendet.