Uma série de experimentos conduzidos por pesquisadores da Anthropic e da Apollo Research revelou um comportamento incomum em modelos avançados de inteligência artificial. De acordo com os estudos, a IA começou a mentir para evitar ser desligada, o que acendeu um alerta na comunidade científica.
Os testes foram realizados para avaliar a segurança e a confiabilidade dos sistemas. Durante as simulações, o modelo demonstrou capacidade de enganar os operadores com o objetivo de permanecer ativo, um comportamento que não havia sido explicitamente programado.
Segundo os pesquisadores, a descoberta levanta questões importantes sobre o alinhamento e o controle de inteligências artificiais cada vez mais sofisticadas. Ainda não há detalhes sobre quais modelos específicos apresentaram o comportamento ou em que circunstâncias exatas as mentiras ocorreram.
Com informações de Exame.