Imagens e vídeos já foram considerados provas praticamente incontestáveis da realidade, mas a Inteligência Artificial (IA) abalou essa certeza. Hoje, é possível substituir a face de uma pessoa pela de outra, alterar expressões faciais, modificar a voz, simular falas e sincronizar lábios de maneira realista. Esse conteúdo é conhecido como deepfakes.

Os custos de produção de conteúdos manipulados caíram, os programas se popularizaram e muitas ferramentas ficaram gratuitas. Elas podem ser usadas para falsificação de identidade, difamação, violação de privacidade, golpes digitais, manipulação política, quebra de confiança nas produções digitais e disseminação de desinformação em escala global.

Graças ao realismo dos deepfakes, é cada vez mais difícil diferenciar mídias reais e falsas à olho nu. Por isso, é necessário usar ferramentas digitais para identificar o conteúdo manipulado. Os detectores funcionam como caçadores de pistas que operam a partir de fraudes que já existem. Mas tem um problema: quando surge uma nova técnica de manipulação, o desempenho dos detectores cai – e conteúdos falsos podem passar despercebidos.

Como diminuir o seu tempo de tela

Com essa questão em mente, pesquisadores do laboratório de IA Recod.ai, que atuam no Brasil, China e Singapura, criaram oOSDFD (Open-Set DeepFake Detection). Esse modelo é capaz de reconhecer deepfakes produzidos por técnicas inéditas, com as quais ele não foi treinado. Em outras palavras, o modelo não se limita a identificar exemplos de métodos de falsificação específicos. O OSDFD aprende padrões gerais que diferenciam imagens autênticas de manipuladas – independentemente da técnica utilizada.

Continua após a publicidade

“Com a explosão de técnicas de criação de conteúdo, fica impossível conseguir exemplos de ataques de todos os geradores. Dessa forma, procuramos pensar o problema por outro ângulo: se é difícil modelar os ataques, devido à sua variabilidade e nuances, seria possível modelar o que chamamos de normal ou no jargão técnico, bonafide?”, diz Anderson Rocha, professor do Instituto de Computação da Unicamp e coordenador doRecod.ai.

A partir dessa lógica, o modelo combina várias estratégias. Uma das principais inovações é o aprendizado de atributos naturais típicos de imagens autênticas, como textura e iluminação. Como as falsificações frequentemente violam esses padrões sutis, o modelo usa essa base como uma referência para identificar o que é real, mesmo diante de manipulações nunca vistas antes.

O OSDFD também analisa sinais de inconsistências globais e locais da face, focando em pistas de alta frequência e irregularidades. Em seguida, integra características de diferentes tipos de deepfakes para ampliar a capacidade de reconhecimento de manipulações. A junção dessas técnicas constrói uma fronteira que separa imagens de rostos reais e sintéticos. A detecção final ocorre quando a IA identifica desvios que mostram que a imagem não se enquadra no grupo das autênticas.

Continua após a publicidade

“Procuramos modelar a classe de imagens chamadas ‘naturais’, de pessoas reais, de modo que consigamos entender as propriedades físicas da geração da imagem, bem como as nuances de uma pessoa de verdade fotografada e não gerada por IA. Dessa forma, precisamos adicionar apenas imagens naturais de tempos em tempos para ele capturar características recentes e atualizadas de fotografia, e não de ataques. É muito mais fácil conseguir imagens de situações normais”, explica Anderson.

O funcionamento do OSDFD pode ser comparado ao trabalho de um perito em documentos. Ao examinar exemplares autênticos e falsificações conhecidas, ele aprende os padrões que os distinguem. Com esse conhecimento, ele identifica sinais de fraude mesmo quando se depara com uma falsificação produzida por uma técnica inédita.

O desafio não é apenas identificar falsificações, mas compreender o que caracteriza uma imagem natural. “O problema é que, historicamente, é mais fácil treinar um modelo para separar uma classe de outra do que ensiná-lo o que é normal. Tanto para humanos quanto para máquinas, é mais simples separar gato de cachorro do que gato de tudo quanto é coisa restante no mundo”, diz Rocha.

Continua após a publicidade

Esse detector busca superar limitações de seus antecessores. Ele requer ajustes em pequenos módulos do sistema, o que permite atualizações rápidas e contínuas e facilita a adaptação para novos cenários. Por isso, ele tem um consumo de memória e de processamento menores, além de manter bom desempenho mesmo em imagens comprimidas ou de baixa qualidade.

A lógica do sistema lembra uma literatura famosa. “Leo Tolstoy, em sua obra Anna Karenina escreveu: ´Todas as famílias felizes se parecem. Cada família infeliz é infeliz à sua maneira´. Em biometria, dizemos que imagens naturais se parecem, pois vêm de um processo físico de transformar a luz em informação, pixels. Já as imagens geradas por IA, cada uma é gerada de uma forma, por um gerador, com características específicas daquele gerador”, completa Anderson.

A novidade publicada no periódicoTCSVT está em fase experimental, mas tem potencial para ser implementada fora do laboratório. Os resultados indicam que a abordagem pode funcionar em contextos que exigem a identificação rápida de deepfakes, como plataformas digitais, ferramentas de checagem de conteúdo, sistemas de autenticação facial e soluções de forense digital.

Continua após a publicidade

A disputa entre geradores e detectores de deepfake é uma corrida. Cada nova técnica de manipulação cria desafios para os sistemas de verificação. A aposta dos pesquisadores com o OSDFD é que a perseguição deixe de seguir cada fraude individualmente e fique mais eficaz ao compreender o que torna uma imagem genuína.

AS MAIS LIDAS DA SEMANA Toda sexta, uma seleção das reportagens que mais bombaram no site da Super ao longo da semana. Inscreva-se aqui Carregando Aceito receber ofertas produtos e serviços do Grupo Abril.

Cadastro efetuado com sucesso!

Você receberá nossas newsletters pela manhã de segunda a sexta-feira.

Juliana Vicentini tem Pós-doutorado em Comunicação (USP) e é Especialista em Jornalismo Científico (Labjor/Unicamp).

Material produzido com o apoio da Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP), Brasil (Processo nº 2025/26523-7), vinculado ao Projeto Horus do Recod.ai (Processo nº 23/12865-8).

Publicidade