Ameaça Invisível: Como Citações "Alucinadas" por IA Contaminam a Ciência Global

Uma análise profunda revela a crescente epidemia de referências científicas forjadas por inteligência artificial, minando a credibilidade da pesquisa e exigindo uma reavaliação urgente dos pilares do conhecimento.

Por hemeson | há 1 hora | 3 visualizações

Ameaça Invisível: Como Citações "Alucinadas" por IA Contaminam a Ciência Global

Reprodução

A integridade da literatura científica está sob ataque, não por fraude humana direta, mas por um adversário mais sutil e onipresente: a inteligência artificial. O que era antes um erro tipográfico ou uma citação imprecisa, agora evolui para um fenômeno de referências acadêmicas completamente inexistentes, carinhosamente apelidadas de "citações alucinadas" – um subproduto indesejado do uso generalizado de Grandes Modelos de Linguagem (LLMs).

O computador cientista Guillaume Cabanac vivenciou isso em primeira mão ao encontrar uma citação de seu trabalho em um periódico de odontologia, embora sua pesquisa jamais tivesse tangenciado a área. O artigo citava um preprint seu, mas com dados de publicação falsos e um DOI inválido, levantando a suspeita imediata de uma alucinação de IA. Este não é um caso isolado; é a ponta de um iceberg em ascensão vertiginosa.

Estudos recentes apontam para um aumento drástico. Uma análise de quase 18.000 artigos em conferências de ciência da computação revelou que 2,6% dos trabalhos em 2025 tinham pelo menos uma citação potencialmente alucinada, um salto significativo de 0,3% em 2024. A própria equipe de notícias da Nature, em colaboração com a Grounded AI, estima que dezenas de milhares de publicações de 2025 – incluindo artigos de periódicos, livros e anais de conferências – provavelmente contêm referências inválidas geradas por IA.

Essas "citações Frankenstein", como são chamadas, combinam fragmentos de publicações genuínas de forma enganosamente crível, tornando-as difíceis de detectar. Editores e pesquisadores agora enfrentam o desafio de diferenciar erros humanos de fabricações algorítmicas, desenvolvendo ferramentas e protocolos para salvaguardar a base do conhecimento científico.

Por que isso importa?

Para o leitor ávido por conhecimento e para a sociedade em geral, a contaminação da literatura científica por citações "alucinadas" representa uma ameaça multifacetada. Primeiramente, ela erode a confiabilidade na ciência. Se mesmo as referências, o alicerce da validação de fatos, podem ser falsas, como distinguir a verdade da ficção em campos críticos como saúde, tecnologia e meio ambiente? Isso leva a uma inevitável desinformação estrutural, onde a própria base do conhecimento está comprometida, dificultando a tomada de decisões informadas por parte de formuladores de políticas públicas, empresas e cidadãos comuns. O tempo e os recursos de pesquisadores são desperdiçados ao tentar verificar ou construir sobre referências inexistentes, desacelerando o progresso científico e possivelmente direcionando investimentos para áreas baseadas em premissas falsas. Em última instância, esta crise desafia a alfabetização científica do público, que busca em fontes confiáveis a validação de informações, mas agora se depara com um cenário onde até mesmo os pilares da credibilidade acadêmica estão abalados por uma inteligência artificial que, por vezes, confabula em vez de informar.

Contexto Rápido

Historicamente, erros de citação (como nomes ou datas incorretas) sempre existiram na academia. Contudo, a proliferação atual de citações fabricadas por IA representa um desafio qualitativamente diferente e mais grave.
Estimativas recentes indicam que 2,6% dos artigos apresentados em conferências de ciência da computação em 2025 podem conter ao menos uma citação alucinada, um aumento exponencial em relação aos anos anteriores, e dezenas de milhares de publicações anuais são potencialmente afetadas.
A crise da reprodutibilidade, que já assola várias disciplinas científicas, é agora agravada pela introdução de informações completamente fictícias, abalando a confiança na própria fundação do método científico e na veracidade dos dados publicados.

Dados de contexto baseados em estatísticas públicas e levantamentos históricos.