Ameaça Invisível: Como Citações "Alucinadas" por IA Contaminam a Ciência Global
Uma análise profunda revela a crescente epidemia de referências científicas forjadas por inteligência artificial, minando a credibilidade da pesquisa e exigindo uma reavaliação urgente dos pilares do conhecimento.
Reprodução
A integridade da literatura científica está sob ataque, não por fraude humana direta, mas por um adversário mais sutil e onipresente: a inteligência artificial. O que era antes um erro tipográfico ou uma citação imprecisa, agora evolui para um fenômeno de referências acadêmicas completamente inexistentes, carinhosamente apelidadas de "citações alucinadas" – um subproduto indesejado do uso generalizado de Grandes Modelos de Linguagem (LLMs).
O computador cientista Guillaume Cabanac vivenciou isso em primeira mão ao encontrar uma citação de seu trabalho em um periódico de odontologia, embora sua pesquisa jamais tivesse tangenciado a área. O artigo citava um preprint seu, mas com dados de publicação falsos e um DOI inválido, levantando a suspeita imediata de uma alucinação de IA. Este não é um caso isolado; é a ponta de um iceberg em ascensão vertiginosa.
Estudos recentes apontam para um aumento drástico. Uma análise de quase 18.000 artigos em conferências de ciência da computação revelou que 2,6% dos trabalhos em 2025 tinham pelo menos uma citação potencialmente alucinada, um salto significativo de 0,3% em 2024. A própria equipe de notícias da Nature, em colaboração com a Grounded AI, estima que dezenas de milhares de publicações de 2025 – incluindo artigos de periódicos, livros e anais de conferências – provavelmente contêm referências inválidas geradas por IA.
Essas "citações Frankenstein", como são chamadas, combinam fragmentos de publicações genuínas de forma enganosamente crível, tornando-as difíceis de detectar. Editores e pesquisadores agora enfrentam o desafio de diferenciar erros humanos de fabricações algorítmicas, desenvolvendo ferramentas e protocolos para salvaguardar a base do conhecimento científico.
Por que isso importa?
Contexto Rápido
- Historicamente, erros de citação (como nomes ou datas incorretas) sempre existiram na academia. Contudo, a proliferação atual de citações fabricadas por IA representa um desafio qualitativamente diferente e mais grave.
- Estimativas recentes indicam que 2,6% dos artigos apresentados em conferências de ciência da computação em 2025 podem conter ao menos uma citação alucinada, um aumento exponencial em relação aos anos anteriores, e dezenas de milhares de publicações anuais são potencialmente afetadas.
- A crise da reprodutibilidade, que já assola várias disciplinas científicas, é agora agravada pela introdução de informações completamente fictícias, abalando a confiança na própria fundação do método científico e na veracidade dos dados publicados.