Qu'est-ce qu'une citation hallucinée ?

C'est une référence bibliographique inventée par un modèle de langage : un auteur fictif, un titre de papier inexistant, un DOI ou une URL qui ne mène nulle part. Elle paraît crédible mais n'existe pas dans la littérature scientifique.

Comment GPTZero détecte-t-il ces hallucinations ?

L'outil vérifie automatiquement chaque citation dans Google Scholar, PubMed et arXiv. Les résultats sont ensuite validés manuellement par des experts humains, avec une précision revendiquée de plus de 99 %.

NeurIPS autorise-t-il l'utilisation de LLM pour rédiger des articles ?

Oui, NeurIPS autorise l'usage de LLM pour la rédaction, mais interdit explicitement les citations hallucinées. Le comité considère que des références incorrectes ne invalident pas nécessairement le contenu scientifique d'un article.

NeurIPS 2025 : 100 citations hallucinées par l'IA détectées

Q: Ce problème existe-t-il en dehors de la recherche IA ?

Oui. Plus de 800 citations erronées générées par IA ont été documentées dans des dossiers juridiques aux États-Unis, montrant que le phénomène touche aussi les avocats et les tribunaux.

4 mars 2026 2 min de lecture Paul Forcadel

Le « vibe citing » s'infiltre dans la recherche

GPTZero, startup spécialisée dans la détection de contenu IA, a passé au crible 4 841 des 5 290 papiers acceptés à NeurIPS 2025, la plus prestigieuse conférence en apprentissage automatique. Résultat : plus de 100 citations hallucinées confirmées dans 53 articles, soit environ 2 % des papiers acceptés.

Chaque article avait pourtant été relu par au moins trois évaluateurs. Aucun n'a détecté les références inventées.

Trois types de fabrications

GPTZero identifie trois catégories de « vibe citing » :

Sources combinées : le LLM fusionne des éléments de plusieurs vrais articles (titres, auteurs, données) pour créer une référence plausible mais inexistante.
Éléments entièrement fabriqués : auteurs fictifs (« John Doe »), DOI inventés, URLs qui ne mènent nulle part, identifiants arXiv incomplets.
Originaux modifiés : un vrai article est cité avec un titre paraphrasé, des co-auteurs ajoutés ou supprimés, ou une conférence de publication erronée.

Un problème systémique

Les soumissions à NeurIPS ont explosé de 220 % entre 2020 et 2025, passant de 9 467 à 21 575 articles. Le nombre d'erreurs par papier a augmenté de 55,3 % sur la même période. Selon une étude, jusqu'à 17 % des évaluations par les pairs dans les grandes conférences informatiques sont elles-mêmes générées par IA, créant un cercle vicieux.

Le phénomène dépasse la recherche : plus de 800 citations erronées ont été documentées dans des dossiers juridiques aux États-Unis.

NeurIPS temporise

Le comité de NeurIPS reconnaît le problème mais nuance : des références incorrectes « ne invalident pas nécessairement les papiers eux-mêmes ». La conférence autorise toujours l'utilisation de LLM pour la rédaction, tout en interdisant explicitement les citations hallucinées. Un problème similaire a été identifié à ICLR 2026, avec 50 hallucinations supplémentaires.