Aller au contenu principal

NeurIPS 2025 : 100 citations hallucinées par l'IA détectées

4 mars 2026 2 min de lecture Paul Forcadel
NeurIPS 2025 : 100 citations hallucinées par l'IA détectées

Le « vibe citing » s'infiltre dans la recherche

GPTZero, startup spécialisée dans la détection de contenu IA, a passé au crible 4 841 des 5 290 papiers acceptés à NeurIPS 2025, la plus prestigieuse conférence en apprentissage automatique. Résultat : plus de 100 citations hallucinées confirmées dans 53 articles, soit environ 2 % des papiers acceptés.

Chaque article avait pourtant été relu par au moins trois évaluateurs. Aucun n'a détecté les références inventées.

Trois types de fabrications

GPTZero identifie trois catégories de « vibe citing » :

  • Sources combinées : le LLM fusionne des éléments de plusieurs vrais articles (titres, auteurs, données) pour créer une référence plausible mais inexistante.
  • Éléments entièrement fabriqués : auteurs fictifs (« John Doe »), DOI inventés, URLs qui ne mènent nulle part, identifiants arXiv incomplets.
  • Originaux modifiés : un vrai article est cité avec un titre paraphrasé, des co-auteurs ajoutés ou supprimés, ou une conférence de publication erronée.

Un problème systémique

Les soumissions à NeurIPS ont explosé de 220 % entre 2020 et 2025, passant de 9 467 à 21 575 articles. Le nombre d'erreurs par papier a augmenté de 55,3 % sur la même période. Selon une étude, jusqu'à 17 % des évaluations par les pairs dans les grandes conférences informatiques sont elles-mêmes générées par IA, créant un cercle vicieux.

Le phénomène dépasse la recherche : plus de 800 citations erronées ont été documentées dans des dossiers juridiques aux États-Unis.

NeurIPS temporise

Le comité de NeurIPS reconnaît le problème mais nuance : des références incorrectes « ne invalident pas nécessairement les papiers eux-mêmes ». La conférence autorise toujours l'utilisation de LLM pour la rédaction, tout en interdisant explicitement les citations hallucinées. Un problème similaire a été identifié à ICLR 2026, avec 50 hallucinations supplémentaires.

Partager cet article

Questions fréquentes

C'est une référence bibliographique inventée par un modèle de langage : un auteur fictif, un titre de papier inexistant, un DOI ou une URL qui ne mène nulle part. Elle paraît crédible mais n'existe pas dans la littérature scientifique.
L'outil vérifie automatiquement chaque citation dans Google Scholar, PubMed et arXiv. Les résultats sont ensuite validés manuellement par des experts humains, avec une précision revendiquée de plus de 99 %.
Oui, NeurIPS autorise l'usage de LLM pour la rédaction, mais interdit explicitement les citations hallucinées. Le comité considère que des références incorrectes ne invalident pas nécessairement le contenu scientifique d'un article.
Oui. Plus de 800 citations erronées générées par IA ont été documentées dans des dossiers juridiques aux États-Unis, montrant que le phénomène touche aussi les avocats et les tribunaux.

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Parcourir par catégorie