Le « vibe citing » s'infiltre dans la recherche
GPTZero, startup spécialisée dans la détection de contenu IA, a passé au crible 4 841 des 5 290 papiers acceptés à NeurIPS 2025, la plus prestigieuse conférence en apprentissage automatique. Résultat : plus de 100 citations hallucinées confirmées dans 53 articles, soit environ 2 % des papiers acceptés.
Chaque article avait pourtant été relu par au moins trois évaluateurs. Aucun n'a détecté les références inventées.
Trois types de fabrications
GPTZero identifie trois catégories de « vibe citing » :
- Sources combinées : le LLM fusionne des éléments de plusieurs vrais articles (titres, auteurs, données) pour créer une référence plausible mais inexistante.
- Éléments entièrement fabriqués : auteurs fictifs (« John Doe »), DOI inventés, URLs qui ne mènent nulle part, identifiants arXiv incomplets.
- Originaux modifiés : un vrai article est cité avec un titre paraphrasé, des co-auteurs ajoutés ou supprimés, ou une conférence de publication erronée.
Un problème systémique
Les soumissions à NeurIPS ont explosé de 220 % entre 2020 et 2025, passant de 9 467 à 21 575 articles. Le nombre d'erreurs par papier a augmenté de 55,3 % sur la même période. Selon une étude, jusqu'à 17 % des évaluations par les pairs dans les grandes conférences informatiques sont elles-mêmes générées par IA, créant un cercle vicieux.
Le phénomène dépasse la recherche : plus de 800 citations erronées ont été documentées dans des dossiers juridiques aux États-Unis.
NeurIPS temporise
Le comité de NeurIPS reconnaît le problème mais nuance : des références incorrectes « ne invalident pas nécessairement les papiers eux-mêmes ». La conférence autorise toujours l'utilisation de LLM pour la rédaction, tout en interdisant explicitement les citations hallucinées. Un problème similaire a été identifié à ICLR 2026, avec 50 hallucinations supplémentaires.