Recherche

DeepMind Aletheia : un agent IA résout des conjectures mathématiques ouvertes et publie ses propres articles

12 févr. 2026 3 min de lecture Paul Forcadel
DeepMind Aletheia : un agent IA résout des conjectures mathématiques ouvertes et publie ses propres articles

De la compétition à la recherche autonome

En été 2025, Gemini Deep Think atteignait le niveau médaille d'or aux Olympiades internationales de mathématiques. Neuf mois plus tard, Google DeepMind franchit une étape bien plus ambitieuse : son IA ne se contente plus de résoudre des problèmes posés par des humains — elle en découvre de nouveaux et publie ses propres résultats.

Le 12 février 2026, l'équipe publie sur arXiv le système Aletheia, un agent IA multi-composants capable de produire des contributions de niveau recherche en mathématiques.

Architecture : trois agents en boucle

Aletheia repose sur une boucle itérative orchestrée par trois sous-agents spécialisés :

  • Generator — Propose des solutions candidates à un problème donné
  • Verifier — Évalue chaque solution en langage naturel, identifie les erreurs et les lacunes
  • Reviser — Corrige les failles détectées et relance le cycle

Cette séparation entre génération et vérification est cruciale : elle permet de détecter des erreurs que les approches en passe unique manquent systématiquement. Le système s'appuie sur Gemini 3 Deep Think et intègre des outils comme la recherche Google pour naviguer dans la littérature scientifique et éviter les hallucinations de citations.

95,1 % sur IMO-ProofBench

Sur le benchmark IMO-ProofBench Advanced, Aletheia atteint 95,1 % de précision — contre 65,7 % pour le meilleur résultat précédent. Le tout avec une réduction de 100x du calcul nécessaire par rapport à la version Deep Think de 2025. Le système démontre aussi de solides performances sur FutureMath Basic, un benchmark interne de niveau doctoral.

Ce bond de performance repose sur un principe de « scaling à l'inférence » : plus on accorde de temps de réflexion au système, plus la précision augmente.

Quatre conjectures d'Erdős résolues

Le test le plus spectaculaire : Aletheia a été lâché sur la base de données Bloom, qui recense 700 problèmes ouverts formulés par le mathématicien Paul Erdős. Le système a identifié 63 solutions techniquement valides et résolu automatiquement 4 questions ouvertes.

L'une de ces solutions, concernant le problème Erdős-1051, a été généralisée en un article publié de manière indépendante (BKKKZ26). Un résultat qui serait passé inaperçu sans l'exploration systématique de l'IA.

Des articles de recherche sans intervention humaine

Trois publications illustrent différents niveaux d'autonomie :

  • Feng26 — Article complet sur les poids propres en géométrie arithmétique, entièrement généré par Aletheia sans intervention humaine
  • LeeSeo26 — Preuves sur les bornes de polynômes d'indépendance, en collaboration humain-IA
  • BKKKZ26 — Généralisation d'une solution à une conjecture d'Erdős

Le papier est dirigé par Tony Feng (UC Berkeley), avec Trieu H. Trinh et Thang Luong de Google DeepMind, et des collaborateurs de Brown, Yonsei, Concordia, KIAS, Scripps et Caltech.

Une taxonomie pour l'IA en recherche

DeepMind propose un cadre de classification sur deux axes : l'autonomie (de « principalement humain » à « essentiellement autonome ») et la significativité (de « négligeable » à « avancée majeure »). Les résultats d'Aletheia se situent au niveau 2 : recherche publiable.

L'équipe reste lucide sur les limites : seulement 6,5 % des solutions générées sur les problèmes d'Erdős étaient « significativement correctes ». Les hallucinations, le biais de confirmation et le « specification gaming » restent des défis majeurs. La supervision humaine n'est pas optionnelle — elle est essentielle.

Ce que ça change

Aletheia ne remplace pas les mathématiciens. Mais il redéfinit leur rôle : moins d'exécution mécanique, plus d'orchestration et de validation. Pour la première fois, une IA produit des résultats mathématiques originaux jugés publiables par la communauté scientifique. La question n'est plus de savoir si l'IA peut contribuer à la recherche — mais à quelle vitesse elle va accélérer le rythme des découvertes.

Partager cet article

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Parcourir par catégorie