Recherche

Ai2 AutoDiscovery : l'IA qui explore vos données et trouve ce que personne ne cherchait

12 févr. 2026 3 min de lecture Paul Forcadel
Ai2 AutoDiscovery : l'IA qui explore vos données et trouve ce que personne ne cherchait

Le goulot d'étranglement de la science

Le problème n'est plus de collecter des données — c'est de savoir quoi en faire. Des pétaoctets de données scientifiques dorment dans des bases de données, inexploitées faute de bonnes questions. C'est ce que l'Allen Institute for AI (Ai2) appelle le « goulot d'étranglement de l'idéation » : les scientifiques passent plus de temps à formuler des hypothèses qu'à les tester.

Le 12 février 2026, Ai2 lance AutoDiscovery, un outil qui renverse le paradigme : au lieu d'attendre qu'un chercheur pose une question, l'IA explore les données et génère ses propres hypothèses.

Comment ça marche

AutoDiscovery fonctionne en boucle autonome :

  1. Le chercheur uploade un dataset (CSV, JSON ou Parquet)
  2. L'IA génère des hypothèses en langage naturel
  3. Elle conçoit des expériences pour les tester
  4. Elle écrit et exécute du code Python pour analyser les données
  5. Elle interprète les résultats statistiques
  6. Les résultats alimentent de nouvelles hypothèses

Jusqu'à 500 hypothèses par session, selon le budget de calcul défini par l'utilisateur. Le tout est reproductible : chaque hypothèse est accompagnée du code Python et des résultats statistiques complets.

La surprise bayésienne : chercher l'inattendu

Le moteur d'exploration repose sur deux mécanismes :

La surprise bayésienne — Le système maintient des croyances a priori sur chaque hypothèse. Après analyse, il mesure à quel point les résultats changent ces croyances. Plus le décalage est grand, plus le résultat est « surprenant » — et donc potentiellement intéressant. Comme le résume Ai2 : « Les résultats qui changent significativement nos attentes sont souvent plus intéressants que ceux qui confirment ce qu'on supposait déjà. »

Monte Carlo Tree Search (MCTS) — L'algorithme navigue dans l'espace des hypothèses en équilibrant exploration (nouvelles directions) et exploitation (approfondissement des pistes prometteuses). La même technique qui fait la force d'AlphaGo, appliquée à la recherche scientifique.

Résultats concrets

AutoDiscovery a déjà produit des découvertes vérifiées :

  • Oncologie — Au Swedish Cancer Institute, l'outil a identifié des patterns d'exclusion mutuelle entre les mutations PIK3CA et TP53 dans des données de cancer, révélant une possible redondance fonctionnelle. Dr. Kelly Paulson : « La capacité de révéler des découvertes cachées en pleine vue est particulièrement précieuse en recherche sur le cancer. »

  • Écologie marine — Sur 20 ans de données d'écosystèmes marins, AutoDiscovery a mis en lumière des relations trophiques inédites. Dr. Fabio Favoretto (Scripps Institution) : « La capacité de générer de multiples hypothèses que l'utilisateur peut ensuite évaluer en profondeur est extrêmement puissante. »

  • Sciences sociales — Des résultats ont été vérifiés de manière indépendante et publiés dans des revues à comité de lecture.

Accès et disponibilité

AutoDiscovery est disponible dans AstaLabs (asta.allen.ai), la plateforme de recherche IA d'Ai2. Le code source est open source (anciennement publié sous le nom AutoDS).

Pour le lancement, Ai2 offre 1 000 Hypothesis Credits gratuits à chaque utilisateur jusqu'au 28 février 2026 — de quoi lancer plusieurs sessions d'exploration complètes.

Pourquoi c'est un tournant

AutoDiscovery ne remplace pas les chercheurs — il fait le travail que personne n'a le temps de faire. Explorer systématiquement un dataset sous tous les angles possibles, tester des centaines d'hypothèses, identifier les anomalies statistiques. Le chercheur reste l'expert qui valide, contextualise et publie.

Avec 108 millions d'abstracts et 12 millions d'articles en texte intégral dans sa base de connaissances, AutoDiscovery transforme les datasets de « dépôts statiques » en « artefacts interactifs d'investigation ». La science n'a jamais manqué de données. Elle manquait de curiosité automatisée.

Partager cet article

Sources

Références et articles originaux

Rédigé par

Paul Forcadel

Paul Forcadel

Fondateur & Rédacteur en chef

Passionné d'IA et de technologies émergentes, Paul décrypte les dernières avancées en intelligence artificielle pour les rendre accessibles à tous.

Parcourir par catégorie