Alibaba entre dans la course à l'IA physique
Après les LLM texte avec Qwen, Alibaba s'attaque à la robotique. Le 10 février 2026, la DAMO Academy (Discovery, Adventure, Momentum, Outlook) publie RynnBrain, un modèle de fondation conçu pour donner un « cerveau » aux robots — et le met en open source sur GitHub et Hugging Face.
L'objectif : permettre à n'importe quel robot de percevoir son environnement, raisonner dans l'espace et planifier des actions dans le monde réel.
Architecture : 30 milliards de paramètres, 3 milliards activés
RynnBrain repose sur Qwen3-VL, le modèle vision-langage d'Alibaba, optimisé via une architecture propriétaire appelée RynnScale qui a doublé la vitesse d'entraînement sans augmenter les ressources de calcul.
Trois tailles sont disponibles :
| Modèle | Paramètres | Type |
|---|---|---|
| RynnBrain-2B | 2 milliards | Dense |
| RynnBrain-8B | 8 milliards | Dense |
| RynnBrain-30B-A3B | 30 milliards | MoE (3B actifs) |
Le modèle phare est le 30B-A3B : premier modèle embodied AI à 30 milliards de paramètres en Mixture-of-Experts. Malgré sa taille, il n'active que 3 milliards de paramètres à l'inférence — plus performant que des modèles denses de 72 milliards.
Trois spécialisations
Au-delà du modèle de base, Alibaba publie trois variantes post-entraînées :
- RynnBrain-Plan — Planification de manipulation (saisir, déplacer, assembler)
- RynnBrain-Nav — Navigation vision-langage en environnements complexes
- RynnBrain-CoP — Raisonnement spatial par chaîne de points (chain-of-point)
16 records sur les benchmarks
RynnBrain établit de nouveaux records sur 16 benchmarks d'IA embodied, mesurant la perception environnementale, le raisonnement spatial et l'exécution de tâches. Il surpasse notamment :
- Gemini Robotics-ER 1.5 de Google DeepMind
- Cosmos-Reason2 de Nvidia
Alibaba publie aussi RynnBrain-Bench, un framework d'évaluation qui teste quatre dimensions : cognition d'objets, cognition spatiale, ancrage et pointage — sur des séquences vidéo épisodiques plutôt que de simples images statiques.
Mémoire spatiotemporelle : la clé
Le problème central de la robotique IA, c'est la mémoire. Un robot doit se souvenir où était un objet il y a 30 secondes et prédire où il sera dans 10 secondes. RynnBrain intègre une mémoire spatiotemporelle qui permet aux machines de :
- Cartographier les objets dans l'espace
- Prédire les trajectoires
- Naviguer dans des environnements encombrés (cuisine, chaîne d'assemblage)
L'équipe DAMO décrit RynnBrain comme « un modèle de fondation ancré dans la réalité physique » qui va au-delà de « l'observation passive » pour exécuter des tâches complexes par raisonnement physique.
Open source vs propriétaire
Alibaba publie 7 modèles entièrement open source — modèles de base et fine-tunés pour le déploiement commercial. C'est un choix stratégique : jusqu'ici, l'IA physique open source était dominée par les universités (Stanford, UC Berkeley). Alibaba est le premier industriel à publier un modèle embodied de cette envergure sous licence libre.
La stratégie est la même que pour Qwen : construire l'écosystème en donnant les outils, monétiser les services cloud. Pour la robotique, les enjeux sont immenses — manufacturing, logistique, services — et le premier à fédérer les développeurs prend une avance décisive.