Lors de la conférence HUAWEI CONNECT 2025, le géant chinois des télécommunications a présenté une innovation d'infrastructure qui pourrait redéfinir les standards du calcul intensif en intelligence artificielle. L'architecture SuperPoD représente une avancée technique majeure dans la capacité à orchestrer des milliers de puces de calcul dispersées sur des dizaines de baies serveurs.
Une approche révolutionnaire du calcul distribué
Contrairement aux architectures traditionnelles où les serveurs fonctionnent de manière relativement indépendante, la technologie SuperPoD permet de créer ce que Huawei décrit comme « une machine logique unique » à partir de milliers d'unités de traitement distinctes. Cette approche permet à l'ensemble du système d'apprendre, de penser et de raisonner comme une entité cohérente.
« Huawei a développé l'architecture révolutionnaire SuperPoD basée sur notre protocole d'interconnexion UnifiedBus », a expliqué Yang Chaobin, directeur du conseil d'administration et PDG du groupe métier ICT chez Huawei. « L'architecture interconnecte profondément les serveurs physiques pour qu'ils puissent apprendre, penser et raisonner comme un seul serveur logique. »
UnifiedBus 2.0 : le cœur technique de l'innovation
Le protocole UnifiedBus 2.0 résout deux défis historiques qui ont longtemps limité le calcul IA à grande échelle : la fiabilité des communications longue distance et les problématiques de bande passante et de latence. Les connexions cuivre traditionnelles offrent une bande passante élevée mais sur de courtes distances, tandis que les câbles optiques supportent des portées plus longues mais souffrent de problèmes de fiabilité.
Eric Xu, président délégué et président tournant de Huawei, a détaillé les solutions techniques : « Nous avons intégré la fiabilité à chaque couche de notre protocole d'interconnexion, de la couche physique et liaison de données jusqu'aux couches réseau et transmission. Une détection de panne au niveau des 100 nanosecondes et une commutation de protection sur les chemins optiques rendent toute déconnexion intermittente ou défaillance des modules optiques imperceptible au niveau applicatif. »
Des performances record pour l'Atlas 950 SuperPoD
L'implémentation phare de cette architecture, l'Atlas 950 SuperPoD, peut intégrer jusqu'à 8 192 puces Ascend 950DT dans une configuration qui délivre 8 EFLOPS en FP8 et 16 EFLOPS en FP4. Sa bande passante d'interconnexion atteint 16 PB/s, ce qui représente, selon Huawei, plus de dix fois la bande passante internet mondiale totale en pic.
Le système occupe 160 baies sur 1 000 m², avec 128 baies de calcul et 32 baies de communication reliées par des interconnexions tout-optique. La capacité mémoire atteint 1 152 To avec une latence revendiquée de 2,1 microsecondes sur l'ensemble du système.
L'Atlas 960 : la prochaine génération déjà annoncée
Huawei a déjà dévoilé les spécifications de l'Atlas 960 SuperPoD, qui intégrera 15 488 puces Ascend 960 dans 220 baies couvrant 2 200 m². Ce système promet 30 EFLOPS en FP8 et 60 EFLOPS en FP4, avec 4 460 To de mémoire et une bande passante d'interconnexion de 34 PB/s.
Une stratégie open source face aux contraintes géopolitiques
Face aux restrictions d'accès aux nœuds de fabrication de semi-conducteurs les plus avancés, Huawei mise sur une approche collaborative. L'entreprise s'engage à publier les spécifications techniques d'UnifiedBus 2.0 et à ouvrir en open source des composants matériels et logiciels clés d'ici fin 2025.
Cette stratégie vise à construire un écosystème robuste autour de sa technologie, permettant à des partenaires de développer des solutions compatibles. Plus de 300 unités de la génération précédente (Atlas 900 A3) ont déjà été déployées chez des clients de divers secteurs, démontrant la maturité opérationnelle de cette approche.
Applications au-delà de l'intelligence artificielle
Bien que conçue principalement pour les charges de travail IA, l'architecture SuperPoD trouve également des applications dans le calcul généraliste. Sa capacité à gérer des volumes massifs de données avec une faible latence ouvre des perspectives pour la recherche scientifique, la modélisation climatique ou encore l'analyse financière haute fréquence.
« Cette architecture représente un changement fondamental dans la manière dont la puissance de calcul IA peut être organisée, mise à l'échelle et déployée dans les industries », a souligné un responsable technique de Huawei.
Impact sur le marché mondial de l'IA
Cette innovation positionne Huawei comme un acteur majeur dans la course à la suprématie technologique en intelligence artificielle, malgré les sanctions internationales. La capacité à créer des supercalculateurs efficaces sans dépendre des technologies américaines pourrait redistribuer les cartes du marché mondial des infrastructures IA.
Les performances annoncées rivalisent avec les systèmes les plus avancés développés par les leaders américains, tout en offrant une approche distinctive de l'orchestration du calcul distribué.
À retenir
- L'architecture SuperPoD permet à des milliers de puces IA de fonctionner comme un seul ordinateur unifié
- Le protocole UnifiedBus 2.0 résout les défis historiques de fiabilité et latence à grande échelle
- Des performances record avec l'Atlas 950 (8 EFLOPS FP8) et l'Atlas 960 (30 EFLOPS FP8) annoncé
- Stratégie open source pour construire un écosystème face aux contraintes géopolitiques
- Plus de 300 systèmes déjà déployés opérationnellement chez des clients