AMD a officiellement publié l'Instinct MI350P, un nouvel accélérateur PCIe conçu pour les utilisateurs d'entreprise qui recherchent une inférence d'IA sur site sans révision de leur infrastructure de centre de données existante.avec une vitesse de sortie inférieure ou égale à 50 WCette carte graphique est entièrement compatible avec les serveurs à refroidissement à air conventionnels.Cela marque également la première sortie d'AMD d'une puce Instinct de génération actuelle conçue pour les emplacements de serveur standard en près de quatre ans..
AMD instinct MI350P
La gamme de produits Instinct basée sur PCIe d'AMD est restée stagnante après le lancement du MI210 au début de 2022.modules à prise OAM adoptés montés sur des plinthes universelles dédiéesCes modules nécessitent des boîtiers personnalisés avec une alimentation et un flux d'air robustes pour supporter jusqu'à huit accélérateurs de classe 1 000 W dans un seul plateau.Une telle architecture matérielle convient aux fournisseurs de cloud hyperscale qui achètent des racks GPU en vracLe MI350P comble précisément ce déficit de marché. Actuellement, le MI350P remplit précisément ce déficit de marché.NVIDIA ne dispose pas d'un concurrent PCIe haut de gamme dans ce segment, laissant à AMD une exclusivité temporaire sur le marché.
Comparaison matérielle: MI350P contre MI350X OAM
Le MI350P n'est pas une variante réduite du MI350X; AMD a conçu une puce rationalisée indépendante pour ce nouveau modèle.Le MI350X intègre deux matrices d'entrée/sortie jumelées à huit matrices complexes d'accélérateur (XCD)En revanche, le MI350P contient une matrice d'E/S et quatre XCD, ce qui équivaut à 128 unités de calcul.fréquence de clock de pointe de 2 GHz en tant que contrepartie de niveau supérieurLa configuration de la mémoire suit la même spécification dégradée: quatre piles HBM3E (contre huit), un bus mémoire de 4 096 bits (contre 8 192 bits),avec une capacité de mémoire de 144 Go et une bande passante de 4 To/s, par rapport aux MI350X ′s 288GB et 8 TB/s de débit.
L'architecture de l'AMD Instinct MI350P
Le débit de calcul maximal est également réduit de moitié. Le MI350P atteint 4.600 MXFP4 TFLOPS par rapport au MI350X ¢s 9.2 PFLOPS, ainsi que 2.300 FP8 TFLOPS par rapport au modèle premium ¢s 4.6 PFLOPS.Indicateurs de performance pour le BF16La carte est également utilisée pour les tests de précision, les tests de détection et les tests de détection de données, les tests de détection et de détection de données, les tests de détection et de détection de données et les tests de détection de données.299 TFLOPS dans le cadre du MXFP4, 1 529 TFLOPS sous FP8 et 713 TFLOPS sous BF16 Ces chiffres pratiques reflètent la puissance réelle dans une plage de puissance de 600 W,où les contraintes de puissance et les limitations de bande passante de mémoire réduisent inévitablement les performances de pointe théoriques.
L'équipe de rédaction a précédemment évalué la plateforme MI350X via le programme Jumpstart de Supermicro et a reconnu ses capacités de charge de travail d'inférence robustes.L'équipe est impatiente de tester le MI350P., en analysant les performances de cet accélérateur de facteur de forme PCIe dans le châssis standard du serveur de produits de base.
Le MI350P ne présente pas de réduction de puissance de 50% malgré sa taille en silicium réduite de moitié.Cette puissance maximale atteint la limite supérieure de la spécification PCIe CEMUn mode de fonctionnement réduit de 450 W est disponible pour les serveurs avec un refroidissement insuffisant, accompagné de coupures de performance modérées.Positionné dans le même support de puissance, le MI350P est en concurrence directe avec le H200 NVL et le RTX Pro 6000 Server de NVIDIA pour les achats d'entreprise.
Contrairement à la NVIDIA H200 avec les interconnexions à haute vitesse NVL4, le MI350P désactive l'exposition à Infinity Fabric.
Déploiement refroidi à l'air avec huit GPU
En tant que carte PCIe FHFL à double fente standard, le MI350P est compatible avec les serveurs d'entreprise existants.y compris le Dell PowerEdge XE7740 et le HPE ProLiant DL380a Gen12 précédemment examinésOptimisées pour les accélérateurs de 600W, ces plates-formes ne nécessitent pas de racks personnalisés, de refroidissement par liquide ou de planches de base OAM.
Une configuration MI350P à huit cartes offre 1 152 GB HBM3E et 32 TB/s de bande passante globale, suffisante pour héberger des modèles de trillions de paramètres en précision MXFP4 dans un châssis refroidi à l'air.Il sacrifie des tissus dédiés à l' écaillageAlors que le MI350X utilise Infinity Fabric pour une communication rapide entre les modules, le MI350P repose uniquement sur PCIe Gen5.Cette architecture s'adapte au parallélisme tensor nœud-local et au parallélisme de données nœud croisé pour l'inférence, alors que le MI350X basé sur l'OAM reste supérieur pour les tâches de formation à l'IA à large bande passante.
Formats de précision
Le MI350P hérite de tous les formats de précision du MI350X sans améliorations.permettant une formation de basse précision avec une dégradation négligeable de la qualité. MXFP4 offre plus du double de la vitesse de FP8 et quatre fois le débit de BF16. Des cas réels tels que OpenAI gpt-oss et Kimi K2.6 prouvent la valeur de la quantification native à faible débit.Étant donné que les poids MXFP4 et INT4 n'occupent que 25% de l'espace mémoire BF16, les modèles de trillions de paramètres peuvent être déployés à l'intérieur d'un seul serveur à huit GPU, éliminant les clusters multi-nœuds encombrants pour les entreprises sur site.
Résumé
La plupart des entreprises d'IA sur site sont limitées par la puissance, le refroidissement, la densité et le budget plutôt que par la capacité de calcul brute.Avec NVIDIA manquant d'un serveur PCIe GPU phare dans ce segment, AMD conserve pour l'instant un avantage concurrentiel clair.
La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!



