logo
Aperçu Nouvelles

nouvelles de l'entreprise Nvidia se vante de 7 puces en production pour la plateforme Vera Rubin, dont le LPU Groq 3

Certificat
Chine Beijing Qianxing Jietong Technology Co., Ltd. certifications
Chine Beijing Qianxing Jietong Technology Co., Ltd. certifications
Examens de client
Le personnel de vente de Beijing Qianxing Jietong Technology Co.,Ltd sont très professionnel et patient. Ils peuvent fournir des citations rapidement. La qualité et l'emballage des produits sont également très bons. Notre coopération est très lisse.

—— LLC de》 de Festfing DV de 《

Quand je recherchais l'unité centrale de traitement d'Intel et le disque transistorisé de Toshiba instamment, Sandy de Beijing Qianxing Jietong Technology Co., Ltd m'a donné beaucoup d'aide et m'a obtenu les produits que j'ai eus besoin rapidement. Je l'apprécie vraiment.

—— Kitty Yen

Sandy de Beijing Qianxing Jietong Technology Co.,Ltd est un vendeur très soigneux, qui peut me rappeler des erreurs de configuration à temps où j'achète un serveur. Les ingénieurs sont également très professionnels et peuvent rapidement compléter le processus de essai.

—— Strelkin Mikhail Vladimirovich

Nous sommes très satisfaits de notre expérience de travail avec Beijing Qianxing Jietong. La qualité du produit est excellente et la livraison est toujours à l'heure. Leur équipe de vente est professionnelle, patiente et très serviable pour toutes nos questions. Nous apprécions vraiment leur soutien et nous nous réjouissons d'un partenariat à long terme. Fortement recommandé !

—— Ahmad Navid

Qualité: “Grande expérience avec mon fournisseur. Le MikroTik RB3011 était déjà utilisé, mais il était en très bon état et tout fonctionnait parfaitement.et toutes mes préoccupations ont été traitées rapidementUn fournisseur très fiable, très recommandé.

—— Geran Colesio

Je suis en ligne une discussion en ligne
Société Nouvelles
Nvidia se vante de 7 puces en production pour la plateforme Vera Rubin, dont le LPU Groq 3
Nvidia a annoncé une mise à jour matérielle clé lors de sa conférence sur la technologie GPU (GTC) à San Jose aujourd'hui,À peine deux mois après avoir acquis la startup de puces Groq et toute sa propriété intellectuelle pour 20 milliards de dollarsMême si l'accord n'a été finalisé que récemment, l'unité de traitement du langage (LPU) de Groq est déjà en production de masse.et est intégré dans la pile de puces Vera Rubin complète de Nvidia, qui comprend maintenant un total de sept nouvelles puces qui sont entrées en production..

Groq a été fondée en 2016 par d'anciens ingénieurs de Google qui faisaient partie de l'équipe d'origine de l'unité de traitement des tenseurs (TPU).traitement d'inférence par IA à faible latenceIan Buck, vice-président de Nvidia et directeur général de l'informatique accélérée,Il a déclaré que la combinaison des "flops extrêmes" des GPU Rubin avec la largeur de bande des LPU Groq créerait une solution unique et puissante pour les charges de travail d'IA..

dernières nouvelles de l'entreprise Nvidia se vante de 7 puces en production pour la plateforme Vera Rubin, dont le LPU Groq 3  0

¢ Les GPU ont une grande mémoire et de fortes performances en virgule flottante, offrant un débit élevé et des taux de jetons rapides pour le marché grand public, et ils excellent dans les tâches générales d'IA,Buck a dit lors d'une conférence de presse la veilleMais la LPU est optimisée uniquement pour la génération de jetons à très faible latence, capable de pousser des milliers de jetons par seconde.

"Le compromis est qu'il faut plusieurs puces pour atteindre ce niveau de performance", a-t-il ajouté.La bande passante est exceptionnelle. Les GPU Rubin offrent jusqu'à 22 TBps., tandis que les LPU Groq atteignent 150 TB par seconde.

Nvidia travaille à combiner les deux processeurs, Buck a confirmé, pour unifier les opérations de décodage du GPU avec le travail de faible latence du LPU,permettant aux deux de fonctionner comme un système unifié plutôt que comme des composants séparés.

Le rack Groq 3 LPX que Nvidia a dévoilé lors du GTC sera déployé aux côtés des racks NVL72, offrant une capacité dédiée pour l'inférence d'IA et les charges de travail d'IA agentique.le support Groq 3 LPX peut contenir jusqu'à 256 accélérateurs LPU, équipé de 128 Go de mémoire SRAM et d'une bande passante de mémoire SRAM de 40 pétaoctets par seconde.et Nvidia note qu'il pourrait éventuellement évoluer pour accueillir plus de 1Des milliers de LPU.

L'association d'un rack Groq 3 LPX avec un système Rubin NVL72 permet aux clients de générer un million de jetons pour seulement 45 $ sur un modèle GPT de 1 billion de paramètres avec une fenêtre de contexte de jetons 400k,selon NvidiaCe chiffre représente 35 fois plus de jetons que le système Rubin NVL72 peut générer seul.

dernières nouvelles de l'entreprise Nvidia se vante de 7 puces en production pour la plateforme Vera Rubin, dont le LPU Groq 3  1

Les LPU Groq 3 ne sont pas les seules nouvelles puces que Nvidia utilise pour augmenter la capacité d'inférence de l'IA.La société a également annoncé un rack dédié pour ses processeurs Vera, les processeurs basés sur ARM couplés à deux GPU Rubin pour construire les superchips au cœur des systèmes NVL72 et NVL8 de Nvidia..

Comme les processeurs sont devenus un goulot d'étranglement clé pour l'inférence de l'IA et les charges de travail d'IA agentique, les entreprises exigent de plus en plus de ressources de CPU.Nvidia a lancé un rack autonome avec un seul processeur, nommé Vera CPU Rack, qui dispose de 256 CPU Vera connectés à 400 To de mémoire LPDDR5x fonctionnant à 300 To/s.

Le rack de processeur Vera est également équipé d'une colonne vertébrale Ethernet Spectrum-X et de 64 unités de traitement de données (DPU) BlueField-4.Ces DPU coordonnent avec les GPU dans les systèmes NVL72 via l'interconnexion NVLink-C2C de Nvidia, offrant 1,8 Tbit/s de bande passante cohérente 7 fois la bande passante de PCIe Gen 6, par entreprise.

Nvidia affirme que le rack Vera peut prendre en charge 22 500 environnements de processeur simultanés, répondant à la demande massive de processeur nécessaire pour exécuter l'inférence d'IA et les charges de travail d'agent en douceur.Le rack utilise le refroidissement par liquide et est construit sur l'architecture de référence MGX de Nvidia, qui est soutenu par 80 partenaires de l'écosystème, et sera distribué par le réseau mondial de partenaires de Nvidia.

Nvidia a également annoncé un nouveau rack rempli de BlueField-4 DPU, l'une des sept nouvelles puces que Nvidia a présentées comme constituant le nouveau supercalculateur IA.Le BlueField-4 STX est la première mise en œuvre à l'échelle de rack de la nouvelle plateforme CMX (context memory storage) de NvidiaIl a dévoilé CMX en janvier, et les partenaires de stockage de Nvidia, comme VAST Data,qui a présenté sur son offre de stockage CMX à sa conférence il y a quelques semaines, commencent à l'adopter via l'architecture de référence Nvidia STX.


Le STX est une couche partagée à bande passante élevée optimisée pour stocker et récupérer les données de cache de valeur clé massives générées par les flux de travail agents, a déclaré Buck.Alors que Nvidia ne va pas le fournir directement, we’re providing [the reference architecture] to all of our storage partners and the entire storage ecosystem so that they can build the next generation of storage for AI factories that has 4x the performance per watt, doubler les pages par seconde pour les données d'entreprise, et fournir 5 fois les jetons par seconde de mémoire contextuelle nécessaires pour les usines d'IA exécutant des flux de travail agents.


Il a été développé par des spécialistes de l'informatique.et WEKA sont tous en train de construire un nouveau stockage sur l'architecture de référence BlueField-4 STX, Nvidia a déclaré, tandis que des entreprises comme CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure (OCI) et Vultr l'adoptent.


En tout, Nvidia présente sept nouvelles puces à la GTC qui ont chacune un rôle pour alimenter l'IA dans la plateforme Vera Rubin.DPU de BlueField-4, Groq 3 LPU, et SpectrumX CPO, le nouveau commutateur Ethernet optique co-emballé qui offre une connectivité de 200 Gbps sur la photonique au silicium.et il est maintenant en production, a déclaré le PDG Jensen Huang dans son discours d'ouverture.


La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com


En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
“Utiliser la technologie pour bâtir un monde intelligent”Votre fournisseur de services de produits TIC de confiance!


Temps de bar : 2026-03-18 14:05:18 >> Liste de nouvelles
Coordonnées
Beijing Qianxing Jietong Technology Co., Ltd.

Personne à contacter: Ms. Sandy Yang

Téléphone: 13426366826

Envoyez votre demande directement à nous (0 / 3000)