Aperçu Les affaires

Google annonce le poisson-soleil TPU v8t et le poisson-zèbre TPU v8i

Tous les produits

Serveur de stockage en rayons
(165)

Serveur de fusion de Huawei
(31)

Dell Poweredge Server
(59)

Serveur de H3C
(31)

Commutateurs de la télématique
(96)

Dispositif de WLAN
(21)

Routeur sans fil intelligent
(10)

Unité de disque dur HDD
(78)

Disque transistorisé de disque dur interne
(16)

Carte graphique de Geforce
(27)

Processeur d'unité centrale de traitement d'INTEL
(20)

Mémoire RAM de serveur
(6)

Serveur refourbi de stockage
(6)

Module d'émetteur-récepteur de SFP
(4)

Commutateur de la Manche de fibre
(94)

Certificat

Examens de client

Le personnel de vente de Beijing Qianxing Jietong Technology Co.,Ltd sont très professionnel et patient. Ils peuvent fournir des citations rapidement. La qualité et l'emballage des produits sont également très bons. Notre coopération est très lisse.

—— LLC de》 de Festfing DV de 《

Quand je recherchais l'unité centrale de traitement d'Intel et le disque transistorisé de Toshiba instamment, Sandy de Beijing Qianxing Jietong Technology Co., Ltd m'a donné beaucoup d'aide et m'a obtenu les produits que j'ai eus besoin rapidement. Je l'apprécie vraiment.

—— Kitty Yen

Sandy de Beijing Qianxing Jietong Technology Co.,Ltd est un vendeur très soigneux, qui peut me rappeler des erreurs de configuration à temps où j'achète un serveur. Les ingénieurs sont également très professionnels et peuvent rapidement compléter le processus de essai.

—— Strelkin Mikhail Vladimirovich

Nous sommes très satisfaits de notre expérience de travail avec Beijing Qianxing Jietong. La qualité du produit est excellente et la livraison est toujours à l'heure. Leur équipe de vente est professionnelle, patiente et très serviable pour toutes nos questions. Nous apprécions vraiment leur soutien et nous nous réjouissons d'un partenariat à long terme. Fortement recommandé !

—— Ahmad Navid

Qualité: Grande expérience avec mon fournisseur. Le MikroTik RB3011 était déjà utilisé, mais il était en très bon état et tout fonctionnait parfaitement.et toutes mes préoccupations ont été traitées rapidementUn fournisseur très fiable, très recommandé.

—— Geran Colesio

Je suis en ligne une discussion en ligne

Google annonce le poisson-soleil TPU v8t et le poisson-zèbre TPU v8i

May 11, 2026

Lors de Google Cloud Next, Google a dévoilé ses accélérateurs d'IA de huitième génération: le TPU v8t ¢Sunfish ¢ pour la formation et le TPU v8i ¢Zebrafish ¢ pour l'inférence, aux côtés du nouveau tissu de centre de données Virgo.Adapté à l'ère de l' IA., ces puces sont optimisées pour la formation de modèles à large mélange d'experts (MoE) et des jetons à faible latence offrant des prix rentables.v8t et v8i diffèrent en mémoire, SRAM, topologie et spécialisation matérielle.

Un superpod v8t prend en charge 9.600 puces avec 2 PB HBM et fournit 121 EFLOPS de calcul FP4, presque le triple des performances de la génération précédente Ironwood.152 puces avec 288 Go de HBM et 384 Mo de SRAM sur la puceLe tissu Virgo est interconnecté par plus de 134 000 puces V8t,fournissant une bande passante de 47 Pb/s sans blocage avec un débit par accélérateur 4 fois plus élevé et une latence 40% plus faible.

L'architecture fondamentale de la TPU par rapport à la GPU

Les TPU sont des ASIC personnalisés caractérisés par de grandes unités de multiplication de matrice (MXU), une SRAM gérée par logiciel et une compilation anticipée.Les TPU présentent un flux de données déterministe avec des tableaux systoliques, éliminant les frais généraux de planification de cache et de distorsion pour une utilisation plus élevée des FLOPS sur des charges de travail de matrice dense.Réseaux graphiques irréguliers et complexes, tout en offrant un support plus restreint de l'écosystème logiciel dominé par JAX et XLA.

La différence structurelle dans le support de la sparsité distingue clairement les TPU et les GPU.Les matrices systoliques TPU fonctionnent en phase de verrouillage rigideAWS Trainium2 adopte un terrain d'entente avec des décompresseurs spars dédiés pour conserver le débit du réseau.

Les TPU intègrent des SparseCores pour gérer des tâches de collect-scatter irrégulières pour l'intégration de tables et le routage MoE.couvrant les charges de travail de recommandation et l'expédition de jetons d'experts que les MXU standard ne peuvent pas traiter efficacement.

TPU v8t: Accélérateur de formation

La puce d'entraînement v8t est équipée de 216 GB de mémoire HBM3e et 128 MB de SRAM.Il conserve une interconnexion 3D torus et mis à niveau 19.2 Tb/s largeur de bande ICI, idéale pour les communications collectives basées sur l'anneau dans la formation à grande échelle.

Les SparseCores hérités optimisent la transmission de données irrégulière tout-à-tout du MoE.TPUDirect RDMA et TPUDirect Storage contournent le processeur hôte pour permettre un accès direct à la mémoire TPUEn outre, le v8t adopte les processeurs Axion basés sur Arm de Google en tant que processeurs hôtes.isoler la frénésie de l'hôte et améliorer la stabilité du pré-traitement pour une formation multi-puce synchronisée.

TPU v8i: Accélérateur d'inférence

Conçu pour les charges de travail d'inférence liées à la bande passante de mémoire, v8i donne la priorité à la génération de jetons à faible latence.Il dispose de 384 MB de SRAM triple que celui d'Ironwood pour mettre en cache le cache KV sur la puce et réduire la lecture répétée de HBM. Avec deux TensorCores et 288 GB HBM3e, il réalise 10,1 PFLOPS FP4 calcul, en superposant des tâches d'inférence de court lot pour une utilisation plus soutenue.

Remplaçant SparseCores, le moteur d'accélération des collectifs (CAE) réduit la latence de synchronisation sur la puce jusqu'à 5 fois, optimisant ainsi les opérations collectives fréquentes de petits lots.Le v8i abandonne le toro 3D pour la topologie Boardfly basée sur Dragonfly, réduisant les sauts maximaux de puce à puce de 16 à 7 et réduisant la latence MoE all-to-all de 50%.

Hiérarchie des tissus de Vierge et Jupiter

Virgo sert de tissu de mise à l'échelle intra-data-center, adoptant une architecture à deux couches non bloquant pour éliminer la surabonnement pour le trafic d'IA est-ouest.Il permet un redirectionnement des défauts au niveau des millisecondes et maintient 97% de bonne performance pour les superpods V8tCombiné avec le tissu de centre de données interconnecté à longue distance de Jupiter ¥ Google ¥, le système d'interconnexion en couches prend en charge plus d'un million de puces TPU dans un seul cluster logique avec 1.7 calculs ZFLOPS au total pour le 4e programmecadre.

Performance, TCO et position sur le marché

Les coûts de formation des TPU sont inférieurs de 62% à ceux de NVIDIA GB300.v8t performance FP4 à densité située entre GB200 et GB300, tandis que Google domine dans le clustering à grande échelle avec un module unique de 9 600 puces, dépassant de loin le domaine NVLink de 72 GPU de NVIDIA.

À l'avenir, Vera Rubin, Rubin Ultra et Kyber de NVIDIA réduiront l'écart de performance des TPU de 2026 à 2027.absence de rareté matérielle et compatibilité limitée avec les écosystèmesNéanmoins, Google maintient ses atouts en matière de regroupement massif, de latence déterministe et d'efficacité en termes de coûts pour les charges de travail du ministère de l'Intérieur.

Google développe à la fois l'infrastructure TPU et le GPU NVIDIA. Meta prévoit un accord d'adoption de TPU de plusieurs milliards de dollars à partir de 2027.TPU v8 assure la compétitivité de Google contre NVIDIA Grace-Blackwell pour le déploiement de l'IA à grande échelle.

La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!

PREV: Examen de la station IA HP ZGX Nano G1n : un nœud IA côté bureau sécurisé et durable

NEXT: AMD Instinct MI350P: L'inférence d'IA PCIe d'entreprise retourne aux serveurs standard

Coordonnées

Beijing Qianxing Jietong Technology Co., Ltd.

Personne à contacter: Ms. Sandy Yang

Téléphone: 13426366826

Google annonce le poisson-soleil TPU v8t et le poisson-zèbre TPU v8i

Serveur de stockage en rayons

Serveur de fusion de Huawei

Dell Poweredge Server

Serveur de H3C

Commutateurs de la télématique

Dispositif de WLAN

Routeur sans fil intelligent

Unité de disque dur HDD

Disque transistorisé de disque dur interne

Carte graphique de Geforce

Processeur d'unité centrale de traitement d'INTEL

Mémoire RAM de serveur

Serveur refourbi de stockage

Module d'émetteur-récepteur de SFP

Commutateur de la Manche de fibre

Google annonce le poisson-soleil TPU v8t et le poisson-zèbre TPU v8i

L'architecture fondamentale de la TPU par rapport à la GPU

TPU v8t: Accélérateur de formation

TPU v8i: Accélérateur d'inférence

Hiérarchie des tissus de Vierge et Jupiter

Performance, TCO et position sur le marché

Serveur de stockage en rayons

12 serveur Rackmount de support de Lenovo ThinkSystem SR630 de serveur des baies 1U

Serveur de stockage en rack ThinkSystem SR250 V2 4SFF Processeur Intel Xeon E-2378G

Serveur de bâti de support d'Inspur NF5180M6 1U de serveur de stockage en rayons d'Intel C621A

Serveur de fusion de Huawei

Serveur 32 DDR4 DIMMs de support de FusionServer 5288 V6 4U 44 disques durs de 3,5 pouces

Serveur ultra à haute densité 1288H V5 de stockage de réseau du serveur 1U de fusion de Huawei

Stockage flash hybride pour serveur rack Huawei nouvelle génération OceanStor 5310