Aperçu Les affaires

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

Tous les produits

Serveur de stockage en rayons
(165)

Serveur de fusion de Huawei
(31)

Dell Poweredge Server
(59)

Serveur de H3C
(31)

Commutateurs de la télématique
(96)

Dispositif de WLAN
(21)

Routeur sans fil intelligent
(10)

Unité de disque dur HDD
(78)

Disque transistorisé de disque dur interne
(16)

Carte graphique de Geforce
(27)

Processeur d'unité centrale de traitement d'INTEL
(20)

Mémoire RAM de serveur
(6)

Serveur refourbi de stockage
(6)

Module d'émetteur-récepteur de SFP
(4)

Commutateur de la Manche de fibre
(94)

Certificat

Examens de client

Le personnel de vente de Beijing Qianxing Jietong Technology Co.,Ltd sont très professionnel et patient. Ils peuvent fournir des citations rapidement. La qualité et l'emballage des produits sont également très bons. Notre coopération est très lisse.

—— LLC de》 de Festfing DV de 《

Quand je recherchais l'unité centrale de traitement d'Intel et le disque transistorisé de Toshiba instamment, Sandy de Beijing Qianxing Jietong Technology Co., Ltd m'a donné beaucoup d'aide et m'a obtenu les produits que j'ai eus besoin rapidement. Je l'apprécie vraiment.

—— Kitty Yen

Sandy de Beijing Qianxing Jietong Technology Co.,Ltd est un vendeur très soigneux, qui peut me rappeler des erreurs de configuration à temps où j'achète un serveur. Les ingénieurs sont également très professionnels et peuvent rapidement compléter le processus de essai.

—— Strelkin Mikhail Vladimirovich

Nous sommes très satisfaits de notre expérience de travail avec Beijing Qianxing Jietong. La qualité du produit est excellente et la livraison est toujours à l'heure. Leur équipe de vente est professionnelle, patiente et très serviable pour toutes nos questions. Nous apprécions vraiment leur soutien et nous nous réjouissons d'un partenariat à long terme. Fortement recommandé !

—— Ahmad Navid

Qualité: Grande expérience avec mon fournisseur. Le MikroTik RB3011 était déjà utilisé, mais il était en très bon état et tout fonctionnait parfaitement.et toutes mes préoccupations ont été traitées rapidementUn fournisseur très fiable, très recommandé.

—— Geran Colesio

Je suis en ligne une discussion en ligne

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

May 15, 2026

MinIO a publié MemKV, un stockage de mémoire contextuelle dédié conçu pour résoudre un goulot d'étranglement critique dans les pipelines d'inférence d'IA à grande échelle.Servant de deuxième solution phare de MinIO® aux côtés d'AIStor, MemKV étend l'infrastructure de données de l'entreprise au niveau de la mémoire. Il est conçu pour fournir des données contextuelles persistantes et partagées pour les charges de travail d'IA agencées exécutées sur des grappes GPU distribuées.

Le mini-AIStor

À mesure que les systèmes d'IA passent des réponses ponctuelles au raisonnement à plusieurs tours et à l'exécution automatisée des tâches, le maintien d'un contexte continu à travers les cycles d'inférence est devenu de plus en plus essentiel.Dans le cadre des architectures existantes, les données contextuelles sont souvent écartées en raison de la capacité limitée des niveaux de mémoire adjacents au GPU, y compris HBM et DRAM.calculer l'utilisation et la consommation d'énergie. MinIO définit cette charge de travail redondante comme la "taxe de recomptage", une inefficacité qui s'aggrave de façon exponentielle dans les environnements de cloud hyperscale.

MemKV est conçu pour atténuer ce point sensible via une couche de mémoire partagée et persistante capable de stocker à l'échelle des pétaoctets avec une latence d'accès de microsecondes.En conservant les données contextuelles tout au long des flux de travail d'inférence, la plateforme réduit les calculs redondants et augmente l'efficacité globale de l'infrastructure.Les données de référence internes de MinIO vérifient une latence améliorée du temps jusqu'au premier jeton dans le cadre de la concurrence de productionDans un déploiement typique équipé de 128 GPU et de fenêtres contextuelles de 128K de jetons, l'utilisation du GPU est passée d'environ 50% à plus de 90%, ce qui se traduit par des réductions substantielles des coûts de calcul annuels.

Les dirigeants de MinIO ont déclaré que les frais généraux de recomptage restent imperceptibles dans les déploiements à petite échelle, mais deviennent un défaut structurel fondamental à l'échelle de l'entreprise.La régénération de contexte répétée entraîne une consommation d'énergie et des dépenses d'infrastructure plus élevées, rendant les systèmes de mémoire spécialisés indispensables au fonctionnement durable de l'IA.

Comment faire face à l'écart de mémoire

L'infrastructure d'IA héritée oblige les développeurs à faire un compromis entre la vitesse d'accès et la capacité de stockage.Les niveaux de mémoire hautes performances tels que HBM et DRAM offrent une latence de microsecondes mais sont limités par une capacité limitée et des coûts élevésEn revanche, les systèmes de stockage conventionnels offrent une grande évolutivité, mais souffrent d'une latence de niveau milliseconde, ce qui les rend incompatibles avec l'inférence en temps réel et les tâches de raisonnement à long contexte.

Pour les appareils de traitement de l'air

MemKV comble cette lacune de l'industrie en introduisant un niveau de mémoire partagée intermédiaire qui équilibre une latence ultra-faible et une grande évolutivité de stockage.Nativement compatible avec NVIDIA BlueField-4 STX et intégré avec NVIDIA Dynamo aux côtés des outils NIXL, la solution permet à des grappes entières de GPU d'accéder à des pools de données contextuels unifiés à des vitesses de transmission alignées sur l'inférence.Cette conception élimine la migration fréquente des données de contexte entre les couches de mémoire et de stockage isolées, réduisant la latence et augmentant le débit du système.

NVIDIA BlueField-4

Architecture optimisée pour les charges de travail d'inférence

Conçu exclusivement pour les pipelines de données d'inférence, MemKV s'intègre dans la couche G3.5 du cadre de hiérarchie de la mémoire GPU de MinIO.il atteint une capacité de pétaoctet tout en conservant une latence d'accès de microsecondes, détachant avec succès l'évolutivité de la mémoire des ressources de calcul du GPU.

Le système abandonne les abstractions de stockage traditionnelles encombrantes, transférant les données directement des lecteurs NVMe vers les pipelines de données IA via une transmission RDMA de bout en bout.Cela coupe les frais généraux de performance apportés par les protocoles HTTP, la conversion de systèmes de fichiers et les serveurs de stockage intermédiaire grelots d'étranglement communs dans les architectures de stockage basées sur des objets et des fichiers.

Source: Google

Les principales optimisations architecturales incluent l'exécution binaire native ARM64 sur NVIDIA BlueField-4 STX, intégrée directement dans la couche de stockage pour réduire la dépendance aux nœuds de stockage x86 externes.Tous les transferts de données entre la mémoire GPU et le stockage NVMe adoptent la transmission RDMAEn outre, MemKV utilise des blocs de taille élargie allant de 2 MB à 16 MB,qui sont optimisés pour les caractéristiques de débit du processeur graphique au lieu des blocs de stockage 4 KB héritésIl prend en charge des tissus d'interconnexion à haute vitesse de pointe tels que NVIDIA Spectrum-X Ethernet et PCIe Gen6, facilitant la transmission de données à une vitesse proche du fil à travers les grappes.

Disponibilité

Le MinIO MemKV est désormais commercialisé pour le déploiement en entreprise.

La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!

PREV: Scality présente la plateforme ADI pour une infrastructure de données souveraine basée sur l'IA

NEXT: Examen ORICO X50 : vitesse Thunderbolt 5 dans un boîtier SSD portable

Coordonnées

Beijing Qianxing Jietong Technology Co., Ltd.

Personne à contacter: Ms. Sandy Yang

Téléphone: 13426366826

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

Serveur de stockage en rayons

Serveur de fusion de Huawei

Dell Poweredge Server

Serveur de H3C

Commutateurs de la télématique

Dispositif de WLAN

Routeur sans fil intelligent

Unité de disque dur HDD

Disque transistorisé de disque dur interne

Carte graphique de Geforce

Processeur d'unité centrale de traitement d'INTEL

Mémoire RAM de serveur

Serveur refourbi de stockage

Module d'émetteur-récepteur de SFP

Commutateur de la Manche de fibre

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

Le mini-AIStor

Comment faire face à l'écart de mémoire

Pour les appareils de traitement de l'air

NVIDIA BlueField-4

Architecture optimisée pour les charges de travail d'inférence

Disponibilité

Serveur de stockage en rayons

12 serveur Rackmount de support de Lenovo ThinkSystem SR630 de serveur des baies 1U

Serveur de stockage en rack ThinkSystem SR250 V2 4SFF Processeur Intel Xeon E-2378G

Serveur de bâti de support d'Inspur NF5180M6 1U de serveur de stockage en rayons d'Intel C621A

Serveur de fusion de Huawei

Serveur 32 DDR4 DIMMs de support de FusionServer 5288 V6 4U 44 disques durs de 3,5 pouces

Serveur ultra à haute densité 1288H V5 de stockage de réseau du serveur 1U de fusion de Huawei

Stockage flash hybride pour serveur rack Huawei nouvelle génération OceanStor 5310