logo
Aperçu Les affaires

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

Certificat
Chine Beijing Qianxing Jietong Technology Co., Ltd. certifications
Chine Beijing Qianxing Jietong Technology Co., Ltd. certifications
Examens de client
Le personnel de vente de Beijing Qianxing Jietong Technology Co.,Ltd sont très professionnel et patient. Ils peuvent fournir des citations rapidement. La qualité et l'emballage des produits sont également très bons. Notre coopération est très lisse.

—— LLC de》 de Festfing DV de 《

Quand je recherchais l'unité centrale de traitement d'Intel et le disque transistorisé de Toshiba instamment, Sandy de Beijing Qianxing Jietong Technology Co., Ltd m'a donné beaucoup d'aide et m'a obtenu les produits que j'ai eus besoin rapidement. Je l'apprécie vraiment.

—— Kitty Yen

Sandy de Beijing Qianxing Jietong Technology Co.,Ltd est un vendeur très soigneux, qui peut me rappeler des erreurs de configuration à temps où j'achète un serveur. Les ingénieurs sont également très professionnels et peuvent rapidement compléter le processus de essai.

—— Strelkin Mikhail Vladimirovich

Nous sommes très satisfaits de notre expérience de travail avec Beijing Qianxing Jietong. La qualité du produit est excellente et la livraison est toujours à l'heure. Leur équipe de vente est professionnelle, patiente et très serviable pour toutes nos questions. Nous apprécions vraiment leur soutien et nous nous réjouissons d'un partenariat à long terme. Fortement recommandé !

—— Ahmad Navid

Qualité: “Grande expérience avec mon fournisseur. Le MikroTik RB3011 était déjà utilisé, mais il était en très bon état et tout fonctionnait parfaitement.et toutes mes préoccupations ont été traitées rapidementUn fournisseur très fiable, très recommandé.

—— Geran Colesio

Je suis en ligne une discussion en ligne

MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet

May 15, 2026
MinIO a publié MemKV, un stockage de mémoire contextuelle dédié conçu pour résoudre un goulot d'étranglement critique dans les pipelines d'inférence d'IA à grande échelle.Servant de deuxième solution phare de MinIO® aux côtés d'AIStor, MemKV étend l'infrastructure de données de l'entreprise au niveau de la mémoire. Il est conçu pour fournir des données contextuelles persistantes et partagées pour les charges de travail d'IA agencées exécutées sur des grappes GPU distribuées.

dernière affaire concernant MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet  0

Le mini-AIStor


À mesure que les systèmes d'IA passent des réponses ponctuelles au raisonnement à plusieurs tours et à l'exécution automatisée des tâches, le maintien d'un contexte continu à travers les cycles d'inférence est devenu de plus en plus essentiel.Dans le cadre des architectures existantes, les données contextuelles sont souvent écartées en raison de la capacité limitée des niveaux de mémoire adjacents au GPU, y compris HBM et DRAM.calculer l'utilisation et la consommation d'énergie. MinIO définit cette charge de travail redondante comme la "taxe de recomptage", une inefficacité qui s'aggrave de façon exponentielle dans les environnements de cloud hyperscale.

MemKV est conçu pour atténuer ce point sensible via une couche de mémoire partagée et persistante capable de stocker à l'échelle des pétaoctets avec une latence d'accès de microsecondes.En conservant les données contextuelles tout au long des flux de travail d'inférence, la plateforme réduit les calculs redondants et augmente l'efficacité globale de l'infrastructure.Les données de référence internes de MinIO vérifient une latence améliorée du temps jusqu'au premier jeton dans le cadre de la concurrence de productionDans un déploiement typique équipé de 128 GPU et de fenêtres contextuelles de 128K de jetons, l'utilisation du GPU est passée d'environ 50% à plus de 90%, ce qui se traduit par des réductions substantielles des coûts de calcul annuels.

Les dirigeants de MinIO ont déclaré que les frais généraux de recomptage restent imperceptibles dans les déploiements à petite échelle, mais deviennent un défaut structurel fondamental à l'échelle de l'entreprise.La régénération de contexte répétée entraîne une consommation d'énergie et des dépenses d'infrastructure plus élevées, rendant les systèmes de mémoire spécialisés indispensables au fonctionnement durable de l'IA.

Comment faire face à l'écart de mémoire


L'infrastructure d'IA héritée oblige les développeurs à faire un compromis entre la vitesse d'accès et la capacité de stockage.Les niveaux de mémoire hautes performances tels que HBM et DRAM offrent une latence de microsecondes mais sont limités par une capacité limitée et des coûts élevésEn revanche, les systèmes de stockage conventionnels offrent une grande évolutivité, mais souffrent d'une latence de niveau milliseconde, ce qui les rend incompatibles avec l'inférence en temps réel et les tâches de raisonnement à long contexte.

dernière affaire concernant MinIO présente MemKV pour la mémoire d'inférence d'IA à l'échelle du pétaoctet  1

Pour les appareils de traitement de l'air


MemKV comble cette lacune de l'industrie en introduisant un niveau de mémoire partagée intermédiaire qui équilibre une latence ultra-faible et une grande évolutivité de stockage.Nativement compatible avec NVIDIA BlueField-4 STX et intégré avec NVIDIA Dynamo aux côtés des outils NIXL, la solution permet à des grappes entières de GPU d'accéder à des pools de données contextuels unifiés à des vitesses de transmission alignées sur l'inférence.Cette conception élimine la migration fréquente des données de contexte entre les couches de mémoire et de stockage isolées, réduisant la latence et augmentant le débit du système.

NVIDIA BlueField-4


Architecture optimisée pour les charges de travail d'inférence


Conçu exclusivement pour les pipelines de données d'inférence, MemKV s'intègre dans la couche G3.5 du cadre de hiérarchie de la mémoire GPU de MinIO.il atteint une capacité de pétaoctet tout en conservant une latence d'accès de microsecondes, détachant avec succès l'évolutivité de la mémoire des ressources de calcul du GPU.

Le système abandonne les abstractions de stockage traditionnelles encombrantes, transférant les données directement des lecteurs NVMe vers les pipelines de données IA via une transmission RDMA de bout en bout.Cela coupe les frais généraux de performance apportés par les protocoles HTTP, la conversion de systèmes de fichiers et les serveurs de stockage intermédiaire grelots d'étranglement communs dans les architectures de stockage basées sur des objets et des fichiers.

Source: Google

Les principales optimisations architecturales incluent l'exécution binaire native ARM64 sur NVIDIA BlueField-4 STX, intégrée directement dans la couche de stockage pour réduire la dépendance aux nœuds de stockage x86 externes.Tous les transferts de données entre la mémoire GPU et le stockage NVMe adoptent la transmission RDMAEn outre, MemKV utilise des blocs de taille élargie allant de 2 MB à 16 MB,qui sont optimisés pour les caractéristiques de débit du processeur graphique au lieu des blocs de stockage 4 KB héritésIl prend en charge des tissus d'interconnexion à haute vitesse de pointe tels que NVIDIA Spectrum-X Ethernet et PCIe Gen6, facilitant la transmission de données à une vitesse proche du fil à travers les grappes.

Disponibilité


Le MinIO MemKV est désormais commercialisé pour le déploiement en entreprise.


La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
“Utiliser la technologie pour bâtir un monde intelligent”Votre fournisseur de services de produits TIC de confiance!
Coordonnées
Beijing Qianxing Jietong Technology Co., Ltd.

Personne à contacter: Ms. Sandy Yang

Téléphone: 13426366826

Envoyez votre demande directement à nous (0 / 3000)