Nous utilisons un Dell PowerEdge R760 avec Ubuntu 22.04.02 LTS comme notre plateforme de test pour toutes les charges de travail dans cette revue.2Notre configuration de système est décrite ci-dessous:
Performances du RCD
Pour simuler une charge de travail CDN réaliste et mixte, les disques SSD ont subi une séquence de référence en plusieurs phases conçue pour reproduire les modèles d'E/S des serveurs d'extrémité à contenu lourd.Le processus de test couvre une gamme de blocs de grande et de petite taille répartis sur des opérations aléatoires et séquentielles., avec des niveaux de concomitance variables.
Avant les principaux tests de performance, chaque SSD a terminé un remplissage complet du périphérique via un passage d'écriture séquentiel à 100% en utilisant des blocs de 1 MB.permettant quatre emplois simultanésCette phase assure que le lecteur entre dans un état d'équilibre qui reflète l'utilisation du monde réel.En utilisant une distribution pondérée de la taille du bloc (taille du bloc/pourcentage) avec un fort accent sur les transferts 128K (98Cette étape émule les modèles d'écriture fragmentés et inégaux couramment vus dans les environnements de cache distribués.
La suite de tests principale était axée sur des opérations de lecture et d'écriture aléatoires à l'échelle pour mesurer les performances du lecteur sous des profondeurs de file d'attente variables et la concomitance des tâches.Chaque test a duré cinq minutes (300 secondes), suivie d'une période d'inactivité de trois minutes pour permettre aux mécanismes de récupération internes de stabiliser les indicateurs de performance.
Les tests ont été effectués en utilisant une distribution de taille de bloc fixe favorisant 128K (98,51%), les 1,49% restants des opérations consistant en de plus petites tailles de transfert allant de 64K à 8K.Chaque configuration varie selon 1, 2 et 4 emplois simultanés, avec des profondeurs de file d'attente de 1, 2, 4, 8, 16 et 32, pour profiler l'évolutivité et la latence du débit dans des conditions d'écriture de bord typiques.
Un profil de taille de bloc fortement mélangé, imitant la récupération de contenu CDN, a également été utilisé, en commençant par un composant dominant 128K (83,21%),suivie d'une longue queue de plus de 30 blocs plus petits (4K à 124K)Cette distribution reflète les différents modèles de requêtes rencontrés lors de la récupération de segments vidéo, de l'accès aux miniatures et des recherches de métadonnées.Ces tests ont également été exécutés à travers la matrice complète du nombre d'emplois et des profondeurs de file d'attente.
Cette combinaison de préconditionnement, de saturation et de tests d'accès randomisés de taille mixte est conçue pour révéler comment les SSD fonctionnent dans des environnements de type CDN,en mettant l'accent sur la réactivité et l'efficacité dans les zones à bande passante élevée, des scénarios hautement parallèles.
Charge de travail CDN en lecture 1
Dans nos tests de lecture de charge de travail CDN (1 tâche), le Kingston DC3000ME a offert des performances solides qui ont évolué efficacement avec l'augmentation de la profondeur de file d'attente.en retard sur le SanDisk SN861 d'environ 26%Cependant, à mesure que la profondeur de file d'attente augmentait, le DC3000ME réduisait l'écart et surpassait plusieurs lecteurs de la génération 5. Au QD4, le Kingston DC3000ME atteignait 3 390 MB/s, soit environ 42% de plus que le Micron 9550,40% en avance sur le Pascari X200P, et environ 25% plus rapide que le Solidigm PS1010, bien qu'il soit légèrement en retard sur le SanDisk SN861 d'environ 2,6%.dépassant le Solidigm PS1010 de ~13% et le Micron 9550 de ~20%À la profondeur de test maximale de QD32, Kingston a atteint 14 131 MB/s, égalant efficacement le Micron 9550 et dépassant le Solidigm PS1010 de ~15% et le SanDisk SN861 de près de 10%.
Kingston DC3000ME - Charge de travail CDN Lire 1 poste
CDN charge de travail de lecture 2
Dans la charge de travail de lecture CDN à 2 tâches, le Kingston DC3000ME a maintenu de bonnes performances sur toutes les profondeurs de file d'attente.le Pascari X200P (1Le PS1010 (2,011MB/s) est en baisse d'environ 8%, bien qu'il soit en retard de 34% par rapport au SanDisk SN861 (2,487MB/s).
À QD4, Kingston a atteint 6,335 MB/s, dépassant sensiblement le Micron (5,337 MB/s), le Pascari (5,249 MB/s) et le Solidigm (5,609 MB/s).qui a pris la première place à 6996 Mo/s.
Au QD16, Kingston atteint 14,131 MB/s, menant le peloton à ce stade.052MB/s) de ~ 6% et 5% respectivement, respectivement, tout en conservant une avance solide sur SanDisk (13,619 MB/s) et Solidigm (13,721 MB/s).
Charge de travail CDN en lecture 4
Avec quatre emplois actifs, le Kingston DC3000ME a continué à se maintenir dans les performances de lecture de CDN. au QD1, il a atteint 3,639 MB/s, dépassant le Micron 9550 (3,070 MB/s) et le Pascari X200P (2,982 MB/s),mais toujours 22% derrière le SanDisk SN861, qui a mené ce niveau à 4 443 MB/s. En QD4, Kingston a offert 10 854 MB/s ≈ 15% d'amélioration par rapport à Micron (9 427 MB/s), 20% devant Pascari (9 070 MB/s) et légèrement au-dessus de Solidigm (9 627 MB/s).,Il traînait toujours les SanDisk à 11 161 MB/s.
En QD8, Kingston a affiché 13,926 MB/s, presque identique à Micron et à peu près en ligne avec SanDisk (13,619 MB/s) et Solidigm (12,800 MB/s).233 MB/s pour Kingston, légèrement derrière Micron et Pascari (tous les deux autour de 15 052 ¢ 15 257 MB/s), mais toujours confortablement devant SanDisk (13 619 MB/s) et Solidigm (13 721 MB/s).
Charge de travail du CDN Écrire 1
Dans notre charge de travail d'écriture de CDN (1 Job), le Kingston DC3000ME a montré une mise à l'échelle cohérente à travers les profondeurs de file d'attente.,Il est également connu pour ses performances de détection de données, comme le détecteur de données de base et le détecteur de données de base, ainsi que pour ses performances de détection de données.437 MB/s), mais 10% plus lent que Micron (4,807 MB/s) et 19% derrière SanDisk (5,353 MB/s).
En QD16, il a livré 5 880 MB/s, dépassant Pascari (4 921 MB/s) de 20% et plus du double de Solidigm (2 664 MB/s), mais toujours 11% derrière Micron (6 686 MB/s) et 15% de moins que SanDisk (6 939 MB/s).Kingston est plafonné à 5, 987MB/s ≈ de nouveau proche de Pascari (5,913MB/s), mais derrière Micron (7,422MB/s) et SanDisk (7,521MB/s) respectivement de ~ 20% et 25%.
Kingston DC3000ME - Travail de rédaction de CDN de performance 1 tâche
Charge de travail CDN Écrire 2
Dans la charge de travail d'écriture CDN à 2 tâches, le Kingston DC3000ME a démontré des performances constantes, bien qu'il ait généralement dépassé les SSD de classe entreprise de la génération 5.651MB/s2 juste sous le micron 9550 (2Il est à peu près à l'arrière du SanDisk SN861 (3,972 MB/s).
Au QD4, il a atteint 4 807 MB/s, soit environ 23% de moins que le Micron 9550 (5 902 MB/s) et 13% de moins que le SanDisk SN861 (5 508 MB/s).mais devant le Solidigm PS1010 à 3- Je ne sais pas.
Au QD16, Kingston a livré 5 772 MB/s, toujours derrière Micron (7 896 MB/s) et SanDisk (6 709 MB/s), mais continuant à surpasser les modèles de niveau inférieur comme le Solidigm PS1010 (3,Les résultats de l'étude ont été publiés dans les journaux de l'UE.Au QD32, le DC3000ME a atteint un sommet à 5.870 MB/s, soit environ 32% derrière le Micron 9550 (8.670 MB/s) et 22% en dessous du SanDisk SN861 (7.537 MB/s), mais toujours en avance sur le Solidigm PS1010 (2,012 MB/s).Les résultats de l'étude ont été publiés dans les journaux de l'Union européenne.,585 MB/s).
Charge de travail CDN Écrire 4
Dans la charge de travail d'écriture CDN à 4 tâches, le Kingston DC3000ME a évolué régulièrement sur toutes les profondeurs de file d'attente, bien qu'il ait généralement suivi les deux premiers lecteurs de génération 5.202MB/s2 placé derrière le Pascari X200P (2Il a été remplacé par le PS1010 (qui a atteint un débit de 845 MB/s), le Micron 9550 (2,703 MB/s) et le SanDisk SN861 (3,544 MB/s), mais en avance sur le Solidigm PS1010 (2,020 MB/s).863 MB/s) et le micron (4,457MB/s), mais en maintient une avance sur Solidigm (2,872MB/s).
À des profondeurs de file d'attente moyennes, le Kingston DC3000ME a atteint 3 647 MB/s à QD4 et 4 410 MB/s à QD8.478 MB/s) et le lecteur SanDisk (5Le QD16 a permis à Kingston d'obtenir un gain modeste de 4,865 MB/s au-dessus du QD8, mais il est toujours en retard par rapport au lecteur SanDisk (6,011 MB/s) et au lecteur Micron (7,474 MB/s).le DC3000ME a atteint son sommet à 5, 307MB/s bien en avance sur Solidigm (3,894MB/s) mais nettement derrière Micron (7,941MB/s) et SanDisk (7,212MB/s).Le moteur Kingston a maintenu une mise à l'échelle et une efficacité constantes.
Indice de référence de contrôle DLIO
Pour évaluer les performances réelles des SSD dans les environnements de formation d'IA, nous avons utilisé l'outil de référence Data and Learning Input/Output (DLIO).DLIO est spécialement conçu pour tester les modèles d'E/S dans les charges de travail d'apprentissage profond, fournissant des informations sur la façon dont les systèmes de stockage gèrent des défis tels que le contrôle des points de contrôle, l'ingestion de données et la formation des modèles.Le graphique ci-dessous illustre comment les deux lecteurs gèrent le processus à travers 36 points de contrôleLors de l'entraînement de modèles d'apprentissage automatique, les points de contrôle sont essentiels pour enregistrer périodiquement l'état du modèle, évitant ainsi la perte de progrès lors d'interruptions ou de pannes de courant.Cette demande de stockage nécessite des performances robustesNous avons utilisé la version 2.0 de référence DLIO de la version du 13 août 2024.
Pour nous assurer que notre benchmarking reflète les scénarios du monde réel, nous avons basé nos tests sur l'architecture du modèle LLAMA 3.1 405B. Nous avons mis en œuvre des points de contrôle en utilisant torch.save() pour capturer les paramètres du modèle,état de l'optimisateurNotre configuration a simulé un système de huit GPU, en utilisant une stratégie de parallélisme hybride avec parallélisme tensoriel à 4 voies et traitement parallèle en pipeline à 2 voies distribué sur les huit GPU.Cette configuration a donné lieu à des tailles de points de contrôle de 1 636 GB, représentatives des exigences modernes en matière de formation aux grands modèles linguistiques.
Dans les résultats de passage moyens de DLIO, le Kingston DC3000ME 7.68TB est légèrement en retard sur les meilleurs concurrents, atterrissant au milieu du pack de cinq entraînements.04 secondes dans le premier passageBien qu'il soit toujours plus rapide que le Pascari X200P 7.68TB (qui a affiché les temps les plus élevés sur les trois passes), il est également plus rapide que le Pascari X200P.atteignant 674.48 secondes dans le passage 3), le Kingston DC3000ME était en retard sur le Micron 9550 7.68TB et le Solidigm PS1010 7.68TB, qui sont tous deux restés en dessous de 565 secondes dans le dernier passage.

Comme le montre le graphique ci-dessous, le Kingston DC3000ME a pris un bon départ, avec des temps de contrôle précoces qui correspondent étroitement à ceux des concurrents de haut niveau.27 secondes juste derrière le Micron 9550 à 464Il est à 0,01 seconde et devant le Pascari X200P à 472,65 secondes.44 secondes, encore près du Micron 9550 et du Solidigm PS1010., les deux flottant dans la tranche de 453 ̊465 secondes.
Au milieu du test (points de contrôle 5 à 8), le Kingston DC3000ME a connu un bond dans les temps de contrôle, atteignant un sommet de 613,01 secondes au point de contrôle 7.42s) et SanDisk SN861 7.68TB (559.56s), bien qu'il soit encore nettement meilleur que le Pascari X200P (qui a atteint 694.38 secondes au cours du même intervalle).le Kingston DC3000ME légèrement stabilisé, terminant à 571,36 secondes pour le point de contrôle 12, soit environ 28 secondes de moins que le Micron 9550, mais dépassant toujours le Pascari X200P (qui a fermé à 689,68 secondes)..68TB a démontré des performances constantes et est resté dans une fourchette compétitive tout au long de la charge de travail de contrôle, ce qui le place au milieu du groupe.
Indice de performance du FIO
Pour mesurer les performances de stockage de chaque SSD à travers des mesures communes de l'industrie, nous avons utilisé FIO.comprenant une étape de préconditionnement de deux remplissages complets avec une charge de travail d'écriture séquentielleComme chaque type de charge de travail a changé, nous avons exécuté un autre remplissage de préconditionnement de cette nouvelle taille de transfert.
Dans cette section, nous nous concentrons sur les critères de référence suivants:
-128K séquentiel
- 64K au hasard
- 16K au hasard
- 4K au hasard
Avec les disques SSD QLC de grande capacité conçus pour de grandes tailles de transfert, nos tests de vitesse d'écriture sont limités à 16K aléatoires.Nous avons utilisé l'état pré-rempli de la charge de travail 16K pour mesurer seulement la performance de lecture aléatoire 4K.
Précondition séquentielle 128K (IODepth 256 / NumJobs 1)
Dans ce test de préconditionnement à haute profondeur de file d'attente, le Kingston DC3000ME a maintenu une bande passante d'écriture constante de 8,944.9MB/s tout au long de la course de 1 000 secondes (en terminant juste après la marque de 800 secondes).le Kingston DC3000ME a démontré un débit constant avec une variance minimale.
128K latence de précondition séquentielle (IODepth 256 / NumJobs 1)
Dans le test de latence de 128K Sequential Write Precondition, le Kingston DC3000ME a montré une latence moyenne de 3,577 ms (restant stable au fil du temps avec une fluctuation minimale),Je le place en deuxième position derrière le micron..
128K écriture séquentielle (IODepth 16 / NumJobs 1)
Dans le test d'écriture séquentielle 128K, le Kingston DC3000ME a obtenu 8,477.4MB/s ∙ plaçant juste derrière le Micron 9550 (qui a mené le groupe à 10,354Le Kingston DC3000ME a surpassé le Pascari X200P et a maintenu une solide avance sur le Solidigm PS1010 et le SanDisk SN861 (chacun flottant autour de 7 100 MB / s).Les performances de Kingston reflètent un équilibre entre la vitesse et la constance..
128K latence d'écriture séquentielle (IODepth 16 / NumJobs 1)
Dans le test de latence d'écriture séquentielle de 128K, le Kingston DC3000ME a donné un résultat solide avec une latence moyenne de 235,6 μs. Cela le place devant le SanDisk SN861 (280.7 μs) et Solidigm PS1010Bien que pas aussi rapide que le Micron 9550 (qui a mené à 192,9 μs), le Kingston DC3000ME est resté compétitif.
Lire séquentiellement 128K (IODepth 64 / NumJobs 1)
Dans le test de lecture séquentielle 128K à une profondeur de file d'attente de 64 avec une tâche, le Kingston DC3000ME a obtenu 13,513.8MB/s. Bien qu'il soit classé quatrième parmi les disques testés, il offre toujours un débit élevé (avec des différences minimales dans le monde réel).242Le résultat de cette analyse est le résultat de l'analyse de la capacité de charge de l'appareil.163Le débit de l'appareil a diminué de 0,3 MB/s de 4,6%, et le micron 9550 (14,050.1MB/s) de ~3,8%, mais dépasse largement le SanDisk SN861 (12,631Dans l'ensemble, les résultats des disques Kingston DC3000ME ont été bons, avec une baisse minimale par rapport aux disques les plus testés.
128K latence de lecture séquentielle (IODepth 64 / NumJobs 1)
Pour ce qui est de la latence, le Kingston DC3000ME a enregistré une moyenne de 591,6 μs, ce qui le place au milieu du groupe.4% inférieure à celle du Solidigm PS1010 (564Le Pascari X200P a mené légèrement à 561,4 μs, tandis que le SanDisk SN861 a montré la réponse la plus lente à 633,0 μs.le Kingston DC3000ME a maintenu une latence relativement faible dans des conditions de lecture à haute profondeur de file d'attente.
64K Ecriture aléatoire
Dans le test d'écriture aléatoire 64K, le Kingston DC3000ME a toujours offert des performances élevées sur diverses profondeurs de file d'attente et combinaisons de fils, atteignant un sommet à 6,649MB/s dans la configuration 32 (profondeur d'OI)/8 (nombre de tâches).
Tout au long du graphique, le Kingston DC3000ME a maintenu une tendance de bande passante stable de 4 000 à 5 000 MB/s, avec des performances particulièrement fortes dans les configurations de concomitance moyenne à élevée (par exemple, 32/4 à 5,380 MB/s et 16/8 à 5Comparé à d'autres disques, le Kingston DC3000ME a généralement mené ou est resté près du sommet dans la plupart des points de test,offrant à la fois un débit de pointe élevé et des performances constantes.
64K latence d'écriture aléatoire
Dans le test de latence d'écriture aléatoire 64K, le Kingston DC3000ME a toujours fourni de faibles temps de réponse sur la plupart des profondeurs de file d'attente et des combinaisons de tâches,démontrant une forte efficacité d'écriture même sous lourde charge.
Par exemple:
- À 4/1, il a montré 49 μs
- À 8/1, la latence est restée basse à 102 μs
- À 16/4, il a mesuré 1 486 μs.
- Et à la charge testée la plus élevée, 32/8, il a atteint 2.402 μs
Ces résultats indiquent que le Kingston DC3000ME a été mis à l'échelle de manière prévisible, évitant les fortes pics de latence observés dans d'autres entraînements, en particulier les modèles Pascari et Solidigm,qui a montré des sauts irréguliers au-dessus de 3,000 ‰ 6 000 μs (notamment à 16/8).
64K lecture aléatoire
Dans le test de lecture aléatoire 64K, le Kingston DC3000ME a offert des performances solides et cohérentes sur l'ensemble de la matrice IOdepth / NumJobs, terminant quatrième à la fin du test (par une petite marge).La bande passante maximale atteint 13,515MB/s à 32/4, avec un débit similaire à 16/4 (13,482MB/s) et 32/8 (13,512MB/s) démontrant une excellente évolutivité sous de lourdes charges de travail de lecture parallèle.le Kingston DC3000ME mesuré 2, 298MB/s et 2,234MB/s, respectivement.
64K latence de lecture aléatoire
La latence 64K du Kingston DC3000ME est restée relativement faible sur tous les points de test.Bien que le SanDisk SN861 ait atteint un sommet nettement plus élevé que les autres à la fin du testÀ partir de 1/2, le Kingston DC3000ME a mesuré 106 μs, suivi de 108 μs à 1/4, 131 μs à 8/1, 133 μs à 4/4, et 177 μs à 8/4.301 μs à 32/2Dans l'ensemble, le profil de latence du Kingston DC3000ME s'est rapproché des meilleurs,avec une vibration minimale ou des pics anormaux (commune à tous les entraînements testés).
16K écriture aléatoire
Dans le test d'écriture aléatoire de 16K, le Kingston DC3000ME a offert une large bande passante sur toute la gamme de profondeurs de file d'attente et de nombres de fils, terminant deuxième parmi les disques concurrents.592 IOPS sous la configuration 32/16D'autres points de performances élevées comprenaient 338 521 IOPS à 32/8, 251 428 IOPS à 16/4, et 226 606 IOPS à 1/8°, tous montrant une excellente efficacité du contrôleur sous des charges parallèles variables.Même avec une charge modérée (2/16 et 1/4), l'entraînement a atteint 218.300 IOPS et 204.867 IOPS, respectivement. Dans l'ensemble, le Kingston DC3000ME a toujours atteint des IOPS supérieurs à 160.000 sur la matrice de test (sauf dans quelques domaines),ce qui en fait l'un des moteurs les plus équilibrés dans cette charge de travail.
16K latence d'écriture aléatoire
Les performances de latence d'écriture 16K du Kingston DC3000ME® étaient excellentes, terminant en haut du classement (avec le lecteur Pascari légèrement en retard).19 μs à 1/4À mesure que la charge augmentait, Kingston a maintenu un profil de latence élevé: 126 μs à 8/4, 146 μs à 2/16, 254 μs à 16/4, et 575 μs à 16/8.la latence est restée contrôlée à 1197 secondes.
16K lecture aléatoire
Dans des conditions de lecture aléatoire de 16K, le Kingston DC3000ME a démontré des performances constamment élevées jusqu'à atteindre 8/8, point auquel il a commencé à ralentir légèrement.Le sommet des IOPS est tombé à un peu moins de 800K (648Le nombre de postes vacants a augmenté de près de 2 millions de personnes au cours de l'année précédente, avec un taux de chômage de plus de 2 millions d'emplois (6,686) au QD32 avec quatre emplois, suivis de 641K IOPS au QD4 avec 16 emplois et de 623K au QD16 avec quatre emplois.le Kingston DC3000ME a terminé près du bas du classement aux côtés du lecteur SanDisk.
16K latence de lecture aléatoire
Au débit maximal (QD8/8), la latence du Kingston DC3000ME ′ mesurait seulement 99 μs, restant dans une bande étroite et à faible latence dans la plupart des configurations jusqu'à environ 16/8, date à laquelle il a commencé à faiblir.La meilleure latence a été observée à QD1/4 (74 μs), avec plusieurs autres résultats sous 80 μs à des profondeurs de file d'attente faibles à modérées.le Kingston DC3000ME affiché 826 μs ̊ significativement plus élevé que les autres lecteurs testés (sauf SanDisk).
Lire au hasard en 4K
Dans le test de lecture aléatoire 4K, le Kingston DC3000ME a montré une excellente mise à l'échelle dans la plage de test, atteignant un sommet à 1,957.92K IOPS sous la configuration 16/16. Il a maintenu un débit élevé à 1,923.42K IOPS à 32/8, 1,361.32K IOPS à 8/16, et 1,326.03K IOPS à 16/8° toujours en tête du classement aux côtés de Solidigm et Micron.
La latence de lecture aléatoire 4K
Le Kingston DC3000ME a maintenu une faible latence tout au long du test de lecture aléatoire 4K, à partir de 60 μs sous la configuration 1/1.Il est resté stable à 63 μs.Au fur et à mesure que la concurrence augmentait, la latence augmentait de manière prévisible: 66 μs à 2/4, 67 μs à 2/16, 71 μs à 4/4, et 80 μs à 8/4.et un pic de 266 μs à 32/16.
Écrire au hasard en 4K
Dans l'écriture aléatoire 4K, le Kingston DC3000ME a offert une performance solide avec un maximum de 979.636 IOPS à 32/16 et 979.173 IOPS à 32/8°, le plaçant bien derrière le meilleur interprète (Pascari X200P,qui ont dépassé 1Cela dit, le Kingston DC3000ME affiche des chiffres décents en charge moyenne: 879K IOPS à 8/16, 944K IOPS à 16/16, et 745K IOPS à 16/4.
La latence d'écriture aléatoire 4K
En latence d'écriture aléatoire, le Kingston DC3000ME a commencé à 11 μs sous 1/1, est resté autour de 20 ‰ 50 μs jusqu'à atteindre la profondeur de 8/8 et a été porté à 261 μs à 32/8 et 522 μs à 32/16.Bien que pas le plus bas en latence, le Kingston DC3000ME a maintenu une mise à l'échelle prévisible et modérée sans les pics observés dans les disques comme Solidigm et Pascari, qui ont montré une plus grande volatilité au-delà de 16 fils.
Le stockage direct du GPU
L'un des tests que nous avons effectués sur ce banc d'essai était le test de stockage direct (GDS) du GPU Magnum IO.GDS est une fonctionnalité développée par NVIDIA qui permet aux GPU de contourner le processeur lors de l'accès aux données stockées sur les lecteurs NVMe ou autres périphériques de stockage à grande vitesse.Au lieu d'acheminer les données à travers le processeur et la mémoire système, le GDS permet une communication directe entre le GPU et le périphérique de stockage, réduisant considérablement la latence et améliorant le débit des données.
Comment fonctionne le stockage direct GPU
Traditionnellement, lorsqu'un GPU traite les données stockées sur un lecteur NVMe, les données doivent d'abord traverser le processeur et la mémoire système avant d'atteindre le GPU.le processeur agit comme un intermédiaire, ajoutant de la latence et consommant de précieuses ressources système. Le stockage direct du GPU élimine cette inefficacité en permettant au GPU d'accéder aux données directement à partir du périphérique de stockage via le bus PCIe.permettant plus rapidement, des transferts plus efficaces.
Les charges de travail de l'IA, en particulier l'apprentissage en profondeur, consomment beaucoup de données.et tout retard dans le transfert de données peut conduire à des GPU sous-utilisés et des temps d'entraînement plus longs. Le stockage direct GPU répond à ce défi en veillant à ce que les données soient livrées au GPU le plus rapidement possible, en minimisant le temps d'inactivité et en maximisant l'efficacité de calcul.
En outre, le GDS est particulièrement bénéfique pour les charges de travail impliquant le streaming de grands ensembles de données (par exemple, traitement vidéo, traitement du langage naturel ou inférence en temps réel).En réduisant la dépendance au CPU, GDS accélère le mouvement des données et libère des ressources de CPU pour d'autres tâches, améliorant ainsi encore les performances globales du système.
Débit de lecture
À travers nos tests de lecture séquentielle GDSIO, le Kingston DC3000ME a démontré une mise à l'échelle de débit cohérente et efficace à travers 16K, 128K,Les performances ont varié légèrement en fonction de la taille du transfert.Avec les blocs 16K, le débit a augmenté régulièrement avec l'augmentation du nombre de fils, atteignant un sommet à 3,70 GiB/s par 32 fils avant de diminuer progressivement à 3,41 GiB/s à 128 fils.La conduite a obtenu son meilleur résultat de 5.88GiB/s à 16 threads, le niveau est maintenu à 32 threads avant de tomber à ~5.35GiB/s par 128 threads.54 GiB/s à 16 fils et diminuant légèrement à 5.91 GiB/s à 128 fils.
Lecture de la latence
En termes de latence, le DC3000ME a montré une mise à l'échelle prévisible (conformément à tous les lecteurs testés): un nombre de fils inférieur a donné des temps de réponse plus faibles dans toutes les tailles de blocs,avec une latence croissante au fur et à mesure que les threads s'agrandissent. À 16K, la latence a commencé à 504 μs et a progressivement augmenté à 582 μs par 128 fils. Pour 128K, la latence a commencé à 260 μs et a augmenté à 3 228 μs au nombre de fils le plus élevé.La latence a montré un saut plus important en raison de la charge utile plus lourde,609 μs avec un fil et en augmentation à 2,703 μs à 128 fils.
Écrire le débit
Pour les opérations de lecture, la latence moyenne avec les blocs 16K a commencé à 2 247 μs avec un seul thread et a diminué à 504 μs à 128 threads, démontrant une mise à l'échelle efficace en parallèle.La latence a commencé à 4 heures.Avec les blocs de 1M, le Kingston DC3000ME a eu la latence la plus faible dans l'ensemble, en commençant à 2 609 μs avec un seul fil et en restant dans le 2 500une portée de 700 μs à travers 128 fils, démontrant une réactivité constante pour de grandes lectures séquentielles.
Écrire la latence
La latence moyenne est restée relativement stable sur les nombres de fils de 1 à 16, se situant autour de 12 234 à 14 247 μs. À 32 fils, la latence a légèrement augmenté pour atteindre 15 559 μs et est montée à 20,944 μs à 64 filsUne augmentation notable s'est produite à 128 threads, où la latence du Kingston DC3000ME a bondi à 28 725 μs, soit plus du double du niveau précédent.
Conclusion
Le Kingston DC3000ME est positionné comme une solution pratique pour les déploiements d'entreprises et de centres de données traditionnels où la fiabilité, les performances constantes,et un ensemble solide de caractéristiques d'entreprise sont des exigences clésCette initiative s'adresse aux intégrateurs de systèmes, aux revendeurs à valeur ajoutée (VAR) et aux équipes informatiques des PME qui construisent et gèrent leurs propres infrastructures.Le facteur de forme 2 et le support PCIe Gen5 offrent une large compatibilité et une bande passante prête pour l'avenir, ce qui en fait un candidat fort pour des déploiements axés sur les canaux.
L'angle de défilement du Kingston DC3000ME
Du point de vue des performances, le DC3000ME offre un débit et une efficacité compétitifs sur une gamme de charges de travail.et mise à l'échelle de la latence constante dans des charges de travail mixtes et aléatoiresBien qu'il soit parfois en retard par rapport aux meilleurs opérateurs de la génération 5 (par exemple, Micron et SanDisk) dans certains CDN lourds ou dans certains critères de contrôle, il reste compétitif.