Qdrant, un fournisseur de solutions de recherche vectorielle composable et de base de données, a déployé des performances d'indexation améliorées, des mécanismes d'échec de cluster en triple zone,et des fonctionnalités de journalisation d'audit axées sur la conformité.
L'entreprise développe une base de données vectorielle autonome pour stocker les intégrations requises par les grands modèles linguistiques (LLM) et les agents d'IA autonomes,qui alimentent généralement des flux de travail d'inférence d'IA tels que la génération augmentée par récupération (RAG)Selon Qdrant, les équipes d'approvisionnement d'entreprise évaluent toujours les outils de recherche vectorielle selon trois critères principaux: évolutivité pour des charges de travail croissantes, continuité des services en cas de défaillance des infrastructures,et des audits opérationnels traçables.
André Zayarni, co-fondateur et PDG de Qdrant, a commenté: " Les GPU ne se limitent plus à l'inférence de modèles; ils optimisent également l'indexation des données.Nous avons activé la construction HNSW accélérée par GPU dans notre version open-source depuis v1.13Cette fonctionnalité est maintenant disponible sur Qdrant Cloud.la suite intégrée permet aux entreprises de déployer Qdrant pour des charges de travail de production critiques.??
Les dernières mises à jour de Qdrant couvrent trois améliorations clés:
Indexation accélérée par GPU: Les tests de référence confirment que les GPU dédiés augmentent la vitesse de construction de l'index HNSW jusqu'à quatre fois sur Qdrant Cloud.Les utilisateurs peuvent monter des ressources GPU sur des clusters existants pour gérer efficacement les rafales d'indexation de haute intensité.
Groupe de zones à disponibilité multiple (AZ): le mécanisme de réplication cross-AZ duplique les données à travers trois zones de disponibilité dans une seule région.assurer des opérations de lecture-écriture ininterrompues même si une zone de disponibilité subit une panne.
Enregistrement des vérifications: La fonction enregistre toutes les opérations basées sur l'API, y compris les requêtes de données, les ajouts, les suppressions, la gestion des collections et les tâches d'instantané.marquer les identités des utilisateursLorsque les systèmes autonomes exécutent des tâches basées sur des données récupérées, les journaux fournissent des pistes d'audit claires pour les sources de demande,temps d'exécution et légitimité de l'accès. Les utilisateurs peuvent personnaliser les cycles de conservation des journaux et exporter les enregistrements à l'extérieur via des API pour une archivation à long terme.
Actuellement, l'indexation accélérée par GPU est accessible sur AWS, avec des plans en cours pour étendre la couverture à plus de fournisseurs et de régions de cloud.fournir un temps de fonctionnement de 99.95%. La fonctionnalité d'enregistrement d'audit est ouverte à tous les clusters payants de Qdrant Cloud.
La documentation officielle fournit plus de détails sur les trois nouvelles capacités.
Nom de l'organisme
Hierarchical Navigable Small World (HNSW) est un algorithme conçu pour identifier les voisins les plus proches des vecteurs.qui s'étendent considérablement avec le volume croissant de données. HNSW empile plusieurs couches de graphes virtuels: la couche supérieure rare contient des vecteurs minimaux pour une recherche préliminaire rapide,tandis que les couches inférieures stockent de plus en plus de vecteurs jusqu'à ce que la couche inférieure couvre tous les points de donnéesChaque couche agit comme un point d'entrée optimisé pour la suivante, raccourcissant considérablement la latence globale de recherche.
Qdrant est confronté à la concurrence de plusieurs pairs de l'industrie. Pinecone adopte également des algorithmes HNSW et tire parti des GPU NVIDIA pour optimiser les performances d'intégration et de re-ranking.Zilliz offre à la fois la compatibilité HNSW et l'accélération du GPU; sa base de données Milvus sous-jacente intègre Nvidia CUDA-Accelerated Graph Index for Vector Retrieval (CAGRA) de la bibliothèque RAPIDS cuVS pour permettre l'indexation du GPU.
La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!