Le fournisseur de bases de données vectorielles Pinecone a dévoilé une solution optimisée pour lutter contre les contraintes de jetons et les dépassements de budget pour les agents d'IA.Les agents de l'IA peuvent atteindre des vitesses opérationnelles plus rapides, et l'entreprise fournit maintenant ces ensembles de vecteurs optimisés pour les utilisateurs d'entreprise.
Le PDG de Pinecone Ash Ashutosh et le cofondateur et directeur technique Edo Liberty ont noté dans un billet de blog officiel: Les agents d'IA ont dépassé les humains pour devenir les principaux consommateurs d'infrastructures de connaissances modernes.Dans cette ère d'IA dirigée par les agents, les agents automatisés exécutent des tâches répétitives et tombent souvent dans des boucles de calcul à force brute rigides.Le traitement des données vectorielles brutes conduit à des inefficacités inhérentes et des goulets d'étranglement pour ces agents intelligents.
De tels inconvénients techniques entraînent un taux de réalisation stagnant de tâches allant de 50% à 60%, accompagné d'une latence imprévisible et de dépenses de jetons excessives.L'industrie a besoin d'une méthode de prétraitement des données adaptée aux scénarios contextuels des agentsPinecone a développé la plateforme Nexus pour répondre à cette demande exacte.
Le moteur de connaissances Nexus se compose de deux modules de base: le compilateur de contexte et le récupérateur composable.Le compilateur contextuel génère des artefacts de données personnalisés des ensembles de données contextuels spécifiques à la tâche construits à partir d'enregistrements de base de données vectoriels brutsCes objets sont joints à des métadonnées complètes, y compris les domaines d'accès RBAC, les codes de version, les sources de données et les balises d'identification de l'IPP.Alimenté par des matériaux de base et des spécifications de tâche claires, le compilateur crée initialement des artefacts sur mesure pour quatre types d'agents prédéfinis: ventes, finances, marketing et agents exécutifs.
Ces agents intelligents utilisent un langage de requête déclaratif dédié appelé KnowQL pour interagir avec le système Nexus.forme de sortieAu lieu de récupérer directement les données vectorielles brutes, les agents soumettent des requêtes KnowQL de haut niveau à la plateforme Nexus.
Le Nexus Composable Retriever est responsable de la réception des requêtes KnowQL de différents types d'agents. Il renvoie des réponses précises basées sur des artefacts pré-générés traités par le compilateur de contexte.Un schéma officiel illustre clairement l'ensemble du processus opérationnel de ce mécanisme..
Environnement et flux de processus du Nexus Pinecone.
La plateforme offre une gestion centralisée de la consommation de jetons pour plusieurs utilisateurs et des charges de travail diverses.les coûts des dépenses et l'état de conformité pour le suivi transparent.
Pinecone a expliqué que Nexus pré-structure, contextualise et compile des artefacts de connaissances spécialisées à l'avance, préparant pleinement les données avant que les agents n'initient des tâches de calcul.
Contrairement aux compilateurs conventionnels, le Context Compiler itératif optimise continuellement la représentation des données.et éventuellement converge dans des cadres de connaissances précis qui correspondent parfaitement aux besoins opérationnels de l'agentLes cas d'utilisation pratiques sont énumérés ci-dessous:
-
Agent de vente: Réunit le contexte intégré des transactions, y compris les transcriptions des appels Gong, les phases du pipeline de vente, les conversations par courriel des clients clés et les informations concurrentielles extraites des enregistrements Slack.
-
Agent financier: Génère un contexte lié aux recettes en corrélant les clauses contractuelles avec les cycles de facturation, les seuils d'utilisation et les indicateurs d'expansion des activités.
-
Agent de commercialisation: Compile les données d'attribution, reliant les enregistrements d'interaction de la campagne aux journaux de réussite/échec des transactions de Gong, ainsi qu'aux signaux de qualification du produit dérivés des données de comportement des utilisateurs.
-
Directeur général: synthétise des informations interdépartementales, reliant les fluctuations du taux d'intérêt des clients aux scores de santé des clients, aux progrès du recrutement et aux jalons du développement des produits.
Selon les deux dirigeants de Pinecone, les utilisateurs de Nexus peuvent bénéficier de taux d'achèvement de tâches plus élevés, de cycles d'exécution raccourcis, de sorties reliées à la terre fiables et d'une consommation de jetons jusqu'à 90% inférieure.Cette mise à niveau technologique réalise une optimisation structurelle: il déplace le calcul de raisonnement complexe vers une couche de connaissances indépendante, plutôt que d'exécuter des calculs répétés dans chaque requête d'inférence.
Plusieurs entreprises du secteur, notamment Box, Unstructured, Teradata, LlamIndex et ThoughtFocus, ont émis des approbations officielles pour la plateforme Nexus.
En tandem avec Nexus, Pinecone a lancé une toute nouvelle place de marché avec des applications de connaissances prêtes à la production.Ces solutions prédéfinies peuvent être déployées en quelques minutes sans configuration compliquée de l'infrastructure d'IALe catalogue de la place de marché contient plus de 90 solutions prêtes à l'emploi couvrant les revenus des ventes, les assurances, l'immobilier, la conformité juridique, les ressources humaines et les secteurs du service à la clientèle.
Pendant la phase de lancement, le marché reste entièrement gratuit à utiliser, avec des solutions commerciales tierces prévues pour la prochaine sortie.
Pinecone a également optimisé ses prix de base de données vectorielles en introduisant un niveau de constructeur à faible coût à un tarif mensuel de 20 $.la société a étendu sa couverture de déploiement cloud à la région AWS Europe (Frankfurt) avec la zone de disponibilité eucentral-1.
En outre, une fonctionnalité de recherche en texte intégré a été intégrée à la base de données de vecteurs de base de Pinecone, actuellement disponible en aperçu public.
Le programme d'accès anticipé pour Nexus et KnowQL est désormais ouvert aux clients et partenaires d'entreprise.services juridiques et industries SaaS d'entreprise ▌scenarios nécessitant que les agents traitent des données de connaissances propriétaires complexes.
La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!