Pour de nombreuses entreprises, l'entrepôt de données est passé d'un atout stratégique à un fardeau opérationnel.ainsi que des services exclusifs du cloud tels que Snowflake, ont offert évolutivité et performance, mais au détriment du verrouillage des fournisseurs, des prix imprévus et de l'adaptabilité architecturale restreinte.
Au fur et à mesure que le contrôle réglementaire s'intensifie et que l'analyse basée sur l'IA devient centrale pour l'avantage concurrentiel,Les organisations réévaluent si leurs plateformes d'entrepôt actuelles sont réellement alignées sur les objectifs commerciaux à long terme.
EDB Postgres® AI (EDB PG AI) s'attaque à ces défis de front avec WarehousePG, un entrepôt de données open-source à l'échelle des pétaoctets conçu pour restaurer le contrôle, la prévisibilité,Les données sont donc plus faciles à collecter et à conserver.Construit sur Postgres et conçu pour des analyses parallèles massives, WarehousePG offre un moyen moderne de se libérer des systèmes restrictifs tout en réduisant le coût total de possession (TCO) jusqu'à 58%.
L'analyse à l'échelle de pétaoctets avec Postgres à l'origine
Les entrepôts de données d'entreprise dépassent désormais les limites de leur conception initiale.et l'analyse basée sur l'IA coexistent dans des environnements de production qui exigent à la fois des performances exceptionnelles et une flexibilité architecturale.
Les plates-formes propriétaires traditionnelles et les entrepôts basés uniquement sur le cloud ont du mal à répondre à ces demandes simultanément, obligeant les organisations à faire des compromis entre le coût, le contrôle et la fonctionnalité.
EDB Postgres AI pour WarehousePG comble cette lacune en fournissant un entrepôt de données entièrement open source, à l'échelle de pétaoctets, construit sur Postgres.et déploiement flexible sur place, le cloud et les environnements hybrides, il aborde les limitations des systèmes hérités et exclusifs du cloud.
Architecture: MPP à l'échelle basée sur le postgres
L'architecture de traitement massivement parallèle (MPP) de WarehousePG permet de s'étendre à des centaines de nœuds.il distribue à la fois les données et l'exécution de requête sur plusieurs nœuds de segment, supervisé par un nœud de coordination central.
Le coordinateur s'occupe de l'analyse des requêtes, de l'optimisation et de la planification de l'exécution.qui fonctionnent en parallèle sur leurs partitions de données localesCette approche permet à WarehousePG d'exécuter efficacement des requêtes analytiques complexes, y compris de grandes joints, agrégations, fonctions de fenêtre et transformations, sur des ensembles de données à l'échelle des pétaoctets.
Cette architecture élimine les goulots d'étranglement inhérents aux bases de données monolithiques tout en maintenant une compatibilité SQL complète avec Postgres, réduisant considérablement la courbe d'apprentissage des équipes de données existantes.
Des performances prévisibles sans restrictions de propriété
Contrairement aux entrepôts natifs basés sur le cloud qui reposent sur la tarification basée sur la consommation et la gestion opaque des ressources, WarehousePG offre un comportement de charge de travail déterministe et des performances cohérentes.L'allocation des ressources et l'exécution des requêtes sont entièrement contrôlées au sein du cluster, assurant des temps de réponse stables même sous charges de travail analytiques mixtes.
En tant que solution sous licence Apache 2.0 basée sur Postgres open source, WarehousePG libère les entreprises des formats de stockage propriétaires et des moteurs d'exécution contrôlés par le fournisseur.,portable et déployable partout où l'organisation en a besoin, sur site pour la conformité réglementaire, dans le cloud public pour l'élasticité ou dans des configurations hybrides pour optimiser les coûts.
Cette indépendance architecturale, combinée à la tarification de base de l'EDB,permet une réduction de 58% du coût total, en particulier pour les organisations qui migrent de plates-formes propriétaires coûteuses ou d'entrepôts cloud imprévisibles.
Stockage hybride et accès SQL aux lacs de données
Les environnements analytiques modernes sont de plus en plus répartis sur plusieurs niveaux de stockage.qui permet un accès direct SQL aux données externes stockées dans les magasins d'objets et les systèmes de fichiers distribués, comme Amazon S3 et le système de fichiers distribués Hadoop (HDFS).
Avec PXF, les ingénieurs de données peuvent interroger des formats tels que Parquet, AVRO, JSON et CSV sans copier les données dans l'entrepôt.Cela réduit considérablement la complexité de l'ETL et la redondance de stockage tout en permettant une stratégie hybride de données chaudes et froides.: les ensembles de données fréquemment consultés restent dans le stockage à haute performance de WarehousePG, tandis que les données rarement utilisées résident dans le stockage d'objets à faible coût.
D'un point de vue technique, cette approche préserve la sémantique SQL à travers diverses couches de stockage, permettant aux équipes d'analyse de travailler avec un seul modèle de données logiques.
Intégration en temps réel avec FlowServer
Les pipelines uniquement par lots ne sont plus suffisants pour de nombreux cas d'utilisation analytiques.
FlowServer prend en charge le streaming d'événements à haut débit à partir de plates-formes comme Apache Kafka et RabbitMQ, permettant des cas d'utilisation tels que l'analyse opérationnelle, la détection de fraude et la surveillance en temps réel.En ingérant des données en continu directement dans l'entrepôt, les organisations éliminent la latence entre les systèmes opérationnels et les informations analytiques.
Cette architecture permet aux charges de travail en streaming et en lots de coexister au sein de la même plateforme analytique, simplifiant l'infrastructure et réduisant le mouvement des données.
IA, ML et traitement vectoriel dans les bases de données
Une caractéristique clé d'EDB Postgres AI for WarehousePG est sa prise en charge de l'analyse et de l'IA dans les bases de données, éliminant la nécessité de déplacer de grands ensembles de données vers des plateformes externes d'apprentissage automatique (ML).
WarehousePG intègre MADlib pour l'apprentissage automatique basé sur SQL, permettant aux utilisateurs de former et de noter des modèles directement dans la base de données en utilisant des structures relationnelles familières.la plateforme prend en charge les frameworks Python ML dans les bases de données, permettant aux scientifiques des données d'opérer à grande échelle sans exporter de données.
La prise en charge native des vecteurs via l'extension pgvector permet la recherche de similitude, la recherche sémantique et les charges de travail de génération augmentée par récupération (RAG) directement dans l'entrepôt.Cette capacité devient de plus en plus critique pour les applications basées sur l'IA qui combinent des données structurées d'entreprise avec du contenu non structuré comme des documents et des journaux..
En centralisant les données, l'analyse et l'IA, WarehousePG réduit la complexité des pipelines et accélère le temps de compréhension.
Haute disponibilité et préparation des entreprises
WarehousePG est conçu pour une fiabilité de production. Une haute disponibilité est obtenue grâce à un coordinateur de veille, assurant un fonctionnement ininterrompu en cas de panne du coordinateur principal.La tolérance à la défaillance au niveau du segment permet aux charges de travail de continuer à fonctionner même lorsque les nœuds individuels ne sont pas disponibles.
Les caractéristiques de l'entreprise comprennent la gestion de la charge de travail, la planification prévisible des requêtes et une observabilité complète, garantissant un fonctionnement stable dans des conditions d'analyse très exigeantes.
Il est essentiel que les organisations aient accès à un soutien 24 heures sur 24 et 7 jours sur 7, fourni par les experts de Postgres de l'EDB, ce qui permet de combler le fossé entre la flexibilité de l'open source et les besoins opérationnels des entreprises.
Une migration sans interruption
Pour les organisations qui modernisent à partir de plates-formes analytiques héritées, WarehousePG offre une voie à faible risque.permettant une modernisation rapide sans réécrire de requêtes ou de recycler des équipes. La parité SQL élevée simplifie également les migrations depuis d'autres entrepôts de données propriétaires basés sur SQL.
Cette approche permet aux entreprises de se moderniser progressivement, en préservant la continuité des activités tout en reprenant le contrôle de leur pile d'analyses.
Reconstruire l'entrepôt pour les analyses modernes
EDB PG AI pour WarehousePG prouve que l'analyse à l'échelle des pétaoctets, la préparation de l'IA et la souveraineté des données ne nécessitent pas de plateformes propriétaires ou de verrouillage dans le cloud.Évolutivité MPP, stockage hybride, ingestion en temps réel et capacités d'IA et de ML dans la base de données, WarehousePG fournit une base techniquement solide pour l'analyse d'entreprise moderne.
Pour les organisations qui recherchent un entrepôt de données qui donne la priorité au contrôle architectural, aux performances prévisibles et à l'économie open source, WarehousePG offre une alternative convaincante et à l'épreuve du temps.
La Commission a examiné les informations fournies par les autorités chinoises.
Sandy Yang, directeur de la stratégie mondiale
WhatsApp ou WeChat: +86 13426366826
Le courrier électronique: yangyd@qianxingdata.com
Le site Web est le suivant: www.qianxingdata.com/www.storagesserver.com
En ce qui concerne les affaires
Distribution de produits TIC/Intégration des systèmes et services/Solutions d'infrastructure
Avec plus de 20 ans d'expérience dans la distribution informatique, nous travaillons en partenariat avec des marques mondiales de premier plan pour fournir des produits fiables et des services professionnels.
Utiliser la technologie pour bâtir un monde intelligentVotre fournisseur de services de produits TIC de confiance!