Galerie de cartes mentales Ingénieur en gouvernance des données DAMA-CDGA-11, entreposage de données et intelligence d'affaires.
L'entrepôt de données et la business intelligence permettent aux organisations d'intégrer des données provenant de différentes sources dans un modèle de données commun. Les données intégrées peuvent fournir des informations sur les opérations commerciales et ouvrir de nouvelles possibilités d'aide à la décision d'entreprise et de création de valeur organisationnelle.
Modifié à 2024-03-05 20:28:30Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
Cent ans de solitude est le chef-d'œuvre de Gabriel Garcia Marquez. La lecture de ce livre commence par l'analyse des relations entre les personnages, qui se concentre sur la famille Buendía et raconte l'histoire de la prospérité et du déclin de la famille, de ses relations internes et de ses luttes politiques, de son métissage et de sa renaissance au cours d'une centaine d'années.
La gestion de projet est le processus qui consiste à appliquer des connaissances, des compétences, des outils et des méthodologies spécialisés aux activités du projet afin que celui-ci puisse atteindre ou dépasser les exigences et les attentes fixées dans le cadre de ressources limitées. Ce diagramme fournit une vue d'ensemble des 8 composantes du processus de gestion de projet et peut être utilisé comme modèle générique.
11. Entreposage de données et veille économique
introduction
technologie d'entrepôt de données
Donnez aux organisations les moyens d'intégrer des données provenant de différentes sources dans un modèle de données commun. Les données intégrées peuvent fournir des informations sur les opérations commerciales et ouvrir de nouvelles possibilités d'aide à la décision d'entreprise et de création de valeur organisationnelle.
Est-ce aussi un moyen de réduire le nombre d’entreprises construisant un grand nombre de systèmes d’aide à la décision ?
Fournit une méthode pour réduire la redondance des données, améliorer la cohérence des informations et permettre aux entreprises d'utiliser les données pour prendre de meilleures décisions.
moteurs d'activité
Les principaux moteurs de la construction d'un entrepôt de données sont les fonctions de support opérationnel, les besoins de conformité et les activités de business intelligence.
La Business Intelligence peut fournir des informations sur les organisations, les clients et les produits.
Les organisations qui peuvent acquérir des connaissances en matière de prise de décision et agir grâce à la business intelligence peuvent améliorer leur efficacité opérationnelle et renforcer leur avantage concurrentiel.
La Business Intelligence évolue de l'évaluation rétrospective à l'analyse prédictive
Cible
Soutenir les activités de business intelligence
Renforcez l’analyse commerciale et la prise de décision efficace
Trouver des méthodes innovantes basées sur la connaissance des données
en principe
Concentrez-vous sur les objectifs commerciaux
S'assurer que l'entrepôt de données est utilisé pour les plus hautes priorités de l'organisation et résoudre les problèmes commerciaux
Commencer en ayant la fin à l'esprit
Laissez les priorités de l'entreprise et la portée des données finalement livrées piloter la création du contenu de l'entrepôt de données
Penser globalement agir localement
Laissez la vision finale guider l’architecture et parcourez rapidement des projets ciblés pour créer une livraison incrémentielle, ce qui se traduit par un retour sur investissement plus immédiat.
Synthèse et optimisation continue
Sur la base des données originales, résumez et agrégez pour répondre aux besoins et garantir les performances, mais ne remplacez pas les données détaillées.
Améliorer la transparence et les services autonomes
Plus les informations contextuelles sont riches, plus les consommateurs peuvent obtenir de données à partir des données.
Exposer les données intégrées et leurs informations de processus aux parties prenantes
Établir des métadonnées avec l'entrepôt de données
La clé du succès d’un entrepôt de données est la capacité à interpréter les données avec précision
Collaboration
Collaborer avec d'autres activités de données, en particulier les activités de gouvernance des données, de qualité des données et de gestion des métadonnées
Ne sois pas le même
Les bons outils et produits pour chaque consommateur de données
concept de base
L'intelligence d'entreprise
premier sens
Désigne une activité d'analyse de données pour comprendre les demandes organisationnelles et trouver des opportunités
Deuxième sens
Fait référence à l'ensemble des technologies qui prennent en charge ce type d'activité d'analyse de données.
base de données
Deux éléments importants
Une base de données intégrée d’aide à la décision
Programmes logiciels associés utilisés pour collecter, nettoyer, transformer et stocker des données provenant de diverses opérations et sources externes
Un datamart est une copie d'un sous-ensemble de données dans un entrepôt de données
L'entrepôt de données comprend le stockage de données ou l'extraction opérationnelle qui fournit des données pour soutenir la réalisation de tous les objectifs de business intelligence.
Construction d'un entrepôt de données
Fait référence au processus opérationnel d'extraction, de nettoyage, de conversion, de contrôle et de chargement des données dans l'entrepôt de données.
L'objectif du processus de construction d'un entrepôt de données est de mettre en œuvre un environnement commercial historique intégré sur les données opérationnelles en appliquant des règles métier et en maintenant des relations appropriées entre les données métier.
Construction d'un entrepôt de données traditionnel
Principalement axé sur les données structurées
Intelligence économique et entreposage de données modernes
Contient des données semi-structurées et non structurées
données non structurées
fait référence à des données qui ne peuvent pas être prédéfinies via le modèle de données
Formes variées
Existe dans les e-mails, les textes libres, les vidéos, les pages Web, les photos
Comment créer un entrepôt de données
L'un est Bill Inmon
Inmon définit un entrepôt de données comme « une collecte de données historiques orientées sujet, intégrées, évolutives, résumées et détaillées, relativement stables, qui soutient la prise de décision de gestion ».
Utiliser un modèle relationnel normalisé pour stocker et gérer les données
Non affecté par le volume de données
L'un est Kimball
Kimball définit un entrepôt de données comme « une copie de données transactionnelles personnalisée pour les requêtes et l'analyse ».
modèle de données multidimensionnel
Ne convient pas aux grandes quantités de données, qui peuvent rendre les données immobiles.
terrain d'entente
L'entrepôt de données stocke les données d'autres systèmes
Les activités de stockage incluent l'intégration des données de manière à augmenter leur valeur.
Les entrepôts de données sont facilement accessibles et analysés
Les organisations créent des entrepôts de données car elles doivent permettre aux parties prenantes autorisées d'accéder à des données fiables et intégrées.
La création d'un entrepôt de données a de nombreux objectifs, couvrant la prise en charge des flux de travail, la gestion des opérations et l'analyse prédictive.
se concentrer
C'est de la BI, mais vous pouvez aussi faire de l'IA
Usine d’informations d’entreprise
La différence entre un entrepôt de données et un système d'entreprise
Orienté vers un sujet
Les entrepôts de données sont organisés en fonction des principales entités commerciales sans se concentrer sur les fonctionnalités ou les applications.
intégré
Les données de l'entrepôt de données sont unifiées et cohérentes
Le maintien des mêmes structures clés, le codage et le décodage des structures, les définitions de données et les conventions de dénomination sont cohérents dans tout l'entrepôt de données.
Parce que les données sont intégrées, le datawarehouse n’est pas une simple copie des données opérationnelles
Au lieu de cela, l'entrepôt de données devient un système d'enregistrement de données
changeant avec le temps
L'entrepôt de données stocke les données pendant une certaine période de temps
Les données de l'entrepôt de données sont comme un instantané. Chaque instantané reflète l'état des données à un moment donné.
Cela signifie qu'une requête de données basée sur une certaine période de temps obtiendra toujours les mêmes résultats, quel que soit le moment où la requête est effectuée.
écurie
Dans un entrepôt de données, les enregistrements de données ne sont pas mis à jour aussi fréquemment que dans les systèmes d'entreprise.
Au lieu de cela, les nouvelles données seront uniquement ajoutées aux anciennes données.
Un ensemble d'enregistrements peut représenter différents états d'une même transaction
Données agrégées et détaillées
Les données de l'entrepôt de données comprennent les détails des transactions atomiques et les données agrégées.
Les systèmes d’entreprise regroupent rarement les données
Dans un entrepôt de données, les données récapitulatives peuvent être conservées dans un tableau ou non persistantes et affichées sous la forme d'une vue.
historique
Le système d'entreprise se concentre sur les données actuelles
L'entrepôt de données comprend également des données historiques, qui consomment généralement beaucoup d'espace de stockage.
Composants CIF
application
L'application gère les processus métier
Les données détaillées générées par les applications sont acheminées vers des entrepôts de données et des magasins de données opérationnelles où elles peuvent être utilisées à des fins d'analyse.
Zone de cache de données
Une base de données entre la base de données source du système métier et l'entrepôt de données cible
La zone de stockage temporaire est utilisée pour l'extraction, la conversion et le chargement des données et est transparente pour les utilisateurs finaux.
La plupart des données de la zone de transit sont enregistrées temporairement et, généralement, seule une partie relativement petite des données est des données persistantes.
Intégrer et transformer
Au niveau de la couche d'intégration, les données provenant de différentes sources de données sont converties et intégrées dans des modèles d'entreprise standard dans les entrepôts de données et ODS.
Magasin de données opérationnelles (ODS)
Le stockage de données opérationnelles est une base de données intégrée pour les données d'entreprise
Les données peuvent provenir du système d'application ou d'autres bases de données
Les magasins de données opérationnelles incluent généralement des données actuelles ou récentes (30 à 90 jours), tandis que les entrepôts de données incluent également des données historiques (généralement plusieurs années).
Les données du stockage de données opérationnelles changent rapidement, tandis que les données de l'entrepôt de données sont relativement stables.
Toutes les organisations ne mettront pas en place un stockage de données opérationnel. L'existence d'un stockage de données opérationnel répond aux besoins des entreprises en matière de données à faible latence.
Le stockage de données opérationnelles peut être utilisé comme source principale de l'entrepôt de données et peut également être utilisé pour auditer l'entrepôt de données.
magasin de données
Le datamart fournit la base de l'analyse ultérieure des données
Les données en question sont généralement un sous-ensemble de l'entrepôt de données utilisé pour prendre en charge une analyse spécifique ou un type spécifique de consommateur.
Magasin de données opérationnel (OpDM)
Les data marts opérationnels sont des data marts axés sur l'aide à la décision opérationnelle
Il récupère les données directement à partir des magasins de données opérationnels plutôt que des entrepôts de données
Présente les mêmes caractéristiques que le stockage de données opérationnel
Contient des données actuelles ou récentes qui changent fréquemment
base de données
L'entrepôt de données fournit une entrée unifiée et intégrée pour les données d'entreprise afin de soutenir la prise de décision de gestion, l'analyse stratégique et la planification.
Les données circulent depuis les magasins de données d'application et opérationnelles vers l'entrepôt de données, puis vers le datamart, souvent dans une seule direction.
Les données qui nécessitent une correction (ne répondent pas aux exigences) se verront refuser l'entrée.
Idéalement, la correction est effectuée sur son système source puis rechargée via le système de processus ETL
Rapport opérationnel
Les rapports opérationnels sont générés à partir du magasin de données
Données de référence, données de base et données externes
Les données des entrepôts de données et des datamarts sont différentes des données des applications
Les données sont organisées par domaine plutôt que par besoin fonctionnel
Les données sont des données intégrées, pas des données cloisonnées
Les données sont une série dans le temps, pas seulement des valeurs actuelles
Les données ont une latence plus élevée dans l'entrepôt de données que dans l'application
Plus de données historiques sont disponibles dans l'entrepôt de données que dans l'application
entrepôt de données multidimensionnel
Il n'est pas organisé par les exigences de normalisation du modèle relationnel
Un modèle multidimensionnel, souvent appelé schéma en étoile, se compose de tables de faits et de tables de dimensions.
La table de faits est liée à de nombreuses tables de dimensions et le graphique entier ressemble à des étoiles.
Plusieurs tables de faits partageront des dimensions communes ou des dimensions cohérentes via un « bus », similaire au bus d'un ordinateur.
Plusieurs datamarts peuvent être intégrés dans un datamart au niveau de l'entreprise en insérant des bus qui suivent les dimensions.
La base de données de Kimball est plus évolutive que la base de données d'Inmon
Composants
système de sources d'affaires
zone de stockage de données
Zone d'affichage des données
Outils d'accès aux données
Composants de l'architecture de l'entrepôt de données
processus
Flux depuis les systèmes sources vers les magasins de données où les données peuvent être nettoyées et enrichies lorsqu'elles sont intégrées et stockées dans un entrepôt de données ou un magasin de données opérationnel
Dans un entrepôt de données, les données sont accessibles via des data marts ou des cubes de données pour générer divers rapports.
Différences de processus Big Data
Alors que la plupart des entrepôts intègrent les données avant de les intégrer dans les rapports, les solutions Big Data chargent les données avant de les intégrer.
En plus des divers types de rapports traditionnels, la business intelligence Big Data peut également inclure l’analyse prédictive et l’exploration de données.
système source
Comprend les systèmes d'entreprise et les données externes à acheminer vers l'entrepôt de données/l'environnement de business intelligence
Y compris le système de gestion de la relation client, le système financier, le système de ressources humaines, les services DaaS externes, etc.
L'entrepôt de données doit avoir
intégration de données
Comprend l'extraction, la transformation et le chargement, la virtualisation des données et d'autres techniques pour convertir les données vers un emplacement dans un format commun
L'entrepôt de données doit avoir
zone de stockage de données
cache de stockage
La zone de préparation est une zone de stockage de données intermédiaire entre la source de données et le référentiel de données centralisé.
C'est là que résident brièvement les données afin qu'elles puissent être transformées, intégrées et préparées pour être chargées dans l'entrepôt de données.
Dimensions de cohérence des données de référence et des données de référence
Les données de référence et les données de base peuvent être stockées dans des référentiels séparés
L'entrepôt de données fournit des données pour les données principales, et ce référentiel distinct fournit les mêmes données dimensionnelles pour l'entrepôt de données.
entrepôt de données central
L'entrepôt de données doit avoir
Une fois le processus de transformation et de préparation terminé, les données de l'entrepôt de données sont généralement conservées dans une couche centrale ou atomique.
Cette couche conserve toutes les données atomiques historiques ainsi que les dernières données instanciées après l'exécution par lots
Stockage de données opérationnelles ODS
Peut prendre en charge une latence plus faible, ce qui lui permet de prendre en charge les applications professionnelles
Étant donné que les magasins de données opérationnelles contiennent une fenêtre temporelle de données plutôt que l'intégralité de l'historique, ils peuvent être actualisés plus rapidement qu'un entrepôt de données.
magasin de données
Il est généralement utilisé comme couche de présentation de l'environnement de l'entrepôt de données et est également utilisé pour présenter des sous-ensembles au niveau du service ou au niveau fonctionnel de l'entrepôt de données pour le reporting, l'interrogation et l'analyse des informations historiques.
Les data marts ciblent un domaine spécifique, un seul département ou un seul processus métier
Il peut également servir de base à un entrepôt de données virtualisé, les datamarts combinés formant l'entité finale de l'entrepôt de données.
cube de données
Il existe trois méthodes classiques pour mettre en œuvre des systèmes prenant en charge l'analyse et le traitement en ligne
Basé sur une base de données relationnelle
Basé sur une base de données multidimensionnelle
base de données hybride
Comment charger
Il existe deux principaux types de traitement d'intégration de données impliqués
données historiques
Il ne doit généralement être chargé qu’une seule fois ou un nombre limité de fois pour gérer les problèmes de données, puis ne doit plus jamais être chargé.
Mises à jour continues des données
Une planification et une exécution cohérentes sont nécessaires pour garantir que l'entrepôt de données contient les données les plus récentes.
données historiques
L'un des avantages d'un entrepôt de données est qu'il capture un historique détaillé des données stockées.
Capture de données de modification par lots
Habituellement, l'entrepôt de données effectue chaque nuit un service de chargement de données via une fenêtre de traitement par lots.
L'horodatage ou le chargement de la table de journalisation sont les techniques les plus courantes.
La charge complète est utilisée lorsqu'il s'agit de systèmes existants sans capacités d'horodatage natives ou sans certaines conditions de récupération par lots.
Chargement des données en temps quasi réel et en temps réel
L'émergence de la business intelligence opérationnelle (ou analyse opérationnelle) nécessite une latence plus faible, intégrant davantage de données en temps réel ou quasi-réel dans les entrepôts de données, et de nouvelles approches architecturales émergent pour gérer les données sujettes à changement.
Les alternatives au traitement par lots répondent aux exigences de latence de plus en plus courtes de disponibilité des données dans les entrepôts de données. Il existe trois alternatives principales : le chargement lent, la messagerie et le streaming. Elles ont différentes positions où les données s'accumulent en attendant d'être traitées.
Transmission goutte à goutte (accumulation de sources)
Contrairement au chargement par lots de fenêtre nocturne, le chargement lent se charge à un rythme plus fréquent ou selon un seuil.
Cette méthode vous permet d'effectuer certaines opérations de traitement par lots pendant la journée sans avoir à vous concentrer sur une fenêtre de traitement par lots dédiée la nuit.
Transfert de messages (accumulation de bus)
L'interaction des messages en temps réel ou quasi réel est très utile lorsque de très petits datagrammes sont publiés sur le bus de messages.
Les systèmes source et cible sont indépendants l’un de l’autre
Souvent utilisé dans les applications DaaS
Streaming (accumulation de destinations)
Contrairement au timing ou au seuil de chargement à la source, le système cible collecte les données dans un tampon ou une file d'attente et les traite de manière séquentielle.
Activité
Comprendre les besoins
Définir et maintenir l'architecture d'entrepôt de données/de business intelligence
Déterminer l'architecture technologique de l'entrepôt de données/de la business intelligence
Identifier les processus de gestion de l'entrepôt de données/de la business intelligence
Développer des entrepôts de données et des datamarts
De manière générale, les projets de construction d’entrepôts de données/de business intelligence comportent trois pistes de construction coexistantes.
données
Données nécessaires pour soutenir l’analyse commerciale
Cette piste consiste à identifier les meilleures sources de données et à concevoir des règles sur la manière de modifier, transformer, intégrer, stocker et mettre les données à disposition des applications.
technologie
Systèmes et processus back-end pour prendre en charge le stockage et la migration des données
outils de veille économique
La suite d'applications nécessaires aux consommateurs de données pour obtenir des informations significatives sur les données à partir des produits de données déployés
Mapper la source à la cible
Corriger et transformer les données
Charger l'entrepôt de données
Mettre en œuvre un portefeuille de business intelligence
Regrouper les utilisateurs selon vos besoins
Adapter les outils aux besoins des utilisateurs
Maintenir les produits de données
Aperçu
Un entrepôt de données bien construit et un outil de business intelligence orienté client sont un produit de données
Les améliorations (extensions, ajouts ou modifications) aux plates-formes d'entrepôt de données existantes doivent être mises en œuvre progressivement.
Maintenir la portée d'un incrément et le chemin critique pour exécuter des éléments de travail ciblés peut être un défi dans un environnement de travail en constante évolution.
La priorisation doit être établie conjointement avec les partenaires commerciaux et se concentrer sur les efforts qui doivent être renforcés.
Gestion des versions
La gestion des versions est essentielle pour codifier le processus de développement, ajouter de nouvelles fonctionnalités, améliorer les déploiements de production et garantir une maintenance régulière des actifs déployés.
Ce processus maintiendra l'entrepôt de données à jour, propre et fonctionnant de manière optimale
Il s'agit d'un travail d'amélioration continue
Gérer le cycle de vie du développement des produits de données
Chaque itération développera les incréments existants ou intégrera de nouvelles fonctionnalités proposées par l'équipe commerciale.
Surveiller et régler le processus de chargement
Surveillez le traitement de la charge sur l'ensemble du système et comprenez les goulots d'étranglement des performances et les chemins de dépendance des performances.
Utilisez les techniques de réglage des bases de données où et quand vous en avez besoin, y compris les ajustements du partitionnement, du réglage des sauvegardes et de la stratégie de récupération.
Surveiller et ajuster les activités et les performances de la Business Intelligence
La transparence et la visibilité sont des principes clés qui régissent l'entreposage des données et la surveillance de la business intelligence.
Plus les détails des activités d’entrepôt de données et de business intelligence sont rendus publics, plus les consommateurs de données peuvent voir et comprendre ce qui se passe, et moins une assistance directe est nécessaire pour les clients finaux.
outil
référentiel de métadonnées
Dictionnaire de données et terminologie
Le dictionnaire de données est un composant nécessaire pour prendre en charge l'utilisation de l'entrepôt de données
Les dictionnaires décrivent les données en termes commerciaux, y compris d'autres informations nécessaires à l'utilisation des données.
Généralement, le contenu du dictionnaire de données provient directement du modèle logique de données.
La parenté entre les données et les modèles de données
La parenté des données enregistrées a de multiples utilisations
Rechercher la cause première des problèmes de données
Effectuer une analyse d'impact sur les modifications du système et les problèmes de données
Déterminer la fiabilité des données en fonction de leur source
Outils d'intégration de données
Les outils d'intégration de données sont utilisés pour charger l'entrepôt de données
Lors de la sélection des outils, vous devez également prendre en compte les fonctions de gestion du système suivantes :
Audit, contrôle, redémarrage et planification des processus
La capacité d'extraire sélectivement des éléments de données au moment de l'exécution et de les auditer avant de les transmettre aux systèmes en aval
Contrôler quelles opérations peuvent ou non être effectuées et quels processus ayant échoué ou abandonnés peuvent être redémarrés
Types d'outils de business intelligence
Aperçu
Rapports opérationnels
L'application d'outils de business intelligence permet-elle d'analyser les tendances commerciales à court terme (mensuel) et à long terme (annuel)
Le reporting opérationnel peut également aider à découvrir des tendances et des schémas, en utilisant des outils de business intelligence tactiques pour soutenir les décisions commerciales à court terme.
gestion des performances de l'entreprise
Comprend une évaluation formelle des indicateurs d'alignement avec les objectifs de l'organisation, généralement au niveau de la direction.
Analyse descriptive en libre-service
Fournit des outils de business intelligence au front office avec des capacités analytiques pour guider les décisions opérationnelles
Rapports opérationnels
Le reporting opérationnel fait référence aux utilisateurs professionnels qui génèrent des rapports directement à partir de systèmes de trading, d'applications ou d'entrepôts de données.
C'est généralement une fonction d'une application
Généralement, les requêtes ad hoc sont utilisées lorsque le rapport n'est qu'un simple rapport ou sont utilisées pour démarrer un flux de travail.
gestion des performances de l'entreprise
La gestion des performances est un ensemble intégré de processus organisationnels et d'applications conçus pour optimiser l'exécution de la stratégie commerciale.
Une autre méthode de gestion professionnelle a été formée dans ce domaine : la création de tableaux de bord sous forme de tableaux de bord et de tableaux de bord pour permettre aux utilisateurs de maintenir une interaction informationnelle cohérente entre la gestion et l'exécution.
Applications d'analyse opérationnelle
Aperçu
Le traitement analytique en ligne (OLAP) est une méthode qui fournit des performances rapides pour les requêtes analytiques multidimensionnelles.
Le terme OLAP dérive en partie de la distinction claire entre le traitement des transactions en ligne OLTP
Les opérations OLAP courantes incluent
tranche
Une tranche est un sous-ensemble d'un tableau multidimensionnel qui correspond à une valeur unique pour un ou plusieurs membres d'une dimension qui ne fait pas partie du sous-ensemble.
Couper en morceaux
Les tuiles sont des tranches de plus de deux dimensions sur le cube de données, ou de plus de deux tranches consécutives.
Explorer vers le haut/vers le bas
est une technique d'analyse spécifique qui permet aux utilisateurs de naviguer entre différents niveaux de données
Va du plus général (vers le haut) au plus détaillé (vers le bas)
Convolution ascendante
La convolution implique le calcul de toutes les relations de données dans une ou plusieurs dimensions
perspective
Les perspectives modifient les dimensions d'affichage d'un rapport ou d'une page
Méthode d'implémentation OLAP
Traitement analytique relationnel en ligne (ROLAP)
ROLAP prend en charge OLAP en utilisant la technologie multidimensionnelle dans les tables bidimensionnelles du SGBDR de base de données relationnelle
Le schéma en étoile est une technique de conception de base de données couramment utilisée dans les environnements ROLAP.
Traitement analytique en ligne matriciel multidimensionnel (MOLAP)
MOLAP prend en charge OLAP grâce à l'utilisation d'une technologie de base de données multidimensionnelle spécialisée
Traitement analytique en ligne hybride (HOLAP)
C'est une combinaison de ROLAP et MOLAP
L'implémentation HOLAP permet de stocker une partie des données dans MOLAP et une partie dans ROLAP.
méthode
Des prototypes qui répondent aux exigences
Le profilage des données facilitera le prototypage et réduira les risques associés aux données inattendues.
Intelligence économique en libre-service
Méthodes de livraison de base pour les produits de business intelligence en libre-service
Il place généralement les activités des utilisateurs dans un portail géré, fournissant diverses fonctionnalités basées sur les autorisations de l'utilisateur.
Y compris la messagerie, les alarmes, l'affichage des rapports de production planifiés, des tableaux de bord, des cartes de pointage, etc.
Les rapports peuvent être transmis au portail selon un calendrier standard pour que les utilisateurs puissent les récupérer à leur guise.
Les utilisateurs peuvent également extraire des données en exécutant des rapports sur des portails qui partagent du contenu au-delà des frontières organisationnelles.
Données d'audit interrogeables
Pour maintenir la traçabilité des données, toutes les structures et tous les processus doivent être capables de créer et de stocker des informations d'audit et de permettre un suivi et un reporting précis.
Guide de mise en œuvre
Évaluation de l’état de préparation/évaluation des risques
L'entrepôt de données doit être en mesure d'atteindre les points suivants
Clarifier la sensibilité des données et les contraintes de sécurité
Sélectionner l'outil
Assurer la sécurité des ressources
Créer un processus d'extraction pour évaluer et recevoir les données sources
Feuille de route des versions
Gestion de la configuration
Changement organisationnel et culturel
Entreposage de données/gouvernance de la Business Intelligence
acceptation commerciale
Certains sous-composants architecturaux très importants et leurs activités de soutien doivent être pris en compte dès le départ.
modèle de données conceptuel
Boucle de rétroaction sur la qualité des données
Métadonnées de bout en bout
Traçabilité des données vérifiables de bout en bout
Satisfaction client/utilisateur
accord de niveau de service
Stratégie de reporting
Une stratégie de reporting comprend des normes, des processus, des lignes directrices, des meilleures pratiques et des procédures qui garantiront que les utilisateurs reçoivent des informations claires, précises et en temps opportun.
Les stratégies de reporting doivent aborder les problèmes suivants
accès sécurisé
Assurez-vous que seuls les utilisateurs autorisés ont accès aux données sensibles
Décrit les mécanismes d'accès pour l'interaction des utilisateurs, la création de rapports, l'inspection ou la visualisation d'autres données.
Types de communautés d'utilisateurs et outils appropriés pour son utilisation
Résumé du rapport, détails, exceptions, fréquence, calendrier, distribution et nature stockée
Libérez le potentiel des capacités de visualisation avec une sortie graphique
Compromis entre rapidité et performance
centre d'excellence
Les centres d'excellence peuvent fournir des formations, la configuration du lancement, les meilleures pratiques de conception, des trucs et astuces sur les sources de données, ainsi que d'autres solutions ou fonctionnalités pour aider les utilisateurs professionnels à mettre en œuvre un modèle en libre-service.
En plus de la gestion des connaissances, le centre assure une communication rapide aux développeurs, concepteurs, analystes et organisations abonnées.
Métrique
Utiliser des indicateurs
Les mesures utilisées dans les entrepôts de données incluent le nombre d'utilisateurs enregistrés, le nombre d'utilisateurs connectés ou le nombre d'utilisateurs simultanés.
Ces métriques représentent le nombre de personnes dans l'organisation qui utilisent l'entrepôt de données
Couverture du domaine
Le pourcentage de couverture du domaine mesure dans quelle mesure chaque service a accès à l'entrepôt et met également en évidence quelles données sont partagées entre les services et lesquelles ne le sont pas encore mais pourraient l'être.
Temps de réponse et mesures de performances
La plupart des outils de requête mesurent le temps de réponse
Récupérer des mesures de réponse ou de performances à partir des outils