Définitions, Caractéristiques Et Comparaisons Des Schémas En étoile Et En Flocon De Neige

Introduction

Le schéma en étoile et en flocon de neige sont des conceptions de stockage logique que l’on trouve couramment dans les magasins de données et l’architecture d’entrepôt de données. Alors que les types de bases de données courants utilisent des diagrammes ER (Entity-Relationship), la structure logique des entrepôts utilise des modèles dimensionnels pour conceptualiser le système de stockage.

Lisez la suite pour découvrir les différences, les caractéristiques et les défauts des schémas en étoile et en flocon de neige.

Schéma En étoile Vs Schéma En Flocon De Neige : La Principale Différence

Les deux principaux éléments du modèle dimensionnel du schéma étoile et flocon sont :

1. Tableau des faits . Table contenant la quantité de données la plus importante, également appelée cube .

2. Tableaux de dimensions . La structure de données dérivée fournit des réponses aux requêtes ou dimensions ad hoc, souvent appelées tables de recherche .

La connexion des dimensions choisies sur une table de faits forme le schéma. Les schémas en étoile et en flocon utilisent tous deux la dimensionnalité des données pour modéliser le système de stockage.

Les principales différences entre les deux schémas sont :

En raison de la complexité du schéma en flocon de neige et des performances moindres, le schéma en étoile est l’option préférée dans la mesure du possible. Une façon typique de contourner les problèmes du schéma en flocon consiste à décomposer le stockage dédié en plusieurs entités plus petites avec un schéma en étoile.

Qu’est-ce Qu’un Schéma En étoile ?

Un schéma en étoile est une structure logique pour le développement de data marts et d’entrepôts de données plus simples. Le modèle simple se compose de tables de dimension reliées à une table de faits au centre.

La table des faits se compose généralement de :

  • Données numériques quantifiables, telles que des valeurs ou des comptages.
  • Références aux dimensions via des clés étrangères.

Les tables de recherche représentent des informations descriptives directement liées à la table de faits.

Par exemple, pour modéliser les ventes d’une entreprise de commerce électronique, la table des faits pour les achats peut contenir le prix total de l’achat. D’autre part, les tableaux dimensionnels contiennent des informations descriptives sur les articles, les données client, l’heure ou le lieu d’achat.

Le schéma en étoile pour l’analyse des achats dans l’exemple a quatre dimensions. La table de faits se connecte aux tables dimensionnelles via le concept de clés étrangères et primaires. Outre les données numériques, la table de faits est donc également constituée de clés étrangères pour définir les relations entre les tables.

Caractéristiques D’un Schéma En étoile

Les principales caractéristiques du schéma en étoile sont :

  • Requêtes simplifiées et rapides . Moins d’opérations JOIN en raison de la dénormalisation rendent les informations plus facilement disponibles.
  • Relations simples. Le schéma fonctionne très bien avec les relations un-à-un ou un-à-plusieurs.
  • Dimensionnalité singulière . Un tableau décrit chaque dimension.
  • Compatible OLAP . Les systèmes OLAP utilisent largement le schéma en étoile pour concevoir des cubes de données.

Inconvénients D’un Schéma En étoile

Les inconvénients de l’utilisation du schéma en étoile sont :

  • Redondance . Les tables dimensionnelles sont unidimensionnelles et la redondance des données est présente.
  • Faible intégrité . En raison de la dénormalisation, la mise à jour des informations est une tâche complexe.
  • Requêtes limitées . L’ensemble de questions est limité, ce qui réduit également le pouvoir d’analyse.

Qu’est-ce Qu’un Schéma En Flocon De Neige ?

Le schéma en flocon de neige a une structure logique ramifiée utilisée dans les grands entrepôts de données. Du centre vers les bords, les informations sur les entités vont du général au plus spécifique.

Outre les éléments communs du modèle dimensionnel, le schéma en flocon de neige décompose en outre les tables dimensionnelles en sous-dimensions.

Le modèle d’analyse des ventes de commerce électronique de l’exemple précédent se subdivise (« flocons de neige ») en catégories et sous-catégories d’intérêt plus petites.

Les quatre dimensions se décomposent en sous-dimensions. Les tables de recherche se normalisent davantage via une série d’objets connectés.

Caractéristiques D’un Schéma En Flocon

Les principales caractéristiques du schéma en flocon de neige incluent :

  • Petit rangement . Le schéma en flocon de neige ne nécessite pas autant d’espace de stockage.
  • Haute granularité . La division des tableaux en sous-dimensions permet une analyse à différentes profondeurs d’intérêt. L’ajout de nouvelles sous-dimensions est également un processus simple.
  • Intégrité . En raison de la normalisation, le schéma présente un niveau d’intégrité des données plus élevé et de faibles redondances.

Inconvénients D’un Schéma En Flocon De Neige

Les faiblesses du schéma en flocon de neige sont :

  • Complexité . Le modèle de base de données est complexe, tout comme les requêtes exécutées. Plusieurs tables multidimensionnelles rendent la conception compliquée à travailler dans l’ensemble.
  • Traitement lent . De nombreuses tables de recherche nécessitent plusieurs opérations JOIN, ce qui ralentit la récupération des informations.
  • Difficile à entretenir . Un haut niveau de granularité rend le schéma difficile à gérer et à maintenir.

Conclusion

Le schéma en étoile et en flocon de neige sont tous deux des conceptions logiques de systèmes de stockage de base de données. Les deux schémas apparaissent dans les grands systèmes de données, où la quantité d’informations est massive et difficile à maintenir.

Pour plus d’informations sur les plateformes de big data, consultez notre article sur la plateforme Hadoop.

Cet article a-t-il été utile?

Oui Non