Livres de référence pour maîtriser la modélisation des données
La définition des 4 mots modèle, physique, données et relationnel donne les éléments de construction de la réponse.
En ingénierie, un modèle est une représentation d'un produit ou d'un service existant ou à réaliser.
Comme toute représentation, un modèle n'est pas la réalité mais une image plus ou moins fidèle.
La réalisation d'un modèle doit satisfaire au besoin de représentation souhaité ; par exemple un plan de charpente ou un plan d'agencement de cuisine pour la construction d'une maison sont deux plans (modèles) satisfaisants deux besoins différents.
Un modèle peut être plus ou moins abstrait. Le réglage de l'échelle du GPS d'une voiture est un exemple d'abstraction. Plus l'échelle est grande, plus vous aurez une vue abstraite privilégiant la vue d'ensemble au détriment des détails. Plus l'échelle est petite, plus vous aurez de détails au détriment de la vue d'ensemble.
Usuellement, en ingénierie des données, nous réalisons des modèles selon 3 niveaux d'abstraction :
Le niveau conceptuel. C'est le niveau le plus abstrait, il doit représenter les données dans la perspective du métier et retranscrire les besoins des utilisateurs et de la maitrise d'ouvrage. Le niveau conceptuel doit être indépendant de toute technologie et respecter les usages, la pratique ou encore la terminologie du métier et des utilisateurs.
Le niveau logique qui doit représenter les données métiers adaptées à une technologie de gestion de bases de données. Actuellement, en informatique de gestion ou des affaires, c'est le modèle relationnel de E. F. Codd qui domine largement.
Le niveau physique qui doit décliner le modèle logique en un modèle physique adapté à une base de données particulière comme par exemple : PostgreSQL, Oracle ou encore MySQL pour le modèle relationnel.
La structure des données est la partie la plus stable d'un système d'information. Au gré de l'évolution des technologies, les méthodes et moyens de collecte, stockage, traitement et restitution changent mais, l'essentiel de la structure des données d'une organisation change peu.
Si nous prenons l'exemple, d'une société qui vend des produits par correspondance, aussi loin que l'on peut remonter dans le temps, il y avait des clients, des commandes et des produits. Au fil du temps les commandes des clients ont été passées par un représentant , par carte postale, par téléphone, par un site Web ou encore par une application de mobile. Il a peut-être fallu modifier, rajouter ou supprimer l'un ou l'autre élément de données mais, l'essentiel de la structure est toujours composées de clients, commandes et produits.
Relationnel réfère à la technologie de persistance des données proposée par E.J. Codd sous le terme de modèle relationnel.
Le modèle relationnel est le fondement technologique sous-jacent aux systèmes de gestion de bases de données relationnelles (SGBD-R).
Il faut réaliser un modèle physique de données relationnel (MPD-R) pour :
Représenter fidèlement la structure de données de tout ou partie d'un système d'information dans la vision du modèle relationnel de E.J. Codd en intégrant les spécificités du SGBD-R cible. Cette représentation constitue le sous-modèle physique dit "classique".
Représenter les APIs de tables. Les APIs de tables sont des déclencheurs propres au SGBD-R cible et des procédures et fonctions stockées écrites dans le langage supporté par le SGBD-R cible. Les APIs de tables mettent en œuvre par programmation les règles métier que le sous-modèle classique ne prend pas en charge. Par exemple : une colonne qui ne change pas de valeur ou l'alimentation de colonnes d'audit ou de tables de journalisation.