Modèles de données. Hiérarchie et relationnalité. Basées sur la technologie de traitement des données, les bases de données sont divisées en bases de données centralisées et distribuées.

22.07.2019

Les données des bases de données sont organisées selon l'un des modèles de données.

À l'aide d'un modèle de données, les objets de domaine et les relations entre eux peuvent être représentés. Que. La base de toute base de données est le modèle de données.

Modèle de données – un ensemble de structures de données et d'opérations pour leur traitement.

Les modèles classiques de représentation des données incluent les modèles hiérarchiques, réseau et relationnels. Les modèles de données hiérarchiques et réseau ont commencé à être utilisés dans les systèmes de gestion de bases de données au début des années 60. Au début des années 70, un modèle de données relationnel a été proposé. Les trois modèles diffèrent principalement par la manière dont ils représentent les relations entre les objets.

Modèles de présentation des données de base :

1. Hiérarchique Le modèle de données représente l'affichage d'informations sur des objets du monde réel - des entités et leurs connexions sous la forme d'un graphique ou d'un arbre orienté (Fig. 2). Les nœuds et branches forment une structure arborescente hiérarchique. Un nœud est une collection d'attributs qui décrivent un objet. Le nœud le plus élevé de la hiérarchie est appelé nœud racine (c'est le type principal d'objet). Le nœud racine est au premier niveau. Les nœuds dépendants (types d'objets subordonnés) sont situés aux deuxième, troisième et autres niveaux. Dans un tel modèle, chaque objet n'a qu'une seule source (à l'exception de l'objet racine), mais en principe il peut y avoir plusieurs dépendants (enfants).

Figure 17. Structure du modèle hiérarchique

Les branches entre les objets reflètent la présence d'une certaine relation, et le nom de la relation est écrit sur le bord. Par exemple, entre les objets « client » et « commande », il peut y avoir une relation appelée « fait », et entre « commande » et « produits », il peut y avoir une relation appelée « consiste en ». Ce type de modèle reflète les connexions verticales, la subordination du niveau inférieur au niveau supérieur, c'est-à-dire Chaque enregistrement de base de données n'a qu'un seul chemin (hiérarchique) à partir de l'enregistrement racine.

Un exemple d'un tel modèle est une base de données contenant des informations sur une université (en utilisant l'exemple du BelGSHA)

2. Modèle de réseau – est une extension du modèle hiérarchique , Cependant, contrairement à cela, il existe des connexions horizontales (Fig. 3). Dans ce modèle de données, n’importe quel objet peut être à la fois maître et esclave. Une structure est appelée réseau si, dans les relations entre données, un élément enfant a plusieurs éléments parents. Le modèle de réseau offre de plus grandes opportunités par rapport au modèle hiérarchique, mais il est plus difficile à mettre en œuvre et à utiliser. Un exemple est la structure d'une base de données contenant des informations sur les étudiants participant à des travaux de recherche. Il est possible qu'un étudiant participe à plusieurs sujets, ainsi que plusieurs étudiants à l'élaboration d'un même sujet.

Riz. 18. Représentation des connexions dans un modèle de réseau

3. Modèle relationnel. Le concept de modèle de données relationnel (de l'anglais relation) est associé aux développements d'Erich Codd. Ce modèle se caractérise par la simplicité de la structure des données, une représentation tabulaire conviviale et la possibilité d'utiliser l'algèbre relationnelle pour le traitement des données.

Le modèle relationnel se concentre sur l'organisation des données sous forme de tableaux bidimensionnels interconnectés par certaines relations.

Une table relationnelle a les éléments suivants propriétés :

ü la table doit avoir un nom ;

ü chaque élément du tableau est un élément de données ;

ü toutes les colonnes du tableau sont homogènes, c'est-à-dire tous les éléments d'une colonne ont le même type (numérique, caractère ou autre) et la même longueur ;

ü chaque colonne a un nom unique ;

ü il n'y a pas de lignes identiques dans le tableau ;

ü l'ordre des lignes et des colonnes peut être arbitraire ;

ü le tableau doit être simple, c'est-à-dire ne contiennent pas de colonnes composées ;

La clé primaire doit être connue.

Une table de base de données relationnelle est constituée d'un certain nombre d'enregistrements du même type, ou tuples. Le mot « même type » signifie que tous les enregistrements ont le même ensemble d'attributs, ou champs, bien que chaque attribut puisse avoir sa propre valeur.

Considérons un tableau contenant des données sur les employés d'une entreprise

Il s'agit d'une base de données basée sur une structure arborescente. Selon le principe de construction, il ressemble un peu au système de fichiers d'un ordinateur. L’utilisation d’un tel modèle présente des avantages et des inconvénients, qui seront abordés dans cet article, accompagnés d’exemples détaillés.

Types de bases de données

Comme vous le savez, il existe quatre types de construction de bases de données :

Relationnel - SGBD tabulaire, où les informations sont présentées sous forme de lignes et de colonnes. C’est le principe utilisé pour les construire dans Access par exemple.
Orientés objet - étroitement liés à la manière dont les objets sont travaillés), et c'est leur principal avantage, mais compte tenu de leur faible productivité, ils sont encore nettement inférieurs en prévalence aux relationnels.
Hybride - SGBD contenant deux des types ci-dessus à la fois.
Les hiérarchies font l’objet de l’attention de cet article. caractérisé par une structure arborescente.

L'exemple le plus célèbre de base de données hiérarchique est un produit créé par IBM appelé Information Management System, en abrégé IMS. La première version d’IMS a été publiée au XXe siècle, en l’an soixante-huit. Il est encore utilisé aujourd’hui pour stocker et contrôler les données.

Le principe de construction d'un modèle hiérarchique

Le modèle de données hiérarchique est construit selon le principe suivant :

pour chaque nœud de la structure arborescente, un certain segment est attribué ;
Un segment fait référence à des champs de données avec un nom attribué à chaque champ et disposés en un tuple linéaire ;
une autre correspondance : un segment d'entrée et plusieurs segments de sortie pour chaque champ source ;
pour chaque élément structurel il y a une et une seule place dans le système hiérarchique ;
la structure arborescente part de l'élément racine ;
Chaque nœud esclave n'a qu'un seul ancêtre, mais chaque nœud parent peut avoir plusieurs enfants.

Application d'une structure de données hiérarchique

Une base de données hiérarchique est un stockage applicable aux systèmes qui ont initialement une structure arborescente. Pour eux, le choix d’une telle modélisation est logique.

Un exemple de base de données hiérarchique avec des diplômes initialement systématisés est une unité militaire dans laquelle, comme on le sait, les grades sont clairement définis. Il peut également s'agir de mécanismes complexes, constitués de particules de plus en plus simples vers le bas de la hiérarchie. Pour modéliser de tels systèmes et les amener sous la forme de la base de données considérée, aucune décomposition n'est nécessaire. Cependant, cette situation ne se produit pas toujours.

De plus, une requête descendante a tendance à être plus simple qu’une requête ascendante.

Opérations de base sur des bases de données construites sur un modèle hiérarchique

La structure de la base de données hiérarchique vous permet d'effectuer avec succès et de manière presque transparente (en fonction des compétences et des capacités) les opérations suivantes (les plus élémentaires sont présentées, la liste peut toujours être élargie avec de petits ajouts) :

rechercher dans la base de données un élément particulier ;
transition à travers la base de données - d'arbre en arbre ;
se déplacer le long d'un arbre - de branche en branche ;
en conséquence, la transition le long des branches se fait élément par élément ;
travailler avec des enregistrements : en insérer un nouveau et/ou supprimer l'actuel, copier, couper, etc.

Description généralisée de la structure

Le terme « arborescent » pour décrire la structure est mentionné à plusieurs reprises dans cet article. Il est temps de dire d'où il vient. En effet, une base de données hiérarchique est une base de données qui utilise le type de données « arbre ». Regardons de plus près ce que c'est.

Il s'agit d'un type composé : chaque élément (nœud) contient plusieurs éléments suivants (un ou plusieurs). Et tout commence par un élément racine. Le fait est que chacune des pièces de type « arbre » est un sous-type, également un « arbre ». De très nombreuses structures ramifiées et toujours ordonnées.

Les types élémentaires peuvent être simples ou composés, mais il s’agit essentiellement toujours d’enregistrements. Mais dans un enregistrement simple, il y en a un, et dans un enregistrement composé, il y en a tout un ensemble.

Le modèle hiérarchique est caractérisé par le principe de descendance, lorsque chaque segment précédent est l'ancêtre du suivant. De plus, un descendant d'un type parent est un type subordonné, tandis que les enregistrements équivalents les uns aux autres sont considérés comme des jumeaux.

Remplir la base de données

Les données principales d'une base de données hiérarchique sont les valeurs (chiffres ou symboles) stockées dans les enregistrements. Une telle base de données est généralement parcourue de bas en haut et de gauche à droite.

Avantages

Une base de données hiérarchique est une base de données qui possède un dossier racine et se ramifie progressivement vers le bas. Étant donné qu'une telle structure est très similaire à un système de fichiers, de telles bases de données sont utilisées avec succès pour effectuer diverses opérations sur des données informatiques. Le résultat : une répartition rationnelle de sa mémoire, ainsi que des indicateurs très corrects du temps passé au travail.

Le modèle hiérarchique est idéal pour l’utiliser pour organiser l’information.

Défauts

Cependant, les mêmes caractéristiques du SGBD considéré, qui sont devenues leurs principaux avantages, déterminent également leurs inconvénients. Par exemple, l'encombrement et la complexité des connexions logiques - il sera difficile à comprendre pour un spécialiste expérimenté lorsqu'il travaillera avec une base de données jusqu'alors inconnue, et un simple utilisateur s'y perdra complètement. Cette complexité de compréhension conduit au fait que peu de SGBD sont réellement construits sur un modèle hiérarchique. Un exemple de base de données hiérarchique est, en plus du produit déjà décrit d'IBM, Oka et MIRIS (fabriqués en Russie), ainsi que Data Edge et Team-UP (provenant de sociétés étrangères).

Exemples

Une base de données hiérarchique est constituée d'une variété de niveaux différents auxquels les relations sont construites. Schématiquement, cela ressemble à un graphique inversé. Un exemple de base de données hiérarchique est n’importe quelle agence administrative gouvernementale. Prenons, par exemple, l'école.

Au plus haut niveau se trouvera le « chef » de l’administration – le directeur. Les directeurs lui sont subordonnés et les directeurs ont des enseignants qui gèrent des classes parallèles. Chaque parallèle en compte un certain nombre, et chaque classe compte un certain nombre d'élèves.

Le même principe peut être utilisé pour décrire la gestion d’une société. Le chef d’entreprise ou même le conseil d’administration se trouve tout en haut. Ensuite, un nombre croissant de divisions, chacune ayant sa propre structure. Il existe également des traits communs : le chef de chaque service, son assistant, sa secrétaire, les employés de bureau eux-mêmes, etc.

Application dans les ordinateurs

Il peut y avoir des applications plus sérieuses. Un exemple frappant de base de données hiérarchique est un système de fichiers. Le familier « Explorateur » est intégré au cœur même du système d'exploitation Windows selon exactement ce schéma, tout comme de nombreux autres gestionnaires de fichiers.

Bases de données réseau

Il y a:

relationnel;
hiérarchique;
bases de données réseau.

Pourquoi avons-nous repensé à la classification ? Car contrairement à une base de données relationnelle, une base de données réseau présente des fonctionnalités similaires à une base de données hiérarchique.

Il est temps de se souvenir dans les bases de données. Il existe des relations un-à-un, un-à-plusieurs et plusieurs-à-plusieurs. C'est ce dernier qui nous intéresse. Dans une base de données réseau, cela se manifeste ainsi : un nœud successeur peut avoir plusieurs ancêtres à la fois. La propriété d'avoir plusieurs descendants est également préservée. On peut dire que les bases de données hiérarchiques et les bases de données en réseau sont elles-mêmes des exemples d'un tel héritage. L'ancêtre dans ce cas est précisément la base de données hiérarchique, puisque le principe de construction de la structure dans les bases de données en réseau reste le même.

Hiérarchie et relationnalité

Le nom « relationnel » vient du mot anglais « relation ». Comme mentionné au début de l’article, ils sont souvent exprimés sous forme de tableaux. Mais dans le paragraphe précédent nous avons indiqué qu'une base de données hiérarchique peut aussi organiser des connexions, cela signifie-t-il qu'entre ces deux types il y a une sorte de fil mince qui les unit ?

Oui. Outre le fait que les premier et deuxième types concernent toujours les bases de données, en plus de cette fonctionnalité, il existe une autre propriété commune. Par exemple, une base de données hiérarchique (et une base de données réseau qui l'accompagne) peut être exprimée dans un tableau. Il ne s'agit pas ici de savoir sous quelle forme les informations doivent être présentées à l'utilisateur final (c'est déjà une question de convivialité de l'interface), mais selon quel principe les informations ont été structurées. Ainsi, une division claire en départements avec leurs chefs, divisions, etc. sera toujours exprimée dans la hiérarchie, mais pour plus de commodité, elle est répertoriée dans un tableau.

Classement des bases de données.

Par technologies de traitement Les bases de données sont divisées en centralisées et distribuées.

Base centralisée les données sont stockées dans la mémoire d’un système informatique. Si ce système informatique fait partie d'un réseau informatique, un accès distribué à une telle base de données est possible. Cette méthode d'utilisation des bases de données est souvent utilisée sur les réseaux PC locaux.

Base de données distribuée les données sont constituées de plusieurs parties, éventuellement superposées ou même dupliquées, stockées dans différents ordinateurs d'un réseau informatique. Le travail avec une telle base de données est effectué à l'aide d'un système de gestion de base de données distribué (SGBDR).

Par méthode d'accès aux bases de données de données sont divisées en bases de données avec accès local et des bases de données avec accès (réseau) à distance.

Le cœur de tout modèle de base de données est le modèle de données.

Modèle de données- un ensemble de structures de données et de traitements. À l'aide d'un modèle de données, les objets de domaine et les relations entre eux peuvent être représentés.

Il existe aujourd'hui trois approches principales pour créer des bases de données : hiérarchique, réseau et relationnel.

Historiquement le premier à apparaître Hiérarchique modèle de données. Le modèle de données hiérarchique est construit sur le principe d'une hiérarchie de types d'objets, c'est-à-dire un type d'objet est le principal et les autres sont subordonnés.

Les données sont présentées sous forme d'arbres. Les deux nœuds de l'arbre sont reliés par un rapport de subordination. Un arbre contient nécessairement un sommet qui n’a pas de sommet principal. Un tel sommet s’appelle une racine. Dans ce cas, il s'agit du sommet 3. Les sommets qui n'ont pas de subordonnés sont appelés feuilles, sur la figure ce sont 1, 2, 5, 7, 8, 9.

Figure 1. Modèle de données hiérarchique

Le sommet de l'arborescence stocke les données caractérisant un objet et plusieurs connexions avec des nœuds subordonnés.

Une relation un-à-plusieurs est établie entre les objets maître et esclave. Pour chaque type d'objet subordonné, il ne peut y avoir qu'un seul type d'objet parent.

Le sommet principal - Département - contient des informations sur le nom, le budget et le numéro de téléphone du département. Le département a un sommet subordonné Manager avec les informations Nom de famille, Année de naissance, Grade et plusieurs sommets subordonnés Employés, chaque employé est caractérisé par son Nom de famille, son Adresse, etc. Cette arborescence contient des informations sur un département. Pour décrire la deuxième division, un deuxième arbre est nécessaire. La base de données contiendra plusieurs arbres de même structure. Opérations possibles avec une base de données hiérarchique : transition entre arbres, création et suppression d'un arbre, recherche d'un sommet d'arbre, modification d'informations dans les sommets. Le travail avec des bases de données hiérarchiques est basé sur la théorie mathématique des graphes.

Réseau modèle de données.

Le modèle de réseau est une généralisation du modèle de données hiérarchique. Tout objet peut être maître et esclave. Chaque objet peut participer à un nombre illimité d'interactions. La seule limite est que le rapport de subordination ne peut pas revenir au sommet d’où il est parti.

Fig.2. Modèle de données réseau

Le département contient des informations : Nom, Budget, Téléphone et connexions avec le Manager et plusieurs Employés. Le manager est caractérisé par Date d'entrée en fonction, Année de naissance, Grade. Les salariés sont identifiés par leur nom et leur adresse. Le sommet Manager est connecté à l'un des sommets Employee ; il stocke le nom et l'adresse du manager.

Relationnel modèle de données.

Dans le modèle de données relationnel, les objets et les interactions entre eux sont représentés à l'aide de tableaux. Chaque table doit avoir une clé primaire : un champ ou une combinaison de champs qui identifie de manière unique chaque ligne de la table.

Actuellement, le modèle de données relationnelles est le plus populaire. Les SGBD FoxPro, Access, Visual C++, etc. sont construits sur son idéologie.

Opérations possibles dans une base de données relationnelle : créer des tables et des relations, modifier la structure des tables, ajouter, supprimer et modifier des enregistrements, rechercher des données, sélectionner des données dans une ou plusieurs tables, etc.

Travailler avec des bases de données relationnelles est basé sur l'algèbre relationnelle.

Le cœur de toute base de données est le modèle de données. Modèle de données - un ensemble de structures de données et de traitements .

Un SGBD repose sur l'utilisation d'un modèle hiérarchique, réseau ou relationnel, une combinaison de ces modèles, ou un sous-ensemble d'entre eux.

Modèle de données hiérarchique.

Les concepts de base d'une structure hiérarchique comprennent : niveau, élément, connexion. Noeud est une collection d'attributs de données qui décrivent un objet. Dans un arbre hiérarchique, les nœuds sont représentés sous forme de sommets dans le graphique. Chaque nœud d'un niveau inférieur est connecté à un seul nœud d'un niveau supérieur. Un arbre hiérarchique n'a qu'un seul sommet (la racine de l'arbre), qui n'est subordonné à aucun autre sommet et est situé au niveau supérieur (premier) (voir Fig. 5).

Riz. 5. Modèle de données hiérarchique

Chaque enregistrement de base de données n'a qu'un seul chemin (hiérarchique) à partir de l'enregistrement racine. Par exemple, pour l'enregistrement C4, le chemin passe par les enregistrements A et B3.

Un exemple de structure hiérarchique. Chaque étudiant étudie dans un certain (un seul) groupe, qui appartient à une certaine (un seul) corps professoral (voir Fig. 6).

Riz. 6. Exemple d'organisation hiérarchique des données

Modèle de données réseau

Dans une structure de réseau, chaque élément peut être connecté à n'importe quel autre élément (voir Figure 7).

Riz. 7. Modèle de données réseau

Un exemple de structure de réseau. Une base de données contenant des informations sur les étudiants participant à des projets de recherche (SRW). Il est possible qu'un étudiant participe à plusieurs projets de recherche, ainsi que plusieurs étudiants participent au développement d'un projet de recherche (voir Fig. 8).

Riz. 8. Exemple d'organisation des données en réseau

Modèle de données relationnel

Ces modèles se caractérisent par une structure de données simple, une présentation conviviale et la capacité d'utiliser l'appareil formel de l'algèbre relationnelle.

Le modèle relationnel se concentre sur l'organisation des données sous forme de tableaux bidimensionnels. Chaque table relationnelle (relation) est un tableau à deux dimensions et possède les propriétés suivantes :

· chaque élément de tableau est un élément de données ;

· toutes les colonnes du tableau sont homogènes, c'est-à-dire tous les éléments d'une colonne ont le même type (numérique, caractère, etc.) et la même longueur ;

Chaque colonne a un nom unique ;

· il n'y a pas de lignes identiques dans le tableau ;

· l'ordre des lignes et des colonnes peut être arbitraire.

Exemple. Une table relationnelle peut être utilisée pour présenter des informations sur les étudiants qui étudient dans une université.

Un champ dont chaque valeur identifie de manière unique l'enregistrement correspondant est appelé avec une simple clé(champ clé). Si les enregistrements sont identifiés de manière unique par les valeurs de plusieurs champs, alors une telle table de base de données a clé composée.

Pour lier deux tables relationnelles, vous devez inclure la clé de la première table dans la clé de la deuxième table (les clés peuvent coïncider) ; sinon vous devez entrer dans la structure du premier tableau clé étrangère- la clé du deuxième tableau.

Les mêmes données peuvent être regroupées dans des tableaux de différentes manières. Le regroupement des attributs dans des tableaux doit être rationnel, c'est-à-dire minimiser la duplication des données et simplifier la procédure de traitement.

Normalisation des relations - un appareil formel de restrictions sur la formation de relations (tables), qui élimine la duplication, assure la cohérence de celles stockées dans la base de données et réduit les coûts de main-d'œuvre pour la maintenance (saisie, ajustement) de la base de données.

Il existe cinq formes normales de relations. Ces formulaires visent à réduire la redondance des informations entre le premier et le cinquième formulaire normal. Par conséquent, chaque forme normale ultérieure doit satisfaire aux exigences de la forme précédente et à certaines conditions supplémentaires. Dans la conception pratique des bases de données, les quatrième et cinquième formes ne sont généralement pas utilisées.

Considérons la procédure de normalisation en utilisant l'exemple de conception d'une base de données multi-tables. Ventes contenant les informations suivantes :

· Informations sur les acheteurs.

· Date de commande et quantité de marchandises commandées.

· Date d'achèvement de la commande et quantité de marchandises vendues.

· Caractéristiques du produit vendu (nom, coût, marque).

Tableau 2. Structure du tableau Ventes

Tableau Ventes peut être considérée comme une base de données à table unique. Le principal problème est qu’il contient une quantité importante d’informations répétitives. Cette structure de données provoque les problèmes suivants qui surviennent lors de l'utilisation de la base de données :

· Vous devez passer beaucoup de temps à saisir des données répétitives. Par exemple, pour toutes les commandes passées par un seul acheteur, vous devrez saisir à chaque fois les mêmes informations sur l’acheteur.

· Lorsque l'adresse ou le numéro de téléphone d'un client change, tous les enregistrements contenant des informations sur les commandes de ce client doivent être ajustés.

· La présence d'informations en double entraînera une augmentation injustifiée de la taille de la base de données. En conséquence, la vitesse d’exécution des requêtes diminuera. De plus, les données en double gaspillent l'espace disque de votre ordinateur.

· Toute situation d'urgence nécessitera beaucoup de temps pour obtenir les informations requises.

Comme indiqué, le modèle infologique cartographie le monde réel en certains concepts compréhensibles par l'homme et totalement indépendants des paramètres de l'environnement de stockage des données. Il existe de nombreuses approches pour construire de tels modèles : modèles de graphes, réseaux sémantiques, modèle entité-relation, etc. Le plus populaire d’entre eux s’est avéré être le modèle entité-relation, qui sera abordé au chapitre 2.

Le modèle d'information doit être mappé dans un modèle datalogique orienté ordinateur qui est « compréhensible » par le SGBD. Dans le processus de développement de la théorie et de l'utilisation pratique des bases de données, ainsi que de la technologie informatique, des SGBD ont été créés, prenant en charge divers modèles datalogiques.

Premièrement, des modèles datalogiques hiérarchiques ont commencé à être utilisés. La simplicité d'organisation, la présence de connexions prédéterminées entre les entités et la similitude avec des modèles de données physiques ont permis d'obtenir des performances acceptables de SGBD hiérarchiques sur des ordinateurs lents avec des quantités de mémoire très limitées. Mais si les données n'avaient pas de structure arborescente, de nombreuses difficultés surgissaient lors de la construction d'un modèle hiérarchique et du désir d'atteindre les performances souhaitées.

Des modèles de réseau ont également été créés pour les ordinateurs à faibles ressources. Il s'agit de structures assez complexes constituées d'« ensembles », appelés arbres à deux niveaux. Les « ensembles » sont connectés à l'aide de « enregistrements de liens », formant des chaînes, etc. Lors du développement de modèles de réseau, de nombreuses « petites astuces » ont été inventées qui ont permis d'augmenter les performances du SGBD, mais ont considérablement compliqué ce dernier. Un programmeur d'applications doit connaître de nombreux termes, étudier plusieurs langages de SGBD internes et avoir une compréhension détaillée de la structure logique de la base de données pour naviguer parmi les différentes instances, ensembles, enregistrements, etc. L'un des développeurs du système d'exploitation UNIX a déclaré : « Une base réseau est le moyen le plus sûr de perdre des données. »

La complexité de l'utilisation pratique des SGBD hiérarchiques et réseau nous a obligés à rechercher d'autres moyens de présenter les données. A la fin des années 60 apparaissent les SGBD basés sur des fichiers inversés, caractérisés par une facilité d'organisation et la présence de langages de manipulation de données très pratiques. Cependant, ces SGBD comportent un certain nombre de restrictions concernant le nombre de fichiers destinés à stocker les données, le nombre de connexions entre eux, la longueur de l'enregistrement et le nombre de ses champs.

Les modèles les plus courants aujourd’hui sont les modèles relationnels, qui seront abordés en détail au chapitre 3.

L'organisation physique des données a un impact majeur sur les caractéristiques opérationnelles de la base de données. Les développeurs de SGBD tentent de créer les modèles de données physiques les plus productifs, offrant aux utilisateurs l'un ou l'autre outil permettant de personnaliser le modèle pour une base de données spécifique. La variété des manières d'ajuster les modèles physiques des SGBD industriels modernes ne nous permet pas de les considérer dans cette section.

Modèles d'organisation de bases de données

1. Approche hiérarchique de l'organisation des bases de données. Les bases de données hiérarchiques se présentent sous la forme d'arbres avec des liens d'arc et des éléments de données de nœuds. La structure hiérarchique impliquait une inégalité entre les données – certaines étaient strictement subordonnées aux autres. Bien entendu, de telles structures satisfont clairement aux exigences de nombreux problèmes réels, mais pas de tous.

2. Modèle de données réseau. Dans les bases de données réseau, outre les connexions verticales, des connexions horizontales sont également implémentées. Cependant, de nombreux inconvénients du système hiérarchique ont été hérités, le principal étant la nécessité de définir clairement les connexions de données au niveau physique et de suivre tout aussi clairement cette structure de connexions lors de l'interrogation de la base de données.

3. Modèle relationnel. Le modèle relationnel est né de la volonté de rendre la base de données la plus flexible possible. Ce modèle fournissait un mécanisme simple et efficace pour maintenir les relations entre les données.

Premièrement, toutes les données du modèle sont présentées sous forme de tableaux et uniquement de tableaux. Le modèle relationnel est le seul qui assure l'uniformité de la présentation des données. Les deux entités et les connexions de ces mêmes entités sont représentées dans le modèle exactement de la même manière : tableaux . Certes, cette approche complique la compréhension de la signification des informations stockées dans la base de données et, par conséquent, la manipulation de ces informations.

Permet d'éviter les difficultés de manipulation deuxième élément modèles – un langage relationnellement complet (notez que le langage fait partie intégrante de tout modèle de données, sans lui le modèle n'existe pas). L'exhaustivité d'un langage lorsqu'il est appliqué à un modèle relationnel signifie qu'il doit effectuer toute opération d'algèbre relationnelle ou de calcul relationnel (l'exhaustivité de ce dernier a été prouvée mathématiquement par E.F. Codd). De plus, le langage doit décrire toute requête en termes d'opérations sur les tables, et non sur leurs lignes. L'un de ces langages est SQL.

Troisième élément Le modèle relationnel nécessite que le modèle relationnel maintienne certaines contraintes d'intégrité. L'une de ces contraintes stipule que chaque ligne d'une table doit avoir un identifiant unique appelé clé primaire . La deuxième limitation est imposée sur l'intégrité des liens entre les tables. Il indique que les attributs de table qui font référence aux clés primaires d'autres tables doivent avoir l'une de ces valeurs de clé primaire.

4. Modèle orienté objet. De nouveaux domaines de la technologie informatique, tels que la recherche scientifique, la conception assistée par ordinateur et l'automatisation institutionnelle, ont nécessité des bases de données capables de stocker et de traiter de nouveaux objets : texte, audio, vidéo et documents. Les principales difficultés de la modélisation de données orientées objet proviennent du fait qu’il n’existe pas d’appareil mathématique aussi développé sur lequel un modèle général de données orienté objet pourrait être basé. C’est en grande partie la raison pour laquelle il n’existe toujours pas de modèle de base orienté objet. D’un autre côté, certains auteurs soutiennent qu’un modèle de données général orienté objet au sens classique ne peut pas être défini parce que le concept classique de modèle de données n’est pas adapté au paradigme orienté objet. Malgré les avantages des systèmes orientés objet - mise en œuvre de types de données complexes, communication avec des langages de programmation, etc. – dans un futur proche, la supériorité des SGBD relationnels est garantie.

5.3.3 Modèles de données et modélisation conceptuelle

Il a déjà été mentionné ci-dessus qu'un schéma est créé à l'aide d'un langage de définition de données. En fait, il est créé sur la base du langage de définition de données du SGBD cible spécifique, qui est un langage de niveau relativement bas ; avec son aide, il est difficile de décrire les exigences en matière de données afin que le diagramme créé soit compréhensible pour les utilisateurs de différentes catégories. Pour parvenir à une telle compréhension, il est nécessaire de créer une description du schéma à un niveau supérieur, que nous appellerons un modèle de données. Dans ce cas, par modèle de données, nous comprendrons un ensemble intégré de concepts pour décrire les données, les connexions entre elles et les restrictions imposées aux données dans un certain domaine.

Un modèle est une représentation d'objets et d'événements dans un domaine, ainsi que des relations qui existent entre eux. Un modèle de données peut être considéré comme une combinaison des trois composants suivants.

· Partie structurelle, c'est-à-dire un ensemble de règles par lesquelles une base de données peut être construite.

· La partie contrôle, qui détermine les types d'opérations autorisées avec les données (cela inclut les opérations de mise à jour et de récupération des données, ainsi que les opérations de modification de la structure de la base de données).

· Un ensemble de contraintes d'intégrité des données qui garantissent l'exactitude des données utilisées.

Le but de la création d’un modèle de données est de présenter les données de manière compréhensible. Si une telle représentation est possible, le modèle de données peut alors être facilement appliqué lors de la conception d'une base de données. Pour représenter l'architecture ANSI-SPARC, les trois modèles de données associés suivants peuvent être définis :

· un modèle de données externe qui affiche des vues de chaque type d'utilisateur existant dans l'organisation ;

· un modèle de données conceptuel qui affiche une vue logique (ou généralisée) des données, indépendamment du type de SGBD sélectionné ;

· un modèle de données interne qui affiche le schéma conceptuel d'une manière spécifique et compréhensible pour le SGBD cible sélectionné.

De nombreux modèles de données ont été proposés et publiés dans la littérature. Ils sont divisés en trois catégories : les modèles de données basés sur des objets, les modèles de données basés sur des enregistrements et les modèles de données physiques. Les deux premiers sont utilisés pour décrire les données aux niveaux conceptuel et externe, et le dernier au niveau interne.

Modèles de données objet. Lors de la création de modèles de données objet, des concepts tels que les entités, les attributs et les relations sont utilisés. Une entité est un élément distinct (employé, produit, concept ou événement) d'un domaine qui doit être représenté dans la base de données. Un attribut est une propriété qui décrit un aspect d'un objet et dont la valeur doit être capturée, et une relation est une relation associative entre entités. Vous trouverez ci-dessous certains des types de modèles d’objets de données les plus courants.

Modèle Entité-Relation ou modèle ER.
Modèle sémantique.
Modèle fonctionnel.
Modèle orienté objet.

Actuellement, le modèle ER est devenu l'une des principales méthodes de conception de bases de données conceptuelles. Le modèle orienté objet étend la définition d'une entité pour inclure non seulement les attributs qui décrivent l'état de l'objet, mais également les actions qui lui sont associées, c'est-à-dire son comportement. Dans ce cas, l’objet est censé encapsuler l’état et le comportement.

Modèles de données basés sur des enregistrements. Dans un modèle basé sur les enregistrements, une base de données se compose de plusieurs enregistrements de format fixe qui peuvent être de différents types. Chaque type d'enregistrement définit un nombre fixe de champs, chacun ayant une longueur fixe. Il existe trois principaux types de modèles de données logiques basés sur des enregistrements : le modèle de données relationnel, le modèle de données réseau et le modèle de données hiérarchique.