Introduction aux bases de données Hiver 2021

Geoffrey Glangine, M.Sc.

8TRD151

Introduction

Quelques exemples... Image introuvable !
Quelques exemples... Image introuvable !
Quelques exemples... Image introuvable !
Quelques exemples... Image introuvable !

Comment peut on utiliser autant de données de manière transparente ?

  • Livres
  • Clients
  • Achats
  • Recherches

Une base de données !

Quelques exemples... Image introuvable !

Quelques exemples...

  • Banques
  • Assurances
  • Restaurants
  • Centres de ski
  • Netflix
  • ...

Explosion des données

Jusqu'à 2013 5 exaoctets de données ont été créées au total.

En 2014, 5 exaoctets de données ont été créées.

Nombres de données crées en zeta octets

Un zeta octet = 1 126 000 000 000 000 000 000 octets

Image introuvable !

Toutes ses données sont stockées dans des bases de données.

Mais comment faisait-on avant l'invention des bases de données ?

connaissez vous l'archiviste ? Cette personne à qui l'on peut demander de nous trouver un document important stocké dans les longues étagères d'une institution ?

Image introuvable !

imaginons une entreprise de location de logements.

Chaque département dispose de cabinets dans lequel sont rangé des classeurs, triés dans un ordre spécifique.

Les dossiers peuvent être sécurisés avec des cabinets que l'ont peut fermer à clefs

Image introuvable !

Exemple de fiche provenant du département des ventes

Image introuvable !

Exemple de fiche provenant du département des contrats

Image introuvable !

Organisation

Les données qui ont un lien logique sont stockées ensemble.

  • Les informations sur un client sur la même fiche.
  • Les informations sur les clients dans le même dossier.
  • Les informations du département dans le même classeur ou cabinet.

Oui mais les ordinateurs ont été inventés avant les bases de données !

Après l'invention des ordinateurs, les informations importantes étaient stockées dans des fichiers et dossiers, tous plus ou moins en lien les uns avec les autres.

Exactement de la même manière que physiquement sur les fiches et les cabinets.

Voici une vidéo d'archive qui montre le passage de l'archivage papier à l'informatique (années 1960)

Le passage des données sous forme informatique se fait sous cette forme :

Image introuvable !

Le passage des données sous forme informatique se fait sous cette forme :

Le passage à l'aire des données informatisée a permis beaucoup de gain de temps, cependant des limites sont identifiables.

Les limites :

Séparation et isolation des données

Difficile de répondre à une question faisant appel à des champs de deux fichiers différents.

Quelles sont les maisons répondant aux exigences d'au moins un client?

Les limites :

Duplication des données

La même donnée peut se trouver dans plus d'un fichier, voire dans plus d'un département (ex.: l'adresse d'un client).

  • Gaspillage de l'espace de stockage
  • Facile de perdre l'intégrité des données

Les limites :

Dépendance des données

la donnée est très dépendante du type de programme qui va ouvrir le fichier

  • Modification du type de donnée ?
  • Modification du logiciel qui lit les données ?

Les limites :

Formats de fichier incompatibles

La même donnée peut être représentée de deux manières différentes dans deux fichiers différents.

Ex.: chercher les détails de chaque propriété faisant l'objet d'un contrat.

  • Nécessite de fusionner les enregistrements du fichier Contrat avec ceux du fichier Propriété, selon le numéro de propriété.
  • Que faire si le numéro est stocké comme un octet dans l'un, et comme une chaîne de caractères dans l'autre?

Les limites :

Prolifération de programmes

Pour chaque question qu'on se pose, il faut écrire un script différent pour trouver la réponse.

  • Très peu de réutilisation du travail possible
  • Difficile de comprendre ce que calcule un script en lisant son code
  • Qu'en est-il de la sécurité et de l'intégrité des données?
  • Comment gérer l'accès simultané aux données par plusieurs scripts?

Solution miracle !

La base de données !

Collection partagée de données liées logiquement, ainsi que la description de ces données, conçues pour répondre aux besoins d'information d'une organisation.

Une BD offre également l'abstraction des données: on ne s'occupe pas de la représentation physique de l'information

Une base de données est composée de :

Entité: objet distinct (personne, lieu, chose, etc.) de l'organisation que l'on cherche à représenter

Attribut: propriété décrivant un aspect d'une entité

-> Relation: association entre entités

Le SGBD

Abréviation pour : Système de Gestion de Base de Données.

C'est le système qui permet :

  • La création de bases de données
  • L'accès aux données
  • De servir d'intermédiaire entre une BD et un logiciel utilisant les données de celle ci

Le SGBD

Image introuvable !

Le SGBD

Le SGBD fourni :

  • Un langage pour la définition des données (LDD)
  • Un langage de manipulation des données (LM)
  • De servir d'intermédiaire entre une BD et un logiciel utilisant les données de celle ci

Un des langages les plus populaires est SQL

Le SGBD

Le SGBD fourni :

Un mécanisme de contrôle d'accès à la BD

  • Assure la confidentialité en empêchant les accès non autorisés
  • Assure l'intégrité des données en vérifiant que chaque opération laisse la BD dans un état valide
  • Coordonne l'accès simultané à la BD par plusieurs utilisateurs
  • Effectue des sauvegardes pour répondre aux pannes ou aux bris
  • Fournit un catalogue des métadonnées

Architecture de logiciels utilisants une bases de donnée

Image introuvable !

Les avantages des bases de données :

  • Contrôle de la redondance des données
  • Cohérence des données
  • Plus d'information avec les mêmes données
  • Intégrité accrue
  • Confidentialité accrue
  • Application de conventions

Les avantages des bases de données :

  • Économie d'échelle
  • Accessibilité accrue aux données
  • Productivité accrue
  • Gestion améliorée grâce à l'indépendance des données
  • Concurrence accrue
  • Services de sauvegarde et de récupération améliorés