A la Une Actualités

Base de données : qu’est-ce que c’est ? Définition et présentation

Les bases de données informatiques sont utilisées dans un grand nombre d’entreprises pour stocker, organiser et analyser les données. Découvrez tout ce que vous devez savoir à ce sujet : qu’est-ce qu’une base de données, à quoi sert-elle, comment fonctionne-t-elle, quelles sont les différentes catégories, et quelles sont les meilleures.

Une base de données (que nous nommerons BDD par commodité) est une collection d’informations organisées afin d’être facilement consultables, gérables et mises à jour. Au sein d’une database, les données sont organisées en lignes, colonnes et tableaux. Elles sont indexées afin de pouvoir facilement trouver les informations recherchées à l’aide d’un logiciel informatique. Chaque fois que de nouvelles informations sont ajoutées, les données sont mises à jour, et éventuellement supprimées.

Qu’est-ce qu’une base de données ? Définition

Elles se chargent elles-mêmes de créer, de mettre à jour ou de supprimer des données. Elles effectuent également des recherches parmi les données qu’elles contiennent sur demande de l’utilisateur, et de lancer des applications à partir des données.

Les bases de données sont utilisées par de nombreuses entreprises dans toutes les industries. Elles sont notamment utilisées par les compagnies aériennes pour gérer les réservations. Elles sont utilisées pour la gestion de production. Pour les enregistrements médicaux dans les hôpitaux, ou encore pour les enregistrements légaux dans les compagnies d’assurances. Les bases de données les plus larges sont généralement utilisées par les agences gouvernementales, les grandes entreprises ou les universités.

Comment fonctionnent les bases de données ?

Les bases de données sont stockées sous forme de fichiers ou d’ensemble de fichiers sur un disque magnétique, une cassette, un disque optique ou tout autre type d’appareil de stockage. Les bases de données traditionnelles (hiérarchiques) sont organisées par champs (fields), enregistrements et fichiers. Un champ est une seule pièce d’information. Un enregistrement est un ensemble de champs. Un fichier est une collection d’enregistrements.

Par exemple, un répertoire téléphonique est l’équivalent d’un fichier. Il contient un ensemble d’enregistrements, et chaque enregistrement regroupe trois champs : nom, adresse et numéro de téléphone. En guise d’exemple, on peut aussi citer les catalogues de produits ou les inventaires.

La faculté de consulter ou de modifier une database (lire ou écrire) est conférée aux divers utilisateurs par un database manager (gestionnaire de base). Les bases de données sont principalement présentes au sein des systèmes mainframe les plus larges, mais on les retrouve aussi au sein de workstations distribuées de moindre envergure et autres systèmes midrange comme les IBM AS/400 ou même les ordinateurs personnels.

L’histoire des bases de données

L’histoire des bases de données remonte aux années 1960, avec l’apparition des bases de données réseau et des bases de données hiérarchiques. Dans les années 1980, ce sont les bases de données object-oriented qui ont fait leur apparition. Aujourd’hui, les bases de données prédominantes sont les SQL, NoSQL et bases de données cloud.

Il est aussi possible de classer les bases de données en fonction de leur contenu : bibliographique, textes, nombres ou images. Toutefois, en informatique, on classe généralement les bases de données en fonction de leur approche organisationnelle. Il existe de nombreux types de bases de données différentes : relationnelle, distribuée, cloud, NoSQL… Voici les différents types de bases de données.

Quels sont les différents types de bases de données

Dans le cas d’une grande database, les multiples utilisateurs doivent être en mesure de manipuler les informations qu’elle contient rapidement et n’importe quand. De plus, les grandes entreprises ont tendance à cumuler de nombreux fichiers indépendants comprenant des fichiers liés ou même des données se superposant. Dans le cadre d’une analyse de données, il est nécessaire que les données en provenance de plusieurs fichiers puissent être liées. C’est pourquoi différents types de bases de données ont été développé pour répondre à ces exigences : orientée texte, hiérarchique, réseau, relationnelle, orientée objet…

Base de données hiérarchique

Les bases de données hiérarchiques comptent parmi les plus anciennes bases de données. Au sein de cette catégorie, les enregistrements sont organisés dans une structure d’arborescence. Chaque niveau d’enregistrements découle sur un ensemble de catégories plus petites.

Base de données réseau

Les bases de données réseau sont également parmi les plus anciennes. Plutôt que de proposer des liens uniques entre différents ensembles de données à divers niveaux, les bases de données réseaux créent des liens multiples entre les ensembles en plaçant des liens, ou des pointeurs, sur un ensemble d’enregistrements ou un autre. La vitesse et la polyvalence des bases de données réseau ont conduit à une adoption massive de ce type de databases au sein des entreprises ou dans le domaine du e-commerce.

Base de données orientée texte

Une database orientée texte, ou flat file database, se présente sous la forme d’un fichier (une table) au format .txt ou .ini. Un fichier plat est un fichier texte, ou un fichier combinant du texte avec un fichier binaire. En général, dans ces bases de données, chaque ligne ne comporte qu’un enregistrement.La plupart des bases de données pour PC sont des bases de données orientées texte.

Base de données SQL (relationnelle)

Les bases de données relationnelles ont été inventées en 1970 par E.F. Codd de IBM. Il s’agit de documents tabulaires dans laquelle les données sont définies afin d’être accessibles et de pouvoir être réorganisées de différentes manières.

Les bases de données relationnelles sont constituées d’un ensemble de tableaux. Au sein de ces tableaux, les données sont classées par catégorie. Chaque tableau comporte au moins une colonne correspondant à une catégorie. Chaque colonne comporte un certain nombre de données correspondant à cette catégorie.

L’API standard pour les bases de données relationnelles est le Structured Query Language (SQL). Les bases de données relationnelles sont facilement extensibles, et de nouvelles catégories de données peuvent être ajoutées après la création de la database originale sans avoir besoin de modifier toutes les applications existantes.

Base de données distribuée

Une BDD distribuée est une database dont certaines portions sont stockées à plusieurs endroits physiques. Le traitement est réparti ou répliqué entre différents points d’un réseau.

Les bases de données distribuées peuvent être homogènes ou hétérogènes. Dans le cas d’un système de base de données distribuée homogène, tous les emplacements physiques fonctionnent avec le même hardware et tournent sous le même système d’exploitation et les mêmes applications de bases de données. Au contraire, dans le cas d’une database distribuée hétérogène, le hardware, les systèmes d’exploitation et les applications de bases de données peuvent varier entre les différents endroits physiques.

Base de données cloud

Dans ce cadre, elle est optimisée ou directement créée pour les environnements virtualisés. Il peut s’agir d’un cloud privé, d’un cloud public ou d’un cloud hybride.

Les bases de données cloud offrent plusieurs avantages comme la possibilité de payer pour la capacité de stockage et la bande passante en fonction de l’usage. Par ailleurs, il est possible de changer l’échelle sur demande. Ces bases de données offrent aussi une disponibilité plus élevée.

Base de données NoSQL

Les bases de données NoSQL sont utiles pour les larges ensembles de données distribuées. En effet, les bases de données relationnelles ne sont pas conçues pour le Big Data, et les ensembles de données trop larges peuvent poser des problèmes de performances.

Si une entreprise doit analyser d’importantes quantités de données non structurées, ou des données stockées sur plusieurs serveurs cloud virtuels, la database NoSQL est idéale. Avec l’essor du Big Data, les bases de données NoSQL sont de plus en plus utilisées.

Base de données orientée objets

Les objets créés à l’aide de langage de programmation orientés objets sont généralement stockés sur des bases de données relationnelles. Toutefois, en réalité, les bases de données orientées objets sont plus adaptées pour stocker ce type de contenu.

Plutôt que d’être organisée autour d’actions, les bases de données orientées objets sont organisées autour d’objets. De même, au lieu d’être organisées autour d’une logique, elles sont organisées autour des données. Par exemple, un enregistrement multimédia au sein d’une BDD relationnelle peut être défini comme un objet de données plutôt que comme une valeur alphanumérique.

Base de données orientée graph

Une base de données orientée graphe, ou graphe, est un type de database NoSQL utilisant la théorie des graphes pour stocker, cartographier et effectuer des requêtes sur les relations entre les données. Les bases de données graphe sont constituées de noeuds et de bords.

Chaque noeud représente une entité, et chaque bord représente une connexion entre les noeuds. Les bases de données graphes gagnent en popularité dans le domaine des analyses d’interconnexions. Par exemple, les entreprises peuvent utiliser une BDD graphe pour miner des données sur ses clients à partir des réseaux sociaux.

De plus en plus souvent, des bases de données jadis séparées sont combinées électroniquement sous forme de collections plus larges que l’on appelle les Data Warehouses. Les entreprises et les gouvernements utilisent ensuite des logiciels de Data Mining pour analyser les différents aspects des données. Par exemple, une agence gouvernementale peut procéder ainsi pour enquêter sur une entreprise ou une personne qui ont acheté une grande quantité d’équipement, même si les achats sont disséminés dans tout le pays ou répartis entre plusieurs subsidiaires.

Les bases de données relationnelles et non relationnelles peuvent-elles coexister ?

Il peut être tentant de voir les bases de données NoSQL comme un remplacement pour les bases de données relationnelles. Toutefois, en réalité, il peut y avoir de la place pour ces deux types de technologies dans la plupart des entreprises.

Les bases de données SQL et NoSQL prennent en charge les informations d’une façon différente et prennent en charge différents types de workloads. Plutôt que de prendre la place des bases de données relationnelles, les bases de données NoSQL permettent aux entreprises de viser de nouveaux objectifs, de relever de nouveaux défis.

Il est important de bien savoir dans quelle situation utiliser une database NoSQL, et dans quelle situation il est préférable d’utiliser une BDD relationnelle. En fonction de la nature du workload et des données sous-jacentes, il convient d’utiliser une solution relationnelle ou NoSQL.

Ainsi, les bases de données NoSQL conviennent davantage aux grands ensembles de données fréquemment exposés à de nouvelles informations, au sein desquels les enregistrements ont des structures variables ne se mariant pas bien aux modèles relationnels.

Une autre raison pour laquelle les bases de données non relationnelles ne remplaceront pas les bases de données relationnelles est que les vendeurs de bases de données relationnelles ont amélioré leurs produits pour les adapter aux applications Big Data. Non seulement ces deux technologies ont encore leur place en entreprise, mais il y a aussi de la place pour qu’elles poursuivent toutes les deux leur croissance de leur côté.

Comment le cloud transforme les bases de données

Les bases de données cloud se distinguent des bases de données traditionnelles par le fait qu’elles résident sur le cloud public, privé ou hybride et non sur des serveurs internes. On distingue deux environnements de bases de données cloud distincts : les bases de données traditionnelles, et les bases de données en tant que service (DBaaS).

Une database cloud traditionnelle peut être lancée sur l’infrastructure informatique d’une entreprise par le biais d’une machine virtuelle. La maintenance et la gestion de la base de données sont assurées par le personnel informatique de l’entreprise.

Dans le cas d’une DBaaS, l’entreprise s’abonne et elle repose sur l’infrastructure physique du fournisseur de services cloud. Le fournisseur se charge de la maintenance de l’infrastructure physique et de la base, tandis que le client est chargé de gérer le contenu et les opérations de la BDD. Certains fournisseurs proposent également de prendre en charge la gestion, une option très utile pour les petites entreprises qui ont besoin d’une database, mais n’ont pas l’expertise informatique.

Les bases de données cloud apportent de nombreux avantages par rapport à une base de données traditionnelle. Elles permettent tout d’abord d’éliminer les infrastructures physiques. L’infrastructure physique est en effet fournie à distance par le fournisseur de cloud qui se charge également de la maintenance et assure la disponibilité.

Le second avantage est économique puisque les bases de données cloud permettent de réduire les coûts. L’élimination de l’infrastructure physique permet de réduire les dépenses, et implique une réduction de l’effectif nécessaire et de la facture d’électricité. Le cloud permet aussi d’économiser de l’espace physique.

Un DBaaS présente encore plus d’avantages. L’utilisateur jouit d’une scalabilité instantanée, qui lui permet d’augmenter ou de réduire la capacité de sa database en fonction de ses besoins. Le fournisseur de services se charge rapidement d’augmenter la capacité allouée au client. En installer une sur site prendrait plusieurs mois pour parvenir au même résultat, avec la nécessité d’installer de nouveaux serveurs et autres ressources de communication.

Par ailleurs, les accords de niveaux de service obligent le fournisseur à garantir les performances de la BDD, la disponibilité et le temps de réponse. Si ce niveau de service n’est pas respecté, le client est remboursé. L’utilisateur d’une DBaaS profite aussi de l’expertise du fournisseur de services, chose qu’il serait très difficile de trouver auprès d’employés en raison des coûts élevés d’une telle qualification. Le fournisseur de DBaaS a des milliers de clients, et ce n’est donc pas un problème pour lui de recruter l’élite des administrateurs de bases de données.

Les fournisseurs de DBaaS s’assurent aussi que leurs logiciels de bases de données, leurs systèmes d’exploitation et toutes les technologies liées à leurs infrastructures soient à la pointe de la technologie. Ceci leur permet de rester compétitifs. Les fonctionnalités et la sécurité sont régulièrement mises à jour. Pour le client, c’est l’assurance de profiter des dernières technologies en date.

Lire la suite

 

ARTICLES SIMILAIRES

Laisser un Commentaire

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient. Accepter En savoir plus

NEWSLETTER

Inscrivez-vous et recevez régulièrement des arletes par mail

Vos informations ne seront pas partagées