L’acte consistant à récupérer ou à extraire des données est une technique permettant d’associer de nombreuses données. L’idée de l’extraction, c’est littéralement « d’aspirer » des données provenant de différentes sources. Objectif : les mettre toutes dans un fichier commun.

Données en XML

Un format fréquent pour connecter plusieurs types de données est le XML. Ce dernier est un langage de programmation permettant la structuration de données. Le XML sert principalement à gérer et échanger des informations sur Internet.

L’idée globale pour connecter les données est relativement simple : chaque source utilise un outil appelé « extracteur ». Ce dernier sert à extraire les données nécessaires pouvant acheminer les données sur le lieu de stockage appelé « entrepôt de données » dans le jargon.

Techniques de rafraîchissement des données

L’extracteur des données doit impérativement avoir une stratégie permettant de « maintenir » les informations collectées. Cet acte porte le nom de « rafraîchissement ». Ce dernier peut être déclenché ou se faire, selon une périodicité pré-déterminée.

  • Le rafraîchissement périodique a un avantage principal : il libère l’utilisateur des contraintes liées au réglage des paramètres permettant de récupérer les données. Ces dernières sont systématiquement exportées vers l’entrepôt. Cela peut se faire chaque heure, chaque jour, chaque semaine…
  • Le rafraîchissement déclenché : il permet d’éviter d’exporter des paquets de données incomplets. Il suffit d’attendre la fin d’un processus pour tout exporter en une fois. Par exemple, une fois qu’une personne hospitalisée quitte le centre de soins, l’ensemble de son dossier médical et des soins qui lui ont été prodigués peuvent être exportées en une seule fois.

Aucune des deux techniques suscitées n’est meilleure. Tout dépend de ce que vous souhaitez faire et du type de données que vous voulez récupérer ou extraire.

La mise en œuvre de ce processus de récupération de données inclut la réplication des systèmes de gestion de base de données communément désignés par les quatre lettres (S.G.B.D.).

Il faut aussi des mécanismes de déclenchement qui utilisent le plus souvent les journaux de navigation.