Data Warehouse

Qu'est-ce qu'un entrepÎt de données ?

Un Data Warehouse (en français "entrepÎt de données") est une base de données spécialement optimisée pour les analyses. Elle rassemble les données de différentes sources et de différentes structures. On obtient ainsi une vue globale des informations.

Sommaire
    Add a header to begin generating the table of contents
    Temps de lecture : 3:13 min

    Comment fonctionne un Data Warehouse ?


    Le stockage et le regroupement des données dans un entrepÎt de données central (DWH) suit un processus en plusieurs étapes. Celui-ci est également appelé Data Warehousing et se présente comme suit :

    Étape Description
    1. Acquisition et intégration des données Extraire les données des sources, les transformer et les intégrer dans le Data Warehouse
    2. Conservation des données Stockage à long terme des données dans le Data Warehouse
    3. Comprendre les données Analyse structurée des données
    4. Mise à disposition des données Stockage des données pour les données séparées nécessaires
    Stocks de données (Data Marts) à des fins d'analyse spécifiques
    Schéma Data Warehouse

    Data Warehouse vs. Data Lake

    Il ne faut pas confondre un Data Warehouse avec un Data Lake. Ce dernier est uniquement responsable de la rĂ©ception de grandes quantitĂ©s de donnĂ©es brutes (Big Data), alors que les informations dans un Data Warehouse sont dĂ©jĂ  prĂ©parĂ©es Ă  l’aide de l’exploration de donnĂ©es.

    Qu’est-ce que le processus ETL ?

    Le processus ETL est responsable de l’intĂ©gration des donnĂ©es provenant de diffĂ©rentes sources dans les Data Warehouse. Il est particuliĂšrement utilisĂ© dans les scĂ©narios impliquant de grandes quantitĂ©s de donnĂ©es, comme c’est le cas dans le domaine des Big Data et de la Business Intelligence.

    ETL est l’abrĂ©viation des Ă©tapes suivantes :

    Extract : Extraire les données des systÚmes sources (par exemple des systÚmes opérationnels comme ERP ou des sources externes).

    Transform : transformation du contenu et de la structure des données dans le schéma et le format de la base de données cible.

    Load : Chargement des données transformées dans le Data Warehouse (ou un autre systÚme).

    Dans le passé, le chargement se faisait souvent de maniÚre tournante (par exemple tous les mois) pour des raisons de ressources. Mais depuis peu, la tendance est clairement au chargement en temps réel. On parle aussi de Warehouse en temps réel.

    Comment utiliser les Data Warehouse ?

    Les Data Warehouse offrent plusieurs possibilitĂ©s d’utilisation pour les entreprises. En gros, on peut citer les suivantes :

    • Mise Ă  disposition rapide et flexible de donnĂ©es pour des statistiques, des rapports et des chiffres clĂ©s.
    • DĂ©termination de relations et de modĂšles dans les donnĂ©es grĂące au data mining ou au traitement analytique en ligne.
    • CrĂ©ation de transparence sur les questions de gestion d’entreprise
    • Mise Ă  disposition de nombreuses informations sur les objets commerciaux
    • Utilisation des donnĂ©es de la production dans le cadre de l’industrie 4.0
    Sommaire
      Add a header to begin generating the table of contents
      À propos de weclapp
      weclapp Teamwork Video Cover
      L'auteur de cet article est , CEO & Fondateur du fournisseur de logiciel ERP weclapp.

      Articles similaires

      Clause de non-responsabilité
      Le contenu de cet article doit ĂȘtre considĂ©rĂ© comme des informations et des conseils sans engagement. weclapp SE ne garantit pas l’exactitude du contenu des informations.

      À propos de weclapp
      weclapp Teamwork Video Cover