BASE DE CONNAISSANCES

Décider entre la jointure de tables et la fusion des données


Date de publication : 12 Apr 2017
Date de dernière modification : 30 Jul 2020

Question

Comment déterminer s'il faut utiliser la liaison de tables ou la fusion des données

Environnement

Tableau Desktop

Réponse

Évaluez vos données et tenez compte des facteurs suivants :
  • Nombre de connexions dans votre classeur
  • Relations entre les données dans chaque source
  • Le nombre d'enregistrements dans vos données
  • Les types de vues que vous avez besoin de créer
Dans la plupart des cas, les jointures de tables traditionnelles sont le meilleur choix car elles offrent généralement les meilleures performances, la tâche étant effectuée par la base de données plutôt que par l'ordinateur local. En règle générale, les jointures entre bases de données sont recommandées de préférence à la fusion des données car elles comportent moins de limitations.
  • Il est généralement possible de lier les tables provenant de différentes sources de données à l'aide d'une jointure entre bases de données. Consultez Combiner des tables provenant de bases de données différentes.
  • Tableau Desktop ne peut pas lier les sources de données publiées, la plupart des sources de données qui sont des extraits uniquement, ou les sources de données de type cube. Vous pouvez envisager de déplacer les données vers une autre source de données, ou de créer une copie locale de la source de données publiée afin d'utiliser une jointure entre bases de données, sans quoi vous devrez fusionner les données.
  • Si la table secondaire comporte une grande quantité de données, la fusion des données peut être plus rapide car cette opération commence par agréger les données.
  • Les jointures de tables fonctionnent mieux lorsque les tables ont une relation 1:1 (par exemple, s'il y a un seul enregistrement pour chaque valeur dans les champs de liaison dans chaque table). Si les tables ont une relation 1-à-plusieurs ou plusieurs-à-plusieurs, des données en double sont créées après la jointure. Consultez Valeurs biaisées (en positif) ou valeurs dupliquées
    Remarque : vous pouvez résoudre les données en double après la création de la jointure de tables, mais l'augmentation de la quantité de données peut provoquer des problèmes de performances.
  • La fusion des données présente plusieurs limitations en raison des contraintes de conception. Pour plus d'informations sur les problèmes courants liés à la fusion des données, consultez Résoudre les problèmes de fusion des données ainsi que les liens associés dans le côté droit de cet article
  • La fusion des donnés peut uniquement être une jointure GAUCHE, ce qui signifie que la table principale doit contenir toutes les valeurs possibles.
  • La fusion des données peut être plus modulable afin que vous puissiez modifier rapidement les propriétés de liaison à la volée en vue d'une analyse ad hoc. Par exemple, avec la fusion des données, les sources de données peuvent être liées à des alias.

Informations supplémentaires

Si l'une des sources de données que vous souhaitez utiliser pour la fusion des données est de type cube, le cube doit être la source de données principale.

Discuter de cet article... Forum de commentaires
Cet article vous a-t-il permis de résoudre le problème ?