BASE DE CONNAISSANCES

Suppression de données dupliquées comportant des calculs de niveau de détail


Date de publication : 22 Dec 2015
Date de dernière modification : 02 Jun 2023

Question

Comment utiliser des calculs de niveau de détail pour supprimer des données dupliquées lors de la jointure de deux tables ou plus.

Environnement

  • Tableau Desktop
  • Jointures de tables

Réponse

Utilisez une expression FIXED pour supprimer les données en double.

Il est nécessaire de connaître quelle dimension de la source de données est unique pour chaque valeur de ligne, ou la combinaison de dimensions. Par exemple, si les mesures de la Table A ont un identificateur de lignes unique basé sur Date/heure, utilisez cette dimension pour supprimer les valeurs en double.

Une fois que la ou les dimensions nécessaires ont été trouvées, utilisez un calcul de niveau de détail pour supprimer les valeurs en double.

Par exemple :
{Fixed [Unique Dimension]: MIN([Measure])}

Si les lignes de la table sont identifiées de manière unique par une combinaison de plusieurs dimensions, utilisez un calcul de ce type où les dimensions 1 à 3 constituent un identificateur unique :
{Fixed [Dimension 1],[Dimension 2], [Dimension 3]: MIN([Measure])}

Pour afficher ces étapes en action, visionnez la vidéo ci-dessous :


 

Informations supplémentaires

Cette solution fonctionnera aussi pour supprimer les doublons créés par l'ajout de données à un extrait, où une ligne peut être dupliquée si la ligne se trouve à la fois dans l'extrait d'origine et les données ajoutées.
Expressions de niveau de détail
 
Cet article vous a-t-il permis de résoudre le problème ?