BASE DE CONNAISSANCES

Trouver la corrélation Pearson


Date de publication : 15 Feb 2017
Date de dernière modification : 01 Aug 2023

Question

Comment trouver la corrélation Pearson de deux mesures dans Tableau Desktop.

Environnement

Tableau Desktop
 

Réponse

Étape 1 : créer un nuage de points
Cet exemple utilise les échantillons de données Superstore et est joint à cet article. Ouvrez le classeur Pearson Correlation.twbx pour plus d'informations.  
  1. Faites glisser Profit vers Colonnes et Sales vers Lignes.
  2. Dans le menu Analysis (Analyse), désélectionnez Aggregate Measures (Agréger les mesures)
  3. Cliquez avec le bouton droit de la souris dans la vue et choisissez Courbes de tendance > Afficher les courbes de tendance.
  4. Cliquez à nouveau avec le bouton droit de la souris dans la vue et sélectionnez Trend Lines (Courbes de tendance) > Describe Trend Model (Décrire le modèle de tendance).  
  5. Localisez la valeur R au carré dans la boîte de dialogue Décrire le modèle de tendance. Dans cet exemple, la valeur R au carré est 0.229503.
Étape 2 : calculer la corrélation Pearson

Vous pouvez utiliser différentes options pour trouver la corrélation Pearson. Par exemple : 

  1. Utilisez un calculateur ou autre programme
    1. Calculez la racine carrée de la valeur R-Squared qui sera votre corrélation (r) : √0.229498 = 0.4791
    2. Arrondie à deux chiffres, la valeur dans cet exemple est 0.48.
  2. Créez un champ calculé à l'aide de la fonction CORR
    • Saisissez une formule du type suivant puis cliquez sur OK : 
      CORR([Profit], [Sales])
    • Cette formule renvoie le coefficient de corrélation Pearson de deux expressions. La corrélation Pearson mesure la relation linéaire entre deux variables. Les résultats vont de -1 à +1 inclus, où 1 dénote une relation linéaire positive exacte, comme lorsqu'un changement positif dans une variable implique un changement positif de magnitude correspondante dans l'autre, 0 ne dénote aucune relation linéaire entre la variance, et -1 est une relation négative exacte.
  3. Créez un champ calculé à l'aide de la fonction WINDOW_CORR
    • Saisissez une formule du type suivant puis cliquez sur OK : 
      WINDOW_CORR(SUM([Profit]), SUM([Sales]))
    • Renvoie le coefficient de corrélation Pearson de deux expressions dans la fenêtre. La fenêtre est définie en tant que décalages à partir de la ligne actuelle. Utilisez FIRST()+n et LAST()-n pour des décalages à partir de la première ou de la dernière ligne de la partition. Si le début et la fin sont omis, la partition entière est utilisée.
  Remarque : la vidéo n'a pas de son. 
 
Pour plus d'exemples et des explications avancées, consultez Covariance, courbes de tendance, coefficient de corrélation R et R au carré dans la communauté.

Informations supplémentaires

  • Une corrélation, r, correspond à un chiffre unique qui représente le degré de relation entre deux mesures. Le cœfficient de corrélation est une valeur, telle que -1 <= r <= 1.
  • Une corrélation positive indique une relation entre les mesures x et y telle que, lorsque les valeurs de x augmentent, les valeurs de y augmentent également.
  • Une corrélation négative indique le contraire : à mesure que les valeurs de x augmentent, les valeurs de y diminuent.
  • Plus la corrélation, r, est proche de -1 ou 1, plus la relation entre x et y est forte.
  • Si r est proche de 0 ou égal à 0, la relation entre les mesures est faible ou absente.
  • En règle générale, vous pouvez interpréter les valeurs R comme suit :
    • +.70 ou supérieur indique une relation positive très puissante
    • +.40 à +.69 indique une relation positive puissante
    • +.20 à +.39 indique une relation positive modérée
    • -.19 à +.19 indique une relation faible ou aucune relation
    • -.20 à -.39 indique une relation négative modérée
    • -.40 à -.69 indique une relation négative puissante
    • -.70 ou inférieur indique une relation négative très puissante
Consultez les sources de données prises en charge pour la fonction agrégée CORR() dans Tableau Help
 
Cet article vous a-t-il permis de résoudre le problème ?