KNOWLEDGE BASE

Ermitteln der Pearson-Korrelation


Veröffentlicht: 15 Feb 2017
Zuletzt geändert am: 01 Aug 2023

Frage

So ermitteln Sie die Pearson-Korrelation zwischen zwei Kennzahlen in Tableau Desktop.

Umgebung

Tableau Desktop
 

Antwort

Schritt 1: Erstellen eines Streudiagramms
In diesem Beispiel werden die Daten aus der Beispieldatenquelle "Superstore" verwendet. Diese befindet sich im Anhang zu diesem Artikel. Öffnen Sie die Arbeitsmappe Pearson Correlation.twbx, um weitere Informationen zu erhalten.  
  1. Ziehen Sie "Gewinn" auf Spalten und "Umsatz" auf Zeilen.
  2. Deaktivieren Sie Kennzahlen aggregieren im Menü Analyse
  3. Klicken Sie mit der rechten Maustaste auf die Ansicht, und wählen Sie Trendlinien > Trendlinien anzeigen aus.
  4. Klicken Sie erneut mit der rechten Maustaste, und wählen Sie Trendlinien > Trendmodell beschreiben aus. 
  5. Suchen Sie den Wert für das Bestimmtheitsmaß im Dialogfeld "Trendmodell beschreiben". In diesem Beispiel hat das Bestimmtheitsmaß den Wert 0,229503.
Schritt 2: Berechnen der Pearson-Korrelation

Für die Ermittlung der Pearson-Korrelation bestehen mehrere Möglichkeiten. Beispiel: 

  1. Verwenden eines Taschenrechners oder eines anderen Programms
    1. Berechnen Sie die Quadratwurzel des Bestimmtheitsmaßes. Das ist dann Ihre Korrelation (r): √0,229498 = 0,4791
    2. Gerundet auf zwei Nachkommastellen beträgt der Wert in diesem Beispiel 0,48.
  2. Erstellen Sie ein berechnetes Feld mithilfe der Funktion CORR
    • Geben Sie eine der folgenden Formel ähnliche Formel ein und klicken Sie auf OK
      CORR([Gewinn], [Umsatz])
    • Diese Formel gibt den Pearson-Korrelationskoeffizienten von zwei Ausdrücken zurück. Bei der Kennzahl der Pearson-Korrelation handelt es sich um eine lineare Beziehung zwischen zwei Variablen. Der Ergebnisbereich liegt zwischen -1 und +1 einschließlich, wobei 1 eine exakte positive lineare Beziehung bezeichnet, d. h. eine positive Änderung einer Variablen impliziert eine positive Änderung des zugehörigen Wertes der anderen Variablen. 0 bedeutet, dass keine lineare Beziehung zwischen der Varianz besteht, und -1 bedeutet eine exakte negative Beziehung.
  3. Erstellen Sie ein berechnetes Feld mithilfe der Funktion WINDOW_CORR
    • Geben Sie eine der folgenden Formel ähnliche Formel ein und klicken Sie auf OK
      WINDOW_CORR(SUM([Gewinn]), SUM([Umsatz]))
    • Gibt den Pearson-Korrelationskoeffizienten zweier Ausdrücke innerhalb des Fensters zurück. Das Fenster ist jeweils als Versatz von der aktuellen Zeile definiert. Verwenden Sie FIRST()+n und LAST()-n für den Versatz von der ersten oder letzten Zeile in der Partition. Falls Anfang und Ende nicht angegeben werden, wird die gesamte Partition verwendet.
  Hinweis: Für das Video ist kein Ton verfügbar.
 
Weitere Beispiele und ausführliche Erläuterungen finden Sie in der Community unter Kovarianz, Trendlinien, Korrelationskoeffizient R und Bestimmtheitsmaß.

Zusätzliche Informationen

  • Bei dem Korrelationskoeffizienten "r" handelt es sich um eine einzelne Zahl, die als Maß für den Grad des Zusammenhangs zwischen zwei Kennzahlen dient. Der Korrelationskoeffizient kann einen Wert zwischen -1 <= r <= 1 annehmen.
  • Eine positive Korrelation gibt folgenden Zusammenhang zwischen den Kennzahlen x und y an: Wenn sich die Werte von x erhöhen, erhöhen sich die Werte von y ebenfalls.
  • Eine negative Korrelation gibt genau das Gegenteil an: Wenn sich die Werte von x erhöhen, verringern sich die Werte von y.
  • Je näher der Korrelationskoeffizient r an -1 oder 1 liegt, desto höher ist der Grad des Zusammenhangs zwischen x und y.
  • Wenn der Koeffizient r nahe 0 liegt oder einen Wert von 0 aufweist, hängen die Kennzahlen nur bedingt oder gar nicht voneinander ab.
  • In der Regel können Sie die r-Werte wie folgt interpretieren:
    • Bei einem Wert von +0,70 oder höher besteht ein sehr starker positiver Zusammenhang.
    • Bei einem Wert von +0,40 bis +0,69 besteht ein starker positiver Zusammenhang.
    • Bei einem Wert von +0,20 bis +0,39 besteht ein mäßiger positiver Zusammenhang.
    • Bei einem Wert von -0,19 bis +0,19 besteht kein oder nur ein geringer Zusammenhang.
    • Bei einem Wert von -0,20 bis -0,39 besteht ein mäßiger negativer Zusammenhang.
    • Bei einem Wert von -0,40 bis -0,69 besteht ein starker negativer Zusammenhang.
    • Bei einem Wert von -0,70 oder niedriger besteht ein sehr starker negativer Zusammenhang.
Beachten Sie die unterstützten Datenquellen für die Aggregatfunktion "CORR()" in der Tableau-Hilfe
 
Hat dieser Artikel das Problem gelöst?