KNOWLEDGE BASE

Erstellen einer Korrelationswertmatrix


Veröffentlicht: 15 Aug 2017
Zuletzt geändert am: 20 Jul 2023

Frage

Wie wird eine Korrelationswertmatrix in Tableau Desktop erstellt?

Beispielsweise kann diese Ansicht die Frage beantworten, ob zwischen den vom Vertrieb nachverfolgten Produktunterkategorien, die ein Kunde kauft, eine Korrelation besteht.Anders gesagt: Wenn Kunden Produkte aus der Unterkategorie X kaufen, ist dann die Wahrscheinlichkeit, dass sie auch Produkte aus Unterkategorie Y kaufen, höher oder niedriger?

Umgebung

  • Tableau Desktop 10.2+
  • Die Funktion "CORR()" ist nicht für alle Datenquellen verfügbar.  Weitere Informationen finden Sie unter dem Eintrag "CORR" in Tableau-Funktionen (alphabethisch)

Antwort

Ab Tableau Desktop 10.2 kann die Funktion CORR() zur Berechnung des Pearson-Korrelationskoeffizienten verwendet werden. In der beigefügten Beispielarbeitsmappe Correlaton Value Matrix.twbx werden die folgenden Anweisungen anhand des Beispieldatensatzes "Superstore" demonstriert:

Schritt 1 – Einrichten der Selbstverknüpfung

  1. Navigieren Sie zur Registerkarte "Datenquelle".
  2. Ziehen Sie eine zweite Kopie der Tabelle "Orders" (Bestellungen) in den Arbeitsbereich.
  3. Erstellen Sie eine INNER-Verknüpfung für "Customer Name = Customer Name (Orders)" (Kundenname = Kundenname (Bestellungen)).
Hinweis: In diesem Beispiel geht es um die Frage, ob Kunden eher Produkte aus der Unterkategorie X kaufen, wenn sie bereits Produkte aus Unterkategorie Y gekauft haben. Eine Variation dieser Frage könnte sein, ob eine höhere Wahrscheinlichkeit besteht, dass eine Bestellung Produkte der Unterkategorie X enthält, wenn sie bereits Produkte aus der Unterkategorie Y enthält. Für diese Variation sollten Sie eine Verknüpfung für "Order ID = Order ID (Orders)" (Auftrags-ID = Auftrags-ID (Bestellungen)) erstellen.

Mit anderen Worten sollte die Join-Klausel die Felder beinhalten, die den Vergleichsbereich definieren.

Schritt 2 – Berechnen des Pearson-Korrelationskoeffizienten

  1. Wählen Sie Analyse > Berechnetes Feld erstellen aus.
  2. Benennen Sie das berechnete Feld "Pearson-Korrelationskoeffizient", geben Sie die folgende Formel ein und klicken Sie auf OK:
    CORR( { INCLUDE [Customer Name] : SUM( [Sales (Orders)])}, { INCLUDE [Customer Name] : SUM( [Sales])})
Hinweis: [Customer Name] sollte durch das/die Feld(er) ersetzt werden, die in der Join-Klausel in Schritt 1 bis 3 verwendet werden. Der INCLUDE-Ausdruck ist nicht erforderlich, wenn die zugrundeliegenden Daten nur einen Datensatz pro Kunde enthalten.

Schritt 2 – Erstellen eines berechneten Felds zum Filtern des Werts

  1. Wählen Sie Analyse > Berechnetes Feld erstellen aus.
  2. Benennen Sie das berechnete Feld "Filter für nicht in der gleichen Unterkategorie", geben Sie die folgende Formel ein und klicken Sie auf OK:
    [Sub-Category] != [Sub-Category (Orders)]

Schritt 4 – Erstellen der Ansicht

  1. Ziehen Sie [Sub-Category] (Unterkategorie) in den Spalten-Container.
  2. Ziehen Sie [Sub-Category (Orders)] in den Zeilen-Container:
  3. Ziehen Sie [Pearson-Korrelationskoeffizient] auf der Karte "Markierungen" auf "Farbe".
  4. Ziehen Sie [Pearson-Korrelationskoeffizient] auf der Karte "Markierungen" auf "Text".
  5. Ändern Sie im Dropdown auf der Karte "Markierungen" den Markierungstyp in "Quadratisch".
  6. Ziehen Sie [Filter für nicht in der gleichen Unterkategorie] auf den Filter-Container.
  7. Wählen Sie im Dialogfeld "Filter" die Option "Wahr" aus und klicken Sie auf "OK".

Zusätzliche Informationen

Pearson-Korrelationskoeffizient ist ein hochentwickeltes Statistiktool. Bevor Sie dieses Tool verwenden, sollten Sie genauer mit diesem Tool vertraut machen. Weitere Informationen zu diesem Thema finden Sie in den folgenden Artikeln: Hinweis: Die beigefügte Arbeitsmappe Correlaton Value Matrix.twbx  dieses Artikels enthält auch ein Beispiel für eine Korrelationsstreuung.

Hat dieser Artikel das Problem gelöst?