KNOWLEDGE BASE

Creating a Correlation Value Matrix


Pubblicato: 15 Aug 2017
Data dell'ultima modifica: 20 Jul 2023

Domanda

Come creare una matrice del valore di correlazione in Tableau Desktop.

Ad esempio, questa vista può rispondere alla domanda: esiste una correlazione tra le sottocategorie di prodotti acquistate da un cliente monitorate dalle vendite? O in un altro modo di esprimerlo, se un cliente acquista prodotti della sottocategoria X, è più o meno probabile che acquisti anche dalla sottocategoria Y?

Ambiente

  • Tableau Desktop 10.2 e succ.
  • La funzione CORR() non è disponibile per tutte le origini dati. Per ulteriori informazioni, consulta la voce CORR di Funzioni di Tableau (alfabetiche)

Risposta

A partire dalla versione di Tableau Desktop 10.2, la funzione CORR() può essere utilizzata per calcolare il Coefficiente di correlazione di Pearson. La cartella di lavoro di esempio Correlaton Value Matrix.twbx utilizza l'insieme di dati campione Superstore per dimostrare le seguenti indicazioni:

Passaggio 1: imposta il join automatico

  1. Passa alla scheda Origine dati
  2. Trascina una seconda copia della tabella Ordini nell'area canvas
  3. Crea un join INNER su Nome cliente = Nome cliente (Ordini)
Nota: In questo esempio si chiede se un cliente ha maggiori probabilità di acquistare prodotti della sottocategoria X se ha già acquistato dalla sottocategoria Y. Una variazione di questa domanda potrebbe essere: è possibile che lo stesso ordine contenga con maggiore probabilità prodotti dalla sottocategoria X se già contiene prodotti dalla sottocategoria Y? In questa variante, il join dovrebbe essere su ID ordine = ID ordine (Ordini).

In altre parole, la clausola join deve trovarsi nel campo o nei campi che definiscono l'ambito del confronto.

Passaggio 2: calcola il coefficiente di correlazione di Pearson

  1. Seleziona Analisi > Crea campo calcolato
  2. Denomina il campo "Coefficiente di correlazione di Pearson", inserisci la seguente formula e fai clic su OK
    CORR( { INCLUDE [Customer Name] : SUM( [Sales (Orders)])}, { INCLUDE [Customer Name] : SUM( [Sales])})
Nota: [Nome cliente] deve essere sostituito con gli stessi campi utilizzati nella clausola join al passaggio 1-3. Non è necessario usare l'espressione INCLUDE se nei dati sottostanti è presente solo il record per cliente.

Passaggio 3: crea un campo calcolato per filtrare il valore

  1. Seleziona Analisi > Crea campo calcolato
  2. Denomina il campo "Non lo stesso filtro di sottocategoria", inserisci la seguente formula e fai clic su OK
    [Sub-Category] != [Sub-Category (Orders)]

Passaggio 4: crea la vista

  1. Trascina [Sottocategoria] nello spazio Colonne
  2. Trascina [Sottocategoria (Ordini)] nello spazio Righe
  3. Trascina [Coefficiente di correlazione di Pearson] su Colore nella scheda Indicatori
  4. Trascina [Coefficiente di correlazione di Pearson] su Testo nella scheda Indicatori
  5. Nel menu a discesa sulla scheda Indicatori, modifica il tipo di indicatore su Quadrato
  6. Trascina [Filtro non della stessa sottocategoria] sullo spazio Filtri
  7. Nella finestra di dialogo Filtro seleziona Vero e fai clic su OK

Ulteriori informazioni

Il coefficiente di correlazione di Pearson è uno strumento statistico sofisticato e si raccomanda di comprendere meglio il funzionamento di questo strumento prima di utilizzarlo. Per ulteriori informazioni su questo argomento, consulta i seguenti articoli: Nota: la cartella di lavoroMatrice del valore correlato.twbx allegata a questo articolo contiene anche un esempio di dispersione di correlazione.

Con questo articolo hai risolto il problema?