BASE DE CONOCIMIENTO

Crear una matriz de valores de correlación


Publicado: 15 Aug 2017
Fecha de la última modificación: 20 Jul 2023

Pregunta

Cómo crear una matriz de valores de correlación en Tableau Desktop.

Por ejemplo, esta vista puede responder a la pregunta siguiente: ¿existe alguna correlación entre qué subcategorías de productos compra un cliente según las ventas? O, dicho de otra forma, si un cliente compra productos de la subcategoría X, ¿tiene más o menos probabilidad de comprar también algo de la subcategoría Y?

Entorno

  • Tableau Desktop 10.2 y versiones posteriores
  • La función CORR() no está disponible para todas las fuentes de datos.Para obtener más información, consulte la entrada CORR en Funciones de Tableau (alfabéticamente).

Respuesta

A partir de Tableau Desktop 10.2, la función CORR() se puede usar para calcular el coeficiente de correlación de Pearson. En el libro de trabajo de ejemplo adjunto, Correlaton Value Matrix.twbx, se usa el conjunto de datos de ejemplo Superstore para realizar una demostración de las instrucciones siguientes:

Paso 1: crear la unión automática

  1. Vaya a la pestaña Fuente de datos.
  2. Arrastre una segunda copia de la tabla Pedidos al área del lienzo.
  3. Cree la unión interior en Nombre de cliente = Nombre de cliente (Pedidos).
Nota: En este ejemplo se pregunta si un cliente tiene más probabilidad de comprar productos de la subcategoría X si ya ha comprado algo de la subcategoría Y. Una variación de esta pregunta sería: ¿hay más probabilidad de que el mismo pedido contenga productos de la subcategoría X si ya contiene productos de la subcategoría Y? En esta variación, la unión debe estar en ID de pedido = ID de pedido (Pedidos).

En otras palabras, la cláusula de unión debe estar en los campos que definan el ámbito de comparación.

Paso 2: calcular el coeficiente de correlación de Pearson

  1. Seleccione Análisis > Crear campo calculado.
  2. Asigne el nombre "Coeficiente de correlación de Pearson" al campo, escriba la fórmula siguiente y haga clic en Aceptar
    CORR( { INCLUDE [Customer Name] : SUM( [Sales (Orders)])}, { INCLUDE [Customer Name] : SUM( [Sales])})
Nota: [Nombre de cliente] se debe sustituir por los mismos campos usados en la cláusula de unión de los pasos 1, 2 y 3. No es necesario utilizar la expresión INCLUDE si solo hay un registro por cliente en los datos subyacentes.

Paso 3: crear un campo calculado para filtrar el valor

  1. Seleccione Análisis > Crear campo calculado.
  2. Asigne el nombre "Filtro de distinta subcategoría" al campo, escriba la fórmula siguiente y haga clic en Aceptar
    [Sub-Category] != [Sub-Category (Orders)]

Paso 4: crear la vista

  1. Arrastre [Subcategoría] al estante Columnas.
  2. Arrastre [Subcategoría (Pedidos)] al estante Filas.
  3. Arrastre el [Coeficiente de correlación de Pearson] a Color en la tarjeta Marcas.
  4. Arrastre el [Coeficiente de correlación de Pearson] a Texto en la tarjeta Marcas.
  5. En el menú desplegable de la tarjeta Marcas, cambie el tipo de marca a Cuadrado.
  6. Arrastre [Filtro de distinta subcategoría] al estante Filtros.
  7. En el cuadro de diálogo Filtrar, seleccione Verdadero y haga clic en Aceptar.

Información adicional

El coeficiente de correlación de Pearson es una herramienta estadística avanzada, por lo que se recomienda informarse bien de su funcionamiento antes de usarla. Para obtener más información sobre este tema, consulte los artículos siguientes:  Nota: el libro de trabajo Correlaton Value Matrix.twbx adjunto a este artículo también contiene un ejemplo de dispersión de correlación.

¿Fue de ayuda este artículo para resolver el problema?