BASE DE DADOS DE CONHECIMENTO

Criação de uma matriz de valor de correlação


Publicado: 15 Aug 2017
Data da última modificação: 20 Jul 2023

Pergunta

Como criar uma matriz de valor de correlação no Tableau Desktop.

Por exemplo, esta exibição pode responder a pergunta: há uma correlação entre quais subcategorias de produtos um cliente compra, rastreado por vendas? Ou, em uma outra formulação, se um cliente comprar produtos de uma subcategoria X, eles estão mais ou menos propensos a comprar da subcategoria Y?

Ambiente

Resposta

A partir do Tableau Desktop 10.2, a função CORR() poderá ser usada para calcular o Coeficiente de correlação de Pearson. A pasta de trabalho de exemplo Valor de correlação Matrix.twbx em anexo usa o conjunto de dados de exemplo da Superstore para demonstrar as instruções a seguir:

Etapa 1 - Definir a auto-união

  1. Acesse a guia Fonte de dados
  2. Arraste uma segunda cópia da tabela Pedidos para a área do canvas
  3. Crie uma união de colunas INTERNA em Nome do cliente = Nome do cliente (Pedidos)
Observação: esse exemplo pergunta se um cliente está mais propenso a comprar produtos da subcategoria X se já tiver comprado da subcategoria Y. Uma variação dessa pergunta pode ser: O mesmo pedido está mais suscetível a conter produtos da subcategoria X se já tiver produtos da subcategoria Y? Nessa variação, a união de colunas deve ser em ID do pedido = ID do pedido (Pedidos).

Em outras palavras, a cláusula de união de colunas deve ser no campo ou nos campos que definem o escopo da comparação.

Etapa 2 - Calcular o coeficiente de correlação de Pearson

  1. Selecione Análise > Criar campo calculado
  2. Nomeie o campo "Coeficiente de correlação de Pearson", insira a fórmula a seguir e clique em OK
    CORR( { INCLUDE [Customer Name] : SUM( [Sales (Orders)])}, { INCLUDE [Customer Name] : SUM( [Sales])})
Observação: [Customer Name (Nome do cliente)] deve ser substituído pelos mesmos campos usados na cláusula de união da etapa 1 a 3. Não é necessário usar a expressão INCLUDE se houver somente registro por cliente nos dados subjacentes.

Etapa 3 - Criar um campo calculado para filtrar o valor

  1. Selecione Análise > Criar campo calculado
  2. Nomeie o campo "Não é o mesmo filtro de subcategoria", insira a seguinte fórmula e clique em OK
    [Sub-Category] != [Sub-Category (Orders)]

Etapa 4 - Criar a exibição

  1. Arraste [Sub-Category (Subcategoria)] para a divisória Colunas
  2. Arraste [Sub-Category (Orders) (Subcategoria (Pedidos))] para a divisória Linhas
  3. Arraste [Pearson Correlation Coefficient (Coeficiente de correlação de Pearson)] para Cor no cartão Marcas
  4. Arraste [Pearson Correlation Coefficient (Coeficiente de correlação de Pearson)] para Texto no cartão Marcas
  5. No menu suspenso do cartão Marcas, altere o Tipo de marca para Quadrado
  6. Arraste [Not same sub category filter (Não é o mesmo filtro de subcategoria)] para a divisória Filtros
  7. Na caixa de diálogo Filtrar, selecione Verdadeiro e clique em OK.

Informações adicionais

O Coeficiente de correlação de Pearson é uma ferramenta estatística sofisticada; um melhor entendimento de como ela funciona é recomendado antes de usá-la. Para obter mais informações sobre este assunto, consulte os artigos a seguir:  Observação: a pasta de trabalho Valor de correlação Matrix.twbx anexada a este artigo também contém um exemplo de gráfico de dispersão de correlação.

Este artigo resolveu o problema?