知识库

创建相关值矩阵


发布时间: 15 Aug 2017
上次修改日期: 20 Jul 2023

问题

如何在 Tableau Desktop 中创建相关性值矩阵。

例如,此视图可能回答以下问题:客户购买的各个产品子类(按销售跟踪)之间是否存在相关性?或者换一种说法,如果客户购买了 X 子类中的产品,那他们或多或少有没有可能也购买 Y 子类中的产品?

答案

从 Tableau Desktop 10.2 开始,可以使用函数 CORR() 来计算皮尔森相关系数。附带的示例工作簿 Correlaton Value Matrix.twbx 使用示例数据集 Superstore 来演示以下指引:

步骤 1 - 设置自联接

  1. 导航到“数据源”选项卡
  2. 将“Orders”表的另一份副本拖到画布区域中
  3. 依据“Customer Name = Customer Name (Orders)”创建内联接
注意:此示例提出问题:如果客户已从 Y 子类中购买,他们是否更有可能从 X 子类中购买产品?此问题的一种变化形式可能为:如果相同订单已包含 Y 子类中的产品,其是否更有可能包含 X 子类中的产品?在这种变化形式中,联接依据应为“Order ID = Order ID (Orders)”。

换句话说,联接子句应以定义比较范围的一个或多个字段为基础。

步骤 2 - 计算皮尔森相关系数

  1. 选择“分析”>“创建计算字段”
  2. 将字段命名为“Pearson Correlation Coefficient”(皮尔森相关系数),输入以下公式并单击“确定”
    CORR( { INCLUDE [Customer Name] : SUM( [Sales (Orders)])}, { INCLUDE [Customer Name] : SUM( [Sales])})
注意:应将“[Customer Name]”(客户名称)替换为步骤 1-3 中的联接子句中使用的相同字段。如果基础数据中每个客户只有一条记录,则不必使用 INCLUDE 表达式。

步骤 3 - 创建计算字段来筛选值

  1. 选择“分析”>“创建计算字段”
  2. 将字段命名为“Not same sub category filter”(非相同子类筛选器),输入以下公式并单击“确定”
    [Sub-Category] != [Sub-Category (Orders)]

步骤 4 - 生成视图

  1. 将“[Sub-Category]”(子类)拖到“列”功能区
  2. 将“[Sub-Category (Orders)]”(子类(订单))拖到“行”功能区
  3. 将“[Pearson Correlation Coefficient]”(皮尔森相关系数)拖到“标记”卡上的“颜色”
  4. 将“[Pearson Correlation Coefficient]”(皮尔森相关系数)拖到“标记”卡上的“文本”
  5. 在“标记”卡上的下拉菜单中,将“标记类型”更改为“正方形”
  6. 将“[Not same sub category filter]”(非相同子类筛选器)拖到“筛选器”功能区
  7. 在“筛选器”对话框中,选中“True”并单击“确定”

其他信息

皮尔森相关系数是一种复杂的统计工具,在使用此工具之前,建议更深入地了解其使用方式。有关本主题的详细信息,请参见以下文章: 注意:本文附带的工作簿 Correlaton Value Matrix.twbx 也包含相关性散点示例。

此文章是否已解决问题?