
四分位数,就是排序后,按照25%、50%、75%的三个点,将数据分为4份
绘制盒须图,需要找到该组数据的最大值、最小值、中位数、两个四分位数,因为画出来很像一个箱子,所以也叫箱型图。
上边缘=》最大值
上四分位数=》第三四分位数(Q3)
中位数
下四分位数=》第一四分位数(Q1)
下边缘=》最小值
图中还有一个异常值,对于异常值的判断,是根据四分位距
看了上面的介绍,感觉绘制起来真心麻烦,还好使用Tableau可以方便的进行绘制。
这里我们使用Tableau的数据源
我们需要至少一个维度+度量,我们就是用省份+数量好了,然后就会自动生成一个盒须图,方便快捷
下面我们来理解一下这个图代表的含义,首先盒须图的几个主要点,Tableau会告诉我们
这里的上须就是最大值,下须就是最小值;
上枢纽就是Q3,第三四分位数;
下枢纽就是Q1,第一四分位数;
然后Q3-Q1,就可以得出一个差值1620.5-644=976.5
Tableau是根据1.5倍可以算的,所以Q3+1.5IQR和Q1-1.5IQR,就可以知道异常值的分界线,即那两根很长的线,就是最大值和最小值,外面的就是异常值了。
通过盒须图,我们可以直观的看到数据的分布情况,发现数据中的异常值,数据集中在哪里
继续上面的例子,我们可以再加一个维度,变成这样,就可以发现更多的故事,
这是每一年的销量情况,每年销量的中位数在哪儿,数据分布在什么地方,有多少异常值,都可以直观的看出来。
本质上就是成对的条形图,是一种特殊的旋风图。
绘制人口金字塔图:
创建新的字段“年龄”---对“年龄”创建间距为10的数据桶---分别创建2个字段:女性人数和男性人数---拖动数据桶至行,女性人数和男性人数至列---数据桶降序排,女性人数编辑坐标轴为倒序---拖动Gender至全部下面的颜色位置
适用于业务流程比较,可以快速的发现流程中问题。
绘制流量转化漏斗图:
步骤1:拖动“阶段”至行,“数量”至列,手动拖拉调整数量降序,“阶段”至颜色---画线:复制“数量”,调整为线,双轴(1)---“总计(数量)”调整为条形图(2),再将两个图进行同步轴。即画出半个漏斗图。
步骤2:列位置再拖动2个“数量”--- *** 作类似步骤1,再画出一半的漏斗图---左边漏斗图编辑轴为倒序---隐藏标题,空白处右击设置格式,“边界”---“行”"和“列”---“列分隔符”的区调整为“无”(去除中间的线)。
步骤3:拖动“数量”至两个线的标签位置,左边添加表计算---百分比---基于第一个,右边添加表计算---百分比---基于上一个,右击设置百分比格式,调整位置。
又叫盒须图,用于显示数据的位置、分散程度、异常值等。
中位数:数据降序排列,处于中间位置的数据,总观测数50%的数据值;第1,3四分位数:总观测数25%的数据值是第1四分位数,总观测数75%的数据值是第3四分位数;IQR:四分位全距,第3四分位数与第1四分位数的差值;上限:第3四分位数加上1.5倍的 IQR;下限:1.5 IQR减去第1四分位;异常值:上下限范围之外的数据。
绘制酒店均价箱线图:
拖动“地区”至列,“价格”至行,下拉列表里度量选择平均值---分析,勾选掉聚合度量---智能显示选择箱线图---不需要显示所有地区,对“地区”筛选,顶部,数量前5,记录数---排除其他地区
还可以编辑参考线,设置样式等。
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)