在线报名
报名咨询
全站搜索未启用
跳到主要内容

3.4 分布图的制作

一、图示法定义

所谓分布的图示法是指使用图形工具表达分布的方法,这样的图称为分布图。

分布图是图示法表现单一随机变量分布的主要手段,虽对联合分布似乎其意义不大,但联合分布离不开边缘分布和条件分布,所有边缘分布和部分条件分布完全可以通过这些分布图进行表达,故单一变量的分布绝不可轻视。

二、分布图的制作步骤
(一)柱状图和直方图

就单一随机变量分布来说,分布图的制作步骤大致为:将每个变量值(一揽子)按分布表里排定的顺序,依次标于横坐标轴上,然后将每个变量值作为横坐标值,对应的频率作为纵坐标值,确定平面上的一揽子点,以这些点为上边之中点,构造等宽立状矩形,若变量为分类变量,这些等宽立状矩形称为“柱”,相邻的柱之间留有肉眼可以分辨的等宽间隔;若变量为数值变量,这些等宽立状矩形称为“直方”,相邻的直方之间不留间隔;前者形成的分布图称为柱状图,后者的称为直方图。

(二)条形图

将柱状顺时针旋转90°,称为条形图。利用纸张、手机显示屏一般纵长横短的物理特性,同样的分辨程度。条形图比柱状图可容纳更多的变量值。对直方图也可顺时针旋转90°,却似乎没有特别的名字。

注意事项:作为原理性的规定,分类变量的柱状图与条形图,其柱与柱之间、条与条之间必须留有间隔,以突出变量值之间的区别;而由连续的数值变量形成的分组变量,其柱与柱之间、条与条之间必须不留间隔,以突出变量值之间的联系。至于离散数值变量,其变量值较多可不留,较少则可留。

(三)饼形图

在变量值极少的场合,在一个圆形内,以顶点在圆心的扇形的相对面积(即占整个圆形面积的比例)表示概率大小,以扇形的颜色或其他标记表示对应变量值(既可是分类变量也可是数值变量的)。这样的图称为饼形图。

(四)线型图

在连续或接近连续的数值变量的变量值极多的场合,直方图的单个矩形宽度接近于0,相当于取消了直方左右边界的,并将每个直立矩形的上方线段中点以直线或平滑曲线进行连接而成,称为线型图。虽有折线图与平滑线图之分,然而视觉上的差异不大。

三、制作过程举例说明

根据媒体上公布的2017年北京市大气中PM2.5的解析结果,从本地污染排放来源看,移动源、扬尘源、工业源、生活面源和燃煤源分别占 45%、16%、12%、12%和 3%,农业及自然源等其他约占 12%,其中移动源里在京行驶的柴油车贡献最大。

按照以上我们介绍的步骤,分布图的结果呈现如下:

1. 饼形图

2. 柱形图

3. 条形图

注意事项:由于变量“污染物来源”属于分类变量,除非出于统计学之外的如艺术美观方面的缘故,不宜采用直方图系列(包括线型图和面积图)表达其分布。相形之下,饼形图、柱状图、条形图三者中,条形图在此场合效果不好,以饼形图和柱状图为佳。

四、不同分布图的特点与适用场合
分布图名称 适用变量类型 变量值数目 功能与适用场合 示例
饼状图 分类或分组 极少

表达总体结构,反映分类或分组数目极少的随机变量分布。分类或分组数目一般不宜多于个位数。

柱状图 分类

表达总体结构,反映分类数目极少的随机变量分布。比示饼形图更能显现不同类别的频率差异。分类数目一般也多于饼形图的。

条形图 分类 较少

向右转90度的、可用来放置更多矩形的柱状图,功能与柱状图完全一样,但可比柱状图反映更多分类的分类变量的分布。条形图利用了一般纸张纵长横短的物理特性。

直方图 数值分组 不多

用矩形的宽度和高度(即面积)来表示分组数值变量分布的图形。由于反映的是数值变量而非分类变量,故矩形间的间隔是0,这与饼形图相似而与柱状图、条形图不同。

线形图 数值分组

宽度等于或接近于0的特殊的直方图,主要用于表示连续或接近连续的数值变量的分布。取消了直方左右边界的,并将每个直立矩形的上方线段中点以直线或平滑曲线进行连接而成。有折线图与平滑曲线图。

面积图 数值分组

特殊的线型图,相当于对取消了左右边界的直方图进行了视觉强化的结果。

最后修改: 2022年01月11日 Tuesday 10:29