在线报名
报名咨询
全站搜索未启用
跳到主要内容

本章导学

从本章的统计数据表开始,先将其简化为数据矩阵,再将其分别按变量(或变量组合)简化为分布,指出分布是统计数据的最简表达式,而分布特征则在分布的基础上进一步择其要者。换言之,分布是总体信息或样本信息的极简全面表达方式,而分布特征是总体信息或样本信息的重点表达工具。

样本分布及其分布特征是对样本或样本信息的反映,总体分布及其分布特征是对总体或总体信息的反映,所以反过来分布及其特征就是对样本或总体的描述。而样本分布及其特征与总体分布及其特征恰恰分别是统计学的起点与终点。本章内容犹如哲学里的本体论,而第5章则好似哲学里的方法论。关于分布的表达方式本书给出了各自适用的场合,关于分布特征不仅列出了各自的功能用途,而且基于数据是否排序给出了分布特征新的分类——几何特征与代数特征,点出了分布特征分为集中趋势与离散趋势特征的习惯分类的瑕疵,提出应以离散程度与离散标准特征替代之。进而说明其中的离散标准均源于某种最优化选择结果:众数的概率最大,中位数的平均差最小,均值的方差最小。

我们展示了分布属于所有变量而非为随机变量所独有的事实,据此复活了总体频率的概念。总体频率这一概念与总体均值总体分布等一脉相承,却莫名其妙为数理统计所回避,且混淆为总体概率。总体频率是确定的,概率是不确定性的量度,岂能同日而语?

鉴于可视化的优点与流行,以及分布图示法的应用广泛性,本章对此着墨甚多,唯有比较复杂的涉及微积分知识的函数法未予展开,留待第4章与理论研究成熟实际应用很广的那些重要分布一并讨论。

信息量受样本量、变量数目和变量值数目三个因素的影响,而变量值数目与量纲的大小有关。分类变量的第一类分布与变量取值频率有关,关注的焦点在变量取值。联合分布是变量组合的所有可能取值及其对应频率的一揽子表示。条件分布是其他变量取特定值或其他变量组合取特定变量值组合及其对应频率的一揽子表示。

本章属于全书的重要章节,具体的学习要求如下:

(一)数据阵和分布

1. 理解统计描述的概念和核心

2.了解统计数据表和数据阵的概念及辨别其表现形式

3. 理解分布的概念,区分总体分布和样本分布

4. 理解条件分布的概念

5. 理解联合总体分布和边缘分布

(二)频率的计算

1. 理解并区分总体频率和样本频率

2.掌握事件的概念和事件运算

3.理解加法原理和乘法原理

4.理解贝叶斯公式

5.理解分组的概念和基本原理

(三)分布表的制作

1.了解常见的分布表达方式

2. 掌握分布表的制作步骤

(四)分布图的制作

1. 了解分布图的含义

2. 掌握常见分布图的制作步骤

3. 理解不同分布图的特点与适用场合

(五)分布特征

1. 理解分布特征的概念

2.理解代表性的概念和常见距离公式

3. 理解和辨别区分代数特征和几何特征

4. 理解和辨别离散程度分布特征和离散基准分布特征

5.了解统计指标的概念

最后修改: 2022年01月11日 Tuesday 10:12