中心极限定理
1.中心极限定理
1.1 定义
中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值。 这些平均值的分布接近正态分布。
其中注意两点:
1.2 总体本身的分布不要求正态分布
中心极限定理对总体的分布形式没有要求。例如我们掷一个骰子,其分布类型是是平均分布,但是最后每组的平均值也会组成一个正态分布。
1.3 样本每组要足够大,但也不需要太大
有一个大家疑惑的地方,样本容量足够大,多大才是足够大?这个问题的答案和总体分布的形状相关,如果样本本是来自近似对称分布的总体,那么当样本量取相当小(如样本量取5)的值的时候,正态逼近的结果也会非常好。然后,如果总体的分布严重倾斜,则样本量必须取相当大的值。根据检验,对于大多数总体来说,样本容量取30或者更大,就足以得到令人满意的正态逼近结果。
不同分布
卡方分布
若
被称为服从自由度为
卡方分布重要定理:
分布
根据中心极限定理,只要样本量足够大,统计量的抽样分布(如样本均值)将遵循正态分布。因此,当我们知道总体的标准偏差时,我们可以计算
但是样本量有时很小,并且我们通常不知道总体的标准偏差。当这些问题中的任何一个出现时,统计学家依赖
假设
两点分布
随机变量
且
二项分布
二项分布是
2.区间估计
2.1 单总体的参数检验
2.1.1 总体均值估计
2.1.2 总体比例估计
总体比例只考虑大样本的情况:
2.1.3 总体方差估计
只考虑正态总体方差的估计。
因为:
所以可得总体方差
2.2 双总体的参数检验
2.2.1 总体均值估计
2.2.2 总体比例估计
2.2.3 总体方差估计
3. 例子:如何用总体比例估计确定产品质量
3.1 背景
公司生产了一批产品,但这批产品到底怎么样,是不是所有的产品都符合质量标准,这批产品里有没有次品,产品的次品率又是多少,次品率是否符合国家标准?
在统计学中,我们把这批产品叫做总体,随机抽出的产品叫样本,而产品的品质可以用随机变量
两点分布的期望(总体均值)
我们称上述从总体中随机抽出一个样本的过程为一次伯努利实验,重复抽取
两点分布就是n=1的二项分布。
3.2 大样本区间估计
当产品的品质X服从两点分布
根据中心极限定理,样本量
可见样本均值的期望为
确定一类错误率
然后就可以得到次品率