四、数理统计的基本概念
本书仅涉及依据数据(即样本)作统计推断。
(一)总体与样本
总体是全体研究对象的某个特性值;样本是总体中部分个体的该特性值(即数据)。
(二)统计模型(也适用于第五、六段)
常用“ ( x 1, … ,x n)是取自总体 x 的容量为n的样本”这一句话。其含义是:
x 1, … ,x n是独立同分布的随机变量,且它们的分布都与 x 的分布相同。
当 x 服从正态分布时,称义为正态总体。
(三)样本均值与样本方差
1.定义
样本均值
样本方差
样本标准差
2 .性质
三个常用的分布
置信区间
本书仅讨论区间估计中最常用的一种形式 ― 置信区间。
1 .定义设未知参数为 ,求区间估计的两个端点、,使其满足
其中l – α 是置信度(或置信水平),常取 90 %、 95 %、 99 %等。称为的置信区间。
2 .正态总体中均值的置信区间
( 1 )当已知时,在置信度 1 – α下,的置信区间是,
其中λ满足.
( 2 )当 未知时,在置信度1-a下的置信区间是,其中满足p(= 1 一 a , t 服从自由度为n- 1 的 t 分布。
3 .正态总体 中方差的置信区间
设未知。在置信度1-a下置信区间是;其中满足 p(x2<) =p(x2>)=, x2服从自由度为n -1的x 2 分布。