2024年4月1日发(作者:酆影)
样本方差的期望
(1)样本(背景知识):由学过的概率论的知识可以知道,若在总体个数有限的情况
下,抽取出一些个体,总体的分布可能会发生变化,所以个体的分布可能反映不了总体的
分布。后一句不太好理解,所以举个经典例子:若N个产品中有M个废品,在抽样调查
其废品率时,正常抽取样本(随机抽不放回),则样品的废品率服从超几何分布;而产品中
的废品率服从二项分布。这样由样品得到的估计,统计性质就与总体不同。而且当产品数
量不是很大时,这种分布差异无法忽视。然而只有在总体中包含的个体极多或包含无限多
个个体时,不放回的抽取才对总体的分布影响极少或者毫无影响,这种例子才不成立,此
时可以用样本估计总体。这种情形在应用中最为常见,数理统计学在理论上对其研究得也
最深入。此时称抽出的若干数据独立同分布,称这组数据为从某总体抽出的独立随机样本,
简称为从某总体中抽出的样本。【1】
(2)样本均值/方差:顾名思义,样本均值就是样本的均值,样本方差就是样本数据
的方差。
(3)总体均值/方差:同上。。
(4)样本均值/方差的期望:样本数据均为我们抽取得来(是已知量)我们利用它算
出样本参数(例如样本均值),假装它是总体的参数(例如总体均值,是未知量),这就是
用样本估计总体的过程;由样本的定义,用样本估计得到的总体的参数不是完美的,有时
和真正的总体的参数之间可能有一个偏移。那么接下来一个很自然的想法就是,由于我们
对样本参数计算式已知,除去不可控的抽样随机性,从计算方法的角度上来说,我们可以
知道这个偏移量是多少吗?更进一步地,我们可以在计算方法上对这个偏移加以修正吗?
自然地,类似前述在定义样本时举过的例子,我们还可以假设对总体的数据和参数已知,
这样就可以用总体的数据和参数模拟抽样,反算出样本参数,并与真实的总体参数加以对
比,达到修正偏移的目的了!而这样反算出的样本参数,就叫做样本参数(例如样本均值、
样本方差)的期望。
从正面的/科学的(也是教材上的)角度来说,我们是用总体反过来估计了样本,得到
的当然就是样本参数的期望值啦。
若样本参数经修偏后,在某种算法下与真实的总体参数达到一致,该样本参数为总体
参数的一个无偏估计量。一个参数往往有不止一个无偏估计,我们需要在一个对估计的整
体的优良性准则下视情况讨论。
2024年4月1日发(作者:酆影)
样本方差的期望
(1)样本(背景知识):由学过的概率论的知识可以知道,若在总体个数有限的情况
下,抽取出一些个体,总体的分布可能会发生变化,所以个体的分布可能反映不了总体的
分布。后一句不太好理解,所以举个经典例子:若N个产品中有M个废品,在抽样调查
其废品率时,正常抽取样本(随机抽不放回),则样品的废品率服从超几何分布;而产品中
的废品率服从二项分布。这样由样品得到的估计,统计性质就与总体不同。而且当产品数
量不是很大时,这种分布差异无法忽视。然而只有在总体中包含的个体极多或包含无限多
个个体时,不放回的抽取才对总体的分布影响极少或者毫无影响,这种例子才不成立,此
时可以用样本估计总体。这种情形在应用中最为常见,数理统计学在理论上对其研究得也
最深入。此时称抽出的若干数据独立同分布,称这组数据为从某总体抽出的独立随机样本,
简称为从某总体中抽出的样本。【1】
(2)样本均值/方差:顾名思义,样本均值就是样本的均值,样本方差就是样本数据
的方差。
(3)总体均值/方差:同上。。
(4)样本均值/方差的期望:样本数据均为我们抽取得来(是已知量)我们利用它算
出样本参数(例如样本均值),假装它是总体的参数(例如总体均值,是未知量),这就是
用样本估计总体的过程;由样本的定义,用样本估计得到的总体的参数不是完美的,有时
和真正的总体的参数之间可能有一个偏移。那么接下来一个很自然的想法就是,由于我们
对样本参数计算式已知,除去不可控的抽样随机性,从计算方法的角度上来说,我们可以
知道这个偏移量是多少吗?更进一步地,我们可以在计算方法上对这个偏移加以修正吗?
自然地,类似前述在定义样本时举过的例子,我们还可以假设对总体的数据和参数已知,
这样就可以用总体的数据和参数模拟抽样,反算出样本参数,并与真实的总体参数加以对
比,达到修正偏移的目的了!而这样反算出的样本参数,就叫做样本参数(例如样本均值、
样本方差)的期望。
从正面的/科学的(也是教材上的)角度来说,我们是用总体反过来估计了样本,得到
的当然就是样本参数的期望值啦。
若样本参数经修偏后,在某种算法下与真实的总体参数达到一致,该样本参数为总体
参数的一个无偏估计量。一个参数往往有不止一个无偏估计,我们需要在一个对估计的整
体的优良性准则下视情况讨论。