2024年3月20日发(作者:练秀华)
1
第三部分 用Excel进行统计推断
利用Excel产生随机数
不论是利用抽签,或者是使用随机数表来进行抽样,过程都相当麻烦,尤其是样本数过
大时,所必须花费的时间就会更多。此时,我们可以使用计算机软件来帮助我们进行随机抽
样。
操作实例:使用Excel抽出随机数
使用Excel中的加载宏,从700个元素的总体当中取得100个元素作为抽样的样本。
1)在A1单元格中,输入“抽样样本编号”,A2单元格中输入“1”,然后使用鼠标选取“编
辑”-“填充”-“序列”命令,打开“序列”对话框。
2)在“序列”对话框当中的“序列产生在”区域选择“列”,“类型”区域选择“等差序列”,
步长值填入“1”,终止值填入“700",最后单击“确定”按钮即可在单元格A2~A701中填
入1—700的数值。
3)接着,选择“工具”-“数据分析”命令,打开“数据分析”对话框。在对话框中,选择
“抽样”,屏幕上则会出现“抽样”对话框。
4)在“抽样”对话框中,“输入区域”指定为先前所填充的序列“A2:A701”单元格范围。
“抽样方法”指定为“随机”,并输入“样本数”为“100",输出选项指定为“新工作表组”,
表示将抽样出来的数值放置在新工作表中。最后单击“确定”按钮,您就会看到在工作簿中
新增了一个工作表,而工作表中选出了100个抽样数值,
而我们就可以先将总体元素编号,再利用这些Excel所选出来的数值,挑选出100个相
对编号的总体单位。
利用EXCEL进行参数估计
工具一数据分析一描述统计
――估计总体均值的程序和输出表解读
在EXCEl工作表中,依次点击:工具一数据分析一描述统计,在对话框中指定数据区
域和置信度(默认值为95%,也可自行指定)等其他选项,可得到包括如内容的输出表(空白
处应为输出数值,表中删除了一些参数估计不必要的输出,最后一列为作者所加的对输出结
果的解释):
表中对指定置信度所对应的抽样误差范围的输出结果,是基于正态总体、总体方差未
知时的公式计算的。
(一)大样本条件下,单一总体均值的置信区间估计.(总体方差未知时)
应用案例1,2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业
内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价格,
调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他(她)们所购汽车
的价格如下(单位:万元):
2
6.88 11.28 19.98 13.6 10.6 14.8
6.88 11.78 20.98 24.4 12.3 14.8
6.88 13.68 13.6 30.3 14.6 14.8
8.28 14.98 14.7 9.6 14.6 17.4
9.6 15.68 15.8 9.6 12.9 5.38
10.18 15.68 20.5 10.6 14,8 7.38
根据这些调查数据怎样估计总体的平均消费价格?如果要进一步推断所购买车辆
在15万元以上的消费者占有多大比例,应当如何分析呢?
对汽车销售价格的总体均值求90%置信区间,利用Excel在大样本条件下进行单一总
体均值的置信区间估计。
具体步骤如下:
打开“年底汽车价格1”表
第1步:将相关数据输入Excel表格。 第2步:选择“工具”下拉菜单。
第3步:选择“数据分析”选项。 第4步:在分析工具中选择“描述统计”。
第5步:当对话框出现时,在“输入区域”设置框内键人数据单元格区域A1:A36,
在“输出区域”设置框内键人数据单元格区域B1,并选择“汇总统计”,然后选择“确定”,
得到输出结果,此时样本均值出现在单元格C3中,抽样误差的值出现在单元格C4。
第6步:选择单元格D2,并键人单元格公式=C3-1.645*C4, 按下回车键;
选择单元格D3,并键人单元格公式=C3+1.645*C4, 按下回车键,
得到输出结果,即汽车销售价格的总体均值90%置信区间为(12.18795,15.02316)。
见“年底汽车价格2”表中的操作及答案。
注:在第6步中,因为所求的是90%的置信区间,所以单元格公式中使用的值是1.645。
通常,使用者需要键人与所希望的置信水平相对应的z值。
(二) 大样本条件下,单一总体均值的置信区间估计.(总体方差已知)
------------------利用CONFIDENCE函数
当抽样数为大样本时,总体方差为已知的情况下,则总体平均数的置信区间为,在Excel
中,我们可以利用CONFIDENCE函数计算出置信区间的数值。
语法:CONFIDENCE(alpha,standard_dev,size)
其中alpha代表用来推算置信度的显著程度。置信等于100*(1·alpha)%,换言之,0.05
的alpha值所指的是95%信赖度。
Standard dev为此数据的总体标准差,且假定为已知。
Size代表样本大小。
以搭车为例:“50位乘客,每天搭乘火车的平均时间为60分钟,总体标准差为10分钟,试
计算总体平均数的95%信赖区间为多少?”
2024年3月20日发(作者:练秀华)
1
第三部分 用Excel进行统计推断
利用Excel产生随机数
不论是利用抽签,或者是使用随机数表来进行抽样,过程都相当麻烦,尤其是样本数过
大时,所必须花费的时间就会更多。此时,我们可以使用计算机软件来帮助我们进行随机抽
样。
操作实例:使用Excel抽出随机数
使用Excel中的加载宏,从700个元素的总体当中取得100个元素作为抽样的样本。
1)在A1单元格中,输入“抽样样本编号”,A2单元格中输入“1”,然后使用鼠标选取“编
辑”-“填充”-“序列”命令,打开“序列”对话框。
2)在“序列”对话框当中的“序列产生在”区域选择“列”,“类型”区域选择“等差序列”,
步长值填入“1”,终止值填入“700",最后单击“确定”按钮即可在单元格A2~A701中填
入1—700的数值。
3)接着,选择“工具”-“数据分析”命令,打开“数据分析”对话框。在对话框中,选择
“抽样”,屏幕上则会出现“抽样”对话框。
4)在“抽样”对话框中,“输入区域”指定为先前所填充的序列“A2:A701”单元格范围。
“抽样方法”指定为“随机”,并输入“样本数”为“100",输出选项指定为“新工作表组”,
表示将抽样出来的数值放置在新工作表中。最后单击“确定”按钮,您就会看到在工作簿中
新增了一个工作表,而工作表中选出了100个抽样数值,
而我们就可以先将总体元素编号,再利用这些Excel所选出来的数值,挑选出100个相
对编号的总体单位。
利用EXCEL进行参数估计
工具一数据分析一描述统计
――估计总体均值的程序和输出表解读
在EXCEl工作表中,依次点击:工具一数据分析一描述统计,在对话框中指定数据区
域和置信度(默认值为95%,也可自行指定)等其他选项,可得到包括如内容的输出表(空白
处应为输出数值,表中删除了一些参数估计不必要的输出,最后一列为作者所加的对输出结
果的解释):
表中对指定置信度所对应的抽样误差范围的输出结果,是基于正态总体、总体方差未
知时的公式计算的。
(一)大样本条件下,单一总体均值的置信区间估计.(总体方差未知时)
应用案例1,2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业
内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价格,
调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他(她)们所购汽车
的价格如下(单位:万元):
2
6.88 11.28 19.98 13.6 10.6 14.8
6.88 11.78 20.98 24.4 12.3 14.8
6.88 13.68 13.6 30.3 14.6 14.8
8.28 14.98 14.7 9.6 14.6 17.4
9.6 15.68 15.8 9.6 12.9 5.38
10.18 15.68 20.5 10.6 14,8 7.38
根据这些调查数据怎样估计总体的平均消费价格?如果要进一步推断所购买车辆
在15万元以上的消费者占有多大比例,应当如何分析呢?
对汽车销售价格的总体均值求90%置信区间,利用Excel在大样本条件下进行单一总
体均值的置信区间估计。
具体步骤如下:
打开“年底汽车价格1”表
第1步:将相关数据输入Excel表格。 第2步:选择“工具”下拉菜单。
第3步:选择“数据分析”选项。 第4步:在分析工具中选择“描述统计”。
第5步:当对话框出现时,在“输入区域”设置框内键人数据单元格区域A1:A36,
在“输出区域”设置框内键人数据单元格区域B1,并选择“汇总统计”,然后选择“确定”,
得到输出结果,此时样本均值出现在单元格C3中,抽样误差的值出现在单元格C4。
第6步:选择单元格D2,并键人单元格公式=C3-1.645*C4, 按下回车键;
选择单元格D3,并键人单元格公式=C3+1.645*C4, 按下回车键,
得到输出结果,即汽车销售价格的总体均值90%置信区间为(12.18795,15.02316)。
见“年底汽车价格2”表中的操作及答案。
注:在第6步中,因为所求的是90%的置信区间,所以单元格公式中使用的值是1.645。
通常,使用者需要键人与所希望的置信水平相对应的z值。
(二) 大样本条件下,单一总体均值的置信区间估计.(总体方差已知)
------------------利用CONFIDENCE函数
当抽样数为大样本时,总体方差为已知的情况下,则总体平均数的置信区间为,在Excel
中,我们可以利用CONFIDENCE函数计算出置信区间的数值。
语法:CONFIDENCE(alpha,standard_dev,size)
其中alpha代表用来推算置信度的显著程度。置信等于100*(1·alpha)%,换言之,0.05
的alpha值所指的是95%信赖度。
Standard dev为此数据的总体标准差,且假定为已知。
Size代表样本大小。
以搭车为例:“50位乘客,每天搭乘火车的平均时间为60分钟,总体标准差为10分钟,试
计算总体平均数的95%信赖区间为多少?”