最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

用Excel进行统计推断

IT圈 admin 66浏览 0评论

2024年3月20日发(作者:练秀华)

1

第三部分 用Excel进行统计推断

利用Excel产生随机数

不论是利用抽签,或者是使用随机数表来进行抽样,过程都相当麻烦,尤其是样本数过

大时,所必须花费的时间就会更多。此时,我们可以使用计算机软件来帮助我们进行随机抽

样。

操作实例:使用Excel抽出随机数

使用Excel中的加载宏,从700个元素的总体当中取得100个元素作为抽样的样本。

1)在A1单元格中,输入“抽样样本编号”,A2单元格中输入“1”,然后使用鼠标选取“编

辑”-“填充”-“序列”命令,打开“序列”对话框。

2)在“序列”对话框当中的“序列产生在”区域选择“列”,“类型”区域选择“等差序列”,

步长值填入“1”,终止值填入“700",最后单击“确定”按钮即可在单元格A2~A701中填

入1—700的数值。

3)接着,选择“工具”-“数据分析”命令,打开“数据分析”对话框。在对话框中,选择

“抽样”,屏幕上则会出现“抽样”对话框。

4)在“抽样”对话框中,“输入区域”指定为先前所填充的序列“A2:A701”单元格范围。

“抽样方法”指定为“随机”,并输入“样本数”为“100",输出选项指定为“新工作表组”,

表示将抽样出来的数值放置在新工作表中。最后单击“确定”按钮,您就会看到在工作簿中

新增了一个工作表,而工作表中选出了100个抽样数值,

而我们就可以先将总体元素编号,再利用这些Excel所选出来的数值,挑选出100个相

对编号的总体单位。

利用EXCEL进行参数估计

工具一数据分析一描述统计

――估计总体均值的程序和输出表解读

在EXCEl工作表中,依次点击:工具一数据分析一描述统计,在对话框中指定数据区

域和置信度(默认值为95%,也可自行指定)等其他选项,可得到包括如内容的输出表(空白

处应为输出数值,表中删除了一些参数估计不必要的输出,最后一列为作者所加的对输出结

果的解释):

表中对指定置信度所对应的抽样误差范围的输出结果,是基于正态总体、总体方差未

知时的公式计算的。

(一)大样本条件下,单一总体均值的置信区间估计.(总体方差未知时)

应用案例1,2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业

内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价格,

调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他(她)们所购汽车

的价格如下(单位:万元):

2

6.88 11.28 19.98 13.6 10.6 14.8

6.88 11.78 20.98 24.4 12.3 14.8

6.88 13.68 13.6 30.3 14.6 14.8

8.28 14.98 14.7 9.6 14.6 17.4

9.6 15.68 15.8 9.6 12.9 5.38

10.18 15.68 20.5 10.6 14,8 7.38

根据这些调查数据怎样估计总体的平均消费价格?如果要进一步推断所购买车辆

在15万元以上的消费者占有多大比例,应当如何分析呢?

对汽车销售价格的总体均值求90%置信区间,利用Excel在大样本条件下进行单一总

体均值的置信区间估计。

具体步骤如下:

打开“年底汽车价格1”表

第1步:将相关数据输入Excel表格。 第2步:选择“工具”下拉菜单。

第3步:选择“数据分析”选项。 第4步:在分析工具中选择“描述统计”。

第5步:当对话框出现时,在“输入区域”设置框内键人数据单元格区域A1:A36,

在“输出区域”设置框内键人数据单元格区域B1,并选择“汇总统计”,然后选择“确定”,

得到输出结果,此时样本均值出现在单元格C3中,抽样误差的值出现在单元格C4。

第6步:选择单元格D2,并键人单元格公式=C3-1.645*C4, 按下回车键;

选择单元格D3,并键人单元格公式=C3+1.645*C4, 按下回车键,

得到输出结果,即汽车销售价格的总体均值90%置信区间为(12.18795,15.02316)。

见“年底汽车价格2”表中的操作及答案。

注:在第6步中,因为所求的是90%的置信区间,所以单元格公式中使用的值是1.645。

通常,使用者需要键人与所希望的置信水平相对应的z值。

(二) 大样本条件下,单一总体均值的置信区间估计.(总体方差已知)

------------------利用CONFIDENCE函数

当抽样数为大样本时,总体方差为已知的情况下,则总体平均数的置信区间为,在Excel

中,我们可以利用CONFIDENCE函数计算出置信区间的数值。

语法:CONFIDENCE(alpha,standard_dev,size)

其中alpha代表用来推算置信度的显著程度。置信等于100*(1·alpha)%,换言之,0.05

的alpha值所指的是95%信赖度。

Standard dev为此数据的总体标准差,且假定为已知。

Size代表样本大小。

以搭车为例:“50位乘客,每天搭乘火车的平均时间为60分钟,总体标准差为10分钟,试

计算总体平均数的95%信赖区间为多少?”

2024年3月20日发(作者:练秀华)

1

第三部分 用Excel进行统计推断

利用Excel产生随机数

不论是利用抽签,或者是使用随机数表来进行抽样,过程都相当麻烦,尤其是样本数过

大时,所必须花费的时间就会更多。此时,我们可以使用计算机软件来帮助我们进行随机抽

样。

操作实例:使用Excel抽出随机数

使用Excel中的加载宏,从700个元素的总体当中取得100个元素作为抽样的样本。

1)在A1单元格中,输入“抽样样本编号”,A2单元格中输入“1”,然后使用鼠标选取“编

辑”-“填充”-“序列”命令,打开“序列”对话框。

2)在“序列”对话框当中的“序列产生在”区域选择“列”,“类型”区域选择“等差序列”,

步长值填入“1”,终止值填入“700",最后单击“确定”按钮即可在单元格A2~A701中填

入1—700的数值。

3)接着,选择“工具”-“数据分析”命令,打开“数据分析”对话框。在对话框中,选择

“抽样”,屏幕上则会出现“抽样”对话框。

4)在“抽样”对话框中,“输入区域”指定为先前所填充的序列“A2:A701”单元格范围。

“抽样方法”指定为“随机”,并输入“样本数”为“100",输出选项指定为“新工作表组”,

表示将抽样出来的数值放置在新工作表中。最后单击“确定”按钮,您就会看到在工作簿中

新增了一个工作表,而工作表中选出了100个抽样数值,

而我们就可以先将总体元素编号,再利用这些Excel所选出来的数值,挑选出100个相

对编号的总体单位。

利用EXCEL进行参数估计

工具一数据分析一描述统计

――估计总体均值的程序和输出表解读

在EXCEl工作表中,依次点击:工具一数据分析一描述统计,在对话框中指定数据区

域和置信度(默认值为95%,也可自行指定)等其他选项,可得到包括如内容的输出表(空白

处应为输出数值,表中删除了一些参数估计不必要的输出,最后一列为作者所加的对输出结

果的解释):

表中对指定置信度所对应的抽样误差范围的输出结果,是基于正态总体、总体方差未

知时的公式计算的。

(一)大样本条件下,单一总体均值的置信区间估计.(总体方差未知时)

应用案例1,2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业

内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价格,

调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他(她)们所购汽车

的价格如下(单位:万元):

2

6.88 11.28 19.98 13.6 10.6 14.8

6.88 11.78 20.98 24.4 12.3 14.8

6.88 13.68 13.6 30.3 14.6 14.8

8.28 14.98 14.7 9.6 14.6 17.4

9.6 15.68 15.8 9.6 12.9 5.38

10.18 15.68 20.5 10.6 14,8 7.38

根据这些调查数据怎样估计总体的平均消费价格?如果要进一步推断所购买车辆

在15万元以上的消费者占有多大比例,应当如何分析呢?

对汽车销售价格的总体均值求90%置信区间,利用Excel在大样本条件下进行单一总

体均值的置信区间估计。

具体步骤如下:

打开“年底汽车价格1”表

第1步:将相关数据输入Excel表格。 第2步:选择“工具”下拉菜单。

第3步:选择“数据分析”选项。 第4步:在分析工具中选择“描述统计”。

第5步:当对话框出现时,在“输入区域”设置框内键人数据单元格区域A1:A36,

在“输出区域”设置框内键人数据单元格区域B1,并选择“汇总统计”,然后选择“确定”,

得到输出结果,此时样本均值出现在单元格C3中,抽样误差的值出现在单元格C4。

第6步:选择单元格D2,并键人单元格公式=C3-1.645*C4, 按下回车键;

选择单元格D3,并键人单元格公式=C3+1.645*C4, 按下回车键,

得到输出结果,即汽车销售价格的总体均值90%置信区间为(12.18795,15.02316)。

见“年底汽车价格2”表中的操作及答案。

注:在第6步中,因为所求的是90%的置信区间,所以单元格公式中使用的值是1.645。

通常,使用者需要键人与所希望的置信水平相对应的z值。

(二) 大样本条件下,单一总体均值的置信区间估计.(总体方差已知)

------------------利用CONFIDENCE函数

当抽样数为大样本时,总体方差为已知的情况下,则总体平均数的置信区间为,在Excel

中,我们可以利用CONFIDENCE函数计算出置信区间的数值。

语法:CONFIDENCE(alpha,standard_dev,size)

其中alpha代表用来推算置信度的显著程度。置信等于100*(1·alpha)%,换言之,0.05

的alpha值所指的是95%信赖度。

Standard dev为此数据的总体标准差,且假定为已知。

Size代表样本大小。

以搭车为例:“50位乘客,每天搭乘火车的平均时间为60分钟,总体标准差为10分钟,试

计算总体平均数的95%信赖区间为多少?”

发布评论

评论列表 (0)

  1. 暂无评论