最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

Kolmogorov

互联网 admin 3浏览 0评论

Kolmogorov

Kolmogorov-Smirnov test

本文主要从以下几个角度来方面来介绍Kolmogorov-Smirnov test

  • Kolmogorov-Smirnov test 的用途
  • Kolmogorov-Smirnov test 的过程
  • Kolmogorov-Smirnov test 各数值代表的数学意义
  • Kolmogorov-Smirnov test 计算工具

用途

  • 无论是人文科学,还是社会科学,都会面临处理数据的问题,人文科学领域常见的是统计调查得到的数据,而自然科学,多则为实验数据(包括物理实验和计算机模拟实验)。那么,当我们面对这些统计数据的时候,我们的第一个问题就是去推测它们到底符合怎样一种分布的问题(当然也可能是一种无规律的分布)。这实际上就涉及到一个假设检验的问题:假设某统计数据X(一个1×n的向量,n为lengthX),服从某种分布(可能是泊松分布,正态分布,对数正态分布…),那么怎么去衡量假设H成立或者拒绝的可能性呢?那么Kolmogorov-Smirnov test就是去判断假设成立与否的一种常用方法(当然还有其他一些方法,不同的方法之间衡量方式不同,苛刻程度也不尽相同,可能某数据用方法A test是正态分布,而用B test就不满足正态分布,所以选取方法一定要谨慎,这里单独只讲kstest,是因为它应用的普遍性)

过程

  • 下面这个图片很好的说明了kstest的原理


蓝线表示数据,红线表示假设假定符合的分布。
而X轴表示数据值的大小,Y轴表示的数据累计所占百分比。如果简单理解实际上就是概率密度函数的积分。这这个图里面红线实际上就是正态分布的情况,而蓝线因为是离散化的数据,所以呈现的是阶梯状。两条线之间的最大距离也就是黑色箭头表现的位置就表示了二者之间的最大区别程度,称为D,D值的大小则决定了两组数据间的差异。用这种百分数的差别来表现差异,有一个最明显的好处,那就是不会因为某一个点的异常而否定所以的点。此外,KEST还可以检验多种分布,只需要把红线换成其他的线即可。
到这里我们仅仅得到了D值,还不能完全判定两者的符合程度,这时候还需要引入显著度α(alpha默认为0.05),学习过了概率论的假设检验这章的各位应该知道显著度的意义:
未完,待续

Kolmogorov

Kolmogorov-Smirnov test

本文主要从以下几个角度来方面来介绍Kolmogorov-Smirnov test

  • Kolmogorov-Smirnov test 的用途
  • Kolmogorov-Smirnov test 的过程
  • Kolmogorov-Smirnov test 各数值代表的数学意义
  • Kolmogorov-Smirnov test 计算工具

用途

  • 无论是人文科学,还是社会科学,都会面临处理数据的问题,人文科学领域常见的是统计调查得到的数据,而自然科学,多则为实验数据(包括物理实验和计算机模拟实验)。那么,当我们面对这些统计数据的时候,我们的第一个问题就是去推测它们到底符合怎样一种分布的问题(当然也可能是一种无规律的分布)。这实际上就涉及到一个假设检验的问题:假设某统计数据X(一个1×n的向量,n为lengthX),服从某种分布(可能是泊松分布,正态分布,对数正态分布…),那么怎么去衡量假设H成立或者拒绝的可能性呢?那么Kolmogorov-Smirnov test就是去判断假设成立与否的一种常用方法(当然还有其他一些方法,不同的方法之间衡量方式不同,苛刻程度也不尽相同,可能某数据用方法A test是正态分布,而用B test就不满足正态分布,所以选取方法一定要谨慎,这里单独只讲kstest,是因为它应用的普遍性)

过程

  • 下面这个图片很好的说明了kstest的原理


蓝线表示数据,红线表示假设假定符合的分布。
而X轴表示数据值的大小,Y轴表示的数据累计所占百分比。如果简单理解实际上就是概率密度函数的积分。这这个图里面红线实际上就是正态分布的情况,而蓝线因为是离散化的数据,所以呈现的是阶梯状。两条线之间的最大距离也就是黑色箭头表现的位置就表示了二者之间的最大区别程度,称为D,D值的大小则决定了两组数据间的差异。用这种百分数的差别来表现差异,有一个最明显的好处,那就是不会因为某一个点的异常而否定所以的点。此外,KEST还可以检验多种分布,只需要把红线换成其他的线即可。
到这里我们仅仅得到了D值,还不能完全判定两者的符合程度,这时候还需要引入显著度α(alpha默认为0.05),学习过了概率论的假设检验这章的各位应该知道显著度的意义:
未完,待续

发布评论

评论列表 (0)

  1. 暂无评论