2024年4月10日发(作者:禹金鑫)
第34卷第1期
2002年3月
东北师大学报自然科学版
JOURNALOFNORTHEASTNORMALUNIVERSITY
Vol.34No.1
March2002
[文章编号]1000-1832(2002)01-0009-06
用于预测的贝叶斯网络
王 辉
(东北师范大学计算机科学系,吉林长春130024)
[摘 要] 通过示例给出了贝叶斯网络的构造方法,概括了贝叶斯网络的特点
及贝叶斯网络学习的内容与过程,同时给出了离散型贝叶斯网络的预测公式.贝
叶斯网络学习主要有三个基本环节,其一是确定变量集和变量域;其二是确定贝
叶斯网络结构;其三是确定局部概率分布.贝叶斯网络是描述变量之间定性与定
量依赖关系的图形模式,是进行数据联合分析与预测的有力工具.
[关键词] 先验贝叶斯网络;后验贝叶斯网络;贝叶斯网络学习
[中图分类号] TP311.134.1 [文献标识码] A
1 贝叶斯网络的构造
构造贝叶斯网络(先验贝叶斯网络)一般分为三个步骤,首先是确定变量集和变量域,
之后是确定网络结构,最后是确定局部概率分布(或局部密度函数).这里以信誉卡欺骗问
题为例说明如何构造贝叶斯网络.
1.1 确定变量集和变量域
分别用F,G,J,A,S表示当前的交易是否是欺骗性的,是否在24小时内有一个汽
油交易,是否在24小时内有一个珠交易,信誉卡持有者的年龄和性别.变量的状态如图1
所示(其中m,w分别代表男性和女性;0代表是,1代表否).
图1 信誉卡欺骗问题贝叶斯网络
[收稿日期] 2001-12-08
[基金项目] 科学技术部国家软科学研究项目(Z99015)
[作者简介] 王辉(1961-),男,副教授,主要从事数据采掘理论的研究与应用.
10
东北师大学报自然科学版第34卷
p(f=0)=0.00001,p(s=m)=0.5.
p(50≥a≥30)=0.40.
p(j=0 f=0,a=
*
,s=
*
)=0.05;
p(j=0 f=1,a≤30,s=m)=0.001;
p(a≤30)=0.25;
p(j=0 f=1,30≤a≤50,s=m)=0.0004;
p(g=0 f=0)=0.2,
p(j=0 f=1,50≤a,s=m)=0.0002;
p(g=0 f=1)=0.01.
p(j=0 f=1,a≤30,s=w)=0.0005;
p(j=0 f=1,30≤a≤50,s=w)=0.002;
p(j=0 f=1,a≤50,s=w)=0.001.
1.2 确定网络结构
一种方法是首先给变量排序,比如(F,G,J,A,S)之后确定变量之间的条件独立性,
p(a f)=p(a),p(s f,a)=p(s),
p(g f,a,s)=p(g f),p(j f,a,s,g)=p(j f,a,s).
另一种方法(更为常用)是用户根据变量之间的因果关系(根据用户的已有知识)来建立网
络结构.
1.3 确定局部概率分布
方法1是用先验数据的统计频率和用户的知识确定局部概率;方法2是用户通过测
试和观察确定局部概率;方法3是根据专家的知识确定局部概率等.也可以混合使用几种
方法.
2 贝叶斯网络的特点
(1)贝叶斯网络能够真正有效地处理不完整数据.
(2)贝叶斯网络和其他技术相结合能够进行因果分析.
(3)贝叶斯网络能够使先验知识和数据有机的结合.
(4)贝叶斯网络能够有效地避免对数据的过度拟合.
3 贝叶斯网络学习
我们把根据用户的先验知识构造的贝叶斯网络称为先验贝叶斯网络,把先验贝叶斯
网络和数据相结合而得到的贝叶斯网络称为后验贝叶斯网络.由先验贝叶斯网络到后验
贝叶斯网络的过程称为贝叶斯网络学习,或者说,把先验贝叶斯网络和数据相结合而得到
后验贝叶斯网络的过程称为贝叶斯网络学习.继而把先验贝叶斯网络和数据相结合而得
到后验贝叶斯网络的过程称为贝叶斯网络学习.贝叶斯网络学习是用数据对先验知识的
修正(贝叶斯网络是一种知识表示形式),贝叶斯网络能够持续学习,上次学习得到的后验
贝叶斯网络变成下一次学习的先验贝叶斯网络.
2024年4月10日发(作者:禹金鑫)
第34卷第1期
2002年3月
东北师大学报自然科学版
JOURNALOFNORTHEASTNORMALUNIVERSITY
Vol.34No.1
March2002
[文章编号]1000-1832(2002)01-0009-06
用于预测的贝叶斯网络
王 辉
(东北师范大学计算机科学系,吉林长春130024)
[摘 要] 通过示例给出了贝叶斯网络的构造方法,概括了贝叶斯网络的特点
及贝叶斯网络学习的内容与过程,同时给出了离散型贝叶斯网络的预测公式.贝
叶斯网络学习主要有三个基本环节,其一是确定变量集和变量域;其二是确定贝
叶斯网络结构;其三是确定局部概率分布.贝叶斯网络是描述变量之间定性与定
量依赖关系的图形模式,是进行数据联合分析与预测的有力工具.
[关键词] 先验贝叶斯网络;后验贝叶斯网络;贝叶斯网络学习
[中图分类号] TP311.134.1 [文献标识码] A
1 贝叶斯网络的构造
构造贝叶斯网络(先验贝叶斯网络)一般分为三个步骤,首先是确定变量集和变量域,
之后是确定网络结构,最后是确定局部概率分布(或局部密度函数).这里以信誉卡欺骗问
题为例说明如何构造贝叶斯网络.
1.1 确定变量集和变量域
分别用F,G,J,A,S表示当前的交易是否是欺骗性的,是否在24小时内有一个汽
油交易,是否在24小时内有一个珠交易,信誉卡持有者的年龄和性别.变量的状态如图1
所示(其中m,w分别代表男性和女性;0代表是,1代表否).
图1 信誉卡欺骗问题贝叶斯网络
[收稿日期] 2001-12-08
[基金项目] 科学技术部国家软科学研究项目(Z99015)
[作者简介] 王辉(1961-),男,副教授,主要从事数据采掘理论的研究与应用.
10
东北师大学报自然科学版第34卷
p(f=0)=0.00001,p(s=m)=0.5.
p(50≥a≥30)=0.40.
p(j=0 f=0,a=
*
,s=
*
)=0.05;
p(j=0 f=1,a≤30,s=m)=0.001;
p(a≤30)=0.25;
p(j=0 f=1,30≤a≤50,s=m)=0.0004;
p(g=0 f=0)=0.2,
p(j=0 f=1,50≤a,s=m)=0.0002;
p(g=0 f=1)=0.01.
p(j=0 f=1,a≤30,s=w)=0.0005;
p(j=0 f=1,30≤a≤50,s=w)=0.002;
p(j=0 f=1,a≤50,s=w)=0.001.
1.2 确定网络结构
一种方法是首先给变量排序,比如(F,G,J,A,S)之后确定变量之间的条件独立性,
p(a f)=p(a),p(s f,a)=p(s),
p(g f,a,s)=p(g f),p(j f,a,s,g)=p(j f,a,s).
另一种方法(更为常用)是用户根据变量之间的因果关系(根据用户的已有知识)来建立网
络结构.
1.3 确定局部概率分布
方法1是用先验数据的统计频率和用户的知识确定局部概率;方法2是用户通过测
试和观察确定局部概率;方法3是根据专家的知识确定局部概率等.也可以混合使用几种
方法.
2 贝叶斯网络的特点
(1)贝叶斯网络能够真正有效地处理不完整数据.
(2)贝叶斯网络和其他技术相结合能够进行因果分析.
(3)贝叶斯网络能够使先验知识和数据有机的结合.
(4)贝叶斯网络能够有效地避免对数据的过度拟合.
3 贝叶斯网络学习
我们把根据用户的先验知识构造的贝叶斯网络称为先验贝叶斯网络,把先验贝叶斯
网络和数据相结合而得到的贝叶斯网络称为后验贝叶斯网络.由先验贝叶斯网络到后验
贝叶斯网络的过程称为贝叶斯网络学习,或者说,把先验贝叶斯网络和数据相结合而得到
后验贝叶斯网络的过程称为贝叶斯网络学习.继而把先验贝叶斯网络和数据相结合而得
到后验贝叶斯网络的过程称为贝叶斯网络学习.贝叶斯网络学习是用数据对先验知识的
修正(贝叶斯网络是一种知识表示形式),贝叶斯网络能够持续学习,上次学习得到的后验
贝叶斯网络变成下一次学习的先验贝叶斯网络.