2024年4月23日发(作者:红鸿晖)
第31卷,第6期
2 0 1 1年6月
光谱学与光谱分析 Vo1.31,No.6,pp1678—1682
June,2011 Spectroscopy and Spectral Analysis
基于实例克隆的ICSMOreg算法及在铀矿床蚀变矿物
水云母中的物谱建模研究
吴 佳,蔡之华 ,高哲超,余
中国地质大学计算机学院,湖北武汉
超
430074
摘要水云母是花岗岩型铀矿床蚀变带中的一种典型蚀变矿物,它也是铀矿找矿的一个重要标志。水云
母含量的大小能在一定程度上体现铀矿床水云母化的强弱。传统建模方法对水云母含量的预测效果较差。
文章将回归支持向量机SMOreg应用到水云母物谱关联建模中,并在验证其有效性的基础上提出一种基于
实例克隆的ICSMOreg方法,以构建水云母含量与光谱特征参数的关联模型。该方法首先选择与待测样本亲
和度较强的部分样本,运用实例克隆的方法对其进行克隆学习,再将得到的新样本数据输入SMOreg,建立
水云母的物谱关联模型。最后将文章提出的算法与SMOreg算法、人工神经网络、模型树及常用的高光谱物
谱关联模型巾的一元线性回归、多元线性回归的预测结果相比较,表明提出的算法预测结果精度高于现有
算法,且通过克隆与待测样本亲和度强的样本降低了无用信息在预测过程中所造成的负面影响。
关键词实例克隆;SMOreg算法;光谱吸收特征参数;铀矿床;水云母;预测
文献标识码:A DOI:10.3964/j.issn.1000—0593(2011)06—1678—05 中图分类号:TP301.6
生物模型来解决很多实际工程问题,尤其足人工神经免疫算
引 言
水云母是主要的铀矿床蚀变矿物之一,在铀矿勘测的过
程中具有很重要的作用n]。目前国内外还缺乏对花岗岩型铀
矿床水云母化蚀变矿物光谱特征的系统研究。本文首先对蚀
变矿物水云母的含量 光谱吸收特征参数(光谱吸收特征参
法的诞生l6]。本文在研究生物免疫系统中克隆机理的基础上
提出一种基于实例克隆的ICSMOreg算法来提高支持向量机
SMOreg的预测精度,该算法模拟生物免疫系统的克隆机理,
扩大了优秀个体(亲和度较高的实例)的规模,从而降低了无
用信息在预测过程中造成的负面影响,提高了预测的精度。
数是反射光谱线的吸收峰所对应的各参数)之间的变化关系
进行相关分析,建立蚀变矿物含量与光谱吸收峰的反射率、
深度、面积和宽度之间的物谱关联模型,从而可以根据光谱
数据预测矿物水云母的含量。据前人研究,在高光谱遥感中
广泛使用的物谱关联建模技术主要有统计回归分析、散点图
等 。统计凹归分析模型主要有一元线性回归、多元线性回
归等。这些同归模型都具有一定的局限性,而且所建立的模
型结构较为简单, 精度比较低。
在数据挖掘技术中,m现r一些新型的复杂非线性系统
建模技术,如支持向量机 、人工神经网络[4]、模型树 ]等。
1水云母光谱特征分析
1.1水云母诊断性光谱特征
蚀变花岗岩中的水云母是富钾离子的热液与固相斜长石
作用的产物,鉴于其重要的指矿价值,何建国等l7J通过提取
水云母矿物的诊断性光谱特征,并对其主要的吸收峰成因进
行了分析。本文获取。j-201铀矿床的6个水云母的粉末样
品,其光谱曲线如图1所示。由图1可以看出2 117~2 121
nm位置的吸收峰规模小,吸收弱,对高光谱遥感而言,目前
很难应用;2 349 ̄2 352 nm位置的吸收峰与绿泥石的诊断
我们在研究传统方法的基础上,将支持向量机SMOreg的方
法应用于水云母物谱关联建模,实验结果表明了该方法的可
行性 有效性。近年来,人们又逐渐开始将注意力转向模拟
收稿日期:2010—07—04,修订日期:2OlO 10—05
性吸收峰l8]基本一致,所以不具有代表性;2 206 ̄2 210 nIn
位置的吸收峰深、窄,呈尖锐的“V”型,是花岗岩型铀矿床
水云母化最为显著的诊断性吸收峰。
基金项目:国家(863计划)项目(2009AA12Z117)和湖北省自然科学基金项目(2009CDBI 39)资助
作者简介:吴佳,1987年生,中国地质大学(武汉)计算机学院在读博士研究生
e-mail:zhcai@cug.edu.cn
e-mail:wujiawb@126.com
*通讯联系人
第6期 光谱学与光谱分析 1679
舳加∞∞∞如加
400 80o l 20o l 600 2 000 2400
iFg.1 Spectral curve of damourite
1.2水云母诊断性光谱特征参数提取原理
光谱吸收峰是矿物识别的主要依据,而矿物的单个诊断
性吸收峰特征又可用光谱吸收特征参数来作完整的表达。光
谱吸收特征参数即反射光谱曲线的吸收峰所对应的各参数,
包括波段位置(P)、宽度(w)、深度(H)、吸收面积(A),如
图2所示。
波段位置(P):在经过包络线消除算法处理后形成的归
一
化光谱曲线上,吸收峰的最小值对应的波长即为吸收谱带
的位置(P)。
宽度(w):吸收峰的宽度可定义为 z— ,其中 是光
谱吸收谷的起始点, z是光谱吸收谷的终点。
70
6O
a
蛊
口
50
l
JD( 0) 3,2
Wavelength/nm
Fig.2 Schematic diagram of mineral spectral
absorption feature parameters
Table 1 Resules of the analysis for
damourite powder specimen
深度(H):吸收峰的吸收深度即为归一化值为1的曲线
与吸收峰的最小值之间的垂直距离。
吸收面积(A):吸收面积即为归一化值为1的曲线和吸
收峰之问的面积。
本文采用包络线分析技术进行水云母诊断性光谱吸收特
征参数的提取_g 。
1.3水云母诊断性光谱特征参数与含量的关系
201矿床的6个水云母粉末样品中各成分的含量见表1,
结合图I对6组样本的光谱曲线在2 206 ̄2 210 nIn位置的
诊断性吸收峰规模与水云母发育程度的对比观察发现,随着
水云母化的增强,水云母的主要诊断性吸收峰越来越显著,
表现为特征吸收峰变深,吸收面积变大。
2基于实例克隆的ICSMOreg算法
2.1实例克隆原理
克隆选择理论是基于抗原刺激而产生免疫应答这一生物
免疫系统的基本特性提出的[ ],用来解释免疫系统与抗原
反应的过程。在生物体受到细菌和病毒的入侵后,B细胞就
开始克隆和消灭这些入侵者,而能够识别抗原的细胞则根据
其识别水平的高低通过无性繁殖实现增殖,与抗原的亲和度
高的细胞有能力产生更多的后代,而这些细胞也会经历略小
的变异。
实例克隆的思想是模拟生物免疫系统的克隆机理。实例
克隆对应着一个亲和度变换的过程,即由抗原亲和度较高的
个体在克隆选择机制的作用下,经历增殖复制过程后,取代
亲和度较低的个体。
2.2 SMOreg算法简介
Platt[1l_提出的序列最小优化(sequential minimal optimi—
zation,SMO)方法以其训练速度快、扩展能力强等优点得到
了最为广泛的应用。SMO算法在使用KKT条件来选择需要
优化的样本时只使用了单一的阈值.8,当样本都出现在边界
上时,该阈值就无法确定。针对这一问题,Shevadel1纠提出了
一
种改进的SMO算法SMOreg,该方法在使用KKT条件判
断优化时使用了两个阈值参数b 和 ,并在论文中给出了
参数的详细定义。
2.3 ICSMOreg算法
本文提出的基于实例克隆的ICSMOreg算法通过2个步
骤来构建水云母的物谱关联模型,进而对水云母的含量进行
预测:首先是通过计算待测样本(抗原)与训练样本集(初始
抗体种群)之间的亲和度,选择克隆样本进行克隆并更新抗
体种群;然后利用新的实例集合来构建SMOreg预测模型。
步骤l:初始抗体种群的产生。首先将样本集合中水云
母的各个特征参数作为其特征值,利用训练样本来构建初始
抗体种群。待测样本为抗原g ,抗原集合G一{g )( —l,2,
…
,
N),其中N为抗原实例集合的抗原总数。抗体b 为训练
样本,抗体集合B一{b )( 一1,2,…,L),其中L为抗体实
例集合的抗体总数。
步骤2:亲和度计算。采用样本个体至抗体的欧式距离
来计算亲和度的值。距离越小,表明该抗体实例与抗原实例
之问的亲和度就越大。假设g为抗原实例,b为抗体实例,
则抗原和抗体之间的亲和度可以表示为
——一
一一
/ ( 一b ) 一1,2,…,N (1)
1
式中,m表示实例的属性个数,N表示抗原实例集合的大
1680
,J、。
光谱学与光谱分析 第3l卷
步骤3:抗体选择。从抗体实例集合也就是训练样本集
合中选出与抗原亲和力最好的 个抗体,组成新的抗体集合
B 。
步骤4:实例克隆。对选出来的n个抗体进行克隆操作,
克隆过程中采用非等比例进行克隆,克隆的数量与其亲和度
成正比。克隆的规模为z,抗体集合B 中第i个抗体被克隆
数量为
N Z×l广 ] 厂J.J (2)
步骤5:更新抗体种群。将克隆后的抗体种群取代原始
的抗体实例种群。
步骤6:在新的抗体实例集合上构建局部SMOreg预测
模型,并返回预测结果。
2.4 ICSMOreg算法参数分析
在用ICSMOreg算法进行建模的过程中,用户需设定以
下六个极其重要的参数:
(1)n:在初始抗体实例集合中被选出来用于克隆的抗
体实例总数。
(2)N:从初始抗体种群B中选出的"个最优抗体组成
的实例集合B 的克隆规模。
; M如∞一 。 n 蛆 ;一。 。一
(3)C:惩罚系数,对错误分类的惩罚力度。
1一暑一 收溅面 ~、量旱一~ u鼹一 髂n∞一 鼹 ; 一M一。"加一。 un鸲一
M∞一 n M"鼹一 : u 一蚰¨一 ∞ "弘一
(4)e:e不敏损失函数的不敏损失度。
(5)kernel:核函数,实现从低维空间到高维空间的映
射。
(6)A:核参数,影响核函数的性能。
本文将对参数n和N对ICSMOreg性能的影响进行详
细的分析。
3水云母含量预测实例研究
3.1实验数据
实验数据是通过对26组人工混合粉样(按一定的种类和
相对重量百分比的蚀变单矿物经由人工充分混合而成)的光
谱特征参数进行分析统计而得。混合所用的单矿物有石英、
绿泥石和水云母,均取自铀矿蚀变带,样本均采用室内矿物
分选得到,其详细的统计数据如表2所示。由于原始样本中
各指标的数量级差别很大,为消除指标量纲的影响,对输入
样本需要进行归一化处理。
3.2 ICSMOreg建模的参数设定
建模的主要运行参数设定如表3所示。
3.3实验方法及结果分析
本文采用数据挖掘平台weka进行建模。Weka数据挖
掘平台l1 是由新西兰怀卡托(Waikato)大学Witten的机器学
习小组用java开发出来的一个通用平台。实验采用1O次运
行十字交叉验证方法(10 runs of 10一fold cross validation),即
用十分之九的数据进行训练,十分之一的数据进行测试,重
复此过程1O次。图3(a)一(f)分别给出本文中提及的六种模
型预测值与实测值之间的拟合情况。
∞一" 毖 盯加u一 n一捣一 n一 ∞J一 M一捣 印一 鼹一∞码一。
Table 3 Parameter settings of ICSMOreg algorithm
运行参数 参数取值
克隆选择的样本数
5
克隆规模N
1.0
舍入误差eps
1.0E——12
误差容忍值e
0.001 0
数据转换类型filterType
Normalize(标准化)
核函数kernel
PolyKernel(径向基核)
核参数
1.0
由图3可以看出:与传统的高光谱物谱关联模型一元线
性回归LR、多元线性回归MLR和神经网络BP、模型树
MSP相比,基于SMOreg的水云母预测模型在26个实验样
本上能较精确地预测实际的水云母含量。这说明了支持向量
机运用于蚀变矿物水云母含量的预测是可行也是有效的。在
SMOreg的基础上,本文提出的基于实例克隆的ICSMOreg
算法的预测值比SMOreg方法更接近实际测量值。
为了更加直观地说明ICSMOreg算法的优越性,我们以
均值绝对误差(mean absolute error)和相对绝对误差(relative
absolute error)作为评价标准。从六种算法的误差分析(见表
4),可以看出:
(1)基于SMOreg的水云母预测模型的均值绝对误差和
相对绝对误差分别为2.315 8 和42.016 5 ,模型准确度
一M阻 ,
第6期 光谱学与光谱分析 l68l
优于传统的物谱关联模型LR(2.489
口3口0u再 IⅧ8 雹
9%,45.175 2%)、
Ial
Ⅱo口 01ⅢoJp^1
(2)本文提出的基于实例克隆的[
_I 口o0 81uI2 ^】_
CSMOreg模型的均值
I
MLR(2.489 9 ,45.175 2 )和
绝对误差为1.941 ,相对绝对误差为35.215 ,明显小
加 m 0
6
如 加
BP(2.423 5
m 0
,43.969
如
加 :2 m 5 0
7%)、M5P(2.375 5 ,43.099 6 )。
于SMOreg算法。
2 4 6 8 10 12 14 16 18 20 22 24 26
Sample serial number
2 4 6 8 10 12 14 16 18 2O 22 24 26
Sample serial number
g昌0u 百2口^1_ ,o,苗o q00 召0J口茸^ 口崔0u B。IⅢ暑^H
如 加:2 m 0
加:2 m 0
”∞ 加 m 5 0
10 l2 14 l6 l8 20 22 24 26
Sample serialnumber
lO 12 l4 16 18 2O 22 24 26
Sample serial number
2 4 6 8 10 12 14 16 l8 20 22 24 26
Sample serialnumber
2 4 6 8 1O l2 14 l6 l8 20 22 24 26
Sample serialnumber
Fig.3 Fitting situation of the calculated value based on LR(a),MLR(b),M5P(c),BP(d),SMOreg(e)
and the new model ICSMOreg(f)and actual value
表4的结论与图3是一致的,即基于实例克隆的
ICSMOreg ̄型所得到的水云母含量预测结果更接近于实测
4结论
值,且优于SMOreg,BP,M5P以及传统的物谱关联模型LR
和MLR所得到的结果。说明用基于实例克隆的ICSMOreg
方法来构建水云母含量与光谱特征参数的关联模型是行之有
效的。
Table 4 Statistical error analysis
本文首先对铀矿床蚀变矿物水云母含量与光谱吸收特征
参数进行相关分析,建立了蚀变矿物含量与光谱吸收峰的特
征参数反射率、深度、宽度和吸收面积之间的物谱关联模
型,并提出将支持向量机SMOreg用于蚀变矿物水云母的物
谱关联建模中,实验结果证明了其可行性与有效性。
在此基础上提出了一种基于实例克隆的SMOreg新模型
ICSMOreg,并将其用于铀矿床典型蚀变矿物水云母含量的
预测。用十字交叉验证方法进行检验,样品的均值绝对误差
为1.941 ,相对绝对误差为35。215 6%。实验证明本文提
出的基于实例克隆的ICSMOreg算法的预测值比SMOreg方
法更接近实际测量值,为铀矿床典型蚀变矿物含量预测提供
了一种新的有效预测模型。
1682 光谱学与光谱分析 第31卷
References
[1]MIN Mao-zhong,wU Jun—qi,Q1 Cheng-yun,et al(阂茂中,吴俊奇,戚成云,等).Uranium Geology(铀矿地质),1992,8(1):25.
[2]CHEN Wen-xia,CHEN An-sheng,CAI Zhi—hua(陈文霞,陈安升,蔡之华).Computer Engineering and Applications(计算机工程与应
用),2008,44(28):230.
[3]ZHAO Hong bo(赵洪波).Rock and Soil Mechanics(岩土力学),2005,26(2):235.
[4]GE Hong wei,LIANG Yan—chun,HU Wei,et al(葛宏伟,梁艳春,刘
与工程学报),2007,28(8):1650.
[5]WANG Yuan—yuan,CHEN Yun-hao,I I Jing(王圆圆,陈云浩,李
大学学报),2006,35(6):818.
玮,等).Journal of Rock Mechanics and Engineering(岩石力学
京).Journal ofChina UniversityofMining&Technology(中国矿业
[6]I I Tao(李
2004.
涛).Computer Immunology(计算机免疫学).Beijing:Publishing House of Electronic Industry(Jg京:电子工业出版社),
[7]HE Jian guo,MA()Yu—xian,LI Jian-zhong,et al(何建国,毛玉仙,李建中,等).Uranium Geology(铀矿地质),2008,24(4):250.
[8]WEN Zhi-jian,DU Le-tian,IdU Zheng-yi(温志坚,杜乐天,刘正义).Mineral Deposits(矿床地质),2000,19(3):257.
[9]ZHANG lAang-pei,ZHANG Li—fu(张良培,张立福).Hyperspectral Remote Sensing(高光谱遥感).Wuhan:Wuhan University Press(武
汉大学出版社),2005.
[1O]ZHONG Yan-fei,ZHANG Liang-pei,I I Ping-xiang(钟燕飞,张良培,李平湘).Chinese Journal of Computers(计算机学报),2007,30
(12):218L
[112 Platt J c.In:Scholkopf B,Burges C,Smola A,eds.Advances in Kernel Methods:Support Vector Machines.Cambridge:MIT Press,
1 998.
[12]Shevade S K,Keerthi S S,Bhattacharyya C.IEEE Transactions on Neural Networks,2000,11(5):1188.
[13]Witten I H,Eibe F Data Mining..Practical Machine Learning Tools and Techniques,Second Edition.San Francisco:Morgan Kaufmann
Press.2005.
A Novel SMOreg Algorithm Based on Instance Cloned and Its Research on
Spectral Modeling for Hydromica in Uranium Deposit
Wu Jia,CAI Zhi—hua ,GAO Zhe-chao,YU Chao
Schoo1 of Computer Science,China University of Geosciences,Wuhan 430074,China
Abstract Hydromica is a typical alteration mineral in granite-type uranium deposit,and also an important indication of uranium.
The amount of hydromiea to some extent reflects the strength of hydromicasization in uranium deposit.Because of the bad
performance of the traditional modelling methods in prediction,in the present paper,the authors’adopt SMOreg in the spectral
modelling for hydromiea,and validate its effectiveness.The authors’also propose a novel method called ICSMOreg.In this
method the authors’employ instance cloned method to learn the samples selected by having a strong affinity with the test sets,
and then get the new samples into SMOreg to build the spectral mode1.Finally,we experimentally compare ICSMOreg with
SMOreg,artificial neural network,model tree and the common modelling methods like linear regression,multiple linear regres—
sion.The result shows that the new method improves the accuracy of prediction,and also reduces the negative impact of noise.
Keywords Instance cloned;SMOreg;Spectral absorption feature parameters;Uranium deposit;Hydromica;Prediction
(Received Ju1.4,2010;accepted Oct.5,2010)
*Corresponding author
2024年4月23日发(作者:红鸿晖)
第31卷,第6期
2 0 1 1年6月
光谱学与光谱分析 Vo1.31,No.6,pp1678—1682
June,2011 Spectroscopy and Spectral Analysis
基于实例克隆的ICSMOreg算法及在铀矿床蚀变矿物
水云母中的物谱建模研究
吴 佳,蔡之华 ,高哲超,余
中国地质大学计算机学院,湖北武汉
超
430074
摘要水云母是花岗岩型铀矿床蚀变带中的一种典型蚀变矿物,它也是铀矿找矿的一个重要标志。水云
母含量的大小能在一定程度上体现铀矿床水云母化的强弱。传统建模方法对水云母含量的预测效果较差。
文章将回归支持向量机SMOreg应用到水云母物谱关联建模中,并在验证其有效性的基础上提出一种基于
实例克隆的ICSMOreg方法,以构建水云母含量与光谱特征参数的关联模型。该方法首先选择与待测样本亲
和度较强的部分样本,运用实例克隆的方法对其进行克隆学习,再将得到的新样本数据输入SMOreg,建立
水云母的物谱关联模型。最后将文章提出的算法与SMOreg算法、人工神经网络、模型树及常用的高光谱物
谱关联模型巾的一元线性回归、多元线性回归的预测结果相比较,表明提出的算法预测结果精度高于现有
算法,且通过克隆与待测样本亲和度强的样本降低了无用信息在预测过程中所造成的负面影响。
关键词实例克隆;SMOreg算法;光谱吸收特征参数;铀矿床;水云母;预测
文献标识码:A DOI:10.3964/j.issn.1000—0593(2011)06—1678—05 中图分类号:TP301.6
生物模型来解决很多实际工程问题,尤其足人工神经免疫算
引 言
水云母是主要的铀矿床蚀变矿物之一,在铀矿勘测的过
程中具有很重要的作用n]。目前国内外还缺乏对花岗岩型铀
矿床水云母化蚀变矿物光谱特征的系统研究。本文首先对蚀
变矿物水云母的含量 光谱吸收特征参数(光谱吸收特征参
法的诞生l6]。本文在研究生物免疫系统中克隆机理的基础上
提出一种基于实例克隆的ICSMOreg算法来提高支持向量机
SMOreg的预测精度,该算法模拟生物免疫系统的克隆机理,
扩大了优秀个体(亲和度较高的实例)的规模,从而降低了无
用信息在预测过程中造成的负面影响,提高了预测的精度。
数是反射光谱线的吸收峰所对应的各参数)之间的变化关系
进行相关分析,建立蚀变矿物含量与光谱吸收峰的反射率、
深度、面积和宽度之间的物谱关联模型,从而可以根据光谱
数据预测矿物水云母的含量。据前人研究,在高光谱遥感中
广泛使用的物谱关联建模技术主要有统计回归分析、散点图
等 。统计凹归分析模型主要有一元线性回归、多元线性回
归等。这些同归模型都具有一定的局限性,而且所建立的模
型结构较为简单, 精度比较低。
在数据挖掘技术中,m现r一些新型的复杂非线性系统
建模技术,如支持向量机 、人工神经网络[4]、模型树 ]等。
1水云母光谱特征分析
1.1水云母诊断性光谱特征
蚀变花岗岩中的水云母是富钾离子的热液与固相斜长石
作用的产物,鉴于其重要的指矿价值,何建国等l7J通过提取
水云母矿物的诊断性光谱特征,并对其主要的吸收峰成因进
行了分析。本文获取。j-201铀矿床的6个水云母的粉末样
品,其光谱曲线如图1所示。由图1可以看出2 117~2 121
nm位置的吸收峰规模小,吸收弱,对高光谱遥感而言,目前
很难应用;2 349 ̄2 352 nm位置的吸收峰与绿泥石的诊断
我们在研究传统方法的基础上,将支持向量机SMOreg的方
法应用于水云母物谱关联建模,实验结果表明了该方法的可
行性 有效性。近年来,人们又逐渐开始将注意力转向模拟
收稿日期:2010—07—04,修订日期:2OlO 10—05
性吸收峰l8]基本一致,所以不具有代表性;2 206 ̄2 210 nIn
位置的吸收峰深、窄,呈尖锐的“V”型,是花岗岩型铀矿床
水云母化最为显著的诊断性吸收峰。
基金项目:国家(863计划)项目(2009AA12Z117)和湖北省自然科学基金项目(2009CDBI 39)资助
作者简介:吴佳,1987年生,中国地质大学(武汉)计算机学院在读博士研究生
e-mail:zhcai@cug.edu.cn
e-mail:wujiawb@126.com
*通讯联系人
第6期 光谱学与光谱分析 1679
舳加∞∞∞如加
400 80o l 20o l 600 2 000 2400
iFg.1 Spectral curve of damourite
1.2水云母诊断性光谱特征参数提取原理
光谱吸收峰是矿物识别的主要依据,而矿物的单个诊断
性吸收峰特征又可用光谱吸收特征参数来作完整的表达。光
谱吸收特征参数即反射光谱曲线的吸收峰所对应的各参数,
包括波段位置(P)、宽度(w)、深度(H)、吸收面积(A),如
图2所示。
波段位置(P):在经过包络线消除算法处理后形成的归
一
化光谱曲线上,吸收峰的最小值对应的波长即为吸收谱带
的位置(P)。
宽度(w):吸收峰的宽度可定义为 z— ,其中 是光
谱吸收谷的起始点, z是光谱吸收谷的终点。
70
6O
a
蛊
口
50
l
JD( 0) 3,2
Wavelength/nm
Fig.2 Schematic diagram of mineral spectral
absorption feature parameters
Table 1 Resules of the analysis for
damourite powder specimen
深度(H):吸收峰的吸收深度即为归一化值为1的曲线
与吸收峰的最小值之间的垂直距离。
吸收面积(A):吸收面积即为归一化值为1的曲线和吸
收峰之问的面积。
本文采用包络线分析技术进行水云母诊断性光谱吸收特
征参数的提取_g 。
1.3水云母诊断性光谱特征参数与含量的关系
201矿床的6个水云母粉末样品中各成分的含量见表1,
结合图I对6组样本的光谱曲线在2 206 ̄2 210 nIn位置的
诊断性吸收峰规模与水云母发育程度的对比观察发现,随着
水云母化的增强,水云母的主要诊断性吸收峰越来越显著,
表现为特征吸收峰变深,吸收面积变大。
2基于实例克隆的ICSMOreg算法
2.1实例克隆原理
克隆选择理论是基于抗原刺激而产生免疫应答这一生物
免疫系统的基本特性提出的[ ],用来解释免疫系统与抗原
反应的过程。在生物体受到细菌和病毒的入侵后,B细胞就
开始克隆和消灭这些入侵者,而能够识别抗原的细胞则根据
其识别水平的高低通过无性繁殖实现增殖,与抗原的亲和度
高的细胞有能力产生更多的后代,而这些细胞也会经历略小
的变异。
实例克隆的思想是模拟生物免疫系统的克隆机理。实例
克隆对应着一个亲和度变换的过程,即由抗原亲和度较高的
个体在克隆选择机制的作用下,经历增殖复制过程后,取代
亲和度较低的个体。
2.2 SMOreg算法简介
Platt[1l_提出的序列最小优化(sequential minimal optimi—
zation,SMO)方法以其训练速度快、扩展能力强等优点得到
了最为广泛的应用。SMO算法在使用KKT条件来选择需要
优化的样本时只使用了单一的阈值.8,当样本都出现在边界
上时,该阈值就无法确定。针对这一问题,Shevadel1纠提出了
一
种改进的SMO算法SMOreg,该方法在使用KKT条件判
断优化时使用了两个阈值参数b 和 ,并在论文中给出了
参数的详细定义。
2.3 ICSMOreg算法
本文提出的基于实例克隆的ICSMOreg算法通过2个步
骤来构建水云母的物谱关联模型,进而对水云母的含量进行
预测:首先是通过计算待测样本(抗原)与训练样本集(初始
抗体种群)之间的亲和度,选择克隆样本进行克隆并更新抗
体种群;然后利用新的实例集合来构建SMOreg预测模型。
步骤l:初始抗体种群的产生。首先将样本集合中水云
母的各个特征参数作为其特征值,利用训练样本来构建初始
抗体种群。待测样本为抗原g ,抗原集合G一{g )( —l,2,
…
,
N),其中N为抗原实例集合的抗原总数。抗体b 为训练
样本,抗体集合B一{b )( 一1,2,…,L),其中L为抗体实
例集合的抗体总数。
步骤2:亲和度计算。采用样本个体至抗体的欧式距离
来计算亲和度的值。距离越小,表明该抗体实例与抗原实例
之问的亲和度就越大。假设g为抗原实例,b为抗体实例,
则抗原和抗体之间的亲和度可以表示为
——一
一一
/ ( 一b ) 一1,2,…,N (1)
1
式中,m表示实例的属性个数,N表示抗原实例集合的大
1680
,J、。
光谱学与光谱分析 第3l卷
步骤3:抗体选择。从抗体实例集合也就是训练样本集
合中选出与抗原亲和力最好的 个抗体,组成新的抗体集合
B 。
步骤4:实例克隆。对选出来的n个抗体进行克隆操作,
克隆过程中采用非等比例进行克隆,克隆的数量与其亲和度
成正比。克隆的规模为z,抗体集合B 中第i个抗体被克隆
数量为
N Z×l广 ] 厂J.J (2)
步骤5:更新抗体种群。将克隆后的抗体种群取代原始
的抗体实例种群。
步骤6:在新的抗体实例集合上构建局部SMOreg预测
模型,并返回预测结果。
2.4 ICSMOreg算法参数分析
在用ICSMOreg算法进行建模的过程中,用户需设定以
下六个极其重要的参数:
(1)n:在初始抗体实例集合中被选出来用于克隆的抗
体实例总数。
(2)N:从初始抗体种群B中选出的"个最优抗体组成
的实例集合B 的克隆规模。
; M如∞一 。 n 蛆 ;一。 。一
(3)C:惩罚系数,对错误分类的惩罚力度。
1一暑一 收溅面 ~、量旱一~ u鼹一 髂n∞一 鼹 ; 一M一。"加一。 un鸲一
M∞一 n M"鼹一 : u 一蚰¨一 ∞ "弘一
(4)e:e不敏损失函数的不敏损失度。
(5)kernel:核函数,实现从低维空间到高维空间的映
射。
(6)A:核参数,影响核函数的性能。
本文将对参数n和N对ICSMOreg性能的影响进行详
细的分析。
3水云母含量预测实例研究
3.1实验数据
实验数据是通过对26组人工混合粉样(按一定的种类和
相对重量百分比的蚀变单矿物经由人工充分混合而成)的光
谱特征参数进行分析统计而得。混合所用的单矿物有石英、
绿泥石和水云母,均取自铀矿蚀变带,样本均采用室内矿物
分选得到,其详细的统计数据如表2所示。由于原始样本中
各指标的数量级差别很大,为消除指标量纲的影响,对输入
样本需要进行归一化处理。
3.2 ICSMOreg建模的参数设定
建模的主要运行参数设定如表3所示。
3.3实验方法及结果分析
本文采用数据挖掘平台weka进行建模。Weka数据挖
掘平台l1 是由新西兰怀卡托(Waikato)大学Witten的机器学
习小组用java开发出来的一个通用平台。实验采用1O次运
行十字交叉验证方法(10 runs of 10一fold cross validation),即
用十分之九的数据进行训练,十分之一的数据进行测试,重
复此过程1O次。图3(a)一(f)分别给出本文中提及的六种模
型预测值与实测值之间的拟合情况。
∞一" 毖 盯加u一 n一捣一 n一 ∞J一 M一捣 印一 鼹一∞码一。
Table 3 Parameter settings of ICSMOreg algorithm
运行参数 参数取值
克隆选择的样本数
5
克隆规模N
1.0
舍入误差eps
1.0E——12
误差容忍值e
0.001 0
数据转换类型filterType
Normalize(标准化)
核函数kernel
PolyKernel(径向基核)
核参数
1.0
由图3可以看出:与传统的高光谱物谱关联模型一元线
性回归LR、多元线性回归MLR和神经网络BP、模型树
MSP相比,基于SMOreg的水云母预测模型在26个实验样
本上能较精确地预测实际的水云母含量。这说明了支持向量
机运用于蚀变矿物水云母含量的预测是可行也是有效的。在
SMOreg的基础上,本文提出的基于实例克隆的ICSMOreg
算法的预测值比SMOreg方法更接近实际测量值。
为了更加直观地说明ICSMOreg算法的优越性,我们以
均值绝对误差(mean absolute error)和相对绝对误差(relative
absolute error)作为评价标准。从六种算法的误差分析(见表
4),可以看出:
(1)基于SMOreg的水云母预测模型的均值绝对误差和
相对绝对误差分别为2.315 8 和42.016 5 ,模型准确度
一M阻 ,
第6期 光谱学与光谱分析 l68l
优于传统的物谱关联模型LR(2.489
口3口0u再 IⅧ8 雹
9%,45.175 2%)、
Ial
Ⅱo口 01ⅢoJp^1
(2)本文提出的基于实例克隆的[
_I 口o0 81uI2 ^】_
CSMOreg模型的均值
I
MLR(2.489 9 ,45.175 2 )和
绝对误差为1.941 ,相对绝对误差为35.215 ,明显小
加 m 0
6
如 加
BP(2.423 5
m 0
,43.969
如
加 :2 m 5 0
7%)、M5P(2.375 5 ,43.099 6 )。
于SMOreg算法。
2 4 6 8 10 12 14 16 18 20 22 24 26
Sample serial number
2 4 6 8 10 12 14 16 18 2O 22 24 26
Sample serial number
g昌0u 百2口^1_ ,o,苗o q00 召0J口茸^ 口崔0u B。IⅢ暑^H
如 加:2 m 0
加:2 m 0
”∞ 加 m 5 0
10 l2 14 l6 l8 20 22 24 26
Sample serialnumber
lO 12 l4 16 18 2O 22 24 26
Sample serial number
2 4 6 8 10 12 14 16 l8 20 22 24 26
Sample serialnumber
2 4 6 8 1O l2 14 l6 l8 20 22 24 26
Sample serialnumber
Fig.3 Fitting situation of the calculated value based on LR(a),MLR(b),M5P(c),BP(d),SMOreg(e)
and the new model ICSMOreg(f)and actual value
表4的结论与图3是一致的,即基于实例克隆的
ICSMOreg ̄型所得到的水云母含量预测结果更接近于实测
4结论
值,且优于SMOreg,BP,M5P以及传统的物谱关联模型LR
和MLR所得到的结果。说明用基于实例克隆的ICSMOreg
方法来构建水云母含量与光谱特征参数的关联模型是行之有
效的。
Table 4 Statistical error analysis
本文首先对铀矿床蚀变矿物水云母含量与光谱吸收特征
参数进行相关分析,建立了蚀变矿物含量与光谱吸收峰的特
征参数反射率、深度、宽度和吸收面积之间的物谱关联模
型,并提出将支持向量机SMOreg用于蚀变矿物水云母的物
谱关联建模中,实验结果证明了其可行性与有效性。
在此基础上提出了一种基于实例克隆的SMOreg新模型
ICSMOreg,并将其用于铀矿床典型蚀变矿物水云母含量的
预测。用十字交叉验证方法进行检验,样品的均值绝对误差
为1.941 ,相对绝对误差为35。215 6%。实验证明本文提
出的基于实例克隆的ICSMOreg算法的预测值比SMOreg方
法更接近实际测量值,为铀矿床典型蚀变矿物含量预测提供
了一种新的有效预测模型。
1682 光谱学与光谱分析 第31卷
References
[1]MIN Mao-zhong,wU Jun—qi,Q1 Cheng-yun,et al(阂茂中,吴俊奇,戚成云,等).Uranium Geology(铀矿地质),1992,8(1):25.
[2]CHEN Wen-xia,CHEN An-sheng,CAI Zhi—hua(陈文霞,陈安升,蔡之华).Computer Engineering and Applications(计算机工程与应
用),2008,44(28):230.
[3]ZHAO Hong bo(赵洪波).Rock and Soil Mechanics(岩土力学),2005,26(2):235.
[4]GE Hong wei,LIANG Yan—chun,HU Wei,et al(葛宏伟,梁艳春,刘
与工程学报),2007,28(8):1650.
[5]WANG Yuan—yuan,CHEN Yun-hao,I I Jing(王圆圆,陈云浩,李
大学学报),2006,35(6):818.
玮,等).Journal of Rock Mechanics and Engineering(岩石力学
京).Journal ofChina UniversityofMining&Technology(中国矿业
[6]I I Tao(李
2004.
涛).Computer Immunology(计算机免疫学).Beijing:Publishing House of Electronic Industry(Jg京:电子工业出版社),
[7]HE Jian guo,MA()Yu—xian,LI Jian-zhong,et al(何建国,毛玉仙,李建中,等).Uranium Geology(铀矿地质),2008,24(4):250.
[8]WEN Zhi-jian,DU Le-tian,IdU Zheng-yi(温志坚,杜乐天,刘正义).Mineral Deposits(矿床地质),2000,19(3):257.
[9]ZHANG lAang-pei,ZHANG Li—fu(张良培,张立福).Hyperspectral Remote Sensing(高光谱遥感).Wuhan:Wuhan University Press(武
汉大学出版社),2005.
[1O]ZHONG Yan-fei,ZHANG Liang-pei,I I Ping-xiang(钟燕飞,张良培,李平湘).Chinese Journal of Computers(计算机学报),2007,30
(12):218L
[112 Platt J c.In:Scholkopf B,Burges C,Smola A,eds.Advances in Kernel Methods:Support Vector Machines.Cambridge:MIT Press,
1 998.
[12]Shevade S K,Keerthi S S,Bhattacharyya C.IEEE Transactions on Neural Networks,2000,11(5):1188.
[13]Witten I H,Eibe F Data Mining..Practical Machine Learning Tools and Techniques,Second Edition.San Francisco:Morgan Kaufmann
Press.2005.
A Novel SMOreg Algorithm Based on Instance Cloned and Its Research on
Spectral Modeling for Hydromica in Uranium Deposit
Wu Jia,CAI Zhi—hua ,GAO Zhe-chao,YU Chao
Schoo1 of Computer Science,China University of Geosciences,Wuhan 430074,China
Abstract Hydromica is a typical alteration mineral in granite-type uranium deposit,and also an important indication of uranium.
The amount of hydromiea to some extent reflects the strength of hydromicasization in uranium deposit.Because of the bad
performance of the traditional modelling methods in prediction,in the present paper,the authors’adopt SMOreg in the spectral
modelling for hydromiea,and validate its effectiveness.The authors’also propose a novel method called ICSMOreg.In this
method the authors’employ instance cloned method to learn the samples selected by having a strong affinity with the test sets,
and then get the new samples into SMOreg to build the spectral mode1.Finally,we experimentally compare ICSMOreg with
SMOreg,artificial neural network,model tree and the common modelling methods like linear regression,multiple linear regres—
sion.The result shows that the new method improves the accuracy of prediction,and also reduces the negative impact of noise.
Keywords Instance cloned;SMOreg;Spectral absorption feature parameters;Uranium deposit;Hydromica;Prediction
(Received Ju1.4,2010;accepted Oct.5,2010)
*Corresponding author