2024年4月15日发(作者:莫英范)
QTL
定位的研究方法
李 宏
(渝州大学生物学系重庆400033)
QTL定位就是采用类似单基因定位的方法将
QTL定位在遗传图谱上,确定QTL与遗传标记间的距
离(以重组率表示)
[1]
。根据标记数目的不同,可分为单
标记、双标记和多标记几种方法。根据统计分析方法的
不同,可分为方差与均值分析法、回归及相关分析法、矩
估计及最大似然法等。根据标记区间数可分为零区间作
图、单区间作图和多区间作图。此外,还有将不同方法结
合起来的综合分析方法,如
QTL
复合区间作图(
CIM
)、
多区间作图(
MIM
)、多
QTL
作图、多性状作图(
MTM
)
等等。
建立在标记与数量性状之间相互关联基础上的关
联分析方法主要有两类:1)以标记为基础(Marker-
Based)的平均值差异法(简称MB法);2)以性状为基础
(Trait-Basedmethod)的方法(简称TB法)。许多学者
根据不同群体的遗传特性,分别提出了相应的标记座位
与QTL相互关联的检测方法,所涉及到的群体包括:
近交系间分离群体,异交系间分离群体,加倍单倍体
(
DH
)群体,两个近交系间的重组近交系(
RIL
),一粒传
群体(
SSD
),单倍体群体等。
目前
QTL
定位分析采用的分子标记为限制性片
段长度多态(RFLP)、扩增片段长度多态(AFLP)、可变
数目序列重复(VNTR)、微卫星(microsatellite)、简单序
列重复(SSR)、单股构象DNA多态(SSCP)、双股构象
DNA多态(DSCP)以及RAPD。
QTL定位方法主要有如下几种:
1 均值-方差分析法
直接利用均值和方差进行分析,进行重组率及
QTL
遗传参数的估计,称之为均值方差分析法。由于
QTL
同效等位基因在双亲间分散分布的影响,可考虑
用
F
2群体中表型极端的两类个体来代替亲本
P
1和
P
2
进行分析,以估计重组率、基因加性效应和显性效应。有
关的亲本均值和方差分别用两类极端个体的均值和方
差代替。
2 矩法和最大似然法
1986年Weller将最大似然技术应用到用两个近交
系间杂交F2代的分析,估计介于标记位点和QTL之
间的重组值。尽管
Weller
(1986)使用的方法不能保证获
得的估计是最大似然估计,但在理论上开创了利用最大
似然法定位
QTL
的先例。
Luo
和
Kearsey
(1989,1991)
发展了分别适合于近交
F
2、回交(
BC
)群体和加倍单倍
体(DH)群体的统计方法。并获得了数量性状基本参数
的最大似然估计。但该方法只适合于遗传率大于0.1的
单个QTL控制的性状,当多个QTL控制该性状时,该
方法有效。因此Darvasi和Weller(1992)认为该方法只
是一种近似最大似然估计,Luo和Wolliams(1993)将其
改称为矩估计法,并发展了相应的适合于近交F2群体
的最大似然估计法。同时还考虑了QTL基因型间数量
性状方差的同质性(方差同质模型)和异质性(方差异质
模型)。徐云碧(1994)引入了似然比检验统计量(LOD),
解决了重组值和连锁的显著性检验问题。
3 相关分析法
Z
.
Huetal
(1995)提出了重组近交系中检测和估计
标记座位和数量性状座位间连锁的相关方法。此方法的
有效性是预期重组值E(r)、QTL基因型均值间标准差
(d)以及样本大小N的函数。
一般情况下,用相关方法进行的r值估计偏高,与
最大似然法的结果相反。相关方法和标记基因型均值比
较法在任何E(r)和d情况下,r值估计都无差别。在不
完全连锁时,该方法估计重组值没有连锁的检测有效。
该方法仅基于1个
QTL
,或1个紧密连锁的一簇
QTLs
控制1个数量性状,
QTLs
的效应是加性的。假定不连
锁的
QTLs
也控制该性状,由于所考虑的
QTL
的方差
与其它未连锁的
QTLs
的方差相混淆,
r
的估计值将偏
高。
在相关方法的研究方面,国内学者胡中立等除提出
了重组近交系(RIL)和双单倍体(DH)群体中使用单个
标记座位定位1个QTL的相关方法外,还再进一步提
出DH群体中区间双标记座位定位QTL的相关方法,
李宏(1999)又对该方法进行了改善,提出了Haldane作
图函数在有交叉干涉存在时(即
C
≠1)
DH
群体区间双
标记定位
QTL
的相关方法
[2]
。并将相关方法拓展到
BC
[4]
群体的
QTL
定位。
4 区间作图法
近年来,由于分子生物学技术的发展,许多生物构
建了精细的分子遗传标记图谱,这大大促进了QTL的
系统作图和分析。Lander和Botstein(1989)提出了一种
有很大改进的方法来定位QTL的位置,称之为区间作
图法(IM)。区间作图法(IM)可以在标记覆盖的任何位
置进行并沿染色体产生1个连锁的LRT统计轮廓线,
在某染色体区段具有明显最大的
LRT
统计值的位置即
为
QTL
的估计位置。已经证明,
IM
方法比标记直接分
析法更加有效,并且要求较少的后代。
Haley
和
Knott
(1992)提出了区间作图的回归方法,近似
IM
。但
Haley
和Knott的方法对剩余方差的估计有偏差,QTL检测
的有效性可能受到影响(Xu,1995)。
IM方法在QTL作图模型中1次只考虑1个
2002年第37卷第6期 生 物 学 通 报
—53—
QTL。因此,当同一连锁群中有多个QTL时,IM可能
对QTL的估计造成偏差(LanderandBostein1989;Ha-
leyandKnott1992;Zeng1994)。为了解决多个QTL的
问题,
Jansen
(1993)和
Zeng
(1993,1994)分别提出了将
IM
方法与多元回归分析相结合进行作图。
Zeng
称之为
“复合区间作图法”(CM)
[4]
。
5 复合区间作图法
Lander和Botstein(1989)曾倡导了对多个区间上
的多个
QTL
进行同步检测的策略。但在参数估计及模
型鉴别上存在一些困难。此外,1个染色体上
QTL
数目
不确定,因此,作图有偏差,而且该法仍然未利用其它标
记所提供的信息。Haley和Knott(1992)以及Martinez
和Curnow(1992)曾建议利用二元回归分析沿着被检测
的染色体在二维检验空间检测以定位两个
QTL
。
Moreno
-
Gonzalez
(1992)提出以区间作图为骨架的混合
模型(Mixturemodel)分析法。Jansen(1993)倡导了一种
将多元回归分析与区间作图相结合的QTL作图方法,
类似于复合区间作图法,但也有不同之处。
Zeng
(1993)将多元回归分析用于
QTL
作图,并指
出多元回归中表型对标记的偏回归系数只取决于相邻
标记所包括的区间中的QTL,与其它区间的QTL无
关。这为QTL作图的区间检验提供了基础。Zeng
(1994)发展了一种作图方法,利用多个标记以改善多个
这一方法的基础是区间检验,
QTL
作图的精度和效率。
所构建的检验统计量不受区间以外的其他
QTL
的影
响。Zeng(1994)倡导的QTL作图方法,将QTL检验和
作图中单个QTL的效应分开来,这可显著提高作图的
精度。这一方法更适用于遗传率较高的性状。Zeng
(1994)只分析了回交群体设计,并且忽略了上位性,如
果
QTL
存在上位性,该作图法可能仍然是有偏的。在
QTL作图分析上位性所遇到的问题是多种类型的遗传
上位性,并且尚未很好地定义起作用的上位性遗传参
数。在原理上,如果遗传上位性的类型可以鉴别,就可以
在
QTL
作图模型中拟合上位性
[2]
。
6 多区间作图
Kao和Zeng(1999年)提出多区间作图(MIM),该
方法同时利用多个标记区间进行多个QTL的作图。
MIM模型的遗传参数的解释与Cockerham的模型相
同,并且用最大似然法估计遗传参数。使用
MIM
方法,
QTL
作图的精度和有效性可得到改进。
QTL
间的上位
性、个体的基因型值和数量性状的遗传力可以得到准确
估计和分析。应用MIM模型,提出了以似然比检验统
计量为临界值的分步选择步骤来证实QTL。应用估计
的
QTL
效应和位置,可以探索对于特殊目的和要求的
性状改良的标记辅助选择的最佳策略。
MIM
的
Fortran
程序可在Web网上获得(.
/~chkao/)。
7 多性状作图
最近一些学者对多性状QTL的检测进行了探索
(Jiang和Zeng1995;Koroletal1995;Welleretal
1997)。对多性状-
QTL
作图感兴趣有如下几个原因。假
如选择是基于
QTL
基因型,不仅对
QTL
在重要经济
性状的遗传协方差中的作用的了解是重要的,而且检测
QTL的统计效力在多性状分析中较单性状为高。
基因型选择应用于家畜QTL测定实验,只有具极
端表型的动物才确定基因型。对于基因型已确定的动
物,
QTL
检测的效力与方法有关。简单回归方法可用于
估计选择基因型的参数,但估计是有偏的。为获得无偏
估计,最大似然法可应用于整套数据的分析,包括未确
定基因型的动物(Lander或Botstein1989),或者得到
参数的近似估计(
Darvasi
和
Soller
1992;
Muranty
和
Goffinet
1997)。
Markov
链、
MonteCarol
方法,对缺失
数据的抽样,也适合于基因型选择的数据。当进行基因
型选择时,与此性状有关的其它性状的QTL效应的估
计也存在问题。除非将基因型选择和相关性考虑在内,
否则相关性参数估计是有偏差的。绝大多数用于
QTL
检测统计方法,都在不同标记基因型的表型间作了比
较。而不同表型的标记基因型也可进行比较。Lebowitz
etal(1987)称这种方法为基于性状的方法,相对于基于
标记的方法。
从目前的研究来看,有关
QTL
作图方法的研究进
展较快,不断有学者提出新的改进方法,就目前来讲,有
许多QTL作图方法还未被遗传学研究工作者普遍接
受,主要是由于有的方法计算太复杂,或者检测QTL
的效力和精度不够理想,目前应用较为广泛的是Lan-
der
和
Botstein
倡导的区间作图法,该方法比较成熟,又
被许多遗传学家所推崇,但仍然不够理想,也有需待改
进的地方,不过从发展的趋势来看,有关QTL作图的
研究在今后一段时间仍是遗传学研究的一大热点,现在
开展的工作仅是进行检测、定位和作图,要应用到作物
和家蓄等的改进方面,以及进行基因克隆等操作,尚有
很多问题需要解决。
参考文献
1 盛志廉,陈瑶生编著.数量遗传学.科学出版社,1999,
340—347.
2 LiHong:Acorrelationmethodformappingquantitative
traitlociindoublehaploidpopulationusingflanking
markersinconditionofcross
-
overinterference
.10
th
in-
ternationalcongressongenes
,
genefamilies
,
and
isozymes
.1999,89.
3 李宏.基于三点测交的双标记-QTL基因定位的相关方
法.生物数学学报,2000,15(1):93—98.
4 Chen-HungKao,-
eintervalmappingforquantitativetraitloci.
Genetics,1999,152:1203—1216.
(
BH
)
—54—
生 物 学 通 报 2002年第37卷第6期
2024年4月15日发(作者:莫英范)
QTL
定位的研究方法
李 宏
(渝州大学生物学系重庆400033)
QTL定位就是采用类似单基因定位的方法将
QTL定位在遗传图谱上,确定QTL与遗传标记间的距
离(以重组率表示)
[1]
。根据标记数目的不同,可分为单
标记、双标记和多标记几种方法。根据统计分析方法的
不同,可分为方差与均值分析法、回归及相关分析法、矩
估计及最大似然法等。根据标记区间数可分为零区间作
图、单区间作图和多区间作图。此外,还有将不同方法结
合起来的综合分析方法,如
QTL
复合区间作图(
CIM
)、
多区间作图(
MIM
)、多
QTL
作图、多性状作图(
MTM
)
等等。
建立在标记与数量性状之间相互关联基础上的关
联分析方法主要有两类:1)以标记为基础(Marker-
Based)的平均值差异法(简称MB法);2)以性状为基础
(Trait-Basedmethod)的方法(简称TB法)。许多学者
根据不同群体的遗传特性,分别提出了相应的标记座位
与QTL相互关联的检测方法,所涉及到的群体包括:
近交系间分离群体,异交系间分离群体,加倍单倍体
(
DH
)群体,两个近交系间的重组近交系(
RIL
),一粒传
群体(
SSD
),单倍体群体等。
目前
QTL
定位分析采用的分子标记为限制性片
段长度多态(RFLP)、扩增片段长度多态(AFLP)、可变
数目序列重复(VNTR)、微卫星(microsatellite)、简单序
列重复(SSR)、单股构象DNA多态(SSCP)、双股构象
DNA多态(DSCP)以及RAPD。
QTL定位方法主要有如下几种:
1 均值-方差分析法
直接利用均值和方差进行分析,进行重组率及
QTL
遗传参数的估计,称之为均值方差分析法。由于
QTL
同效等位基因在双亲间分散分布的影响,可考虑
用
F
2群体中表型极端的两类个体来代替亲本
P
1和
P
2
进行分析,以估计重组率、基因加性效应和显性效应。有
关的亲本均值和方差分别用两类极端个体的均值和方
差代替。
2 矩法和最大似然法
1986年Weller将最大似然技术应用到用两个近交
系间杂交F2代的分析,估计介于标记位点和QTL之
间的重组值。尽管
Weller
(1986)使用的方法不能保证获
得的估计是最大似然估计,但在理论上开创了利用最大
似然法定位
QTL
的先例。
Luo
和
Kearsey
(1989,1991)
发展了分别适合于近交
F
2、回交(
BC
)群体和加倍单倍
体(DH)群体的统计方法。并获得了数量性状基本参数
的最大似然估计。但该方法只适合于遗传率大于0.1的
单个QTL控制的性状,当多个QTL控制该性状时,该
方法有效。因此Darvasi和Weller(1992)认为该方法只
是一种近似最大似然估计,Luo和Wolliams(1993)将其
改称为矩估计法,并发展了相应的适合于近交F2群体
的最大似然估计法。同时还考虑了QTL基因型间数量
性状方差的同质性(方差同质模型)和异质性(方差异质
模型)。徐云碧(1994)引入了似然比检验统计量(LOD),
解决了重组值和连锁的显著性检验问题。
3 相关分析法
Z
.
Huetal
(1995)提出了重组近交系中检测和估计
标记座位和数量性状座位间连锁的相关方法。此方法的
有效性是预期重组值E(r)、QTL基因型均值间标准差
(d)以及样本大小N的函数。
一般情况下,用相关方法进行的r值估计偏高,与
最大似然法的结果相反。相关方法和标记基因型均值比
较法在任何E(r)和d情况下,r值估计都无差别。在不
完全连锁时,该方法估计重组值没有连锁的检测有效。
该方法仅基于1个
QTL
,或1个紧密连锁的一簇
QTLs
控制1个数量性状,
QTLs
的效应是加性的。假定不连
锁的
QTLs
也控制该性状,由于所考虑的
QTL
的方差
与其它未连锁的
QTLs
的方差相混淆,
r
的估计值将偏
高。
在相关方法的研究方面,国内学者胡中立等除提出
了重组近交系(RIL)和双单倍体(DH)群体中使用单个
标记座位定位1个QTL的相关方法外,还再进一步提
出DH群体中区间双标记座位定位QTL的相关方法,
李宏(1999)又对该方法进行了改善,提出了Haldane作
图函数在有交叉干涉存在时(即
C
≠1)
DH
群体区间双
标记定位
QTL
的相关方法
[2]
。并将相关方法拓展到
BC
[4]
群体的
QTL
定位。
4 区间作图法
近年来,由于分子生物学技术的发展,许多生物构
建了精细的分子遗传标记图谱,这大大促进了QTL的
系统作图和分析。Lander和Botstein(1989)提出了一种
有很大改进的方法来定位QTL的位置,称之为区间作
图法(IM)。区间作图法(IM)可以在标记覆盖的任何位
置进行并沿染色体产生1个连锁的LRT统计轮廓线,
在某染色体区段具有明显最大的
LRT
统计值的位置即
为
QTL
的估计位置。已经证明,
IM
方法比标记直接分
析法更加有效,并且要求较少的后代。
Haley
和
Knott
(1992)提出了区间作图的回归方法,近似
IM
。但
Haley
和Knott的方法对剩余方差的估计有偏差,QTL检测
的有效性可能受到影响(Xu,1995)。
IM方法在QTL作图模型中1次只考虑1个
2002年第37卷第6期 生 物 学 通 报
—53—
QTL。因此,当同一连锁群中有多个QTL时,IM可能
对QTL的估计造成偏差(LanderandBostein1989;Ha-
leyandKnott1992;Zeng1994)。为了解决多个QTL的
问题,
Jansen
(1993)和
Zeng
(1993,1994)分别提出了将
IM
方法与多元回归分析相结合进行作图。
Zeng
称之为
“复合区间作图法”(CM)
[4]
。
5 复合区间作图法
Lander和Botstein(1989)曾倡导了对多个区间上
的多个
QTL
进行同步检测的策略。但在参数估计及模
型鉴别上存在一些困难。此外,1个染色体上
QTL
数目
不确定,因此,作图有偏差,而且该法仍然未利用其它标
记所提供的信息。Haley和Knott(1992)以及Martinez
和Curnow(1992)曾建议利用二元回归分析沿着被检测
的染色体在二维检验空间检测以定位两个
QTL
。
Moreno
-
Gonzalez
(1992)提出以区间作图为骨架的混合
模型(Mixturemodel)分析法。Jansen(1993)倡导了一种
将多元回归分析与区间作图相结合的QTL作图方法,
类似于复合区间作图法,但也有不同之处。
Zeng
(1993)将多元回归分析用于
QTL
作图,并指
出多元回归中表型对标记的偏回归系数只取决于相邻
标记所包括的区间中的QTL,与其它区间的QTL无
关。这为QTL作图的区间检验提供了基础。Zeng
(1994)发展了一种作图方法,利用多个标记以改善多个
这一方法的基础是区间检验,
QTL
作图的精度和效率。
所构建的检验统计量不受区间以外的其他
QTL
的影
响。Zeng(1994)倡导的QTL作图方法,将QTL检验和
作图中单个QTL的效应分开来,这可显著提高作图的
精度。这一方法更适用于遗传率较高的性状。Zeng
(1994)只分析了回交群体设计,并且忽略了上位性,如
果
QTL
存在上位性,该作图法可能仍然是有偏的。在
QTL作图分析上位性所遇到的问题是多种类型的遗传
上位性,并且尚未很好地定义起作用的上位性遗传参
数。在原理上,如果遗传上位性的类型可以鉴别,就可以
在
QTL
作图模型中拟合上位性
[2]
。
6 多区间作图
Kao和Zeng(1999年)提出多区间作图(MIM),该
方法同时利用多个标记区间进行多个QTL的作图。
MIM模型的遗传参数的解释与Cockerham的模型相
同,并且用最大似然法估计遗传参数。使用
MIM
方法,
QTL
作图的精度和有效性可得到改进。
QTL
间的上位
性、个体的基因型值和数量性状的遗传力可以得到准确
估计和分析。应用MIM模型,提出了以似然比检验统
计量为临界值的分步选择步骤来证实QTL。应用估计
的
QTL
效应和位置,可以探索对于特殊目的和要求的
性状改良的标记辅助选择的最佳策略。
MIM
的
Fortran
程序可在Web网上获得(.
/~chkao/)。
7 多性状作图
最近一些学者对多性状QTL的检测进行了探索
(Jiang和Zeng1995;Koroletal1995;Welleretal
1997)。对多性状-
QTL
作图感兴趣有如下几个原因。假
如选择是基于
QTL
基因型,不仅对
QTL
在重要经济
性状的遗传协方差中的作用的了解是重要的,而且检测
QTL的统计效力在多性状分析中较单性状为高。
基因型选择应用于家畜QTL测定实验,只有具极
端表型的动物才确定基因型。对于基因型已确定的动
物,
QTL
检测的效力与方法有关。简单回归方法可用于
估计选择基因型的参数,但估计是有偏的。为获得无偏
估计,最大似然法可应用于整套数据的分析,包括未确
定基因型的动物(Lander或Botstein1989),或者得到
参数的近似估计(
Darvasi
和
Soller
1992;
Muranty
和
Goffinet
1997)。
Markov
链、
MonteCarol
方法,对缺失
数据的抽样,也适合于基因型选择的数据。当进行基因
型选择时,与此性状有关的其它性状的QTL效应的估
计也存在问题。除非将基因型选择和相关性考虑在内,
否则相关性参数估计是有偏差的。绝大多数用于
QTL
检测统计方法,都在不同标记基因型的表型间作了比
较。而不同表型的标记基因型也可进行比较。Lebowitz
etal(1987)称这种方法为基于性状的方法,相对于基于
标记的方法。
从目前的研究来看,有关
QTL
作图方法的研究进
展较快,不断有学者提出新的改进方法,就目前来讲,有
许多QTL作图方法还未被遗传学研究工作者普遍接
受,主要是由于有的方法计算太复杂,或者检测QTL
的效力和精度不够理想,目前应用较为广泛的是Lan-
der
和
Botstein
倡导的区间作图法,该方法比较成熟,又
被许多遗传学家所推崇,但仍然不够理想,也有需待改
进的地方,不过从发展的趋势来看,有关QTL作图的
研究在今后一段时间仍是遗传学研究的一大热点,现在
开展的工作仅是进行检测、定位和作图,要应用到作物
和家蓄等的改进方面,以及进行基因克隆等操作,尚有
很多问题需要解决。
参考文献
1 盛志廉,陈瑶生编著.数量遗传学.科学出版社,1999,
340—347.
2 LiHong:Acorrelationmethodformappingquantitative
traitlociindoublehaploidpopulationusingflanking
markersinconditionofcross
-
overinterference
.10
th
in-
ternationalcongressongenes
,
genefamilies
,
and
isozymes
.1999,89.
3 李宏.基于三点测交的双标记-QTL基因定位的相关方
法.生物数学学报,2000,15(1):93—98.
4 Chen-HungKao,-
eintervalmappingforquantitativetraitloci.
Genetics,1999,152:1203—1216.
(
BH
)
—54—
生 物 学 通 报 2002年第37卷第6期