最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

IT圈 admin 20浏览 0评论

2024年11月2日发(作者:完颜月灵)

作物学报

ACTA

AGRONOMICA

SINICA 2020, 46(12): 18701883 /

ISSN 0496-3490; CN 11-1809/S; CODEN TSHPA9 E-mail: zwxb301@

DOI: 10.3724/SP.J.1006.2020.01009

小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

杨正钊 王梓豪 胡兆荣 辛明明 姚颖垠 彭惠茹 尤明山

宿振起

*

郭伟龙

*

中国农业大学农学院 / 农业生物技术国家重点实验室 / 杂种优势研究与利用教育部重点实验室, 北京 100193

摘 要: 济麦22和良星99是我国黄淮冬麦区和北部冬麦区大面积推广的高产小麦品种, 也是目前小麦杂交育种的

重要亲本。虽然济麦22和良星99的来源和系谱不同, 但在重要农艺、产量等性状上存在较高的相似性。为了从全

基因组水平研究其遗传组成的异同, 本研究采用Illumina HiSeq2500测序平台对上述两个品种进行了全基因组测序

(平均测序深度为5.8×), 并系统地比较了两个品种拷贝数变异(CNV)、单核苷酸多态性(SNP)和插入/缺失(InDel)的序

列差异。与中国春参考基因组序列相比, 两个品种除了具有总长466 Mb的共有CNV变异区间外, 济麦22和良星99

的特有CNV变异区间的总长分别为91 Mb和45 Mb, 这些特有CNV区间主要集中在2B和4B染色体上; 济麦22

和良星99间存在1,547,371个SNP差异位点和137,817个InDel差异位点。以差异SNP分布规律为依据, 在全基因

组水平鉴定出济麦22和良星99间存在14.2%的差异多态性热点区间, 这些区间集中分布在1D、2B和4B染色体上。

通过对5个控制小麦株高和穗长基因的序列分析,

发现有2个位于多态性热点区间的基因在品种间存在移码突变。

本研究为利用重测序数据在基因组水平上比较小麦品种间遗传差异提供了重要参考, 同时揭示了济麦22和良星99

在全基因组的遗传相似区间和差异区间, 为今后小麦育种改良中更好利用济麦22与良星99提供了重要遗传信息。

关键词: 小麦; 济麦22; 良星99; 全基因组重测序; SNP; CNV

Comparative analysis of the genomic sequences between commercial wheat

varieties Jimai 22 and Liangxing 99

YANG Zheng-Zhao, WANG Zi-Hao, HU Zhao-Rong, XIN Ming-Ming, YAO Ying-Yin, PENG Hui-Ru, YOU

Ming-Shan, SU Zhen-Qi

*

, and GUO Wei-Long

*

College of Agronomy and Biotechnology / State Key Laboratory for Agrobiotechnology / Key Laboratory of Crop Heterosis and Utilization, Ministry

of Education, China Agricultural University, Beijing 100193, China

Abstract: Jimai 22 and Liangxing 99 are high-yield wheat varieties widely planted in the North Huang-Huai Rivers Valley Winter

Wheat Zone and Northern Winter Wheat Zone in China, and are currently used as important parents in wheat breeding programs.

Although the origins and pedigrees of Jimai 22 and Liangxing 99 are different, they are highly similar in many important agro-

nomic traits, yield-associated traits, and so on. To identify the genomic differences between the two varieties, we performed

whole-genome sequencing using the Illumina HiSeq2500 platform, with an average sequencing depth of 5.8×. We aligned the raw

sequencing data against the Chinese Spring reference genome and identified the difference of copy-number variation (CNV) re-

gions, single-nucleotide polymorphisms (SNPs) and InDels in sequence between the two varieties. Lengths of 466 Mb CNV in-

tervals were shared by the two varieties. The lengths of cultivar-specific CNV intervals in Jimai 22 and Liangxing 99 were 91 Mb

and 45 Mb, respectively, and these intervals are mainly located on chromosomes 2B and 4B. Beyond the CNV intervals,

1,547,371 SNPs and 137,817 InDels were different between the two cultivars. Based on the distribution of SNP densities in the

intervals, we identified the polymorphic hotspot regions on chromosomes 1D, 2B, and 4B, making up 14.2% of the whole genome.

本研究由国家重点研发计划项目(2018YFD0100803), 国家自然科学基金项目(31701415)和中央高校基本科研业务费专项资助。

This study was supported by the National Key Research and Development Program of China (2018YFD0100803), the National Natural

Science Foundation of China (31701415), and the Chinese Universities Scientific Fund.

*

通信作者(Corresponding authors): 郭伟龙, E-mail: guoweilong@; 宿振起, E-mail: suzhenqi80@

第一作者联系方式: E-mail: yangzhengzhao@

Received (收稿日期): 2020-01-15; Accepted (接受日期): 2020-06-02; Published online (网络出版日期): 2020-08-10.

URL: /kcms/detail/

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1871

The sequences of five previous cloned dwarf genes and spike length related genes were investigated, and two genes located in the

polymorphic hotspot regions were detected with the frame shift variations. This study provides an important guidance for evaluat-

ing the genetic differences between two wheat varieties in the genomic level, and also identified both genetic similarity regions

and polymorphic hotspot regions between Jimai 22 and Liangxing 99, which provided a valuable genetic information for future

genetic improvement utilizing Jimai 22 and Liangxing 99 as parents.

Keywords: wheat; Jimai 22; Liangxing 99; whole-genome resequencing; SNP; CNV

小麦是重要的口粮作物。我国是世界上最大的

小麦生产和消费国, 提高单产是保障我国小麦生产

可持续发展和粮食安全的重要途径。新中国成立以

来, 我国小麦主产区经历了5~6次的品种更换, 小

麦品种的产量、抗性、品质等重要性状得到了大幅

提高。小麦品种的遗传改良对我国小麦单产和总产

的提高发挥了重要作用

[1]

。不同小麦生态区中对照

品种既是各时代育种水平的代表, 通常又是下一代

品种改良的骨干亲本

[2]

。例如, 黄淮冬麦区的对照品

种周麦18

[3]

、鲁麦14

[4]

、石4185

[5]

等在小麦的遗传

改良中做出重要贡献。

常规育种是我国小麦遗传改良的主要手段, 但

在亲本选配、后代选择等关键育种过程中依赖于有

限的表型性状和育种者的经验。育种过程中存在不

确定因素和盲目性, 影响了小麦遗传改良的效率。

分子标记的开发和应用为小麦性状的基因定位、标

记辅助选择、亲本遗传多样性分析等方面提供了重

要支撑, 可有效提升抗性、品质等性状遗传的改良

效率。继水稻、玉米、大麦等主要作物基因组测序

的完成, 六倍体普通小麦中国春的高质量基因组参

考基因组序列(IWGSCv1)的测序完成, 标志着小麦

遗传研究已进入“后基因组学时代”

[6]

。与基于表型和

有限分子标记辅助的选择相比, 利用基因组测序并

从全基因组水平解析品种间的遗传差异为小麦的遗

传研究和品种的改良提供高维度的组学数据支持

[7]

济麦22是山东省农业科学院作物研究所选育

[8]

良星99是山东省德州市良星种子研究所选育

[9]

。济

麦22和良星99分别于2006年通过黄淮冬麦区北片

审定, 此后相继通过北部冬麦区和黄淮南片等麦区

审定, 累计推广面积超过6000万公顷。由于综合性

状突出, 济麦22 (2015至今)和良星99 (2010—2015)

先后作为黄淮冬麦区北片区域试验的对照品种, 也

是我国当前小麦品种改良的重要亲本资源。育种家在

长期育种和生产实践中发现, 虽然济麦22和良星99

来源及系谱不同, 但两品种间除株高外, 田间总体形

态相近; 主要农艺、产量和抗病反应等性状表现一致,

两者的杂交后代亦无明显分离, 普遍认为两个品种

遗传组成相似性较高, 亲缘关系较近。近期研究发现

麦22和良星99的2个衍生材料的白粉病抗性相近,

通过分子标记定位发现两者具有相同Pm52基因

[10]

但对其遗传相似性的认识仍以有限的表型性状描述和

经验为主, 尚未从遗传水平上对两者进行系统解析。

本研究通过对济麦22和良星99的重测序数据

分析, 在全基因组水平系统解析了两者的遗传组成

差异, 以期对今后小麦育种的亲本利用、重要性状

基因区间追溯、新品种系谱分析、基因组水平上研

究重要骨干种质的遗传组成等方面提供重要参考。

1 材料与方法

1.1 小麦材料及田间表型考察

供试材料为小麦品种济麦22 (系谱: 935024×

935106)与良星99 [系谱: (济91102×鲁麦

14)×PH85-16]。2018年10月1日将上述两个品种播

种于中国农业大学上庄实验站(北京, 40°14′N,

116°19′E), 按照完全随机试验设计, 设3次重复, 2

行区, 行长1.5 m, 行距25.0 cm, 株距3.0 cm。收获

前每小区取中部10株调查株高、穗长、小穗数、穗

粒数、旗叶长和宽等农艺性状; 收获后利用考种仪

(良田高拍仪S500A3B)考察千粒重、粒长、粒宽等

籽粒性状。品种间性状差异检验用t测验进行统计

分析, 数据分析通过R语言计算完成。

1.2 全基因组重测序与多态性位点鉴定

用CTAB的方法分别从济麦22和良星99幼根

提取DNA。用Illumina HiSeq2500测序平台采用双

端测序的方法进行全基因组测序, 建库和测序由北

京诺禾致源科技股份有限公司完成。对重测序原始

数据用Trimmomatic软件(v0.36)

[11]

进行过滤后再使

用BWA软件(v0.7.15)

[12]

的BWA-MEM工具将过滤后

的数据在小麦参考基因组(IWGSCv1)

[13]

上进行比对,

选择保留存在“唯一最优匹配(Unique Best Hit)”的读

段对; 最后利用与samtools (v1.4)

[14]

工具进行过滤。

利用GATK软件(v3.8)

[15]

中的HaplotypeCaller、

GenotypeGVCF、SelectVariants和VariantFiltration

等功能计算并过滤获得材料基因组上的高质量SNP

和InDel位点。其中, SNP位点过滤参数为“QD < 2.0,

FS > 60.0, MQRankSum < –12.5, ReadPosRankSum <

1872

作 物 学 报

第46卷

–8.0, SOR > 3.0, MQ < 40.0, DP > 30||DP < 3”; InDel

过滤参数为“QD < 2.0, FS > 200.0, ReadPosRankSum

< –20.0, DP > 30||DP < 3”。对过滤后的SNP与InDel

位点通过SNPEff软件(v4.3t)

[16]

morphism, SNP)的频率进行分析, 在每个窗口中统

计两品种间存在差异的纯合SNP的密度分布(附图

2)。这部分研究中仅考虑拷贝数正常的区间, CNV变

异区间未被统计。考虑该密度分布具有明显的高斯

混合分布的特点, 我们利用EM算法拟合出两个正

态分布的模型, 并据此选择阈值x=1.5 (差异频率约

为3.1×10

–5

)作为2个分布的分隔边界。其中, 高密

度SNP分布区间被认为两个材料的多态性热点区间;

低密度SNP分布区间被认为两个材料的相似区间。

进行注释。使用的中

国春基因注释版本为IWGSC RefSeq v1.1 (

/download/iwgsc/IWGSC_RefSe

q_Annotations/v1.1/)。

1.3 拷贝数变异区间鉴定及比较分析

拷贝数变异(copy-number variation, CNV)是小

麦基因组研究的主要多态性类型之一。本研究为鉴

定供试材料相对于中国春参照基因组的CNV变异

区间, 在分析中以1 Mb为单位将全基因组划分为小

窗, 利用bedtools (v2.26.0)

[17]

计算两个品种的重测

序比对读段在每个窗口内的“平均覆盖深度”(Dep

bin

);

并结合该材料的全基因组“平均读段覆盖深

度”(Dep

ave

)进行归一化, 得到每个小窗的“平均相对

覆盖深度”: Dep

bin

/Dep

ave

。由于在CNV分析的结果

中, 基因组序列丢失相比于序列插入更容易被检测,

本研究计算得到的CNV变异区间仅考虑相对于参

照基因组低覆盖度(“丢失”)情况。下文中的CNV均

指“丢失(低覆盖度)变异”。“相对平均覆盖深度”低于

0.5的小窗被视为“CNV变异区间”(附图1)。CNV变

异区间分析均由每个材料分别和“中国春”参照基因

组的序列比较计算获得。其中, 在两个品种中同时

存在CNV变异的区间被称为“共有CNV变异区间”。

1.4 品种间全基因组高频率SNP差异区段的鉴定

为鉴定两个品种的基因组序列差异区间, 本研

究以1 Mb为单位对全基因组进行划分窗口, 对每个

窗口中的单核苷酸多态性(single nucleotide poly

表1 本研究使用的引物编号和序列

Table 1 Primer IDs and sequences used in this study

引物编号

Primer ID

TraesCS2D02G055700_F

TraesCS2D02G055700_R

TraesCS2D02G051500_F

TraesCS2D02G051500_R

2B_LX99_CNV1_F

2B_LX99_CNV1_R

2B_LX99_CNV2_F

2B_LX99_CNV2_R

2B_COM_CNV_F

2B_COM_CNV_R

2D_COM_CNV_F

2D_COM_CNV_R

引物序列

Primer sequence (5'–3')

CAGGTCGAGACAGAGAACAA

ATCGAGCCCCTCAATTTCAT

TCAGCTCAGGGTTATCAAGC

TTGGGTGCATTTTTCAGTCC

AGCAGGTAATCCACACCAAA

TGGAGAACCCACTTATCCAA

AGCAGGTAATCCACACCAAA

AATCCACACCAAATCCCCAT

CACCCTAGATACAACCGAGG

ATGTCACCGATCTTCTGAGC

ATGATCACGATGGACCTAGC

TGCCACGAAGATTTAGAGGA

1.5 差异CNV区间和基因序列差异差异位点的验

对济麦22与良星99基因组内的特有与共有

CNV区间分别进行验证, 选取区间内2000 bp左右长

度的序列设计染色体区间特异的引物对CNV区间进

行验证。扩增引物由在线软件Primer 3.0设计, 其中

引物长度范围为18~24 bp, GC含量范围在40%~60%

之间, 退火温度范围为54~60℃, 扩增产物大小1~2

kb (表1)。以济麦22、良星99与中国春的DNA为模

板进行PCR扩增, 通过有无目标扩增产物判断CNV

是否存在。对与小麦株高相关的候选基因TraesCS-

2D02G051500、TraesCS2D02G055700的序列差异

SNP位点, 设计出基因组特异引物(表1)进行PCR扩

增并测序。PCR反应体系为20 μL, 包括10 μL的2X

M5 HiPer plus Taq HiFi PCR mix, 正、反向引物(10

μmol L

–1

)各1 μL, 150 ng μL

–1

模板DNA 2 μL, 用

ddH

2

O补至20 μL。PCR扩增程序为95℃ 3 min; 95

℃ 30 s, 56~57.4℃ 30~60 s (依引物退火温度以及目

标序列而定), 72℃ 2 min, 35个循环; 72℃ 5 min。

退火温度

Annealing temperature (℃)

56

58

测序引物

用途

Purpose

Sequencing primers

CNV标记特异引物

Specific primers for CNV markers

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1873

2 结果与分析

2.1 济麦22与良星99的农艺性状比较

田间观察发现2个品种株形相近, 两者除株高、

穗长存在显著差异外(P < 0.01) (图1), 旗叶大小、小

穗数、千粒重、粒长、粒宽等主要农艺和产量相关

性状差异均不显著(表2)。这表明济麦22和良星99

在主要农艺和产量性状上存在较高的相似性。

2.2 济麦22和良星99全基因组多态性位点检测

利用Illumina HiSeq2500分别对济麦22和良星

99进行了全基因组测序, 分别获得了88 Gb和128

Gb的重测序数据。通过和中国春参考基因组序列

(IWGSCv1)进行测序数据的比对并去除重复序列,

选择“唯一最优匹配”的读段进行后续分析, 最终两

品种的平均覆盖深度均为5.8×。经过SNP calling分

析, 济麦22和良星99中分别鉴定出15,326,314个

与15,060,004个和中国春参照基因组不同的高质量

纯合SNP位点, 约占全基因组的0.109%和0.107%

(表3)。其中, A、B基因组中的SNP的频率(0.130%~

0.155%)明显高于D基因组(0.0224%~0.0225%)。两品

种间基因型不一致的纯合SNP位点仅占总SNP位点个

数的9.8%, 即超过90%的SNP是两个品种间共有的。

图1 济麦22与良星99的表型比较

Fig. 1 Morphological comparison between Jimai 22 and

Liangxing 99

A: 济麦22 (左)与良星99 (右)的株高及节间长度比较; B: 济麦

22 (上)与良星99 (下)的粒型比较。

A: plant height and internode length comparison between Jimai 22

(left) and Liangxing 99 (right); B: grain morphological comparison

between Jimai 22 (top) and Liangxing 99 (bottom).

表2 济麦22与良星99的主要农艺性状差异显著性分析

Table 2 Statistical analysis of the main agronomic traits for Jimai 22 and Liangxing 99

济麦22

表型

Phenotype

Jimai 22

均值±标准误差

Mean ± SE

旗叶长Flag leaf length (cm)

旗叶宽Flag leaf width (cm)

每穗小穗数Spikelet number per spike

16.78±0.36

1.88±0.024

21.87±0.45

样本量

Sample counts

30

30

30

30

30

30

30

30

6

6

6

良星99

Liangxing 99

均值±标准误差

Mean ± SE

16.94±0.40

1.85±0.039

21.80±0.28

样本量

Sample counts

30

30

30

差异显著性

Statistical significance of

the difference

P-value

(t-test)

0.76

0.53

0.91

1.00

0.90

3.98E-5

**

1.90E-6

**

0.31

0.66

0.39

0.58

每穗可育小穗数Fertile spikelet per spike 21.23±0.50

每穗不育小穗数Infertile spikelet per spike

穗长Spike length (cm)

株高Plant length (cm)

穗粒数Grain number per spike

千粒重Thousand seed weight (g)

粒长Grain length (cm)

粒宽Grain width (cm)

**

**

21.17±0.14 30

0.63±0.23

10.43±0.15

80.23±0.75

55.20±0.35

48.30±0.03

6.53±0.03

3.30±0.02

30

30

30

30

6

6

6

0.63±0.14

9.57±0.13

75.05±0.57

52.23±0.73

49.20±0.33

6.43±0.07

3.25±0.06

表示在0.01水平上差异显著。

represents significantly different at the 0.01 probability level.

同时, 在济麦22和良星99中分别鉴定出1,143,512

与1,118,564个的InDel位点(表4), 分别占全基因组

的0.0813%和0.0795%。与D基因组, A、B基因组

中鉴定出的InDel频率更高。济麦22和良星99间

差异的InDel多态性位点占鉴定出的InDel位点总数

的11.8%。

1874

作 物 学 报

第46卷

表3 济麦22与良星99的纯合SNP位点统计

Table 3 Summary of homozygous SNPs in Jimai 22 and Liangxing 99

济麦22中的纯合

基因组

Genome

SNP个数

SNPs in Jimai 22

良星99中的纯合

SNP个数

SNPs in Liangxing 99

两者基因型相同的纯合SNP

个数

Number of homozygous

SNPs with the same genotype

6,194,047

7,248,448

818,951

14,261,446

两者基因型不同的纯合

SNP个数

Number of homozygous SNPs

with different genotypes

301,206

1,148,764

97,401

1,547,371

Number of homozygous

Number of homozygous

A 6,405,063 6,395,080

B 8,033,789 7,781,369

D 887,462 883,555

全基因组 Whole genome 15,326,314 15,060,004

表4 济麦22与良星99的纯合InDel位点统计

Table 4 Summary of InDels in Jimai 22 and Liangxing 99

济麦22中的纯合

基因组

Genome

InDel个数

InDels in Jimai 22

良星99中的纯合

InDel个数

InDels in Liangxing 99

两者基因型相同的纯合

InDel个数

Dels with the same genotype

两者基因型不同的纯合

InDel个数

Number of homozygous InDels

with different genotypes

28,732

95,316

13,769

137,817

Number of homozygous

Number of homozygous

Number of homozygous In-

A 464,369 459,599 438,410

B 562,658 543,395 492,112

D 116,485 115,570 104,345

全基因组Whole genome 1,143,512 1,118,564 1,034,867

2.3 济麦22与良星99的基因组CNV区间的鉴

726 Mb), 2B_COM_CNV位于2B染色体上良星99

与济麦22共有的CNV区间(Chr. 2B: 738 Mb~769 Mb),

2D_COM_CNV位于2D染色体上济麦22与良星99

共有的CNV区间(Chr. 2D: 570 Mb~638 Mb)。利用

这4对引物在济麦22、良星99和中国春材料内进

行PCR扩增, 结果表明材料间的差异CNV区间可

以通过扩增条带的有无进行验证(图3); 其中2B_

LX99_CNV1与2B_LX99_CNV2在中国春与济麦22

中均扩增出目标条带, 但未在良星99中扩增出条带,

证明该区间仅在良星99中丢失, 2B_ COM_CNV与

2D_COM_CNV仅在中国春中扩增出目标条带, 证明

该区间在济麦22与良星99中均丢失。PCR验证结果

与全基因组分析结果吻合, 表明该分析方法计算得

到的CNV变异准确可靠。

定与比较

济麦22的基因组相对于中国春参照基因组中

存在557 Mb的CNV变异区间, 占全基因组的4.0%;

而在良星99基因组中检测出511 Mb的CNV变异区

间, 占全基因组的3.6% (表5)。其中, 两品种共有的

CNV变异区间的长度为466 Mb, 主要集中于2B、

2D、5A和6A染色体; 两品种特有的CNV区间分

别为91 Mb和45 Mb, 共计约占总CNV区间的

22.6%, 主要集中在2B和4B染色体上(图2)。

为了验证CNV区间的分析结果, 在2B和2D

染色体上的CNV差异区间中设计了特异PCR引物。

其中2B_LX99_CNV1与2B_LX99_CNV2位于2B

染色体上良星99特有CNV区间(Chr.2B: 667 Mb~

表5 济麦22与良星99的全基因组CNV区间长度统计

Table 5 Summary for the CNV regions identified in Jimai 22 and Liangxing 99

济麦22的特有CNV区间

基因组

Genome

Specific CNV region in

Jimai 22

长度

Length (Mb)

%

良星99的特有CNV区间

Specific CNV region in

Liangxing 99

长度

Length (Mb)

%

长度

Length (Mb)

两品种的共有CNV区间

Common CNV regions in the

two cultivars

%

A 8 0.06 4 0.03 135 0.96

B 80 0.57 33 0.23 226 1.61

全基因组Whole genome 91 0.65 45 0.32 466 3.31

D 3 0.02 8 0.06 105 0.75

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1875

图2 济麦22与良星99的CNV区间(相对于中国春参照基因组)在各染色体上的分布

Fig. 2 Distribution of CNV regions detected in Jimai 22 and Liangxing 99 compared to the Chinese Spring reference genome

绿色: 济麦22的特有CNV区间; 粉色: 良星99的特有CNV区间; 紫色: 济麦22与良星99的共有CNV区间。

Green: specific CNV regions in Jimai 22; Pink: specific CNV regions in Liangxing 99; Purple: common CNV regions in the two varieties.

图3 利用PCR对济麦22(JM22)、良星99(LX99)和中国春(CS)中检测的CNV区间进行验证

Fig. 3 PCR validation of detected CNVs in Jimai 22 (JM22), Liangxing 99 (LX99) and Chinese Spring (CS)

2D_COM_CNV和2B_COM_CV分别为2D和2B染色体上共有区间序列设计的引物; 2B_LX99_CNV1和2B_LX99_CNV2为在2B染

色体上良星99特有的CNV区间中序列设计的引物。每对引物对应的3个泳道从左到右分别为: 良星99(LX99)、济麦22(JM22)和中

国春(CS)。

2D_COM_CNV and 2B_COM_CNV were designed utilizing sequences in common CNV regions in 2D and 2B chromosomes, respectively;

2B_LX99_CNV1 and 2B_ LX99_CNV2 were designed utilizing sequences in Liangxing 99-specific CNV regions in chromosome 2B. The

corresponding three lanes from left to right for each primer are Liangxing 99 (LX99), Jimai 22 (JM 22) and Chinese Spring (CS).

通过对济麦22与良星99中特有的CNV区间内

高可信度(HC)基因进行GO富集分析发现, 在济麦

22的特有CNV区间内有982个基因, 其中294个基

因显著富集在25个GO条目, 主要包括“ADP 结

合”(GO: 0043531)、“肽酶抑制剂活性”(GO: 0030414),

辅酶结合”(GO: 0050662)、“酶抑制剂活性”(GO:

0004857)、“半胱氨酸型内肽酶抑制剂活性”(GO:

0004869)等分子功能, 以及“肽酶活性负调控”(GO:

1876

作 物 学 报

第46卷

0010466)、“内肽酶活性负调控”(GO: 0010951)、“催

化活性负调控”(GO: 0043086)、“碳代谢过程”(GO:

0008152)等生物学过程中, 细胞组分分类内未有富

集(图4-A)。在良星99特有CNV区间内包括513个

基因, 其中富集到的395个基因分布在25个GO条

目中, 主要有“ADP结合”(GO: 0043531)、“血红素结

合”(GO: 0020037)、“过氧化物酶活性”(GO:

0004601)、“萜烯合酶活性”(GO: 0010333)、“O-甲基

转移酶活性”(GO: 0008171)、“腺苷脱氨酶活性”(GO:

0004000)等分子功能, 以及“抗氧化反应”(GO:

0006979)、“过氧化氢分解过程”(GO: 0042744)、“细

胞氧化解毒”(GO: 0098869)、“蛋白磷酸化”(GO:

0006468)、“糖原生物合成”(GO: 0005978)等生物学

过程和“胞外区”(GO:0005576)这一细胞组分中(

4-B)。济麦22特有CNV区间内富集在GO条目, 如

“生长素反应”(GO: 0009733), “色素合成过程”(GO:

0046148)下的基因, 可能是影响两材料间的表型差

异的候选基因。

图4 济麦22(A)与良星99(B)特有CNV区间中基因的GO富集分析结果

Fig. 4 GO enrichment analysis of the genes in Jimai 22 (A) and Liangxing 99 (B) specified CNV regions

绿色: 生物过程; 紫色: 细胞组分; 橙色: 分子功能。

2.4 济麦22和良星99间的SNP多态性热点区间

和序列相似区间分析

以中国春IWGSCv1参考基因组为模板, 利用剔

除品种间大片段CNV后的13.5 G大小的基因组序列

进行分析。以差异纯合SNP的密度为3.1×10

–5

为阈值

将染色体区分为“多态性热点区间”(高密度差异SNP

区间)和“序列相似区间”(低密度差异SNP区间)。济麦

22与良星99之间共有1915 Mb (14.2%)区间为多态性

热点区间(图5-A)。在多态性热点区间中, 两品种间有

1,375,981个纯合差异SNP位点, 约占两品种全部纯合

差异SNP位点总数的96.5% (图5-B), 这些多态性热点

区间主要集中于1D、2B、3B和4B染色体(图5-C)。

通过对两品种多态性热点区间内的14,306个高

可信度基因进行GO富集分析, 其中1461个基因显

著富集在20个GO条目中, 主要包括“5'–3' RNA聚

合酶活性” (GO: 0003899)、“二磷酸核酮糖羧化酶活

性” (GO: 0016984)、“光合作用的循环电子转运通路

内转移电子的电子转运器活性” (GO: 0045156)、“醛

糖1-表异构酶活性” (GO: 0004034)、以NAD或

NADP为受体提供

CH-OH基团的氧化还原酶活性”

(GO: 0016616)等分子功能, “光合作用” (GO:

0015979)、“己糖代谢过程” (GO: 0019318)和“光系统

II中的光合电子传输” (GO: 0009772)等生物过程,

以及“光系统II” (GO: 0009523)、“光系统II反应中

心” (GO: 0009539)、“叶绿体” (GO: 0009507)、“质体”

(GO: 0009536)和“类囊体” (GO: 0007579)等细胞组

分内(图6)。综合看来, 该部分基因的GO富集分析

结果主要集中在光合作用通路相关条目。

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1877

图5 济麦22与良星99全基因组内多态性热点区间分布

Fig. 5 Statistics and distribution of the SNP hotspot regions between Jimai 22 and Liangxing 99

A: 两品种间差异SNP位点中分布在多态性热点区间与序列相似区间的比例; B: 多态性热点区间与序列相似区间的长度在全基因组

上的比例; C: 多态性热点区间与序列相似区间在全基因组分布。深蓝色: 多态性热点区间; 浅蓝色: 序列相似区间; 白色: CNV区间。

A: pie chart for the proportions of differential SNPs in the polymorphism hotspot regions (PHRs) and the genetic similar regions (GSRs); B:

pie chart for the proportions of the PHRs and GSRs in length; C: distributions of the PHRs and the GSRs across chromosomes.

图6 济麦22与良星99间多态性热点区间的基因GO富集分析结果

Fig. 6 GO enrichment result of the genes in the SNP hotspot regions between in Jimai 22 and Liangxing 99

绿色: 生物过程; 紫色: 细胞组分; 橙色: 分子功能。

1878

作 物 学 报

第46卷

2.5 济麦22和良星99的多态性热点区间和序列

相似区间的突变类型分析

为比较两品种间多态性热点区间和序列相似区间

中的突变类型的异同, 我们首先统计差异SNP位点的

碱基变异类型的频率(图7-A和表6)。无论在多态性热

点区间还是序列相似区间, T↔C和G↔A类型的突变

频率均为最多, 在多态性热点区间内约占71.4%, 略

高于在序列相似区间内所占总SNP的比例(66.5%)。同

时, 我们还统计了两品种间差异InDel的长度分布(图

7-B和表7)。多态性热点区间中的单碱基的InDel占该

区间内所有InDel位点的64.7%, 其比例高于单碱基的

InDel在序列相似区间中所占的比例(49.0%)。

图7 济麦22与良星99间多态性热点区间与序列相似区间中各自的InDel长度分布(A)和SNP突变类型(B)

Fig. 7 Length distributions of homozygous InDels (A) and mutation types of homozygous SNPs (B) in the polymorphism hotspot

regions and genetic similar regions between Jimai 22 and Liangxing 99

深蓝: 多态性热点区间; 浅蓝: 序列相似区间。

Dark blue: polymorphism hotspot regions; Light blue: genetic similar regions.

我们分别对多态性热点区间与序列相似区间

内两品种间差异SNP与InDel位点对于基因功能

的影响进行了注释与比较(表8), 结果表明多态

性热点区间与序列相似区间中基因序列上的SNP

和InDel变异的类型主要以错义突变(missense

variation)和同义突变(synonymous variation)为

主。在多态性热点区间中错义突变(51.3%)与终止

子相关突变(stop-codon gain/lost)(1.5%)所占比例

要分别略高于两者在序列相似区间的44.7%和

0.8%比例。

表6 济麦22与良星99全基因组差异纯合SNP的突变类型的统计

Table 6 Summary of the mutation types of the differential homozygous SNPs in Jimai 22 and Liangxing 99

SNP突变类型

Types of SNP

mutations

多态性热点区间

Differential genetic region

数量

Counts

每Mb密度

Density per Mb

数量

Counts

相似区间

Similar genetic region

每Mb密度

Density per Mb

数量

Counts

全基因组

Whole genome region

每Mb密度

Density per Mb

T>A 33,545 17.52

A>T 33,868 17.69

G>C 49,065 25.62

C>G 49,521 25.86

A>C 47,712 24.91

T>G 47,862 24.99

G>T 65,670 34.29

C>A 66,047 34.49

A>G 200,697 104.80

T>C 201,236 105.08

1701 0.15 35,246 2.62

1713 0.15 35,581 2.64

2020 0.17 51,085 3.79

1956 0.17 51,477 3.82

2089 0.18 49,801 3.70

1888 0.16 49,750 3.69

3204 0.28 68,874 5.11

3226 0.28 69,273 5.14

6364 0.55 207,061 15.37

6540 0.57 207,776 15.42

G>A 289,933 151.40 11,276 0.98 301,209 22.36

C>T 290,292 151.59 11,151 0.96 301,443 22.38

转换Transition 982,158

颠换Transversion 393,290

512.88

205.37

35,331

17,797

3.06 1,017,489

1.54 411,087

75.53

30.51

全部Total 1,375,448 718.25 53,128 4.60 1,428,576 106.04

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1879

表7 济麦22与良星99的纯合InDel变异的长度分布

Table 7 Length distribution of differential homozygous InDels in Jimai 22 and Liangxing 99

差异区间

InDel类型

Types of InDel

在济麦22中插入, 在良

星99中丢失

Insertion in Jimai 22,

deletion in Liangxing 99

InDel长度

Length of InDel

Differential genetic region

数量

Count

每Mb密度

Density per Mb

数量

Count

相似区间

Similar genetic region

每Mb密度

Density per Mb

数量

Count

全基因组

Whole genome region

每Mb密度

Density per Mb

1 34,031 17.77 7723 0.67 41,754 3.10

2 7259 3.79 3017 0.26 10,276 0.76

3 2664 1.39 1242 0.11 3906 0.29

4 1685 0.88 843 0.07 2528 0.19

5 701 0.37 419 0.04 1120 0.08

6 883 0.46 370 0.03 1253 0.09

7 453 0.24 225 0.02 678 0.05

8 476 0.25 216 0.02 692 0.05

9 363 0.19 153 0.01 516 0.04

≥10 4131 2.16 1599 0.14 5730 0.43

在良星99中插入, 在济

麦22中丢失

Insertion in Liangxing

99, deletion in Jimai 22

全部Total 52,646 27.49 15,807 1.37 68,453 5.08

1 34,083 17.80 7796 0.67 41,879 3.11

2 7315 3.82 3037 0.26 10,352 0.77

3 2690 1.40 1190 0.10 3880 0.29

4 1710 0.89 785 0.07 2495 0.19

5 746 0.39 420 0.04 1166 0.09

6 832 0.43 356 0.03 1188 0.09

7 412 0.22 227 0.02 639 0.05

8 509 0.27 208 0.02 717 0.05

9 402 0.21 183 0.02 585 0.04

≥10 3993 2.09 1637 0.14 5630 0.42

全部Total 52,696 27.52 15,835 1.37 68,531 5.09

表8 济麦22与良星99的纯合点突变对蛋白编码功能影响的统计

Table 8 Statistics of the effects on protein coding of homozygous point mutations between Jimai 22 and Liangxing 99

错义突变

变异所在区间

Region of variations

差异区间Different region

相似区间Similar region

数量

Count

2981

348

同义突变

数量

Count

2431

330

移码突变

数量

Count

304

94

提前终止突变

数量

Count

68

6

终止子丢失突变

Stop-lost mutation

数量

Count

16

0

%

0.3

0

Missense mutation Synonymous mutationFrame-shift mutationStop-gained mutation

%

51.3

44.7

%

41.9

42.4

%

5.2

12.1

%

1.2

0.8

全部Total 3329 50.6 2761 42.0398 6.1 74 1.1 16 0.2

2.6 株高候选基因在济麦22和良星99之间的序

Rht-B1

[18]

、Rht-D1

[18]

、株高相关基因Ppd-D1

[19]

和在

2D染色体的QPht/-2D.1内定位到2个株高穗长

候选基因

[20]

等进行序列分析, 发现QPht/-2D.1

区间内的2个基因在品种间存在序列差异(表9)。

列差异分析及重测序结果验证

济麦22与良星99在株高和穗长上存在显著差异,

利用两者的重测序数据对小麦目前已克隆的矮秆基因

1880

作 物 学 报

第46卷

表9 小麦株高相关基因列表及在序列相似区间和多态性热点区间的分布

Table 9 List of dwarf genes and their distributions in genetic similar regions and polymorphism hotspot regions

株高基因/QTL

Plant height

gene/QTL

Rht-B1

Rht-D1

Ppd-D1

基因编号

Gene ID

TraesCS4B02G043100

TraesCS4D02G040400

TraesCS2D02G079600

染色体

Chromosome

4B

4D

2D

2D

区间

Region

多态性热点区间

Polymorphic hotspot regions

相似区间

Genetic similar region

相似区间

Genetic similar region

QPht/-2D.1 TraesCS2D02G051500 多态性热点区间

Polymorphic hotspot regions

QPht/-2D.1 TraesCS2D02G055700 2D 多态性热点区间

Polymorphic hotspot regions

基因功能注释

Function annotation

编码DELLA蛋白

DELLA protein-coding gene

编码DELLA蛋白

DELLA protein-coding gene

编码PRRs蛋白

PRRs protein-coding gene

编码WRKY转录因子

WRKY transcription factor

protein-coding gene

编码GRAS转录因子

GRAS transcription factor

protein-coding gene

InDel, SNP

序列差异类型

Variation type

None

None

None

InDel

利用基因特异性引物对QPht/-2D.1 QTL

区间内的TraesCS2D02G051500和TraesCS2D02

G055700基因分别在济麦22与良星99中进行扩增、

测序发现, 2个基因在品种间存在引起氨基酸改变的

差异位点(图8)。该QTL区间是矮秆基因Rht8所在

区间, 该位点对小麦的株高和穗长均有影响

[21]

, 但

其遗传功能仍需进一步试验验证。

果表明, 与中国春参考基因组序列相比, 济麦22和

良星99中存在大量的CNV变异(特别是CNV丢失

变异)。通过比较2个材料中CNV变异区间的异同,

发现大部分CNV区间是共有的, 但仍有22.6%的差

异CNV区间; 其中60.3%的差异CNV区间集中于

2B染色体。需要指出的是, 本研究中发现的“CNV

缺失区间”是通过读段比对后的覆盖度确定的, 不能

排除该区域可能来源于遗传距离较远的基因组序列

的可能性。根据品种间差异SNP的分布密度对染色

体区间进行了划分, 鉴定出基因组14.2%的区间是

两品种间的多态性热点区间, 集中了全基因组

2B和

96.5%差异SNP位点, 这些区间主要位于

1D、

4B染色体上。通过鉴定相似区间和多态性热点区间

变异位点的特征, 发现两类区间在SNP变异类型、

InDel长度分布、突变影响编码功能的比例上有一定

区别。上述结果表明济麦22和良星99在全基因组

水平具有较高的相似性, 但在特定的染色体上确实

存大片段的差异区间。

济麦22和良星99的主要农艺和产量性状存在

较高相似性, 只有在株高和穗长上存在差异。结合

品种间序列差异位点分析, 我们推测控制品种间株

高和穗长的差异基因可能位于差异SNP热点区域或

差异CNV区间。结合目前已经在小麦中克隆的株高

或穗长的5个相关基因, 并分析两品种间基因序列,

发现了2个位于差异SNP热点区且存在影响编码功

能的变异的候选基因。本研究在已有基因组变异和

表型信息的基础上对已知性状相关基因和品种间差

异序列区间进行了初步分析, 找到了位于多态性热

点区间的2个具有序列差异的基因, 但其生物学功

图8 TraesCS2D02G051500(A)与TraesCS2D02G055700(B)在中

国春、济麦22和良星99中功能改变位点附近的核苷酸序列

Fig. 8 Sequence of TraesCS2D02G051500 (A) and TraesCS

2D02G055700 (B) near the coding-function affected sites in

Chinese Spring, Jimai 22, and Liangxing 99

3 讨论

本研究通过对济麦22和良星99两个小麦品种

的重测序数据进行分析, 系统研究了两个品种在基

因组水平上存在的CNV区间和SNP热点区间。与

中国春参照基因组比较发现, 两个品种均有大量

CNV丢失变异区间, 约占全基因组的4.3%。除集中

分布在2B染色体上148 Mb的CNV变异外, 大部分

CNV变异区间零散地分布在不同染色体上。这一结

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1881

能和关联仍需进一步验证。利用表型差异和全基因

组序列多态性分析相结合的方法, 本研究的方法可

为今后借助基因组测序方法快速定位和克隆候选基

因提供了新的参考。

Zhao等

[22]

研究发现, 良星99的2BL上有一个控

制抗白粉病的主效基因, 该基因被命名为Pm52

[23]

利用中国春参照基因组的信息, 将Pm52基因定位在

chr2B的581 Mb~596 Mb的区间

[24]

。本研究的结果显

示, 济麦22和良星99的2BL的绝大部分区间为多

态性热点区间, 但575 Mb~603 Mb区段为本研究中

鉴定的“序列相似区间”, 该区段包含Pm52所在的

物理区间; 本研究间接支持了Qu等

[24]

在济麦22和

良星99的衍生材料中均携带相同的Pm52基因的结

论。该结果也表明本研究鉴定的序列相似区间可为

抗病等关键性状基因的定位研究提供参考。

小麦品种的重测序研究为探索小麦基因组序列

的多态性提供高维度、高精细度、类型丰富的基因

组变异信息。本研究也为比较小麦品种间的基因组

序列差异分析提供了方法学参考。随着小麦材料重

测序数据的不断积累, 小麦品种间基因组序列变异

的特征和规律也将得到进一步揭示。有效分析和利

用丰富的基因组变异信息, 将有助于对关键性状基

因功能进行阐释, 辅助小麦育种对优异基因区间的

利用, 提高小麦品种选育的效率。

4 结论

济麦22和良星99两个重要小麦品种的田间表

型相似。本研究通过对两个品种进行全基因序列差

异分析发现, 济麦22和良星99间的遗传组成相似

性较高(序列相似区间占85.8%), 但仍存在大区段

CNV变异(136 M)和占全基因组14.2%的差异多态性

热点区间; 其中差异SNP热点区间主要集中在1D、

2B和4B染色体上。本工作为进一步研究和利用济

麦22和良星99提供了重要的基因组变异数据; 也

为小麦品种间的基因组变异热点区间的鉴定提供了

方法参考。

说明: 本研究中的原始测序数据已提交至中国科学

院北京基因组研究所BIG数据中心

[25]

的组学原始数

据归档库

[26]

中(/gsa), 编号为

CRA002333。为便于数据的共享, 我们利用SnpHub

数据库模型

[27]

搭建了2个材料的基因组变异信息查

询数据库(/Wheat_SnpHub_

Portal/lx99_jm22/)。

References

[1] 何中虎, 庄巧生, 程顺和, 于振文, 赵振东, 刘旭. 中国小麦

产业发展与科技进步. 农学学报, 2018, 8(1): 99–106.

He Z H, Zhuang Q S, Cheng S H, Yu Z W, Zhao Z D, Liu X.

Wheat production and technology improvement in China. J Agric,

2018, 8(1): 99–106 (in Chinese).

[2] 张婷, 逯腊虎, 张伟, 杨斌, 袁凯, 史晓芳. 黄淮麦区300个小

麦种质的主要农艺性状比较. 小麦研究, 2018, 39(1): 13–20.

Zhang T, Lu L H, Zhang W, Yang B, Yuan K, Shi X F. Compari-

son of main agronomic traits of 300 wheat germplasms in

Huanghuai Wheat Region. J Wheat Res, 2018, 39(1): 13–20 (in

Chinese).

[3] 曹廷杰, 王西成, 赵虹. 国审小麦新品种周麦18号丰产性、稳

产性及适应性分析. 中国农业科技导报, 2007, 9(1): 39–41.

Cao T J, Wang X C, Zhao H. Analysis on the yield potential, sta-

bility and adaptability of national authorized wheat variety

Zhoumai 18. Rev China Agric Sci Technol, 2007, 9(1): 39–41 (in

Chinese with English abstract)

[4] 盖红梅, 李玉刚, 王瑞英, 李振清, 王圣健, 高峻岭, 张学勇.

鲁麦14对山东新选育小麦品种的遗传贡献. 作物学报, 2012,

38: 954–961.

Gai H M, Li Y G, Wang R Y, Li Z Q, Wang S J, Gao J L, Zhang X

Y. Genetic contribution of Lumai 14 to novel wheat varieties de-

veloped in Shandong province. Acta Agron Sin, 2012, 38:

954–961 (in Chinese with English abstract)

[5] 傅晓艺, 郭进考, 刘艳滨

, 史占良, 单子龙, 韩然, 何明琦. 利

用石4185为骨干亲本培育高产小麦新品种. 种子, 2017,

36(12): 95–99.

Fu X Y, Guo J K, Liu Y B, Shi Z L, Shan Z L, Han R, He M Q.

New wheat varieties with high yield of core parent breeding by

using Shi 4185. Seed, 2017, 36(12): 95–99 (in Chinese).

[6] 凌宏清. 小麦及其近缘种基因组测序研究进展与发展趋势.

麦类作物学报, 2016, 36: 397–403.

Ling H Q. Progress and perspectives of the genome sequencing in

wheat and its relatives. J Triticeae Crops, 2016, 36: 397–403 (in

Chinese with English abstract)

[7] Uauy C. Wheat genomics comes of age. Curr Opin Plant Biol,

2017, 36: 142–148.

[8] 殷贵鸿, 李根英, 何中虎, 刘建军, 王辉, 夏先春. 小麦新品

种济麦22抗白粉病基因的分子标记定位. 作物学报, 2009, 35:

1425–1431.

Yin H G, Li G Y, He Z H, Liu J J, Wang H, Xia X C. Molecular

mapping of powdery mildew resistance gene in wheat cultivar

Jimai 22. Acta Agron Sin, 2009, 35: 1425–1431 (in Chinese with

English abstract)

[9] 赵广军, 张英肖. 高产稳产冬小麦品种良星99栽培技术. 小

麦研究, 2006, 27(3): 12–13.

Zhao G J, Zhang Y X. Cultivation technique of Liangxing 99, a

winter wheat variety with high and stable yield. J Wheat Res,

2006, 27(3): 12–13 (in Chinese)

[10] Qu Y F, Wu P P, Hu J H, Chen Y X, Shi Z L, Qiu D, Li Y H,

Zhang H J, Zhou Y, Yang L, Liu H W, Zhu T Q, Liu Z Y, Zhang Y

M, Li H J. Molecular detection of the powdery mildew resistance

genes in winter wheats DH51302 and Shimai 26. J Integr Agric,

2020, 19: 931–940.

1882 作 物 学 报

第46卷

[11] Bolger A M, Lohse M, Usadel B. Trimmomatic: a flexible trim-

mer for Illumina sequence data. Bioinformatics, 2014, 30:

2114–2120.

[12] Li H, Durbin R. Fast and accurate short read alignment with Bur-

rows-Wheeler transform. Bioinformatics, 2009, 25: 1754–1760.

[13] Appels R, Eversole K, Feuillet C, Keller B, Rogers J, Stein N,

Pozniak C J, Stein N, Choulet F, Distelfeld A, Eversole K, Poland

J, Rogers J, Ronen G, Sharpe A G, Pozniak C, Ronen G, Stein N,

Barad O, Baruch K, Choulet F, Keeble-Gagnere G, Mascher M,

Sharpe A G, Ben-Zvi G, Josselin A A, Stein N, Mascher M,

Himmelbach A, Choulet F, Keeble-Gagnere G, Mascher M,

Rogers J, Balfourier F, Gutierrez-Gonzalez J, Hayden M, Josselin

A A, Koh C, Muehlbauer G, Pasam R K, Paux E, Pozniak C J,

Rigault P, Sharpe A G, Tibbits J, Tiwari V, Choulet F, Kee-

ble-Gagnere G, Mascher M, Josselin A A, Rogers J, Spannagl M,

Choulet F, Lang D, Gundlach H, Haberer G, Keeble-Gagnere G,

Mayer KFX, Ormanbekova D, Paux E, Prade V, Simkova H,

Wicker T, Choulet F, Spannagl M, Swarbreck D, Rimbert H,

Felder M, Guilhot N, Gundlach H, Haberer G, Kaithakottil G,

Keilwagen J, Lang D, Leroy P, Lux T, Mayer KFX, Twardziok S,

Venturini L, Appels R, Rimbert H, Choulet F, Juhasz A, Kee-

ble-Gagnere G, Choulet F, Spannagl M, Lang D, Abrouk M,

Haberer G, Keeble-Gagnere G, Mayer KFX, Wicker T, Choulet F,

Wicker T, Gundlach H, Lang D, Spannagl M, Lang D, Spannagl

M, Appels R, Fischer I, Uauy C, Borrill P, Ramirez-Gonzalez R

H, Appels R, Arnaud D, Chalabi S, Chalhoub B, Choulet F, Cory

A, Datla R, Davey M W, Hayden M, Jacobs J, Lang D, Robinson

S J, Spannagl M, Steuernagel B, Tibbits J, Tiwari V, van Ex F,

Wulff BBH, Pozniak C J, Robinson S J, Sharpe A G, Cory A,

Benhamed M, Paux E, Bendahmane A, Concia L, Latrasse D,

Rogers J, Jacobs J, Alaux M, Appels R, Bartos J, Bellec A,

Berges H, Dolezel J, Feuillet C, Frenkel Z, Gill B, Korol A,

Letellier T, Olsen O A, Simkova H, Singh K, Valarik M, van der

Vossen E, Vautrin S, Weining S, Korol A, Frenkel Z, Fahima T,

Glikson V, Raats D, Rogers J, Tiwari V, Gill B, Paux E, Poland J,

Dolezel J, Cihalikova J, Simkova H, Toegelova H, Vrana J, Sour-

dille P, Darrier B, Appels R, Spannagl M, Lang D, Fischer I, Or-

manbekova D, Prade V, Barabaschi D, Cattivelli L, Hernandez P,

Galvez S, Budak H, Steuernagel B, Jones J D G, Witek K, Wulff

B B H, Yu G, Small I, Melonek J, Zhou R, Juhasz A, Belova T,

Appels R, Olsen O A, Kanyuka K, King R, Nilsen K, Walkowiak

S, Pozniak C J, Cuthbert R, Datla R, Knox R, Wiebe K, Xiang D,

Rohde A, Golds T, Dolezel J, Cizkova J, Tibbits J, Budak H, Ak-

pinar B A, Biyiklioglu S, Muehlbauer G, Poland J, Gao L,

Gutierrez-Gonzalez J, N'Daiye A, Dolezel J, Simkova H, Ci-

halikova J, Kubalakova M, Safar J, Vrana J, Berges H, Bellec A,

Vautrin S, Alaux M, Alfama F, Adam-Blondon A F, Flores R,

Guerche C, Letellier T, Loaec M, Quesneville H, Pozniak C J,

Sharpe A G, Walkowiak S, Budak H, Condie J, Ens J, Koh C,

Maclachlan R, Tan Y, Wicker T, Choulet F, Paux E, Alberti A,

Aury J M, Balfourier F, Barbe V, Couloux A, Cruaud C, Labadie

K, Mangenot S, Wincker P, Gill B, Kaur G, Luo M, Sehgal S,

Singh K, Chhuneja P, Gupta O P, Jindal S, Kaur P, Malik P,

Sharma P, Yadav B, Singh N K, Khurana J, Chaudhary C,

Khurana P, Kumar V, Mahato A, Mathur S, Sevanthi A, Sharma N,

Tomar R S, Rogers J, Jacobs J, Alaux M, Bellec A, Berges H,

Dolezel J, Feuillet C, Frenkel Z, Gill B, Korol A, van der Vossen

E, Vautrin S, Gill B, Kaur G, Luo M, Sehgal S, Bartos J, Ho-

lusova K, Plihal O, Clark M D, Heavens D, Kettleborough G,

Wright J, Valarik M, Abrouk M, Balcarkova B, Holusova K, Hu Y,

Luo M, Salina E, Ravin N, Skryabin K, Beletsky A, Kadnikov V,

Mardanov A, Nesterov M, Rakitin A, Sergeeva E, Handa H,

Kanamori H, Katagiri S, Kobayashi F, Nasuda S, Tanaka T, Wu J,

Appels R, Hayden M, Keeble-Gagnere G, Rigault P, Tibbits J,

Olsen O A, Belova T, Cattonaro F, Jiumeng M, Kugler K, Mayer

K F X, Pfeifer M, Sandve S, Xun X, Zhan B, Simkova H, Abrouk

M, Batley J, Bayer P E, Edwards D, Hayashi S, Toegelova H,

Tulpova Z, Visendi P, Weining S, Cui L, Du X, Feng K, Nie X,

Tong W, Wang L, Borrill P, Gundlach H, Galvez S, Kaithakottil G,

Lang D, Lux T, Mascher M, Ormanbekova D, Prade V, Rami-

rez-Gonzalez R H, Spannagl M, Stein N, Uauy C, Venturini L,

Stein N, Appels R, Eversole K, Rogers J, Borrill P, Cattivelli L,

Choulet F, Hernandez P, Kanyuka K, Lang D, Mascher M, Nilsen

K, Paux E, Pozniak C J, Ramirez-Gonzalez R H, Simkova H,

Small I, Spannagl M, Swarbreck D, Uauy C. Shifting the limits in

wheat research and breeding using a fully annotated reference

genome. Science, 2018, 361: eaar7191.

[14] Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N,

Marth G, Abecasis G, Durbin R. The sequence alignment/map

format and SAMtools. Bioinformatics, 2009, 25: 2078–2079.

[15] van der Auwera G A, Carneiro M O, Hartl C, Poplin R, Del Angel

G, Levy-Moonshine A, Jordan T, Shakir K, Roazen D, Thibault J,

Banks E, Garimella K V, Altshuler D, Gabriel S, Depristo M A.

From FastQ data to high-confidence variant calls: The genome

analysis toolkit best practices pipeline. Curr Protoc Bioinform,

2013, 43: 10–11.

[16] Cingolani P, Platts A, Wang L L, Coon M, Nguyen T, Wang L,

Land S J, Lu X, Ruden D M. A program for annotating and pre-

dicting the effects of single nucleotide polymorphisms, SnpEff.

Fly, 2014, 6: 80–92.

[17] Quinlan A R, Hall I M. BEDTools: a flexible suite of utilities for

comparing genomic features. Bioinformatics, 2010, 26: 841–842.

[18] Peng J, Richards D E, Hartley N M, Murphy G P, Devos K M,

Flintham J E, Beales J, Fish L J, Worland A J, Pelica F, Sudhakar

D, Christou P, Snape J W, Gale M D, Harberd N P. ‘Green revo-

lution’ genes encode mutant gibberellin response modulators.

Nature, 1999, 400: 256–261.

[19] Beales J, Turner A, Griffiths S, Snape J W, Laurie D A. A

pseudo-response regulator is misexpressed in the photoperiod in-

sensitive Ppd-D1a mutant of wheat (Triticum aestivum L.). Theor

Appl Genet, 2007, 115: 721–733.

[20] 柴岭岭. 普通小麦2D染色体株高和穗长QTL的精细定位与图

位克隆. 中国农业大学博士学位论文, 北京, 2019. pp 38–39.

Chai L L. Fine Mapping and Map-based Cloning of QTL Con-

trolling Plant Height and Spike Length on Chromosome 2D in

Common Wheat (Triticum aestivum L.). PhD Dissertation of

China Agricultural University, Beijing, China, 2019. pp 38–39 (in

Chinese with English abstract).

[21] Chai L L, Chen Z Y, Bian R L, Zhai H J, Cheng X J, Peng H R,

Yao Y Y, Hu Z R, Xin M M, Guo W L, Sun Q X, Zhao A J, Ni Z

F. Dissection of two quantitative trait loci with pleiotropic effects

on plant height and spike length linked in coupling phase on the

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1883

short arm of chromosome 2D of common wheat (Triticum aesti-

vum L.). Theor Appl Genet, 2018, 131: 2621–2637.

[22] Zhao Z H, Sun H G, Song W, Lu M, Huang J, Wu L F, Wang X M,

Li H J. Genetic analysis and detection of the gene MlLX99 on

chromosome 2BL conferring resistance to powdery mildew in the

wheat cultivar Liangxing 99. Theor Appl Genet, 2013, 126:

3081–3089.

[23] 邹景伟, 邱丹, 孙艳玲, 郑超星, 李静婷, 吴培培, 武小菲, 王

晓鸣, 周阳, 李洪杰. Pm52——小麦品种良星99抗白粉病基

因的有效性. 作物学报, 2017, 43: 332–342.

Zou J W, Qiu D, Sun Y L, Zheng C X, Li J T, Wu P P, Wu X F,

Wang X M, Zhou Y, Li H J. Pm52: effectiveness of the gene con-

ferring resistance to powdery mildew in wheat cultivar Liangxing

99. Acta Agron Sin, 2017, 43: 332–342 (in Chinese with English

abstract).

[24] Wu P P, Hu J H, Zou J W, Qiu D, Qu Y F, Li Y H, Li T, Zhang H

J, Yang L, Liu H W, Zhou Y, Zhang Z J, Li, J T, Liu Z Y, Li H J.

Fine mapping of the wheat powdery mildew resistance gene

Pm52 using comparative genomics analysis and the Chinese

Spring reference genomic sequence. Theor Appl Genet, 2019, 132:

1451–1461.

[25] Wang Y, Song F, Zhu J, Zhang S, Yang Y, Chen T, Tang B, Dong L,

Ding N, Zhang Q, Bai Z, Dong X, Chen H, Sun M, Zhai S, Sun Y,

Yu L, Lan L, Xiao J, Fang X, Lei H, Zhang Z, Zhao W. GSA: ge-

nome sequence archive. Genom Proteom Bioinf, 2017, 15: 14–18.

[26] National genomics data center members and partners. Nucleic

Acids Res, 2020, 48: D24–D33.

[27] Wang W X, Wang Z H, Li X T, Ni Z F, Hu Z R, Xin M M,

Peng H R, Yao Y Y, Sun Q X, Guo W L. SnpHub: an

easy-to-set-up web server framework for exploring large-scale

genomic variation data in the post-genomic era with applica-

tions in wheat. GigaScience, 2020, 9: giaa060.

附图1 济麦22(A)与良星99(B)全基因组reads覆盖度的密度分布直方图

Supplementary Fig. 1 Density plot of bin-wise normalized average read coverage in Jimai 22 (A) and Liangxing 99 (B)

X轴为经归一化的每1 Mb内的平均reads覆盖度; Y轴为覆盖度的密度。

X-axis, the averaged read coverage per 1 Mb after normalization. Y-axis, the distribution density. A and B represent density plot of bin-wise

normalized average read coverage in Jimai 22 and Liangxing 99, respectively.

附图2 济麦22与良星99间的单区间差异SNP的密度分布图

Supplementary Fig. 2 Density plot of bin-wise density of SNPs different between Jimai 22 and Liangxing 99

X轴, 每Mb区间内差异SNP位点数的对数(以10为底); Y轴, 位点数的密度。

X-axis, 10-based logarithm of the counts of differential SNP sites per Mb. Y-axis, the distribution density.

2024年11月2日发(作者:完颜月灵)

作物学报

ACTA

AGRONOMICA

SINICA 2020, 46(12): 18701883 /

ISSN 0496-3490; CN 11-1809/S; CODEN TSHPA9 E-mail: zwxb301@

DOI: 10.3724/SP.J.1006.2020.01009

小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

杨正钊 王梓豪 胡兆荣 辛明明 姚颖垠 彭惠茹 尤明山

宿振起

*

郭伟龙

*

中国农业大学农学院 / 农业生物技术国家重点实验室 / 杂种优势研究与利用教育部重点实验室, 北京 100193

摘 要: 济麦22和良星99是我国黄淮冬麦区和北部冬麦区大面积推广的高产小麦品种, 也是目前小麦杂交育种的

重要亲本。虽然济麦22和良星99的来源和系谱不同, 但在重要农艺、产量等性状上存在较高的相似性。为了从全

基因组水平研究其遗传组成的异同, 本研究采用Illumina HiSeq2500测序平台对上述两个品种进行了全基因组测序

(平均测序深度为5.8×), 并系统地比较了两个品种拷贝数变异(CNV)、单核苷酸多态性(SNP)和插入/缺失(InDel)的序

列差异。与中国春参考基因组序列相比, 两个品种除了具有总长466 Mb的共有CNV变异区间外, 济麦22和良星99

的特有CNV变异区间的总长分别为91 Mb和45 Mb, 这些特有CNV区间主要集中在2B和4B染色体上; 济麦22

和良星99间存在1,547,371个SNP差异位点和137,817个InDel差异位点。以差异SNP分布规律为依据, 在全基因

组水平鉴定出济麦22和良星99间存在14.2%的差异多态性热点区间, 这些区间集中分布在1D、2B和4B染色体上。

通过对5个控制小麦株高和穗长基因的序列分析,

发现有2个位于多态性热点区间的基因在品种间存在移码突变。

本研究为利用重测序数据在基因组水平上比较小麦品种间遗传差异提供了重要参考, 同时揭示了济麦22和良星99

在全基因组的遗传相似区间和差异区间, 为今后小麦育种改良中更好利用济麦22与良星99提供了重要遗传信息。

关键词: 小麦; 济麦22; 良星99; 全基因组重测序; SNP; CNV

Comparative analysis of the genomic sequences between commercial wheat

varieties Jimai 22 and Liangxing 99

YANG Zheng-Zhao, WANG Zi-Hao, HU Zhao-Rong, XIN Ming-Ming, YAO Ying-Yin, PENG Hui-Ru, YOU

Ming-Shan, SU Zhen-Qi

*

, and GUO Wei-Long

*

College of Agronomy and Biotechnology / State Key Laboratory for Agrobiotechnology / Key Laboratory of Crop Heterosis and Utilization, Ministry

of Education, China Agricultural University, Beijing 100193, China

Abstract: Jimai 22 and Liangxing 99 are high-yield wheat varieties widely planted in the North Huang-Huai Rivers Valley Winter

Wheat Zone and Northern Winter Wheat Zone in China, and are currently used as important parents in wheat breeding programs.

Although the origins and pedigrees of Jimai 22 and Liangxing 99 are different, they are highly similar in many important agro-

nomic traits, yield-associated traits, and so on. To identify the genomic differences between the two varieties, we performed

whole-genome sequencing using the Illumina HiSeq2500 platform, with an average sequencing depth of 5.8×. We aligned the raw

sequencing data against the Chinese Spring reference genome and identified the difference of copy-number variation (CNV) re-

gions, single-nucleotide polymorphisms (SNPs) and InDels in sequence between the two varieties. Lengths of 466 Mb CNV in-

tervals were shared by the two varieties. The lengths of cultivar-specific CNV intervals in Jimai 22 and Liangxing 99 were 91 Mb

and 45 Mb, respectively, and these intervals are mainly located on chromosomes 2B and 4B. Beyond the CNV intervals,

1,547,371 SNPs and 137,817 InDels were different between the two cultivars. Based on the distribution of SNP densities in the

intervals, we identified the polymorphic hotspot regions on chromosomes 1D, 2B, and 4B, making up 14.2% of the whole genome.

本研究由国家重点研发计划项目(2018YFD0100803), 国家自然科学基金项目(31701415)和中央高校基本科研业务费专项资助。

This study was supported by the National Key Research and Development Program of China (2018YFD0100803), the National Natural

Science Foundation of China (31701415), and the Chinese Universities Scientific Fund.

*

通信作者(Corresponding authors): 郭伟龙, E-mail: guoweilong@; 宿振起, E-mail: suzhenqi80@

第一作者联系方式: E-mail: yangzhengzhao@

Received (收稿日期): 2020-01-15; Accepted (接受日期): 2020-06-02; Published online (网络出版日期): 2020-08-10.

URL: /kcms/detail/

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1871

The sequences of five previous cloned dwarf genes and spike length related genes were investigated, and two genes located in the

polymorphic hotspot regions were detected with the frame shift variations. This study provides an important guidance for evaluat-

ing the genetic differences between two wheat varieties in the genomic level, and also identified both genetic similarity regions

and polymorphic hotspot regions between Jimai 22 and Liangxing 99, which provided a valuable genetic information for future

genetic improvement utilizing Jimai 22 and Liangxing 99 as parents.

Keywords: wheat; Jimai 22; Liangxing 99; whole-genome resequencing; SNP; CNV

小麦是重要的口粮作物。我国是世界上最大的

小麦生产和消费国, 提高单产是保障我国小麦生产

可持续发展和粮食安全的重要途径。新中国成立以

来, 我国小麦主产区经历了5~6次的品种更换, 小

麦品种的产量、抗性、品质等重要性状得到了大幅

提高。小麦品种的遗传改良对我国小麦单产和总产

的提高发挥了重要作用

[1]

。不同小麦生态区中对照

品种既是各时代育种水平的代表, 通常又是下一代

品种改良的骨干亲本

[2]

。例如, 黄淮冬麦区的对照品

种周麦18

[3]

、鲁麦14

[4]

、石4185

[5]

等在小麦的遗传

改良中做出重要贡献。

常规育种是我国小麦遗传改良的主要手段, 但

在亲本选配、后代选择等关键育种过程中依赖于有

限的表型性状和育种者的经验。育种过程中存在不

确定因素和盲目性, 影响了小麦遗传改良的效率。

分子标记的开发和应用为小麦性状的基因定位、标

记辅助选择、亲本遗传多样性分析等方面提供了重

要支撑, 可有效提升抗性、品质等性状遗传的改良

效率。继水稻、玉米、大麦等主要作物基因组测序

的完成, 六倍体普通小麦中国春的高质量基因组参

考基因组序列(IWGSCv1)的测序完成, 标志着小麦

遗传研究已进入“后基因组学时代”

[6]

。与基于表型和

有限分子标记辅助的选择相比, 利用基因组测序并

从全基因组水平解析品种间的遗传差异为小麦的遗

传研究和品种的改良提供高维度的组学数据支持

[7]

济麦22是山东省农业科学院作物研究所选育

[8]

良星99是山东省德州市良星种子研究所选育

[9]

。济

麦22和良星99分别于2006年通过黄淮冬麦区北片

审定, 此后相继通过北部冬麦区和黄淮南片等麦区

审定, 累计推广面积超过6000万公顷。由于综合性

状突出, 济麦22 (2015至今)和良星99 (2010—2015)

先后作为黄淮冬麦区北片区域试验的对照品种, 也

是我国当前小麦品种改良的重要亲本资源。育种家在

长期育种和生产实践中发现, 虽然济麦22和良星99

来源及系谱不同, 但两品种间除株高外, 田间总体形

态相近; 主要农艺、产量和抗病反应等性状表现一致,

两者的杂交后代亦无明显分离, 普遍认为两个品种

遗传组成相似性较高, 亲缘关系较近。近期研究发现

麦22和良星99的2个衍生材料的白粉病抗性相近,

通过分子标记定位发现两者具有相同Pm52基因

[10]

但对其遗传相似性的认识仍以有限的表型性状描述和

经验为主, 尚未从遗传水平上对两者进行系统解析。

本研究通过对济麦22和良星99的重测序数据

分析, 在全基因组水平系统解析了两者的遗传组成

差异, 以期对今后小麦育种的亲本利用、重要性状

基因区间追溯、新品种系谱分析、基因组水平上研

究重要骨干种质的遗传组成等方面提供重要参考。

1 材料与方法

1.1 小麦材料及田间表型考察

供试材料为小麦品种济麦22 (系谱: 935024×

935106)与良星99 [系谱: (济91102×鲁麦

14)×PH85-16]。2018年10月1日将上述两个品种播

种于中国农业大学上庄实验站(北京, 40°14′N,

116°19′E), 按照完全随机试验设计, 设3次重复, 2

行区, 行长1.5 m, 行距25.0 cm, 株距3.0 cm。收获

前每小区取中部10株调查株高、穗长、小穗数、穗

粒数、旗叶长和宽等农艺性状; 收获后利用考种仪

(良田高拍仪S500A3B)考察千粒重、粒长、粒宽等

籽粒性状。品种间性状差异检验用t测验进行统计

分析, 数据分析通过R语言计算完成。

1.2 全基因组重测序与多态性位点鉴定

用CTAB的方法分别从济麦22和良星99幼根

提取DNA。用Illumina HiSeq2500测序平台采用双

端测序的方法进行全基因组测序, 建库和测序由北

京诺禾致源科技股份有限公司完成。对重测序原始

数据用Trimmomatic软件(v0.36)

[11]

进行过滤后再使

用BWA软件(v0.7.15)

[12]

的BWA-MEM工具将过滤后

的数据在小麦参考基因组(IWGSCv1)

[13]

上进行比对,

选择保留存在“唯一最优匹配(Unique Best Hit)”的读

段对; 最后利用与samtools (v1.4)

[14]

工具进行过滤。

利用GATK软件(v3.8)

[15]

中的HaplotypeCaller、

GenotypeGVCF、SelectVariants和VariantFiltration

等功能计算并过滤获得材料基因组上的高质量SNP

和InDel位点。其中, SNP位点过滤参数为“QD < 2.0,

FS > 60.0, MQRankSum < –12.5, ReadPosRankSum <

1872

作 物 学 报

第46卷

–8.0, SOR > 3.0, MQ < 40.0, DP > 30||DP < 3”; InDel

过滤参数为“QD < 2.0, FS > 200.0, ReadPosRankSum

< –20.0, DP > 30||DP < 3”。对过滤后的SNP与InDel

位点通过SNPEff软件(v4.3t)

[16]

morphism, SNP)的频率进行分析, 在每个窗口中统

计两品种间存在差异的纯合SNP的密度分布(附图

2)。这部分研究中仅考虑拷贝数正常的区间, CNV变

异区间未被统计。考虑该密度分布具有明显的高斯

混合分布的特点, 我们利用EM算法拟合出两个正

态分布的模型, 并据此选择阈值x=1.5 (差异频率约

为3.1×10

–5

)作为2个分布的分隔边界。其中, 高密

度SNP分布区间被认为两个材料的多态性热点区间;

低密度SNP分布区间被认为两个材料的相似区间。

进行注释。使用的中

国春基因注释版本为IWGSC RefSeq v1.1 (

/download/iwgsc/IWGSC_RefSe

q_Annotations/v1.1/)。

1.3 拷贝数变异区间鉴定及比较分析

拷贝数变异(copy-number variation, CNV)是小

麦基因组研究的主要多态性类型之一。本研究为鉴

定供试材料相对于中国春参照基因组的CNV变异

区间, 在分析中以1 Mb为单位将全基因组划分为小

窗, 利用bedtools (v2.26.0)

[17]

计算两个品种的重测

序比对读段在每个窗口内的“平均覆盖深度”(Dep

bin

);

并结合该材料的全基因组“平均读段覆盖深

度”(Dep

ave

)进行归一化, 得到每个小窗的“平均相对

覆盖深度”: Dep

bin

/Dep

ave

。由于在CNV分析的结果

中, 基因组序列丢失相比于序列插入更容易被检测,

本研究计算得到的CNV变异区间仅考虑相对于参

照基因组低覆盖度(“丢失”)情况。下文中的CNV均

指“丢失(低覆盖度)变异”。“相对平均覆盖深度”低于

0.5的小窗被视为“CNV变异区间”(附图1)。CNV变

异区间分析均由每个材料分别和“中国春”参照基因

组的序列比较计算获得。其中, 在两个品种中同时

存在CNV变异的区间被称为“共有CNV变异区间”。

1.4 品种间全基因组高频率SNP差异区段的鉴定

为鉴定两个品种的基因组序列差异区间, 本研

究以1 Mb为单位对全基因组进行划分窗口, 对每个

窗口中的单核苷酸多态性(single nucleotide poly

表1 本研究使用的引物编号和序列

Table 1 Primer IDs and sequences used in this study

引物编号

Primer ID

TraesCS2D02G055700_F

TraesCS2D02G055700_R

TraesCS2D02G051500_F

TraesCS2D02G051500_R

2B_LX99_CNV1_F

2B_LX99_CNV1_R

2B_LX99_CNV2_F

2B_LX99_CNV2_R

2B_COM_CNV_F

2B_COM_CNV_R

2D_COM_CNV_F

2D_COM_CNV_R

引物序列

Primer sequence (5'–3')

CAGGTCGAGACAGAGAACAA

ATCGAGCCCCTCAATTTCAT

TCAGCTCAGGGTTATCAAGC

TTGGGTGCATTTTTCAGTCC

AGCAGGTAATCCACACCAAA

TGGAGAACCCACTTATCCAA

AGCAGGTAATCCACACCAAA

AATCCACACCAAATCCCCAT

CACCCTAGATACAACCGAGG

ATGTCACCGATCTTCTGAGC

ATGATCACGATGGACCTAGC

TGCCACGAAGATTTAGAGGA

1.5 差异CNV区间和基因序列差异差异位点的验

对济麦22与良星99基因组内的特有与共有

CNV区间分别进行验证, 选取区间内2000 bp左右长

度的序列设计染色体区间特异的引物对CNV区间进

行验证。扩增引物由在线软件Primer 3.0设计, 其中

引物长度范围为18~24 bp, GC含量范围在40%~60%

之间, 退火温度范围为54~60℃, 扩增产物大小1~2

kb (表1)。以济麦22、良星99与中国春的DNA为模

板进行PCR扩增, 通过有无目标扩增产物判断CNV

是否存在。对与小麦株高相关的候选基因TraesCS-

2D02G051500、TraesCS2D02G055700的序列差异

SNP位点, 设计出基因组特异引物(表1)进行PCR扩

增并测序。PCR反应体系为20 μL, 包括10 μL的2X

M5 HiPer plus Taq HiFi PCR mix, 正、反向引物(10

μmol L

–1

)各1 μL, 150 ng μL

–1

模板DNA 2 μL, 用

ddH

2

O补至20 μL。PCR扩增程序为95℃ 3 min; 95

℃ 30 s, 56~57.4℃ 30~60 s (依引物退火温度以及目

标序列而定), 72℃ 2 min, 35个循环; 72℃ 5 min。

退火温度

Annealing temperature (℃)

56

58

测序引物

用途

Purpose

Sequencing primers

CNV标记特异引物

Specific primers for CNV markers

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1873

2 结果与分析

2.1 济麦22与良星99的农艺性状比较

田间观察发现2个品种株形相近, 两者除株高、

穗长存在显著差异外(P < 0.01) (图1), 旗叶大小、小

穗数、千粒重、粒长、粒宽等主要农艺和产量相关

性状差异均不显著(表2)。这表明济麦22和良星99

在主要农艺和产量性状上存在较高的相似性。

2.2 济麦22和良星99全基因组多态性位点检测

利用Illumina HiSeq2500分别对济麦22和良星

99进行了全基因组测序, 分别获得了88 Gb和128

Gb的重测序数据。通过和中国春参考基因组序列

(IWGSCv1)进行测序数据的比对并去除重复序列,

选择“唯一最优匹配”的读段进行后续分析, 最终两

品种的平均覆盖深度均为5.8×。经过SNP calling分

析, 济麦22和良星99中分别鉴定出15,326,314个

与15,060,004个和中国春参照基因组不同的高质量

纯合SNP位点, 约占全基因组的0.109%和0.107%

(表3)。其中, A、B基因组中的SNP的频率(0.130%~

0.155%)明显高于D基因组(0.0224%~0.0225%)。两品

种间基因型不一致的纯合SNP位点仅占总SNP位点个

数的9.8%, 即超过90%的SNP是两个品种间共有的。

图1 济麦22与良星99的表型比较

Fig. 1 Morphological comparison between Jimai 22 and

Liangxing 99

A: 济麦22 (左)与良星99 (右)的株高及节间长度比较; B: 济麦

22 (上)与良星99 (下)的粒型比较。

A: plant height and internode length comparison between Jimai 22

(left) and Liangxing 99 (right); B: grain morphological comparison

between Jimai 22 (top) and Liangxing 99 (bottom).

表2 济麦22与良星99的主要农艺性状差异显著性分析

Table 2 Statistical analysis of the main agronomic traits for Jimai 22 and Liangxing 99

济麦22

表型

Phenotype

Jimai 22

均值±标准误差

Mean ± SE

旗叶长Flag leaf length (cm)

旗叶宽Flag leaf width (cm)

每穗小穗数Spikelet number per spike

16.78±0.36

1.88±0.024

21.87±0.45

样本量

Sample counts

30

30

30

30

30

30

30

30

6

6

6

良星99

Liangxing 99

均值±标准误差

Mean ± SE

16.94±0.40

1.85±0.039

21.80±0.28

样本量

Sample counts

30

30

30

差异显著性

Statistical significance of

the difference

P-value

(t-test)

0.76

0.53

0.91

1.00

0.90

3.98E-5

**

1.90E-6

**

0.31

0.66

0.39

0.58

每穗可育小穗数Fertile spikelet per spike 21.23±0.50

每穗不育小穗数Infertile spikelet per spike

穗长Spike length (cm)

株高Plant length (cm)

穗粒数Grain number per spike

千粒重Thousand seed weight (g)

粒长Grain length (cm)

粒宽Grain width (cm)

**

**

21.17±0.14 30

0.63±0.23

10.43±0.15

80.23±0.75

55.20±0.35

48.30±0.03

6.53±0.03

3.30±0.02

30

30

30

30

6

6

6

0.63±0.14

9.57±0.13

75.05±0.57

52.23±0.73

49.20±0.33

6.43±0.07

3.25±0.06

表示在0.01水平上差异显著。

represents significantly different at the 0.01 probability level.

同时, 在济麦22和良星99中分别鉴定出1,143,512

与1,118,564个的InDel位点(表4), 分别占全基因组

的0.0813%和0.0795%。与D基因组, A、B基因组

中鉴定出的InDel频率更高。济麦22和良星99间

差异的InDel多态性位点占鉴定出的InDel位点总数

的11.8%。

1874

作 物 学 报

第46卷

表3 济麦22与良星99的纯合SNP位点统计

Table 3 Summary of homozygous SNPs in Jimai 22 and Liangxing 99

济麦22中的纯合

基因组

Genome

SNP个数

SNPs in Jimai 22

良星99中的纯合

SNP个数

SNPs in Liangxing 99

两者基因型相同的纯合SNP

个数

Number of homozygous

SNPs with the same genotype

6,194,047

7,248,448

818,951

14,261,446

两者基因型不同的纯合

SNP个数

Number of homozygous SNPs

with different genotypes

301,206

1,148,764

97,401

1,547,371

Number of homozygous

Number of homozygous

A 6,405,063 6,395,080

B 8,033,789 7,781,369

D 887,462 883,555

全基因组 Whole genome 15,326,314 15,060,004

表4 济麦22与良星99的纯合InDel位点统计

Table 4 Summary of InDels in Jimai 22 and Liangxing 99

济麦22中的纯合

基因组

Genome

InDel个数

InDels in Jimai 22

良星99中的纯合

InDel个数

InDels in Liangxing 99

两者基因型相同的纯合

InDel个数

Dels with the same genotype

两者基因型不同的纯合

InDel个数

Number of homozygous InDels

with different genotypes

28,732

95,316

13,769

137,817

Number of homozygous

Number of homozygous

Number of homozygous In-

A 464,369 459,599 438,410

B 562,658 543,395 492,112

D 116,485 115,570 104,345

全基因组Whole genome 1,143,512 1,118,564 1,034,867

2.3 济麦22与良星99的基因组CNV区间的鉴

726 Mb), 2B_COM_CNV位于2B染色体上良星99

与济麦22共有的CNV区间(Chr. 2B: 738 Mb~769 Mb),

2D_COM_CNV位于2D染色体上济麦22与良星99

共有的CNV区间(Chr. 2D: 570 Mb~638 Mb)。利用

这4对引物在济麦22、良星99和中国春材料内进

行PCR扩增, 结果表明材料间的差异CNV区间可

以通过扩增条带的有无进行验证(图3); 其中2B_

LX99_CNV1与2B_LX99_CNV2在中国春与济麦22

中均扩增出目标条带, 但未在良星99中扩增出条带,

证明该区间仅在良星99中丢失, 2B_ COM_CNV与

2D_COM_CNV仅在中国春中扩增出目标条带, 证明

该区间在济麦22与良星99中均丢失。PCR验证结果

与全基因组分析结果吻合, 表明该分析方法计算得

到的CNV变异准确可靠。

定与比较

济麦22的基因组相对于中国春参照基因组中

存在557 Mb的CNV变异区间, 占全基因组的4.0%;

而在良星99基因组中检测出511 Mb的CNV变异区

间, 占全基因组的3.6% (表5)。其中, 两品种共有的

CNV变异区间的长度为466 Mb, 主要集中于2B、

2D、5A和6A染色体; 两品种特有的CNV区间分

别为91 Mb和45 Mb, 共计约占总CNV区间的

22.6%, 主要集中在2B和4B染色体上(图2)。

为了验证CNV区间的分析结果, 在2B和2D

染色体上的CNV差异区间中设计了特异PCR引物。

其中2B_LX99_CNV1与2B_LX99_CNV2位于2B

染色体上良星99特有CNV区间(Chr.2B: 667 Mb~

表5 济麦22与良星99的全基因组CNV区间长度统计

Table 5 Summary for the CNV regions identified in Jimai 22 and Liangxing 99

济麦22的特有CNV区间

基因组

Genome

Specific CNV region in

Jimai 22

长度

Length (Mb)

%

良星99的特有CNV区间

Specific CNV region in

Liangxing 99

长度

Length (Mb)

%

长度

Length (Mb)

两品种的共有CNV区间

Common CNV regions in the

two cultivars

%

A 8 0.06 4 0.03 135 0.96

B 80 0.57 33 0.23 226 1.61

全基因组Whole genome 91 0.65 45 0.32 466 3.31

D 3 0.02 8 0.06 105 0.75

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1875

图2 济麦22与良星99的CNV区间(相对于中国春参照基因组)在各染色体上的分布

Fig. 2 Distribution of CNV regions detected in Jimai 22 and Liangxing 99 compared to the Chinese Spring reference genome

绿色: 济麦22的特有CNV区间; 粉色: 良星99的特有CNV区间; 紫色: 济麦22与良星99的共有CNV区间。

Green: specific CNV regions in Jimai 22; Pink: specific CNV regions in Liangxing 99; Purple: common CNV regions in the two varieties.

图3 利用PCR对济麦22(JM22)、良星99(LX99)和中国春(CS)中检测的CNV区间进行验证

Fig. 3 PCR validation of detected CNVs in Jimai 22 (JM22), Liangxing 99 (LX99) and Chinese Spring (CS)

2D_COM_CNV和2B_COM_CV分别为2D和2B染色体上共有区间序列设计的引物; 2B_LX99_CNV1和2B_LX99_CNV2为在2B染

色体上良星99特有的CNV区间中序列设计的引物。每对引物对应的3个泳道从左到右分别为: 良星99(LX99)、济麦22(JM22)和中

国春(CS)。

2D_COM_CNV and 2B_COM_CNV were designed utilizing sequences in common CNV regions in 2D and 2B chromosomes, respectively;

2B_LX99_CNV1 and 2B_ LX99_CNV2 were designed utilizing sequences in Liangxing 99-specific CNV regions in chromosome 2B. The

corresponding three lanes from left to right for each primer are Liangxing 99 (LX99), Jimai 22 (JM 22) and Chinese Spring (CS).

通过对济麦22与良星99中特有的CNV区间内

高可信度(HC)基因进行GO富集分析发现, 在济麦

22的特有CNV区间内有982个基因, 其中294个基

因显著富集在25个GO条目, 主要包括“ADP 结

合”(GO: 0043531)、“肽酶抑制剂活性”(GO: 0030414),

辅酶结合”(GO: 0050662)、“酶抑制剂活性”(GO:

0004857)、“半胱氨酸型内肽酶抑制剂活性”(GO:

0004869)等分子功能, 以及“肽酶活性负调控”(GO:

1876

作 物 学 报

第46卷

0010466)、“内肽酶活性负调控”(GO: 0010951)、“催

化活性负调控”(GO: 0043086)、“碳代谢过程”(GO:

0008152)等生物学过程中, 细胞组分分类内未有富

集(图4-A)。在良星99特有CNV区间内包括513个

基因, 其中富集到的395个基因分布在25个GO条

目中, 主要有“ADP结合”(GO: 0043531)、“血红素结

合”(GO: 0020037)、“过氧化物酶活性”(GO:

0004601)、“萜烯合酶活性”(GO: 0010333)、“O-甲基

转移酶活性”(GO: 0008171)、“腺苷脱氨酶活性”(GO:

0004000)等分子功能, 以及“抗氧化反应”(GO:

0006979)、“过氧化氢分解过程”(GO: 0042744)、“细

胞氧化解毒”(GO: 0098869)、“蛋白磷酸化”(GO:

0006468)、“糖原生物合成”(GO: 0005978)等生物学

过程和“胞外区”(GO:0005576)这一细胞组分中(

4-B)。济麦22特有CNV区间内富集在GO条目, 如

“生长素反应”(GO: 0009733), “色素合成过程”(GO:

0046148)下的基因, 可能是影响两材料间的表型差

异的候选基因。

图4 济麦22(A)与良星99(B)特有CNV区间中基因的GO富集分析结果

Fig. 4 GO enrichment analysis of the genes in Jimai 22 (A) and Liangxing 99 (B) specified CNV regions

绿色: 生物过程; 紫色: 细胞组分; 橙色: 分子功能。

2.4 济麦22和良星99间的SNP多态性热点区间

和序列相似区间分析

以中国春IWGSCv1参考基因组为模板, 利用剔

除品种间大片段CNV后的13.5 G大小的基因组序列

进行分析。以差异纯合SNP的密度为3.1×10

–5

为阈值

将染色体区分为“多态性热点区间”(高密度差异SNP

区间)和“序列相似区间”(低密度差异SNP区间)。济麦

22与良星99之间共有1915 Mb (14.2%)区间为多态性

热点区间(图5-A)。在多态性热点区间中, 两品种间有

1,375,981个纯合差异SNP位点, 约占两品种全部纯合

差异SNP位点总数的96.5% (图5-B), 这些多态性热点

区间主要集中于1D、2B、3B和4B染色体(图5-C)。

通过对两品种多态性热点区间内的14,306个高

可信度基因进行GO富集分析, 其中1461个基因显

著富集在20个GO条目中, 主要包括“5'–3' RNA聚

合酶活性” (GO: 0003899)、“二磷酸核酮糖羧化酶活

性” (GO: 0016984)、“光合作用的循环电子转运通路

内转移电子的电子转运器活性” (GO: 0045156)、“醛

糖1-表异构酶活性” (GO: 0004034)、以NAD或

NADP为受体提供

CH-OH基团的氧化还原酶活性”

(GO: 0016616)等分子功能, “光合作用” (GO:

0015979)、“己糖代谢过程” (GO: 0019318)和“光系统

II中的光合电子传输” (GO: 0009772)等生物过程,

以及“光系统II” (GO: 0009523)、“光系统II反应中

心” (GO: 0009539)、“叶绿体” (GO: 0009507)、“质体”

(GO: 0009536)和“类囊体” (GO: 0007579)等细胞组

分内(图6)。综合看来, 该部分基因的GO富集分析

结果主要集中在光合作用通路相关条目。

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1877

图5 济麦22与良星99全基因组内多态性热点区间分布

Fig. 5 Statistics and distribution of the SNP hotspot regions between Jimai 22 and Liangxing 99

A: 两品种间差异SNP位点中分布在多态性热点区间与序列相似区间的比例; B: 多态性热点区间与序列相似区间的长度在全基因组

上的比例; C: 多态性热点区间与序列相似区间在全基因组分布。深蓝色: 多态性热点区间; 浅蓝色: 序列相似区间; 白色: CNV区间。

A: pie chart for the proportions of differential SNPs in the polymorphism hotspot regions (PHRs) and the genetic similar regions (GSRs); B:

pie chart for the proportions of the PHRs and GSRs in length; C: distributions of the PHRs and the GSRs across chromosomes.

图6 济麦22与良星99间多态性热点区间的基因GO富集分析结果

Fig. 6 GO enrichment result of the genes in the SNP hotspot regions between in Jimai 22 and Liangxing 99

绿色: 生物过程; 紫色: 细胞组分; 橙色: 分子功能。

1878

作 物 学 报

第46卷

2.5 济麦22和良星99的多态性热点区间和序列

相似区间的突变类型分析

为比较两品种间多态性热点区间和序列相似区间

中的突变类型的异同, 我们首先统计差异SNP位点的

碱基变异类型的频率(图7-A和表6)。无论在多态性热

点区间还是序列相似区间, T↔C和G↔A类型的突变

频率均为最多, 在多态性热点区间内约占71.4%, 略

高于在序列相似区间内所占总SNP的比例(66.5%)。同

时, 我们还统计了两品种间差异InDel的长度分布(图

7-B和表7)。多态性热点区间中的单碱基的InDel占该

区间内所有InDel位点的64.7%, 其比例高于单碱基的

InDel在序列相似区间中所占的比例(49.0%)。

图7 济麦22与良星99间多态性热点区间与序列相似区间中各自的InDel长度分布(A)和SNP突变类型(B)

Fig. 7 Length distributions of homozygous InDels (A) and mutation types of homozygous SNPs (B) in the polymorphism hotspot

regions and genetic similar regions between Jimai 22 and Liangxing 99

深蓝: 多态性热点区间; 浅蓝: 序列相似区间。

Dark blue: polymorphism hotspot regions; Light blue: genetic similar regions.

我们分别对多态性热点区间与序列相似区间

内两品种间差异SNP与InDel位点对于基因功能

的影响进行了注释与比较(表8), 结果表明多态

性热点区间与序列相似区间中基因序列上的SNP

和InDel变异的类型主要以错义突变(missense

variation)和同义突变(synonymous variation)为

主。在多态性热点区间中错义突变(51.3%)与终止

子相关突变(stop-codon gain/lost)(1.5%)所占比例

要分别略高于两者在序列相似区间的44.7%和

0.8%比例。

表6 济麦22与良星99全基因组差异纯合SNP的突变类型的统计

Table 6 Summary of the mutation types of the differential homozygous SNPs in Jimai 22 and Liangxing 99

SNP突变类型

Types of SNP

mutations

多态性热点区间

Differential genetic region

数量

Counts

每Mb密度

Density per Mb

数量

Counts

相似区间

Similar genetic region

每Mb密度

Density per Mb

数量

Counts

全基因组

Whole genome region

每Mb密度

Density per Mb

T>A 33,545 17.52

A>T 33,868 17.69

G>C 49,065 25.62

C>G 49,521 25.86

A>C 47,712 24.91

T>G 47,862 24.99

G>T 65,670 34.29

C>A 66,047 34.49

A>G 200,697 104.80

T>C 201,236 105.08

1701 0.15 35,246 2.62

1713 0.15 35,581 2.64

2020 0.17 51,085 3.79

1956 0.17 51,477 3.82

2089 0.18 49,801 3.70

1888 0.16 49,750 3.69

3204 0.28 68,874 5.11

3226 0.28 69,273 5.14

6364 0.55 207,061 15.37

6540 0.57 207,776 15.42

G>A 289,933 151.40 11,276 0.98 301,209 22.36

C>T 290,292 151.59 11,151 0.96 301,443 22.38

转换Transition 982,158

颠换Transversion 393,290

512.88

205.37

35,331

17,797

3.06 1,017,489

1.54 411,087

75.53

30.51

全部Total 1,375,448 718.25 53,128 4.60 1,428,576 106.04

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1879

表7 济麦22与良星99的纯合InDel变异的长度分布

Table 7 Length distribution of differential homozygous InDels in Jimai 22 and Liangxing 99

差异区间

InDel类型

Types of InDel

在济麦22中插入, 在良

星99中丢失

Insertion in Jimai 22,

deletion in Liangxing 99

InDel长度

Length of InDel

Differential genetic region

数量

Count

每Mb密度

Density per Mb

数量

Count

相似区间

Similar genetic region

每Mb密度

Density per Mb

数量

Count

全基因组

Whole genome region

每Mb密度

Density per Mb

1 34,031 17.77 7723 0.67 41,754 3.10

2 7259 3.79 3017 0.26 10,276 0.76

3 2664 1.39 1242 0.11 3906 0.29

4 1685 0.88 843 0.07 2528 0.19

5 701 0.37 419 0.04 1120 0.08

6 883 0.46 370 0.03 1253 0.09

7 453 0.24 225 0.02 678 0.05

8 476 0.25 216 0.02 692 0.05

9 363 0.19 153 0.01 516 0.04

≥10 4131 2.16 1599 0.14 5730 0.43

在良星99中插入, 在济

麦22中丢失

Insertion in Liangxing

99, deletion in Jimai 22

全部Total 52,646 27.49 15,807 1.37 68,453 5.08

1 34,083 17.80 7796 0.67 41,879 3.11

2 7315 3.82 3037 0.26 10,352 0.77

3 2690 1.40 1190 0.10 3880 0.29

4 1710 0.89 785 0.07 2495 0.19

5 746 0.39 420 0.04 1166 0.09

6 832 0.43 356 0.03 1188 0.09

7 412 0.22 227 0.02 639 0.05

8 509 0.27 208 0.02 717 0.05

9 402 0.21 183 0.02 585 0.04

≥10 3993 2.09 1637 0.14 5630 0.42

全部Total 52,696 27.52 15,835 1.37 68,531 5.09

表8 济麦22与良星99的纯合点突变对蛋白编码功能影响的统计

Table 8 Statistics of the effects on protein coding of homozygous point mutations between Jimai 22 and Liangxing 99

错义突变

变异所在区间

Region of variations

差异区间Different region

相似区间Similar region

数量

Count

2981

348

同义突变

数量

Count

2431

330

移码突变

数量

Count

304

94

提前终止突变

数量

Count

68

6

终止子丢失突变

Stop-lost mutation

数量

Count

16

0

%

0.3

0

Missense mutation Synonymous mutationFrame-shift mutationStop-gained mutation

%

51.3

44.7

%

41.9

42.4

%

5.2

12.1

%

1.2

0.8

全部Total 3329 50.6 2761 42.0398 6.1 74 1.1 16 0.2

2.6 株高候选基因在济麦22和良星99之间的序

Rht-B1

[18]

、Rht-D1

[18]

、株高相关基因Ppd-D1

[19]

和在

2D染色体的QPht/-2D.1内定位到2个株高穗长

候选基因

[20]

等进行序列分析, 发现QPht/-2D.1

区间内的2个基因在品种间存在序列差异(表9)。

列差异分析及重测序结果验证

济麦22与良星99在株高和穗长上存在显著差异,

利用两者的重测序数据对小麦目前已克隆的矮秆基因

1880

作 物 学 报

第46卷

表9 小麦株高相关基因列表及在序列相似区间和多态性热点区间的分布

Table 9 List of dwarf genes and their distributions in genetic similar regions and polymorphism hotspot regions

株高基因/QTL

Plant height

gene/QTL

Rht-B1

Rht-D1

Ppd-D1

基因编号

Gene ID

TraesCS4B02G043100

TraesCS4D02G040400

TraesCS2D02G079600

染色体

Chromosome

4B

4D

2D

2D

区间

Region

多态性热点区间

Polymorphic hotspot regions

相似区间

Genetic similar region

相似区间

Genetic similar region

QPht/-2D.1 TraesCS2D02G051500 多态性热点区间

Polymorphic hotspot regions

QPht/-2D.1 TraesCS2D02G055700 2D 多态性热点区间

Polymorphic hotspot regions

基因功能注释

Function annotation

编码DELLA蛋白

DELLA protein-coding gene

编码DELLA蛋白

DELLA protein-coding gene

编码PRRs蛋白

PRRs protein-coding gene

编码WRKY转录因子

WRKY transcription factor

protein-coding gene

编码GRAS转录因子

GRAS transcription factor

protein-coding gene

InDel, SNP

序列差异类型

Variation type

None

None

None

InDel

利用基因特异性引物对QPht/-2D.1 QTL

区间内的TraesCS2D02G051500和TraesCS2D02

G055700基因分别在济麦22与良星99中进行扩增、

测序发现, 2个基因在品种间存在引起氨基酸改变的

差异位点(图8)。该QTL区间是矮秆基因Rht8所在

区间, 该位点对小麦的株高和穗长均有影响

[21]

, 但

其遗传功能仍需进一步试验验证。

果表明, 与中国春参考基因组序列相比, 济麦22和

良星99中存在大量的CNV变异(特别是CNV丢失

变异)。通过比较2个材料中CNV变异区间的异同,

发现大部分CNV区间是共有的, 但仍有22.6%的差

异CNV区间; 其中60.3%的差异CNV区间集中于

2B染色体。需要指出的是, 本研究中发现的“CNV

缺失区间”是通过读段比对后的覆盖度确定的, 不能

排除该区域可能来源于遗传距离较远的基因组序列

的可能性。根据品种间差异SNP的分布密度对染色

体区间进行了划分, 鉴定出基因组14.2%的区间是

两品种间的多态性热点区间, 集中了全基因组

2B和

96.5%差异SNP位点, 这些区间主要位于

1D、

4B染色体上。通过鉴定相似区间和多态性热点区间

变异位点的特征, 发现两类区间在SNP变异类型、

InDel长度分布、突变影响编码功能的比例上有一定

区别。上述结果表明济麦22和良星99在全基因组

水平具有较高的相似性, 但在特定的染色体上确实

存大片段的差异区间。

济麦22和良星99的主要农艺和产量性状存在

较高相似性, 只有在株高和穗长上存在差异。结合

品种间序列差异位点分析, 我们推测控制品种间株

高和穗长的差异基因可能位于差异SNP热点区域或

差异CNV区间。结合目前已经在小麦中克隆的株高

或穗长的5个相关基因, 并分析两品种间基因序列,

发现了2个位于差异SNP热点区且存在影响编码功

能的变异的候选基因。本研究在已有基因组变异和

表型信息的基础上对已知性状相关基因和品种间差

异序列区间进行了初步分析, 找到了位于多态性热

点区间的2个具有序列差异的基因, 但其生物学功

图8 TraesCS2D02G051500(A)与TraesCS2D02G055700(B)在中

国春、济麦22和良星99中功能改变位点附近的核苷酸序列

Fig. 8 Sequence of TraesCS2D02G051500 (A) and TraesCS

2D02G055700 (B) near the coding-function affected sites in

Chinese Spring, Jimai 22, and Liangxing 99

3 讨论

本研究通过对济麦22和良星99两个小麦品种

的重测序数据进行分析, 系统研究了两个品种在基

因组水平上存在的CNV区间和SNP热点区间。与

中国春参照基因组比较发现, 两个品种均有大量

CNV丢失变异区间, 约占全基因组的4.3%。除集中

分布在2B染色体上148 Mb的CNV变异外, 大部分

CNV变异区间零散地分布在不同染色体上。这一结

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1881

能和关联仍需进一步验证。利用表型差异和全基因

组序列多态性分析相结合的方法, 本研究的方法可

为今后借助基因组测序方法快速定位和克隆候选基

因提供了新的参考。

Zhao等

[22]

研究发现, 良星99的2BL上有一个控

制抗白粉病的主效基因, 该基因被命名为Pm52

[23]

利用中国春参照基因组的信息, 将Pm52基因定位在

chr2B的581 Mb~596 Mb的区间

[24]

。本研究的结果显

示, 济麦22和良星99的2BL的绝大部分区间为多

态性热点区间, 但575 Mb~603 Mb区段为本研究中

鉴定的“序列相似区间”, 该区段包含Pm52所在的

物理区间; 本研究间接支持了Qu等

[24]

在济麦22和

良星99的衍生材料中均携带相同的Pm52基因的结

论。该结果也表明本研究鉴定的序列相似区间可为

抗病等关键性状基因的定位研究提供参考。

小麦品种的重测序研究为探索小麦基因组序列

的多态性提供高维度、高精细度、类型丰富的基因

组变异信息。本研究也为比较小麦品种间的基因组

序列差异分析提供了方法学参考。随着小麦材料重

测序数据的不断积累, 小麦品种间基因组序列变异

的特征和规律也将得到进一步揭示。有效分析和利

用丰富的基因组变异信息, 将有助于对关键性状基

因功能进行阐释, 辅助小麦育种对优异基因区间的

利用, 提高小麦品种选育的效率。

4 结论

济麦22和良星99两个重要小麦品种的田间表

型相似。本研究通过对两个品种进行全基因序列差

异分析发现, 济麦22和良星99间的遗传组成相似

性较高(序列相似区间占85.8%), 但仍存在大区段

CNV变异(136 M)和占全基因组14.2%的差异多态性

热点区间; 其中差异SNP热点区间主要集中在1D、

2B和4B染色体上。本工作为进一步研究和利用济

麦22和良星99提供了重要的基因组变异数据; 也

为小麦品种间的基因组变异热点区间的鉴定提供了

方法参考。

说明: 本研究中的原始测序数据已提交至中国科学

院北京基因组研究所BIG数据中心

[25]

的组学原始数

据归档库

[26]

中(/gsa), 编号为

CRA002333。为便于数据的共享, 我们利用SnpHub

数据库模型

[27]

搭建了2个材料的基因组变异信息查

询数据库(/Wheat_SnpHub_

Portal/lx99_jm22/)。

References

[1] 何中虎, 庄巧生, 程顺和, 于振文, 赵振东, 刘旭. 中国小麦

产业发展与科技进步. 农学学报, 2018, 8(1): 99–106.

He Z H, Zhuang Q S, Cheng S H, Yu Z W, Zhao Z D, Liu X.

Wheat production and technology improvement in China. J Agric,

2018, 8(1): 99–106 (in Chinese).

[2] 张婷, 逯腊虎, 张伟, 杨斌, 袁凯, 史晓芳. 黄淮麦区300个小

麦种质的主要农艺性状比较. 小麦研究, 2018, 39(1): 13–20.

Zhang T, Lu L H, Zhang W, Yang B, Yuan K, Shi X F. Compari-

son of main agronomic traits of 300 wheat germplasms in

Huanghuai Wheat Region. J Wheat Res, 2018, 39(1): 13–20 (in

Chinese).

[3] 曹廷杰, 王西成, 赵虹. 国审小麦新品种周麦18号丰产性、稳

产性及适应性分析. 中国农业科技导报, 2007, 9(1): 39–41.

Cao T J, Wang X C, Zhao H. Analysis on the yield potential, sta-

bility and adaptability of national authorized wheat variety

Zhoumai 18. Rev China Agric Sci Technol, 2007, 9(1): 39–41 (in

Chinese with English abstract)

[4] 盖红梅, 李玉刚, 王瑞英, 李振清, 王圣健, 高峻岭, 张学勇.

鲁麦14对山东新选育小麦品种的遗传贡献. 作物学报, 2012,

38: 954–961.

Gai H M, Li Y G, Wang R Y, Li Z Q, Wang S J, Gao J L, Zhang X

Y. Genetic contribution of Lumai 14 to novel wheat varieties de-

veloped in Shandong province. Acta Agron Sin, 2012, 38:

954–961 (in Chinese with English abstract)

[5] 傅晓艺, 郭进考, 刘艳滨

, 史占良, 单子龙, 韩然, 何明琦. 利

用石4185为骨干亲本培育高产小麦新品种. 种子, 2017,

36(12): 95–99.

Fu X Y, Guo J K, Liu Y B, Shi Z L, Shan Z L, Han R, He M Q.

New wheat varieties with high yield of core parent breeding by

using Shi 4185. Seed, 2017, 36(12): 95–99 (in Chinese).

[6] 凌宏清. 小麦及其近缘种基因组测序研究进展与发展趋势.

麦类作物学报, 2016, 36: 397–403.

Ling H Q. Progress and perspectives of the genome sequencing in

wheat and its relatives. J Triticeae Crops, 2016, 36: 397–403 (in

Chinese with English abstract)

[7] Uauy C. Wheat genomics comes of age. Curr Opin Plant Biol,

2017, 36: 142–148.

[8] 殷贵鸿, 李根英, 何中虎, 刘建军, 王辉, 夏先春. 小麦新品

种济麦22抗白粉病基因的分子标记定位. 作物学报, 2009, 35:

1425–1431.

Yin H G, Li G Y, He Z H, Liu J J, Wang H, Xia X C. Molecular

mapping of powdery mildew resistance gene in wheat cultivar

Jimai 22. Acta Agron Sin, 2009, 35: 1425–1431 (in Chinese with

English abstract)

[9] 赵广军, 张英肖. 高产稳产冬小麦品种良星99栽培技术. 小

麦研究, 2006, 27(3): 12–13.

Zhao G J, Zhang Y X. Cultivation technique of Liangxing 99, a

winter wheat variety with high and stable yield. J Wheat Res,

2006, 27(3): 12–13 (in Chinese)

[10] Qu Y F, Wu P P, Hu J H, Chen Y X, Shi Z L, Qiu D, Li Y H,

Zhang H J, Zhou Y, Yang L, Liu H W, Zhu T Q, Liu Z Y, Zhang Y

M, Li H J. Molecular detection of the powdery mildew resistance

genes in winter wheats DH51302 and Shimai 26. J Integr Agric,

2020, 19: 931–940.

1882 作 物 学 报

第46卷

[11] Bolger A M, Lohse M, Usadel B. Trimmomatic: a flexible trim-

mer for Illumina sequence data. Bioinformatics, 2014, 30:

2114–2120.

[12] Li H, Durbin R. Fast and accurate short read alignment with Bur-

rows-Wheeler transform. Bioinformatics, 2009, 25: 1754–1760.

[13] Appels R, Eversole K, Feuillet C, Keller B, Rogers J, Stein N,

Pozniak C J, Stein N, Choulet F, Distelfeld A, Eversole K, Poland

J, Rogers J, Ronen G, Sharpe A G, Pozniak C, Ronen G, Stein N,

Barad O, Baruch K, Choulet F, Keeble-Gagnere G, Mascher M,

Sharpe A G, Ben-Zvi G, Josselin A A, Stein N, Mascher M,

Himmelbach A, Choulet F, Keeble-Gagnere G, Mascher M,

Rogers J, Balfourier F, Gutierrez-Gonzalez J, Hayden M, Josselin

A A, Koh C, Muehlbauer G, Pasam R K, Paux E, Pozniak C J,

Rigault P, Sharpe A G, Tibbits J, Tiwari V, Choulet F, Kee-

ble-Gagnere G, Mascher M, Josselin A A, Rogers J, Spannagl M,

Choulet F, Lang D, Gundlach H, Haberer G, Keeble-Gagnere G,

Mayer KFX, Ormanbekova D, Paux E, Prade V, Simkova H,

Wicker T, Choulet F, Spannagl M, Swarbreck D, Rimbert H,

Felder M, Guilhot N, Gundlach H, Haberer G, Kaithakottil G,

Keilwagen J, Lang D, Leroy P, Lux T, Mayer KFX, Twardziok S,

Venturini L, Appels R, Rimbert H, Choulet F, Juhasz A, Kee-

ble-Gagnere G, Choulet F, Spannagl M, Lang D, Abrouk M,

Haberer G, Keeble-Gagnere G, Mayer KFX, Wicker T, Choulet F,

Wicker T, Gundlach H, Lang D, Spannagl M, Lang D, Spannagl

M, Appels R, Fischer I, Uauy C, Borrill P, Ramirez-Gonzalez R

H, Appels R, Arnaud D, Chalabi S, Chalhoub B, Choulet F, Cory

A, Datla R, Davey M W, Hayden M, Jacobs J, Lang D, Robinson

S J, Spannagl M, Steuernagel B, Tibbits J, Tiwari V, van Ex F,

Wulff BBH, Pozniak C J, Robinson S J, Sharpe A G, Cory A,

Benhamed M, Paux E, Bendahmane A, Concia L, Latrasse D,

Rogers J, Jacobs J, Alaux M, Appels R, Bartos J, Bellec A,

Berges H, Dolezel J, Feuillet C, Frenkel Z, Gill B, Korol A,

Letellier T, Olsen O A, Simkova H, Singh K, Valarik M, van der

Vossen E, Vautrin S, Weining S, Korol A, Frenkel Z, Fahima T,

Glikson V, Raats D, Rogers J, Tiwari V, Gill B, Paux E, Poland J,

Dolezel J, Cihalikova J, Simkova H, Toegelova H, Vrana J, Sour-

dille P, Darrier B, Appels R, Spannagl M, Lang D, Fischer I, Or-

manbekova D, Prade V, Barabaschi D, Cattivelli L, Hernandez P,

Galvez S, Budak H, Steuernagel B, Jones J D G, Witek K, Wulff

B B H, Yu G, Small I, Melonek J, Zhou R, Juhasz A, Belova T,

Appels R, Olsen O A, Kanyuka K, King R, Nilsen K, Walkowiak

S, Pozniak C J, Cuthbert R, Datla R, Knox R, Wiebe K, Xiang D,

Rohde A, Golds T, Dolezel J, Cizkova J, Tibbits J, Budak H, Ak-

pinar B A, Biyiklioglu S, Muehlbauer G, Poland J, Gao L,

Gutierrez-Gonzalez J, N'Daiye A, Dolezel J, Simkova H, Ci-

halikova J, Kubalakova M, Safar J, Vrana J, Berges H, Bellec A,

Vautrin S, Alaux M, Alfama F, Adam-Blondon A F, Flores R,

Guerche C, Letellier T, Loaec M, Quesneville H, Pozniak C J,

Sharpe A G, Walkowiak S, Budak H, Condie J, Ens J, Koh C,

Maclachlan R, Tan Y, Wicker T, Choulet F, Paux E, Alberti A,

Aury J M, Balfourier F, Barbe V, Couloux A, Cruaud C, Labadie

K, Mangenot S, Wincker P, Gill B, Kaur G, Luo M, Sehgal S,

Singh K, Chhuneja P, Gupta O P, Jindal S, Kaur P, Malik P,

Sharma P, Yadav B, Singh N K, Khurana J, Chaudhary C,

Khurana P, Kumar V, Mahato A, Mathur S, Sevanthi A, Sharma N,

Tomar R S, Rogers J, Jacobs J, Alaux M, Bellec A, Berges H,

Dolezel J, Feuillet C, Frenkel Z, Gill B, Korol A, van der Vossen

E, Vautrin S, Gill B, Kaur G, Luo M, Sehgal S, Bartos J, Ho-

lusova K, Plihal O, Clark M D, Heavens D, Kettleborough G,

Wright J, Valarik M, Abrouk M, Balcarkova B, Holusova K, Hu Y,

Luo M, Salina E, Ravin N, Skryabin K, Beletsky A, Kadnikov V,

Mardanov A, Nesterov M, Rakitin A, Sergeeva E, Handa H,

Kanamori H, Katagiri S, Kobayashi F, Nasuda S, Tanaka T, Wu J,

Appels R, Hayden M, Keeble-Gagnere G, Rigault P, Tibbits J,

Olsen O A, Belova T, Cattonaro F, Jiumeng M, Kugler K, Mayer

K F X, Pfeifer M, Sandve S, Xun X, Zhan B, Simkova H, Abrouk

M, Batley J, Bayer P E, Edwards D, Hayashi S, Toegelova H,

Tulpova Z, Visendi P, Weining S, Cui L, Du X, Feng K, Nie X,

Tong W, Wang L, Borrill P, Gundlach H, Galvez S, Kaithakottil G,

Lang D, Lux T, Mascher M, Ormanbekova D, Prade V, Rami-

rez-Gonzalez R H, Spannagl M, Stein N, Uauy C, Venturini L,

Stein N, Appels R, Eversole K, Rogers J, Borrill P, Cattivelli L,

Choulet F, Hernandez P, Kanyuka K, Lang D, Mascher M, Nilsen

K, Paux E, Pozniak C J, Ramirez-Gonzalez R H, Simkova H,

Small I, Spannagl M, Swarbreck D, Uauy C. Shifting the limits in

wheat research and breeding using a fully annotated reference

genome. Science, 2018, 361: eaar7191.

[14] Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N,

Marth G, Abecasis G, Durbin R. The sequence alignment/map

format and SAMtools. Bioinformatics, 2009, 25: 2078–2079.

[15] van der Auwera G A, Carneiro M O, Hartl C, Poplin R, Del Angel

G, Levy-Moonshine A, Jordan T, Shakir K, Roazen D, Thibault J,

Banks E, Garimella K V, Altshuler D, Gabriel S, Depristo M A.

From FastQ data to high-confidence variant calls: The genome

analysis toolkit best practices pipeline. Curr Protoc Bioinform,

2013, 43: 10–11.

[16] Cingolani P, Platts A, Wang L L, Coon M, Nguyen T, Wang L,

Land S J, Lu X, Ruden D M. A program for annotating and pre-

dicting the effects of single nucleotide polymorphisms, SnpEff.

Fly, 2014, 6: 80–92.

[17] Quinlan A R, Hall I M. BEDTools: a flexible suite of utilities for

comparing genomic features. Bioinformatics, 2010, 26: 841–842.

[18] Peng J, Richards D E, Hartley N M, Murphy G P, Devos K M,

Flintham J E, Beales J, Fish L J, Worland A J, Pelica F, Sudhakar

D, Christou P, Snape J W, Gale M D, Harberd N P. ‘Green revo-

lution’ genes encode mutant gibberellin response modulators.

Nature, 1999, 400: 256–261.

[19] Beales J, Turner A, Griffiths S, Snape J W, Laurie D A. A

pseudo-response regulator is misexpressed in the photoperiod in-

sensitive Ppd-D1a mutant of wheat (Triticum aestivum L.). Theor

Appl Genet, 2007, 115: 721–733.

[20] 柴岭岭. 普通小麦2D染色体株高和穗长QTL的精细定位与图

位克隆. 中国农业大学博士学位论文, 北京, 2019. pp 38–39.

Chai L L. Fine Mapping and Map-based Cloning of QTL Con-

trolling Plant Height and Spike Length on Chromosome 2D in

Common Wheat (Triticum aestivum L.). PhD Dissertation of

China Agricultural University, Beijing, China, 2019. pp 38–39 (in

Chinese with English abstract).

[21] Chai L L, Chen Z Y, Bian R L, Zhai H J, Cheng X J, Peng H R,

Yao Y Y, Hu Z R, Xin M M, Guo W L, Sun Q X, Zhao A J, Ni Z

F. Dissection of two quantitative trait loci with pleiotropic effects

on plant height and spike length linked in coupling phase on the

12

杨正钊等: 小麦主栽品种济麦22与良星99的基因组序列多态性比较分析

1883

short arm of chromosome 2D of common wheat (Triticum aesti-

vum L.). Theor Appl Genet, 2018, 131: 2621–2637.

[22] Zhao Z H, Sun H G, Song W, Lu M, Huang J, Wu L F, Wang X M,

Li H J. Genetic analysis and detection of the gene MlLX99 on

chromosome 2BL conferring resistance to powdery mildew in the

wheat cultivar Liangxing 99. Theor Appl Genet, 2013, 126:

3081–3089.

[23] 邹景伟, 邱丹, 孙艳玲, 郑超星, 李静婷, 吴培培, 武小菲, 王

晓鸣, 周阳, 李洪杰. Pm52——小麦品种良星99抗白粉病基

因的有效性. 作物学报, 2017, 43: 332–342.

Zou J W, Qiu D, Sun Y L, Zheng C X, Li J T, Wu P P, Wu X F,

Wang X M, Zhou Y, Li H J. Pm52: effectiveness of the gene con-

ferring resistance to powdery mildew in wheat cultivar Liangxing

99. Acta Agron Sin, 2017, 43: 332–342 (in Chinese with English

abstract).

[24] Wu P P, Hu J H, Zou J W, Qiu D, Qu Y F, Li Y H, Li T, Zhang H

J, Yang L, Liu H W, Zhou Y, Zhang Z J, Li, J T, Liu Z Y, Li H J.

Fine mapping of the wheat powdery mildew resistance gene

Pm52 using comparative genomics analysis and the Chinese

Spring reference genomic sequence. Theor Appl Genet, 2019, 132:

1451–1461.

[25] Wang Y, Song F, Zhu J, Zhang S, Yang Y, Chen T, Tang B, Dong L,

Ding N, Zhang Q, Bai Z, Dong X, Chen H, Sun M, Zhai S, Sun Y,

Yu L, Lan L, Xiao J, Fang X, Lei H, Zhang Z, Zhao W. GSA: ge-

nome sequence archive. Genom Proteom Bioinf, 2017, 15: 14–18.

[26] National genomics data center members and partners. Nucleic

Acids Res, 2020, 48: D24–D33.

[27] Wang W X, Wang Z H, Li X T, Ni Z F, Hu Z R, Xin M M,

Peng H R, Yao Y Y, Sun Q X, Guo W L. SnpHub: an

easy-to-set-up web server framework for exploring large-scale

genomic variation data in the post-genomic era with applica-

tions in wheat. GigaScience, 2020, 9: giaa060.

附图1 济麦22(A)与良星99(B)全基因组reads覆盖度的密度分布直方图

Supplementary Fig. 1 Density plot of bin-wise normalized average read coverage in Jimai 22 (A) and Liangxing 99 (B)

X轴为经归一化的每1 Mb内的平均reads覆盖度; Y轴为覆盖度的密度。

X-axis, the averaged read coverage per 1 Mb after normalization. Y-axis, the distribution density. A and B represent density plot of bin-wise

normalized average read coverage in Jimai 22 and Liangxing 99, respectively.

附图2 济麦22与良星99间的单区间差异SNP的密度分布图

Supplementary Fig. 2 Density plot of bin-wise density of SNPs different between Jimai 22 and Liangxing 99

X轴, 每Mb区间内差异SNP位点数的对数(以10为底); Y轴, 位点数的密度。

X-axis, 10-based logarithm of the counts of differential SNP sites per Mb. Y-axis, the distribution density.

发布评论

评论列表 (0)

  1. 暂无评论