2024年4月4日发(作者:零凝竹)
作物学报
ACTA
AGRONOMICA
SINICA 2013, 39(7): 1164−1171
ISSN 0496-3490; CODEN TSHPA9
/zwxb/
E-mail: xbzw@
DOI: 10.3724/SP.J.1006.2013.01164
一个棉花GDSL脂肪酶基因的克隆与功能分析
佟祥超 王丽曼 胡文静 张雪颖 张天真 郭旺珍
*
南京农业大学作物遗传与种质创新国家重点实验室 / 教育部杂交棉创制工程研究中心, 江苏南京210095
摘 要: GDSL脂肪酶与GXSXG脂肪酶是2个重要的脂肪酶亚家族。其中, GDSL家族脂肪酶具有水解酶活性, 能水
解多种酯类物质。本试验根据新乡小吉无绒无絮(XinWX)和无绒有絮(XinFLM)近等基因系纤维起始期29K芯片竞争
杂交结果, 选择了一个在纤维起始期具有极显著表达差异的EST序列(GenBank登录号为DR458916), 以该序列信息
为探针, 利用电子克隆方法并进行cDNA及基因组全长基因PCR扩增、测序验证, 克隆获得一个陆地棉GDSL脂肪
酶基因(GhGDSL; GenBank登录号为KC186125)。该基因ORF长1065 bp, 编码354个氨基酸, 含有5个外显子和4
个内含子。该基因在二倍体棉种基因组中含一个拷贝, 在四倍体棉种基因组中含2个拷贝。序列比对显示该基因在四
倍体棉种的2个亚组中独立进化, 且D亚组比A亚组变异大。染色体定位显示该基因2个拷贝分别位于A4 (Chr. 4)
和D4 (Chr. 22)染色体上。定量RT-PCR结果表明, GhGDSL在开花后3~10 d的纤维组织中表达量高, 其中在海7124
中表达高峰在8DPA, 在TM-1中表达高峰从5DPA持续到10DPA。利用[(TM-1×Hai7124)×TM-1]的
BC
1
S
1
群体开展
GhGDSL功能与纤维、种子品质性状关联分析, 发现该基因A亚组的拷贝与种子脂肪含量存在显著相关(P=0.048); D
亚组的拷贝与种子蛋白含量存在极显著相关(P=0.008)。推测GhGDSL基因功能与种子中脂肪、蛋白代谢相关, 同时
也参与纤维伸长过程。
关键词: GDSL脂肪酶; 克隆; 表达; 基因定位; 关联分析; 棉花
Molecular Cloning and Functional Analysis of a GDSL Lipase Gene from Gos-
sypium hirsutum L.
TONG Xiang-Chao, WANG Li-Man, HU Wen-Jing, ZHANG Xue-Ying, ZHANG Tian-Zhen, and GUO
Wang-Zhen
*
State Key Laboratory of Crop Genetics and Germplasm Enhancement, Hybrid Cotton R&D Engineering Research Center, Ministry of Education,
Nanjing Agricultural University, Nanjing 210095, China
Abstract: GDSL and GXSXG lipases are two important sub-families of lipases. Unlike the GXSXG motif-containing lipases,
GDSL lipases have a GDSL motif and are active in hydrolysis and synthesis of abundant ester compounds. In this experiment, a
EST sequence (GenBank accession number: DR458916) was screened based on extremely significant expression differences at
fiber initiation stages between lintless-fuzzless XinWX and linted-fuzzless XinFLM isogenic lines by 29K cotton genome array
hybridization. Using the EST sequence as queries, the Gossypium EST database (/) was screened and
the corresponding cDNA sequences containing a complete ORF were assembled. Further, the ORF information was reconfirmed
in transcriptional and genomic level. As a result, a novel gene encoding GDSL lipase was cloned, and the gene was designated as
GhGDSL (Gossypium hirsutum GDSL; GenBank accession number: KC186125). GhGDSL included an open reading frame of
1065 bp that encoded a polypeptide of 354 amino acids. The genome sequence indicated that GhGDSL had four introns and five
exons. The homolog of GhGDSL had one copy in diploid cotton species G. herbaceum and G. raimondii and two copies in
tetraploid cotton species G. hirsutum acc. TM-1 and G. barbadense cv. Hai 7124, respectively. Sequence alignment from different
cotton species showed GhGDSL homoelogs in tetraploid were evolved independently, with more variations in D-subgenome than
in A-subgenome. GhGDSL homoelogs in tetraploid were located on chromosome 4 (Chr. A4) and chromosome 22 (Chr. D4) by
developing subgenome-specific SNP marker, respectively. Q-PCR analysis showed that GhGDSL was accumulated highly in
本研究由国家重点基础研究发展计划(973计划)项目(2011CB109300)资助。
*
通讯作者(Corresponding author): 郭旺珍, E-mail: moelab@
Received(收稿日期): 2012-11-21; Accepted(接受日期): 2013-03-11; Published online(网络出版日期): 2013-04-23.
URL: /kcms/detail/
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1165
ovule and fiber tissue at 3–10 days post anthesis (DPA), with expression peak at 8DPA in Hai 7124 and high expression from
5DPA to 10 DPA in TM-1. The association analysis between GhGDSL and the traits related to fiber and seed qualities in corre-
sponding [(TM-1×Hai 7124)×TM-1] BC
1
S
1
individuals showed that GhGDSL homolog in A-subgenome was significantly corre-
lated with the seeds’ fat content (P=0.048), and GhGDSL homolog in D-subgenome was very significantly correlated with the
seeds’ protein content (P=0.008). These results suggested that GhGDSL might be functionally important in the metabolic process
of lipid and protein in seeds and in the process of fiber development.
Keywords: GDSL lipase; Cloning; Expression; Gene mapping; Association analysis; Cotton
植物脂肪酶根据编码蛋白催化活性区域氨基酸
序列的保守型分为GXSXG脂肪酶和GDSL脂肪酶。
其中, GDSL家族脂肪酶具有水解酶活性, 能水解多
种酯类物质。与微生物和动物的脂肪酶研究相比,
植物脂肪酶基因的克隆起步较晚, 近年来随着分子
生物技术的发展, 特别是模式植物拟南芥和水稻全
基因组测序的完成, GDSL脂肪酶的相关报道也逐渐
增多, 有大量水稻
[1]
、油菜
[2]
、苜蓿
[3]
GDSL脂肪酶
基因及其相关功能的报道。
GDSL家族脂肪酶作用主要分为三大类: (1)参
与脂类代谢。拟南芥GDSL脂肪酶Arab-1基因在种
子萌发过程中表达, 行使水解酶活性
[4]
; (2)参与植
物应激反应。Oh等
[5]
研究表明, 拟南芥GDSL脂肪
酶GLIP1基因可能触发植物体内针对真菌侵染的抗
病信号, 兼具水解酶活性和抗菌活性; (3)参与植物
次生代谢物合成。Rupperl等
[6]
研究指出, 萝芙木
(Rauvolfia serpentina)的GDSL基因参与催化生成阿
吗碱(ajmaline)的次生代谢。
棉花既是重要的纤维作物, 又是重要的油料作
物, 在国民经济中占有重要地位。阐明纤维和胚珠
的发育进程及其相关基因表达特征为充分发挥这一
重要经济作物的经济价值奠定了基础。棉纤维的分
化和发育可以分为起始期(initiation)、伸长或初生壁
合成期(elongation or primary cell wall synthesis)、次
生壁合成期(secondary cell wall synthesis)以及成熟
期(maturation)
[7]
4个相互重叠的阶段。伴随着棉纤
维发育, 胚珠中与油脂和蛋白代谢相关的基因均表
达并参与相应代谢过程。Ji等
[8]
利用cDNA消减杂
交和微阵列技术比较野生型棉纤维和无绒无絮突变
体开花后10 d的表达差异, 发现280条差异表达的
cDNA片段。进一步分析发现在纤维伸长发育过程
中显著上调表达的172个基因中, 29条参与长链脂
肪酸生物合成的各种上游通路, 如MAPK通路、生
长素信号通路等。因此, 脂肪酸代谢途径, 不仅在种
子发育进程中参与棉籽大量脂肪酸的形成, 而且在
维持棉纤维生长、发育过程中也起重要作用。
本研究室前期研究完成了新乡小吉无绒无絮
(XinWX)和无绒有絮(XinFLM)近等基因系纤维发育
起始期29K芯片竞争杂交, 获得一批差异表达基
因。本研究从中选择了一个在纤维起始期二者具有
极显著表达差异的EST序列(NCBI登录号为
DR458916), 以该序列信息为探针, 开展了该基因
的克隆及相关特征分析研究。明确了该基因结构和
表达特征, 通过定量表达和关联分析表明该基因在
棉花种子和纤维发育中扮演重要角色。
1 材料与方法
1.1 试验材料
选用二倍体A染色体组的阿非利加棉(G. her-
baceum var. africanum)、D染色体组的雷蒙德氏棉(G.
raimondii)和异源四倍体栽培棉种陆地棉遗传标准
系TM-1 (G. hirsutum acc. TM-1)和海岛棉海7124 (G.
barbadense cv. Hai 7124), 将其种植于南京农业大学
牌楼实验基地。
1.2 目的基因的获得与分析
以获得的EST序列为探针, 对陆地棉的dbEST
数据库(/)进行tBlastn比
对。将获得的EST序列用CAP3拼接, 用Blastn方式
对拼接结果进行检索, 直至检出的Contig不能再延
伸。对最长Contig进行ORF预测, 利用NCBI中
Blastp功能搜索与该基因相似的序列, 通过比较将其
分类命名。根据该序列电子克隆结果设计扩增ORF
和全长基因引物, 分别以陆地棉遗传标准系TM-1基
因组DNA和开花后10DPA的纤维组织cDNA为模板,
克隆该基因并测序验证(表1)。由南京金斯瑞生物科技
有限公司完成所有引物合成和DNA序列测定。
每一基因分别从来自TM-1和海7124中的阳性
克隆中随机挑选10个克隆, 从雷蒙德氏棉和阿非利
加棉的阳性克隆中随机挑选3个克隆, 进行测序。利
用在线软件Gene Structure Display Server (GSDS,
/)进行基因结构
分析。利用ClustalX (Ver 2.0.12)进行多重序列比对,
利用MEGA5 (/)进行进
化树分析。
1166
作 物 学 报
表1 本研究所用引物
Table 1 Primer pairs used in this study
第39卷
基因
Gene
His3
GhGDSL
引物
Primer
Y 8991F
引物序列
Sequences information (5′–3′)
CGGTGGTGTGAAGAAGCCTCAT
用途
Purpose
内标对照
Reference gene as control
扩增ORF所用的RT-PCR引物
RT-PCR primers for ORF amplification
Y 8991R AATTTCACGAACAAGCCTCTGGAA
Y5705F GTTGCTTCCCTGCTTAATTT
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
Y5705F GTTGCTTCCCTGCTTAATTT
Y5705R CAAGCAGTGAACGATCTCAA
Y8302F TAAGACACCAGTGCCCTACAGATAC
Y8302R TAGAGCCGTTGGTGGCAATGTA
Y9759F TACATTGCCACCAACGGCTCTA
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
Y9408F GTGAATCCATTTGAGCCCTGTT
Y9408R CTACGGAACAAGGATGGCGA
Y8441F ACTCTTTTTCTTCTTCTTTTTTTCTTCCTATTTCCG
Y8441R AGACAGCTCCTTGTTGTCATGAGTTGTCTGT
Y9363F GGAGGTAAAATGTAATTTGATTCCTAATACAGGCGT
Y9363R TCCCAAGTTATGGATGCGTTTCAGGTT
扩增全长基因所用的3套巢式引物
Three sets of nested primers for amplifying the
full length of the gene
Q-PCR分析
Q-PCR analysis
用于A亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in A-subgenome
用于D亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in D-subgenome
1.4 染色体定位
基因定位作图群体为[(TM-1×海7124)×TM-1]的
BC
1
群体, 群体大小为138个单株
[9]
。根据基因在
TM-1和海7124中的序列差异, 设计亚基因组专化
的SNP标记引物(表1), 通过PAGE胶电泳检测该基
因在BC
1
作图群体中的分离情况, 然后利用
JoinMap3.0对多态性数据进行连锁分析
[10]
, 将结果
整合到我室构建的海陆遗传图谱上
[11]
, 用MapChart
完成基因定位图谱的制作
[12]
。
1.5 关联分析
分别于2003、2004、2005和2008年重复调查
了TM-1和海7124亲本及 [(TM-1×海7124)×TM-1]
的BC
1
S
1
家系的5个纤维品质性状指标, 即纤维长
度(fiber length, FL)、纤维强度(fiber strength, FS)、
马克隆值(micronaire value, FM)、纤维伸长率(fiber
elongation, FE)和纤维整齐度(fiber uniform, FU)。分
别在2003年和2004年重复测定种子油分和蛋白含
量。由农业部棉花品质监督检验测试中心测定纤维
品质; 国家谷物品质监督检验测试中心泰安分中心
测定油分和蛋白含量。由南京农业大学棉花研究所
提供上述数据。基于上述数据和目标基因在[(TM-1×
海7124)×TM-1] BC
1
中2种基因型, 利用t测验进行
目标基因与性状的关联分析。
1.6 总RNA和DNA的提取
分别将TM-1和海7124的种子浸泡水中24 h左
右, 再转入营养钵30℃光照培养箱培养, 每日光照
与黑暗各12 h, 待小苗生长到5~6片真叶时, 分别采
收其根、茎和叶; 在植株生长盛花期, 分别采集
TM-1和海7124开花前1 d (–1DPA)、开花后0、1、
3和5 d (DPA)的胚珠和纤维混合物, 开花后8、10、
14、17、20和23 d (DPA)的纤维, 开花后8、10、14、
17、20和23 d (DPA)的胚珠。将样品迅速置液氮冷
冻并保存在–70℃冰箱。用CTAB法
[13]
从新鲜幼嫩的
叶片提取DNA。用改进的热硼酸法
[14]
提取不同纤维
发育时期的纤维细胞总RNA。用CTAB-酸酚法提取
根、茎和叶总RNA
[15]
。
1.7 实时荧光定量Q-PCR分析
将提取的目标组织、器官总RNA反转录成
cDNA, 稀释10倍取1 μL用于实时荧光定量PCR分
析。以His3为内参, 在荧光定量PCR仪上(iQ5型,
Bio-Rad, USA)扩增, 反应体系为cDNA 1 μL、10
μmol L
–1
正向和反向引物各0.5 μL、2×SYBR (Roche)
溶液10 μL, 加无菌超纯水至20 μL于专用的定量
PCR管中, 扩增条件为95℃预变性10 min; 94℃变
性15 s, 60℃退火15 s, 72℃延伸30 s, 40个循环;
72℃延伸10 min, 以熔解曲线结束。参照ΔΔC
t
法
[16]
分析定量结果, 目的基因相对表达量=2
–ΔCt
; ΔC
t
=
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1167
C
t
目的基因
−C
t,His3
。
对发现其与蓖麻(Ricinus communis)和麻疯树(Jatropha
curcas)中的GDSL类基因同源性最高, 分别为72%
和75%, 因此将该基因命名为GhGDSL (Gossypium
hirsutum GDSL; GenBank登录号为KC186125)。
2 结果与分析
2.1 基因全长cDNA的获得及其序列分析
以本试验获得的EST序列信息为探针, 搜索
NCBI棉花EST数据库中与此序列同源的目标序列,
通过电子拼接克隆, 获得该候选基因的最大ORF。
进一步设计扩增全长ORF的引物, 以TM-1开花后
10DPA的纤维组织cDNA为模板, 通过扩增产物测
序验证, 获得一个含完整ORF的cDNA序列。ORF长
度为1065 bp, 可编码354个氨基酸。用Expasy pI/Mw
程序预测该基因编码的氨基酸一级结构, 其等电点
8.77, 分子量39.33 kD。根据NCBI CDS (www.
/Structure/cdd/)分析, 其编码的氨基
酸残基含有GDS(L)-motif, 在50~330氨基酸之间有
属于SGNH_hydrolase superfamily保守域。BlastX比
2.2 分子系统进化分析
为了进一步了解新发现的GhGDSL基因的系统
进化分类, 从TAIR (/in-
/)上下载拟南芥107个GDSL脂肪酶基因序列,
用MEGA5与GhGDSL基因序列构建系统发生树(图
1), 使用Neighbor-Jioning法, 其中BootStrap值为
1000。根据序列的同源性将进化分析结果分成3组
(Group I~III), GhGDSL与拟南芥GDSL基因家族中
的Group III同源性最高, 其中相似度最高的是
AT2G36325.1和AT3G09930.1 (NP_187604.1)。拟南芥
Group III中大部分基因的功能与种子油脂代谢有关
[17]
,
推测GhGDSL在种子油脂代谢过程中发挥作用。
图1 GhGDSL与拟南芥GDSL脂肪酶聚类分析
Fig. 1 Phylogenetic analysis of GhGDSL and GDSL lipases subfamily in Arabidopsis
107个拟南芥GDSL脂肪酶基因序列从TAIR (//)网站下载。
Subfamily of 107 GDSL lipases was downloaded from TAIR (//).
1168
作 物 学 报
第39卷
2.3 不同棉种GhGDSL同源基因结构分析
基因结构分析表明(图2), 该基因包含5个外显
子, 4个内含子, 与GDSL脂肪酶基因家族大多数基
因的内含子数目一致
[17]
。不同棉种中GhGDSL的同
源基因序列在第2个内含子位置, 均存在A组和A
亚组与D组和D亚组之间明显差异。序列进化分析
显示该基因在四倍体棉种中形成A亚组和D亚组两
大分支, 可明确追溯到其祖先来源, 说明在四倍体
棉种中GhGDSL A亚组与D亚组重复基因是独立进
化的。进一步比较TM-1和海7124中来源同一亚组
基因的同源性, 发现在这2个棉种中来源于D亚组
的基因其变异程度高于A亚组, 说明在进化进程中,
GhGDSL的同源基因在A亚组中的拷贝比D亚组保
守性高(图3)。
图2 GhGDSL类同源基因在不同棉种中的结构比较
Fig. 2 Gene structure of GhGDSL orthologs in four cotton species
A: 阿非利加棉; D: 雷蒙德氏棉; TM-1_At: TM-1的A亚组; TM-1_Dt: TM-1的D亚组; H7124_At: 海7124的A亚组; H7124_Dt: 海
7124的D亚组。
A: G. herbaceum L. var. africanum; D: G. raimondii; TM-1_At: A subgenome of G. hirsutum -1; TM-1_Dt: D subgenome of G. hirsu-
tum acc. TM-1; H7124_At: A subgenome of G. barbadense cv. Hai 7124; H7124_Dt: D subgenome of G. barbadense cv. Hai 7124.
图3 GhGDSL类同源基因在不同棉种中的系统进化
Fig. 3 Phylogenetic analysis for GhGDSL orthologs in four
cotton species
基因来源同图2。Gene origins are the same as those in Fig. 2.
图4 GhGDSL基因的染色体定位
Fig. 4 Mapping of GhGDSL homologs in tetraploid cotton
2.4 染色体定位
根据来源于TM-1和海7124棉种间的GhGDSL
同源基因其相应基因组序列上SNP位点差异, 分别
开发出这2个棉种在A、D亚组专化的SNP引物(表
1)。利用该引物仅可在海7124中扩增出相应的目标
产物, 因此在[(TM-1×海7124) ×TM-1]BC
1
群体中可
根据扩增产物的有无确定来源于TM-1和海7124的
2种基因型。将在群体中获得的多态分离信息, 利用
JoinMap 3.0作图软件与我们实验室的骨架标记整合,
将该基因在四倍体中的2个拷贝分别定位于A4 (Chr.
4)和D4 (Chr. 22)部分同源染色体上, 其中来源于A
亚组的拷贝(GhGDSL-At)其两侧标记分别为E10M15-
100和NAU2363-200, 来源于D亚组的拷贝(GhGDSL-
Dt)其两侧标记分别为BNL1047-680和Gh591-155
(图4)。
2.5 定量分析
Q-PCR分析表明, 在海7124中, GhGDSL在根、
茎、叶、–1、0、1DPA中表达量低, 3~14DPA纤维
中表达量逐渐由高到低, 其中8DPA表达量最高,
17DPA以后的纤维组织以及8DPA以后胚珠中表达
量均很低。在TM-1中, GhGDSL在5~10DPA纤维组
织中表达量明显高于其他纤维发育时期和其他组织,
推测该基因主要在纤维伸长期发挥作用。由Q-PCR
结果可知(图5), GhGDSL在海7124和TM-1中表达
模式基本相似, 其表达高峰均在纤维伸长期的纤维
组织中。在海7124中最高表达峰在8DPA, 在TM-1
中最高表达峰由5DPA持续到10DPA, 高表达时期
长, 但最高表达值没有在海7124中高。
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1169
图5 GhGDSL基因在TM-1和海7124中定量表达分析
Fig. 5 Q-PCR analysis of GhGDSL in TM-1 and Hai 7124
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do分别代表根, 茎, 叶, –1, 0, 1, 3, 5
DPA胚珠纤维混合物, 8, 10, 14, 17, 20, 23 DPA纤维, 8, 10, 14, 17, 20, 23 DPA胚珠。“A”表示材料之间极显著差异, “a”表示材料之间
显著差异。
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do indicated root, stem, leaf, –1, 0, 1, 3, 5
DPA mixture of ovule and fibers, 8, 10, 14, 17, 20, 23 DPA fibers, 8, 10, 14, 17, 20, 23 DPA ovules, respectively. “A” means the significant
difference at the 0.01 probability level, “a” means the significant difference at the 0.05 probability level.
2.6 关联分析
利用专化扩增海7124基因组的四倍体A、D亚
组SNP标记, 筛选[(TM-1×海7124)×TM-1]的BC
1
作图群体获得的分离群体标记信息, 与来源于
BC
1
S
1
群体多年份的纤维品质、种子油分和蛋白等性
状指标进行关联分析。结果显示, 关联分析未检测
到该基因功能与纤维长度、强度、细度等品质的关
联性, 但检测到该基因A亚组的拷贝与种子脂肪含
量存在显著相关(P=0.048), 在[(TM-1×海7124)×
TM-1] BC
1
分离群体中, 陆地棉纯合基因型均值脂
肪含量为36.11%, 而海陆杂合基因型均值脂肪含量
为35.26%; D亚组的拷贝与种子蛋白含量存在极显
著相关(P=0.008), 在[(TM-1×海7124)×TM-1] BC
1
分
离群体中, 陆地棉纯合基因型均值蛋白含量为
37.60%, 而海陆杂合基因型均值蛋白含量为
40.86%。说明该基因参与种子中油脂代谢及蛋白形
成。研究发现, 尽管来源于四倍体A、D亚组的
GhGDSL2个拷贝分别与种子中脂肪或蛋白含量关
联, 但群体中2种基因型种子脂肪含量和蛋白含量
的总和基本接近, 这与种子中油脂与蛋白质含量之
和是稳定常数相一致
[18]
。
EXL1~6
[20]
, 以及CaGLIP1对胡椒疾病易感性和非
生物胁迫的耐受性有调控作用
[21]
。
棉纤维和棉籽中的脂肪蛋白均是重要的相关
产业原料。GDSL家族脂肪酶具有水解酶活性, 参
与脂肪酸代谢。本研究克隆的GhGDSL基因与拟
南芥107个GDSL脂肪酶家族基因中73个基因结
构类似。说明该基因在进化中的保守性。系统进化
分析显示GhGDSL与AT2G36325.1和AT3G09930.1
(NP_187604.1)相似度最高, 它们属于拟南芥GDSL
基因家族中的Group III, 可能参与种子的油脂代
谢
[17]
。
脂肪酶是脂代谢中的关键酶, 能催化长链脂肪
酸甘油酯水解为甘油和长链脂肪酸。脂肪酸是生物
体中重要的组成成分, 可作为重要的信号分子参与
细胞的生长发育
[22]
, 细胞中脂肪酸的组成、含量以
及存在形式对细胞的生存和正常生长都具有重要的
意义。在棉纤维细胞伸长过程中, 参与脂肪酸合成和
延长途径中的大部分基因均上调表达
[23]
。Qin等
[22]
发
现在胚珠培养基中加入外源饱和超长链脂肪酸
(VLCFA; C20:0~C30:0)可以显著提高棉纤维细胞的
伸长, 而加入抑制VLCFA生物合成的乙草胺(ACE)
则可以阻止纤维生长, 同时对棉花中4个KCS (超长
链脂肪酸合成的限速酶)的研究发现, 在开花后10
或15 d纤维伸长阶段检测到不同的KCS基因相对于
开花当天的转录水平增加了8~35倍。而相对于短纤
维种质, 长纤维棉花在快速伸长阶段(开花后10 d)
含有的所有4种KCS转录物, 其量几乎是短纤维的
2倍。Gou等
[24]
通过对纤维快速伸长期、次生壁合
成期的转录组以及代谢组研究, 发现脂肪酸合成、
3 讨论
GDSL脂肪酶作为重要的脂肪酶基因家族之一,
在植物生长发育等多种生理活动中扮演重要角色。
Beisson等
[19]
发现拟南芥中的Arab-1只在萌发种子
的黄化苗中发挥作用, 说明该类基因参与种子萌发
过程。GDSL脂肪酶也在花器官发育及植物抗逆性
中发挥作用。如已经鉴定花粉外壁中的胞外脂肪酶
1170 作 物 学 报
第39卷
代谢相关基因在纤维伸长期具有较高的表达, 在次
生壁合成时期表达开始逐渐降低。总的脂肪酸含量
也在纤维伸长期达到最大值, 而到开花后21 d显著
降低。表明脂肪酸合成与代谢相关的基因参与棉纤
维的伸长。本研究克隆的GhGDSL基因主要在胚珠
发育早期及纤维伸长期高表达, 推测该基因通过参
与脂质代谢而促进纤维的伸长。当纤维细胞快速伸
长时, 脂肪酶与其他相关酶协同发挥作用, 催化分
解油脂类物质生成糖类, 提供纤维细胞扩展中所必
需的养料和能量。
本研究表明, 该基因A亚组的拷贝与种子脂肪
含量显著相关, D亚组的拷贝与种子蛋白质含量极
显著相关。Wei等
[25]
研究发现, 油菜中GDSL脂肪
酶基因BnSDP1在低油品系种子中转录水平高于高
油品系, 推测GhGDSL在种子油脂代谢过程中起着
重要作用。棉籽作为棉花主要的副产品之一, 是可
再生的“绿色能源”, 能用于工业生产及食品、药品和
保健品研制, 为人类使用。尽管GhGDSL主要在纤
维发育早期及伸长期表达量最高, 但其与棉籽中脂
肪及蛋白含量的相关性, 也提示我们进一步阐明该
类基因在种子发育进程中的功能及作用机制, 进而
应用生物技术手段操纵其表达, 培育棉籽高油或高
蛋白品种。研究结果无论对促进人类身体健康, 还
是缓解工业能源压力, 均有积极的意义。
4 结论
克隆了一个含GDSL基元的棉花新基因
GhGDSL, 其ORF全长1065 bp, 编码354个氨基酸,
含有5个外显子和4个内含子。在二倍体棉种阿非
利加棉和雷蒙德氏棉基因组中含1个拷贝, 在四倍
体陆地棉和海岛棉基因组中存在2个拷贝, 分别定
位于A4 (Chr. 4)、D4 (Chr. 22)部分同源染色体上。
该基因与拟南芥中第3类GDSL脂肪酶家族同源性
高, 主要参与种子发育相关的油脂代谢, 且在胚珠
发育早期及纤维伸长期高表达。在四倍体棉种中该
基因A亚组的拷贝与种子脂肪含量显著相关, D亚
组的拷贝与种子蛋白含量极显著相关。推测
GhGDSL基因功能与种子发育和纤维伸长过程中油
脂代谢及蛋白形成有关。
References
[1] Kim Y. Cloning and expression of a lipase gene from rice (Oryza
sativa cv. Dongjin). Mol Cells, 2004, 18: 40–45
[2] Roberts M R, Foster G D, Blundell R P, Robinson S W, Kumar A,
Draper J, Scott R. Gametophytic and sporophytic expression of
an anther-specific Arabidopsis thaliana gene. Plant J, 1993, 3:
111–120
[3] Pringe D, Dickstein R. Purification of ENOD8 proteins from
Medicago sativa root nodules and their characterization as estera-
ses. Plant Physiol Biochem, 2004, 42: 73–79
[4] Brick D J, Brumlik M J, Buckley J T, Cao J X, Davies P C, Misra
S, Tranbarger T J, Upton C. A new family of lipolytic plant en-
zymes with members in rice, Arabidopsis and maize. FEBS Lett,
1995, 377: 475–480
[5] Oh I S, Park A R, Bae M S. Kwon S J, Kin Y S, Lee J E, Kang N
Y, Lee S, Cheong H, Park O K. Secretome analysis reveals an
Arabidopsis lipase involved in defense against Alternaria brassi-
cicola. Plant Cell, 2005, 17: 2832–2847
[6] Rupperl M, Woll J, Giritch A, Genady E, Ma X Y, Stochigt J.
Functional expression of an ajmaline pathway-specific esterase
from Rauvolfia in a novel plant-virus expression system. Planta,
2005, 222: 888–898
[7] Basra A, Malik C P. Development of the cotton fiber: Interna-
tional fibers. In: Basra A M ed. Cotton Fibers. New York: Ha-
worth Press, 1984. pp 231–267
[8] Ji S J, Lu Y C, Feng J X, Wei G, Shi Y H, Fu Q, Liu D, Luo J C,
Zhu Y X. Isolation and analyses of genes preferentially expressed
during early cotton fiber development by subtractive PCR and
cDNA array. Nucl Acids Res, 2003, 31: 2534–2543
[9] Song X L, Wang K, Guo W Z, Zhang J, Zhang T Z. A comparison
of genetic maps constructed from haploid and BC
1
mapping
populations from the same crossing between Gossypium hirsutum
L. and Gossypium barbadense L. Genome, 2005, 48: 378–390
[10] Van Ooijen J W, Voorrips R E. JoinMap Version 3.0: Software
for the Calculation of Genetic Linkage Maps. Wageningen, the
Netherlands: CPRO-DLO, 2001
[11] Guo W Z, Cai C P, Wang C B, Wang C B, Han Z G, Song X L,
Wang K, Niu X W, Wang C, Lu K Y, Shi B, Zhang T Z. A mi-
crosatellite-based, gene-rich linkage map reveals genome struc-
ture, function, and evolution in Gossypium. Genetics, 2007, 176:
527–541
[12] Voorrips R E. MapChart: software for the graphical presentation
of linkage maps and QTLs. J Heredity, 2002, 93: 77–78
[13] Paterson A H, Brubaker C L, Jonathan F. Rapid method for ex-
traction of cotton (Gossypium spp.) genomic DNA suitable for
RFLP or PCR analysis. Plant Mol Biol Rep, 1993, 11: 122–127
[14] Wu Y-T(武耀廷), Liu J-Y(刘进元). A modified hot borate
method for efficient isolation of total RNA from different cotton
tissues. Cotton Sci (棉花学报), 2004, 16(2): 67–71 (in Chinese
with English abstract)
[15] Jiang J-X(蒋建雄), Zhang T-Z(张天真). Tissues with CTAB
acidic phenolic method. Cotton Sci (棉花学报), 2003, 15(3):
166−167 (in Chinese with English abstract)
[16] Licak K J, Schmittgen T D. Analysis of relative gene expression
第
7
期 佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1171
data using Real-time quantitative PCR and the 2(-delta delta C(t))
method. Method, 2001, 25: 402–408
[17] Ling H, Zhao J Y, Zuo K J, Qiu C X, Yao H Y, Qin J, Sun X F,
Tang K X. Isolation and expression analysis of a GDSL-like li-
pase gene from Brassica napus L. J Biochem Mol Biol, 2006, 39:
297–303
[18] Sun S-K(孙善康), Chen J-H(陈建华), Xiang S-K(项时康), Wei
S-J(魏守军). Study on the nutritional quality of cotton seeds. Sci
Agric Sin (中国农业科学), 1987, 20(5): 12–16 (in Chinese with
English abstract)
[19] Beisson F, Arondel V, Verger R. Assaying Arabidopsis lipase ac-
tivity. Biochem Soc Transact, 2000, 28: 773–775
[20] Mayfield J A, Fiebig A, Johnstone S E, Preuss D. Gene families
from Arabidopsis thaliana pollen coat proteome. Science, 2001,
292: 2482–2485
[21] Hong J K, Choi H W, Hwang I S, Kin D S, Kim N H, Choi D S,
Kim Y J, Hwang B K. Function of a novel GDSL-type pepper li-
pase gene, CaGLIP1, in disease susceptibility and abiotic stress
tolerance. Planta, 2008, 227: 539–558
[22] Qin Y M, Hu C Y, Pang Y, Kastaniotis A J, Hilunen J K, Zhu Y
X. Saturated very-long-chain fatty acids promote cotton fiber and
Arabidopsis cell elongation by activating ethylene biosythesis.
Plant Cell, 2007, 19: 3692–3704
[23] Shi Y H, Zhu S W, Mao X Z, Feng J X, Qin Y M, Zhang L,
Cheng J, Wei L P, Wang Z Y, Zhu Y X. Transcriptome profiling,
molecular biological, and physiological studies reveal a major
role for ethylene in cotton fiber cell elongation. Plant Cell, 2006,
18: 651–664
[24] Gou J Y, Wang L J, Chen S P, Hu W L, Chen X Y. Gene expres-
sion and metabolite profiles of cotton fiber during cell elongation
and secondary cell wall synthesis. Cell Res, 2007, 17: 422–434
[25] Wei M-Y(魏明玉), Zhou J(周佳), Yan S-Z(闫素珍), Wang Z(王
政), Tan X-L(谭小力). Cloning and expression analysis of an
oil-content related lipase (BnSDP1) gene in Brassica napus. Chin
Oil Crop Sci (中国油料作物学报), 2011, 33(4): 338–343 (in
Chinese with English abstract)
2024年4月4日发(作者:零凝竹)
作物学报
ACTA
AGRONOMICA
SINICA 2013, 39(7): 1164−1171
ISSN 0496-3490; CODEN TSHPA9
/zwxb/
E-mail: xbzw@
DOI: 10.3724/SP.J.1006.2013.01164
一个棉花GDSL脂肪酶基因的克隆与功能分析
佟祥超 王丽曼 胡文静 张雪颖 张天真 郭旺珍
*
南京农业大学作物遗传与种质创新国家重点实验室 / 教育部杂交棉创制工程研究中心, 江苏南京210095
摘 要: GDSL脂肪酶与GXSXG脂肪酶是2个重要的脂肪酶亚家族。其中, GDSL家族脂肪酶具有水解酶活性, 能水
解多种酯类物质。本试验根据新乡小吉无绒无絮(XinWX)和无绒有絮(XinFLM)近等基因系纤维起始期29K芯片竞争
杂交结果, 选择了一个在纤维起始期具有极显著表达差异的EST序列(GenBank登录号为DR458916), 以该序列信息
为探针, 利用电子克隆方法并进行cDNA及基因组全长基因PCR扩增、测序验证, 克隆获得一个陆地棉GDSL脂肪
酶基因(GhGDSL; GenBank登录号为KC186125)。该基因ORF长1065 bp, 编码354个氨基酸, 含有5个外显子和4
个内含子。该基因在二倍体棉种基因组中含一个拷贝, 在四倍体棉种基因组中含2个拷贝。序列比对显示该基因在四
倍体棉种的2个亚组中独立进化, 且D亚组比A亚组变异大。染色体定位显示该基因2个拷贝分别位于A4 (Chr. 4)
和D4 (Chr. 22)染色体上。定量RT-PCR结果表明, GhGDSL在开花后3~10 d的纤维组织中表达量高, 其中在海7124
中表达高峰在8DPA, 在TM-1中表达高峰从5DPA持续到10DPA。利用[(TM-1×Hai7124)×TM-1]的
BC
1
S
1
群体开展
GhGDSL功能与纤维、种子品质性状关联分析, 发现该基因A亚组的拷贝与种子脂肪含量存在显著相关(P=0.048); D
亚组的拷贝与种子蛋白含量存在极显著相关(P=0.008)。推测GhGDSL基因功能与种子中脂肪、蛋白代谢相关, 同时
也参与纤维伸长过程。
关键词: GDSL脂肪酶; 克隆; 表达; 基因定位; 关联分析; 棉花
Molecular Cloning and Functional Analysis of a GDSL Lipase Gene from Gos-
sypium hirsutum L.
TONG Xiang-Chao, WANG Li-Man, HU Wen-Jing, ZHANG Xue-Ying, ZHANG Tian-Zhen, and GUO
Wang-Zhen
*
State Key Laboratory of Crop Genetics and Germplasm Enhancement, Hybrid Cotton R&D Engineering Research Center, Ministry of Education,
Nanjing Agricultural University, Nanjing 210095, China
Abstract: GDSL and GXSXG lipases are two important sub-families of lipases. Unlike the GXSXG motif-containing lipases,
GDSL lipases have a GDSL motif and are active in hydrolysis and synthesis of abundant ester compounds. In this experiment, a
EST sequence (GenBank accession number: DR458916) was screened based on extremely significant expression differences at
fiber initiation stages between lintless-fuzzless XinWX and linted-fuzzless XinFLM isogenic lines by 29K cotton genome array
hybridization. Using the EST sequence as queries, the Gossypium EST database (/) was screened and
the corresponding cDNA sequences containing a complete ORF were assembled. Further, the ORF information was reconfirmed
in transcriptional and genomic level. As a result, a novel gene encoding GDSL lipase was cloned, and the gene was designated as
GhGDSL (Gossypium hirsutum GDSL; GenBank accession number: KC186125). GhGDSL included an open reading frame of
1065 bp that encoded a polypeptide of 354 amino acids. The genome sequence indicated that GhGDSL had four introns and five
exons. The homolog of GhGDSL had one copy in diploid cotton species G. herbaceum and G. raimondii and two copies in
tetraploid cotton species G. hirsutum acc. TM-1 and G. barbadense cv. Hai 7124, respectively. Sequence alignment from different
cotton species showed GhGDSL homoelogs in tetraploid were evolved independently, with more variations in D-subgenome than
in A-subgenome. GhGDSL homoelogs in tetraploid were located on chromosome 4 (Chr. A4) and chromosome 22 (Chr. D4) by
developing subgenome-specific SNP marker, respectively. Q-PCR analysis showed that GhGDSL was accumulated highly in
本研究由国家重点基础研究发展计划(973计划)项目(2011CB109300)资助。
*
通讯作者(Corresponding author): 郭旺珍, E-mail: moelab@
Received(收稿日期): 2012-11-21; Accepted(接受日期): 2013-03-11; Published online(网络出版日期): 2013-04-23.
URL: /kcms/detail/
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1165
ovule and fiber tissue at 3–10 days post anthesis (DPA), with expression peak at 8DPA in Hai 7124 and high expression from
5DPA to 10 DPA in TM-1. The association analysis between GhGDSL and the traits related to fiber and seed qualities in corre-
sponding [(TM-1×Hai 7124)×TM-1] BC
1
S
1
individuals showed that GhGDSL homolog in A-subgenome was significantly corre-
lated with the seeds’ fat content (P=0.048), and GhGDSL homolog in D-subgenome was very significantly correlated with the
seeds’ protein content (P=0.008). These results suggested that GhGDSL might be functionally important in the metabolic process
of lipid and protein in seeds and in the process of fiber development.
Keywords: GDSL lipase; Cloning; Expression; Gene mapping; Association analysis; Cotton
植物脂肪酶根据编码蛋白催化活性区域氨基酸
序列的保守型分为GXSXG脂肪酶和GDSL脂肪酶。
其中, GDSL家族脂肪酶具有水解酶活性, 能水解多
种酯类物质。与微生物和动物的脂肪酶研究相比,
植物脂肪酶基因的克隆起步较晚, 近年来随着分子
生物技术的发展, 特别是模式植物拟南芥和水稻全
基因组测序的完成, GDSL脂肪酶的相关报道也逐渐
增多, 有大量水稻
[1]
、油菜
[2]
、苜蓿
[3]
GDSL脂肪酶
基因及其相关功能的报道。
GDSL家族脂肪酶作用主要分为三大类: (1)参
与脂类代谢。拟南芥GDSL脂肪酶Arab-1基因在种
子萌发过程中表达, 行使水解酶活性
[4]
; (2)参与植
物应激反应。Oh等
[5]
研究表明, 拟南芥GDSL脂肪
酶GLIP1基因可能触发植物体内针对真菌侵染的抗
病信号, 兼具水解酶活性和抗菌活性; (3)参与植物
次生代谢物合成。Rupperl等
[6]
研究指出, 萝芙木
(Rauvolfia serpentina)的GDSL基因参与催化生成阿
吗碱(ajmaline)的次生代谢。
棉花既是重要的纤维作物, 又是重要的油料作
物, 在国民经济中占有重要地位。阐明纤维和胚珠
的发育进程及其相关基因表达特征为充分发挥这一
重要经济作物的经济价值奠定了基础。棉纤维的分
化和发育可以分为起始期(initiation)、伸长或初生壁
合成期(elongation or primary cell wall synthesis)、次
生壁合成期(secondary cell wall synthesis)以及成熟
期(maturation)
[7]
4个相互重叠的阶段。伴随着棉纤
维发育, 胚珠中与油脂和蛋白代谢相关的基因均表
达并参与相应代谢过程。Ji等
[8]
利用cDNA消减杂
交和微阵列技术比较野生型棉纤维和无绒无絮突变
体开花后10 d的表达差异, 发现280条差异表达的
cDNA片段。进一步分析发现在纤维伸长发育过程
中显著上调表达的172个基因中, 29条参与长链脂
肪酸生物合成的各种上游通路, 如MAPK通路、生
长素信号通路等。因此, 脂肪酸代谢途径, 不仅在种
子发育进程中参与棉籽大量脂肪酸的形成, 而且在
维持棉纤维生长、发育过程中也起重要作用。
本研究室前期研究完成了新乡小吉无绒无絮
(XinWX)和无绒有絮(XinFLM)近等基因系纤维发育
起始期29K芯片竞争杂交, 获得一批差异表达基
因。本研究从中选择了一个在纤维起始期二者具有
极显著表达差异的EST序列(NCBI登录号为
DR458916), 以该序列信息为探针, 开展了该基因
的克隆及相关特征分析研究。明确了该基因结构和
表达特征, 通过定量表达和关联分析表明该基因在
棉花种子和纤维发育中扮演重要角色。
1 材料与方法
1.1 试验材料
选用二倍体A染色体组的阿非利加棉(G. her-
baceum var. africanum)、D染色体组的雷蒙德氏棉(G.
raimondii)和异源四倍体栽培棉种陆地棉遗传标准
系TM-1 (G. hirsutum acc. TM-1)和海岛棉海7124 (G.
barbadense cv. Hai 7124), 将其种植于南京农业大学
牌楼实验基地。
1.2 目的基因的获得与分析
以获得的EST序列为探针, 对陆地棉的dbEST
数据库(/)进行tBlastn比
对。将获得的EST序列用CAP3拼接, 用Blastn方式
对拼接结果进行检索, 直至检出的Contig不能再延
伸。对最长Contig进行ORF预测, 利用NCBI中
Blastp功能搜索与该基因相似的序列, 通过比较将其
分类命名。根据该序列电子克隆结果设计扩增ORF
和全长基因引物, 分别以陆地棉遗传标准系TM-1基
因组DNA和开花后10DPA的纤维组织cDNA为模板,
克隆该基因并测序验证(表1)。由南京金斯瑞生物科技
有限公司完成所有引物合成和DNA序列测定。
每一基因分别从来自TM-1和海7124中的阳性
克隆中随机挑选10个克隆, 从雷蒙德氏棉和阿非利
加棉的阳性克隆中随机挑选3个克隆, 进行测序。利
用在线软件Gene Structure Display Server (GSDS,
/)进行基因结构
分析。利用ClustalX (Ver 2.0.12)进行多重序列比对,
利用MEGA5 (/)进行进
化树分析。
1166
作 物 学 报
表1 本研究所用引物
Table 1 Primer pairs used in this study
第39卷
基因
Gene
His3
GhGDSL
引物
Primer
Y 8991F
引物序列
Sequences information (5′–3′)
CGGTGGTGTGAAGAAGCCTCAT
用途
Purpose
内标对照
Reference gene as control
扩增ORF所用的RT-PCR引物
RT-PCR primers for ORF amplification
Y 8991R AATTTCACGAACAAGCCTCTGGAA
Y5705F GTTGCTTCCCTGCTTAATTT
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
Y5705F GTTGCTTCCCTGCTTAATTT
Y5705R CAAGCAGTGAACGATCTCAA
Y8302F TAAGACACCAGTGCCCTACAGATAC
Y8302R TAGAGCCGTTGGTGGCAATGTA
Y9759F TACATTGCCACCAACGGCTCTA
Y9759R GAAGGGATTTGACAGATACCAAGAAACTAAA
Y9408F GTGAATCCATTTGAGCCCTGTT
Y9408R CTACGGAACAAGGATGGCGA
Y8441F ACTCTTTTTCTTCTTCTTTTTTTCTTCCTATTTCCG
Y8441R AGACAGCTCCTTGTTGTCATGAGTTGTCTGT
Y9363F GGAGGTAAAATGTAATTTGATTCCTAATACAGGCGT
Y9363R TCCCAAGTTATGGATGCGTTTCAGGTT
扩增全长基因所用的3套巢式引物
Three sets of nested primers for amplifying the
full length of the gene
Q-PCR分析
Q-PCR analysis
用于A亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in A-subgenome
用于D亚组GhGDSL 拷贝染色体定位的SNP引物
SNP primers for chromosome location of GhGDSL
homolog in D-subgenome
1.4 染色体定位
基因定位作图群体为[(TM-1×海7124)×TM-1]的
BC
1
群体, 群体大小为138个单株
[9]
。根据基因在
TM-1和海7124中的序列差异, 设计亚基因组专化
的SNP标记引物(表1), 通过PAGE胶电泳检测该基
因在BC
1
作图群体中的分离情况, 然后利用
JoinMap3.0对多态性数据进行连锁分析
[10]
, 将结果
整合到我室构建的海陆遗传图谱上
[11]
, 用MapChart
完成基因定位图谱的制作
[12]
。
1.5 关联分析
分别于2003、2004、2005和2008年重复调查
了TM-1和海7124亲本及 [(TM-1×海7124)×TM-1]
的BC
1
S
1
家系的5个纤维品质性状指标, 即纤维长
度(fiber length, FL)、纤维强度(fiber strength, FS)、
马克隆值(micronaire value, FM)、纤维伸长率(fiber
elongation, FE)和纤维整齐度(fiber uniform, FU)。分
别在2003年和2004年重复测定种子油分和蛋白含
量。由农业部棉花品质监督检验测试中心测定纤维
品质; 国家谷物品质监督检验测试中心泰安分中心
测定油分和蛋白含量。由南京农业大学棉花研究所
提供上述数据。基于上述数据和目标基因在[(TM-1×
海7124)×TM-1] BC
1
中2种基因型, 利用t测验进行
目标基因与性状的关联分析。
1.6 总RNA和DNA的提取
分别将TM-1和海7124的种子浸泡水中24 h左
右, 再转入营养钵30℃光照培养箱培养, 每日光照
与黑暗各12 h, 待小苗生长到5~6片真叶时, 分别采
收其根、茎和叶; 在植株生长盛花期, 分别采集
TM-1和海7124开花前1 d (–1DPA)、开花后0、1、
3和5 d (DPA)的胚珠和纤维混合物, 开花后8、10、
14、17、20和23 d (DPA)的纤维, 开花后8、10、14、
17、20和23 d (DPA)的胚珠。将样品迅速置液氮冷
冻并保存在–70℃冰箱。用CTAB法
[13]
从新鲜幼嫩的
叶片提取DNA。用改进的热硼酸法
[14]
提取不同纤维
发育时期的纤维细胞总RNA。用CTAB-酸酚法提取
根、茎和叶总RNA
[15]
。
1.7 实时荧光定量Q-PCR分析
将提取的目标组织、器官总RNA反转录成
cDNA, 稀释10倍取1 μL用于实时荧光定量PCR分
析。以His3为内参, 在荧光定量PCR仪上(iQ5型,
Bio-Rad, USA)扩增, 反应体系为cDNA 1 μL、10
μmol L
–1
正向和反向引物各0.5 μL、2×SYBR (Roche)
溶液10 μL, 加无菌超纯水至20 μL于专用的定量
PCR管中, 扩增条件为95℃预变性10 min; 94℃变
性15 s, 60℃退火15 s, 72℃延伸30 s, 40个循环;
72℃延伸10 min, 以熔解曲线结束。参照ΔΔC
t
法
[16]
分析定量结果, 目的基因相对表达量=2
–ΔCt
; ΔC
t
=
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1167
C
t
目的基因
−C
t,His3
。
对发现其与蓖麻(Ricinus communis)和麻疯树(Jatropha
curcas)中的GDSL类基因同源性最高, 分别为72%
和75%, 因此将该基因命名为GhGDSL (Gossypium
hirsutum GDSL; GenBank登录号为KC186125)。
2 结果与分析
2.1 基因全长cDNA的获得及其序列分析
以本试验获得的EST序列信息为探针, 搜索
NCBI棉花EST数据库中与此序列同源的目标序列,
通过电子拼接克隆, 获得该候选基因的最大ORF。
进一步设计扩增全长ORF的引物, 以TM-1开花后
10DPA的纤维组织cDNA为模板, 通过扩增产物测
序验证, 获得一个含完整ORF的cDNA序列。ORF长
度为1065 bp, 可编码354个氨基酸。用Expasy pI/Mw
程序预测该基因编码的氨基酸一级结构, 其等电点
8.77, 分子量39.33 kD。根据NCBI CDS (www.
/Structure/cdd/)分析, 其编码的氨基
酸残基含有GDS(L)-motif, 在50~330氨基酸之间有
属于SGNH_hydrolase superfamily保守域。BlastX比
2.2 分子系统进化分析
为了进一步了解新发现的GhGDSL基因的系统
进化分类, 从TAIR (/in-
/)上下载拟南芥107个GDSL脂肪酶基因序列,
用MEGA5与GhGDSL基因序列构建系统发生树(图
1), 使用Neighbor-Jioning法, 其中BootStrap值为
1000。根据序列的同源性将进化分析结果分成3组
(Group I~III), GhGDSL与拟南芥GDSL基因家族中
的Group III同源性最高, 其中相似度最高的是
AT2G36325.1和AT3G09930.1 (NP_187604.1)。拟南芥
Group III中大部分基因的功能与种子油脂代谢有关
[17]
,
推测GhGDSL在种子油脂代谢过程中发挥作用。
图1 GhGDSL与拟南芥GDSL脂肪酶聚类分析
Fig. 1 Phylogenetic analysis of GhGDSL and GDSL lipases subfamily in Arabidopsis
107个拟南芥GDSL脂肪酶基因序列从TAIR (//)网站下载。
Subfamily of 107 GDSL lipases was downloaded from TAIR (//).
1168
作 物 学 报
第39卷
2.3 不同棉种GhGDSL同源基因结构分析
基因结构分析表明(图2), 该基因包含5个外显
子, 4个内含子, 与GDSL脂肪酶基因家族大多数基
因的内含子数目一致
[17]
。不同棉种中GhGDSL的同
源基因序列在第2个内含子位置, 均存在A组和A
亚组与D组和D亚组之间明显差异。序列进化分析
显示该基因在四倍体棉种中形成A亚组和D亚组两
大分支, 可明确追溯到其祖先来源, 说明在四倍体
棉种中GhGDSL A亚组与D亚组重复基因是独立进
化的。进一步比较TM-1和海7124中来源同一亚组
基因的同源性, 发现在这2个棉种中来源于D亚组
的基因其变异程度高于A亚组, 说明在进化进程中,
GhGDSL的同源基因在A亚组中的拷贝比D亚组保
守性高(图3)。
图2 GhGDSL类同源基因在不同棉种中的结构比较
Fig. 2 Gene structure of GhGDSL orthologs in four cotton species
A: 阿非利加棉; D: 雷蒙德氏棉; TM-1_At: TM-1的A亚组; TM-1_Dt: TM-1的D亚组; H7124_At: 海7124的A亚组; H7124_Dt: 海
7124的D亚组。
A: G. herbaceum L. var. africanum; D: G. raimondii; TM-1_At: A subgenome of G. hirsutum -1; TM-1_Dt: D subgenome of G. hirsu-
tum acc. TM-1; H7124_At: A subgenome of G. barbadense cv. Hai 7124; H7124_Dt: D subgenome of G. barbadense cv. Hai 7124.
图3 GhGDSL类同源基因在不同棉种中的系统进化
Fig. 3 Phylogenetic analysis for GhGDSL orthologs in four
cotton species
基因来源同图2。Gene origins are the same as those in Fig. 2.
图4 GhGDSL基因的染色体定位
Fig. 4 Mapping of GhGDSL homologs in tetraploid cotton
2.4 染色体定位
根据来源于TM-1和海7124棉种间的GhGDSL
同源基因其相应基因组序列上SNP位点差异, 分别
开发出这2个棉种在A、D亚组专化的SNP引物(表
1)。利用该引物仅可在海7124中扩增出相应的目标
产物, 因此在[(TM-1×海7124) ×TM-1]BC
1
群体中可
根据扩增产物的有无确定来源于TM-1和海7124的
2种基因型。将在群体中获得的多态分离信息, 利用
JoinMap 3.0作图软件与我们实验室的骨架标记整合,
将该基因在四倍体中的2个拷贝分别定位于A4 (Chr.
4)和D4 (Chr. 22)部分同源染色体上, 其中来源于A
亚组的拷贝(GhGDSL-At)其两侧标记分别为E10M15-
100和NAU2363-200, 来源于D亚组的拷贝(GhGDSL-
Dt)其两侧标记分别为BNL1047-680和Gh591-155
(图4)。
2.5 定量分析
Q-PCR分析表明, 在海7124中, GhGDSL在根、
茎、叶、–1、0、1DPA中表达量低, 3~14DPA纤维
中表达量逐渐由高到低, 其中8DPA表达量最高,
17DPA以后的纤维组织以及8DPA以后胚珠中表达
量均很低。在TM-1中, GhGDSL在5~10DPA纤维组
织中表达量明显高于其他纤维发育时期和其他组织,
推测该基因主要在纤维伸长期发挥作用。由Q-PCR
结果可知(图5), GhGDSL在海7124和TM-1中表达
模式基本相似, 其表达高峰均在纤维伸长期的纤维
组织中。在海7124中最高表达峰在8DPA, 在TM-1
中最高表达峰由5DPA持续到10DPA, 高表达时期
长, 但最高表达值没有在海7124中高。
第
7
期
佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1169
图5 GhGDSL基因在TM-1和海7124中定量表达分析
Fig. 5 Q-PCR analysis of GhGDSL in TM-1 and Hai 7124
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do分别代表根, 茎, 叶, –1, 0, 1, 3, 5
DPA胚珠纤维混合物, 8, 10, 14, 17, 20, 23 DPA纤维, 8, 10, 14, 17, 20, 23 DPA胚珠。“A”表示材料之间极显著差异, “a”表示材料之间
显著差异。
R, S, L, –1 d, 0 d, 1 d, 3 d, 5 d, 8 d, 10 d, 14 d, 17 d, 20 d, 23 d, 8 do, 10 do, 14 do, 17 do, 20 do, 23 do indicated root, stem, leaf, –1, 0, 1, 3, 5
DPA mixture of ovule and fibers, 8, 10, 14, 17, 20, 23 DPA fibers, 8, 10, 14, 17, 20, 23 DPA ovules, respectively. “A” means the significant
difference at the 0.01 probability level, “a” means the significant difference at the 0.05 probability level.
2.6 关联分析
利用专化扩增海7124基因组的四倍体A、D亚
组SNP标记, 筛选[(TM-1×海7124)×TM-1]的BC
1
作图群体获得的分离群体标记信息, 与来源于
BC
1
S
1
群体多年份的纤维品质、种子油分和蛋白等性
状指标进行关联分析。结果显示, 关联分析未检测
到该基因功能与纤维长度、强度、细度等品质的关
联性, 但检测到该基因A亚组的拷贝与种子脂肪含
量存在显著相关(P=0.048), 在[(TM-1×海7124)×
TM-1] BC
1
分离群体中, 陆地棉纯合基因型均值脂
肪含量为36.11%, 而海陆杂合基因型均值脂肪含量
为35.26%; D亚组的拷贝与种子蛋白含量存在极显
著相关(P=0.008), 在[(TM-1×海7124)×TM-1] BC
1
分
离群体中, 陆地棉纯合基因型均值蛋白含量为
37.60%, 而海陆杂合基因型均值蛋白含量为
40.86%。说明该基因参与种子中油脂代谢及蛋白形
成。研究发现, 尽管来源于四倍体A、D亚组的
GhGDSL2个拷贝分别与种子中脂肪或蛋白含量关
联, 但群体中2种基因型种子脂肪含量和蛋白含量
的总和基本接近, 这与种子中油脂与蛋白质含量之
和是稳定常数相一致
[18]
。
EXL1~6
[20]
, 以及CaGLIP1对胡椒疾病易感性和非
生物胁迫的耐受性有调控作用
[21]
。
棉纤维和棉籽中的脂肪蛋白均是重要的相关
产业原料。GDSL家族脂肪酶具有水解酶活性, 参
与脂肪酸代谢。本研究克隆的GhGDSL基因与拟
南芥107个GDSL脂肪酶家族基因中73个基因结
构类似。说明该基因在进化中的保守性。系统进化
分析显示GhGDSL与AT2G36325.1和AT3G09930.1
(NP_187604.1)相似度最高, 它们属于拟南芥GDSL
基因家族中的Group III, 可能参与种子的油脂代
谢
[17]
。
脂肪酶是脂代谢中的关键酶, 能催化长链脂肪
酸甘油酯水解为甘油和长链脂肪酸。脂肪酸是生物
体中重要的组成成分, 可作为重要的信号分子参与
细胞的生长发育
[22]
, 细胞中脂肪酸的组成、含量以
及存在形式对细胞的生存和正常生长都具有重要的
意义。在棉纤维细胞伸长过程中, 参与脂肪酸合成和
延长途径中的大部分基因均上调表达
[23]
。Qin等
[22]
发
现在胚珠培养基中加入外源饱和超长链脂肪酸
(VLCFA; C20:0~C30:0)可以显著提高棉纤维细胞的
伸长, 而加入抑制VLCFA生物合成的乙草胺(ACE)
则可以阻止纤维生长, 同时对棉花中4个KCS (超长
链脂肪酸合成的限速酶)的研究发现, 在开花后10
或15 d纤维伸长阶段检测到不同的KCS基因相对于
开花当天的转录水平增加了8~35倍。而相对于短纤
维种质, 长纤维棉花在快速伸长阶段(开花后10 d)
含有的所有4种KCS转录物, 其量几乎是短纤维的
2倍。Gou等
[24]
通过对纤维快速伸长期、次生壁合
成期的转录组以及代谢组研究, 发现脂肪酸合成、
3 讨论
GDSL脂肪酶作为重要的脂肪酶基因家族之一,
在植物生长发育等多种生理活动中扮演重要角色。
Beisson等
[19]
发现拟南芥中的Arab-1只在萌发种子
的黄化苗中发挥作用, 说明该类基因参与种子萌发
过程。GDSL脂肪酶也在花器官发育及植物抗逆性
中发挥作用。如已经鉴定花粉外壁中的胞外脂肪酶
1170 作 物 学 报
第39卷
代谢相关基因在纤维伸长期具有较高的表达, 在次
生壁合成时期表达开始逐渐降低。总的脂肪酸含量
也在纤维伸长期达到最大值, 而到开花后21 d显著
降低。表明脂肪酸合成与代谢相关的基因参与棉纤
维的伸长。本研究克隆的GhGDSL基因主要在胚珠
发育早期及纤维伸长期高表达, 推测该基因通过参
与脂质代谢而促进纤维的伸长。当纤维细胞快速伸
长时, 脂肪酶与其他相关酶协同发挥作用, 催化分
解油脂类物质生成糖类, 提供纤维细胞扩展中所必
需的养料和能量。
本研究表明, 该基因A亚组的拷贝与种子脂肪
含量显著相关, D亚组的拷贝与种子蛋白质含量极
显著相关。Wei等
[25]
研究发现, 油菜中GDSL脂肪
酶基因BnSDP1在低油品系种子中转录水平高于高
油品系, 推测GhGDSL在种子油脂代谢过程中起着
重要作用。棉籽作为棉花主要的副产品之一, 是可
再生的“绿色能源”, 能用于工业生产及食品、药品和
保健品研制, 为人类使用。尽管GhGDSL主要在纤
维发育早期及伸长期表达量最高, 但其与棉籽中脂
肪及蛋白含量的相关性, 也提示我们进一步阐明该
类基因在种子发育进程中的功能及作用机制, 进而
应用生物技术手段操纵其表达, 培育棉籽高油或高
蛋白品种。研究结果无论对促进人类身体健康, 还
是缓解工业能源压力, 均有积极的意义。
4 结论
克隆了一个含GDSL基元的棉花新基因
GhGDSL, 其ORF全长1065 bp, 编码354个氨基酸,
含有5个外显子和4个内含子。在二倍体棉种阿非
利加棉和雷蒙德氏棉基因组中含1个拷贝, 在四倍
体陆地棉和海岛棉基因组中存在2个拷贝, 分别定
位于A4 (Chr. 4)、D4 (Chr. 22)部分同源染色体上。
该基因与拟南芥中第3类GDSL脂肪酶家族同源性
高, 主要参与种子发育相关的油脂代谢, 且在胚珠
发育早期及纤维伸长期高表达。在四倍体棉种中该
基因A亚组的拷贝与种子脂肪含量显著相关, D亚
组的拷贝与种子蛋白含量极显著相关。推测
GhGDSL基因功能与种子发育和纤维伸长过程中油
脂代谢及蛋白形成有关。
References
[1] Kim Y. Cloning and expression of a lipase gene from rice (Oryza
sativa cv. Dongjin). Mol Cells, 2004, 18: 40–45
[2] Roberts M R, Foster G D, Blundell R P, Robinson S W, Kumar A,
Draper J, Scott R. Gametophytic and sporophytic expression of
an anther-specific Arabidopsis thaliana gene. Plant J, 1993, 3:
111–120
[3] Pringe D, Dickstein R. Purification of ENOD8 proteins from
Medicago sativa root nodules and their characterization as estera-
ses. Plant Physiol Biochem, 2004, 42: 73–79
[4] Brick D J, Brumlik M J, Buckley J T, Cao J X, Davies P C, Misra
S, Tranbarger T J, Upton C. A new family of lipolytic plant en-
zymes with members in rice, Arabidopsis and maize. FEBS Lett,
1995, 377: 475–480
[5] Oh I S, Park A R, Bae M S. Kwon S J, Kin Y S, Lee J E, Kang N
Y, Lee S, Cheong H, Park O K. Secretome analysis reveals an
Arabidopsis lipase involved in defense against Alternaria brassi-
cicola. Plant Cell, 2005, 17: 2832–2847
[6] Rupperl M, Woll J, Giritch A, Genady E, Ma X Y, Stochigt J.
Functional expression of an ajmaline pathway-specific esterase
from Rauvolfia in a novel plant-virus expression system. Planta,
2005, 222: 888–898
[7] Basra A, Malik C P. Development of the cotton fiber: Interna-
tional fibers. In: Basra A M ed. Cotton Fibers. New York: Ha-
worth Press, 1984. pp 231–267
[8] Ji S J, Lu Y C, Feng J X, Wei G, Shi Y H, Fu Q, Liu D, Luo J C,
Zhu Y X. Isolation and analyses of genes preferentially expressed
during early cotton fiber development by subtractive PCR and
cDNA array. Nucl Acids Res, 2003, 31: 2534–2543
[9] Song X L, Wang K, Guo W Z, Zhang J, Zhang T Z. A comparison
of genetic maps constructed from haploid and BC
1
mapping
populations from the same crossing between Gossypium hirsutum
L. and Gossypium barbadense L. Genome, 2005, 48: 378–390
[10] Van Ooijen J W, Voorrips R E. JoinMap Version 3.0: Software
for the Calculation of Genetic Linkage Maps. Wageningen, the
Netherlands: CPRO-DLO, 2001
[11] Guo W Z, Cai C P, Wang C B, Wang C B, Han Z G, Song X L,
Wang K, Niu X W, Wang C, Lu K Y, Shi B, Zhang T Z. A mi-
crosatellite-based, gene-rich linkage map reveals genome struc-
ture, function, and evolution in Gossypium. Genetics, 2007, 176:
527–541
[12] Voorrips R E. MapChart: software for the graphical presentation
of linkage maps and QTLs. J Heredity, 2002, 93: 77–78
[13] Paterson A H, Brubaker C L, Jonathan F. Rapid method for ex-
traction of cotton (Gossypium spp.) genomic DNA suitable for
RFLP or PCR analysis. Plant Mol Biol Rep, 1993, 11: 122–127
[14] Wu Y-T(武耀廷), Liu J-Y(刘进元). A modified hot borate
method for efficient isolation of total RNA from different cotton
tissues. Cotton Sci (棉花学报), 2004, 16(2): 67–71 (in Chinese
with English abstract)
[15] Jiang J-X(蒋建雄), Zhang T-Z(张天真). Tissues with CTAB
acidic phenolic method. Cotton Sci (棉花学报), 2003, 15(3):
166−167 (in Chinese with English abstract)
[16] Licak K J, Schmittgen T D. Analysis of relative gene expression
第
7
期 佟祥超等: 一个棉花GDSL脂肪酶基因的克隆与功能分析 1171
data using Real-time quantitative PCR and the 2(-delta delta C(t))
method. Method, 2001, 25: 402–408
[17] Ling H, Zhao J Y, Zuo K J, Qiu C X, Yao H Y, Qin J, Sun X F,
Tang K X. Isolation and expression analysis of a GDSL-like li-
pase gene from Brassica napus L. J Biochem Mol Biol, 2006, 39:
297–303
[18] Sun S-K(孙善康), Chen J-H(陈建华), Xiang S-K(项时康), Wei
S-J(魏守军). Study on the nutritional quality of cotton seeds. Sci
Agric Sin (中国农业科学), 1987, 20(5): 12–16 (in Chinese with
English abstract)
[19] Beisson F, Arondel V, Verger R. Assaying Arabidopsis lipase ac-
tivity. Biochem Soc Transact, 2000, 28: 773–775
[20] Mayfield J A, Fiebig A, Johnstone S E, Preuss D. Gene families
from Arabidopsis thaliana pollen coat proteome. Science, 2001,
292: 2482–2485
[21] Hong J K, Choi H W, Hwang I S, Kin D S, Kim N H, Choi D S,
Kim Y J, Hwang B K. Function of a novel GDSL-type pepper li-
pase gene, CaGLIP1, in disease susceptibility and abiotic stress
tolerance. Planta, 2008, 227: 539–558
[22] Qin Y M, Hu C Y, Pang Y, Kastaniotis A J, Hilunen J K, Zhu Y
X. Saturated very-long-chain fatty acids promote cotton fiber and
Arabidopsis cell elongation by activating ethylene biosythesis.
Plant Cell, 2007, 19: 3692–3704
[23] Shi Y H, Zhu S W, Mao X Z, Feng J X, Qin Y M, Zhang L,
Cheng J, Wei L P, Wang Z Y, Zhu Y X. Transcriptome profiling,
molecular biological, and physiological studies reveal a major
role for ethylene in cotton fiber cell elongation. Plant Cell, 2006,
18: 651–664
[24] Gou J Y, Wang L J, Chen S P, Hu W L, Chen X Y. Gene expres-
sion and metabolite profiles of cotton fiber during cell elongation
and secondary cell wall synthesis. Cell Res, 2007, 17: 422–434
[25] Wei M-Y(魏明玉), Zhou J(周佳), Yan S-Z(闫素珍), Wang Z(王
政), Tan X-L(谭小力). Cloning and expression analysis of an
oil-content related lipase (BnSDP1) gene in Brassica napus. Chin
Oil Crop Sci (中国油料作物学报), 2011, 33(4): 338–343 (in
Chinese with English abstract)