2024年4月1日发(作者:邴雍)
生命的化学, 2014, 34(3): 385-391 常天俊, 等. 四链体核酸的生物学功能 doi: 10.13488/.20140309· 385 ·
G-四链体核酸的生物学功能
常天俊
*
,李 刚,李卫国
(河南理工大学资源环境学院,焦作 454000)
摘要:
G-
四链体是由富含鸟嘌呤的
DNA
或
RNA
折叠形成的高级结构。可形成
G-
四链体的序列在人基
因组中广泛分布,涉及
DNA
复制、端粒维持、基因表达与调控以及遗传不稳定性等过程。研究发现有
些化学合成的
G-
四链体序列也具有生物活性,如核仁素的核酸适体
AS1411
具有抑制恶性肿瘤增殖活
性。
G-
四链体的生物学功能研究对于恶性疾病的发病机理和靶向治疗,以及设计开发核酸类抗癌药物
有重要意义。
关键词:
G-
四链体;功能核酸;核酸适体;分子识别
The biological functions of G-quadruplex nucleic acids
CHANG Tianjun
*
, LI Gang, LI Weiguo
(School of Resources and Environment Engineering, He’nan Polytechnic University, Jiaozuo 454000, China)
Abstract: G-quadruplexes (G4s) are four-stranded DNA or RNA secondary structures formed in special
G-riching sequences. Putative G-quadruplex-forming sequences are highly prevalent in human genome, involved
in DNA replication, telomere maintenance, gene expression and regulation, and genetic instability. Synthetic
G-quadruplexes also have important biological functions, e.g., AS1411 is reported as an anti-nucleolin aptamer
and has cancer-selective antiproliferative activity. Therefore, studying the biological functions of G-quadruplexes
is very important for the pathogenesis and targeted therapy of malignancies, and for the design and development
of nucleic acids anti-cancer drugs.
Key Words: G-quadruplex; functional nucleic acid; aptamer; molecular recognition
G-
四链体
(G-quadruplex)
是由富含串联重复鸟
嘌呤
(G)
的
DNA
或
RNA
折叠形成的高级结构。
G-
四
分体
(G-quartet)
是四链体的结构单元,由
Hoogsteen
氢键连接
4
个
G
形成环状平面,两层或以上的四分
体通过
π
-
π
堆积形成四链体
(
图
1)
[1]
。
G-
四链体一般
需要一价阳离子如
Na
+
或
K
+
来稳定其结构
(
图
1A)
:
Na
+
位于
G-
四链体的四分体平面内,而
K
+
位于两层
四分体之间。根据
G
-
四链体主链的走向,可将其
分为平行、反平行和混合平行三种构型
(
图
1B)
[1]
。
1962
年,
Gellert
等
[3]
首次报道了
G-
四链体结
构。自
20
世纪
90
年代开始,研究人员陆续发现了
人端粒及基因启动子区以及
RNA
的
5′-UTR
存在可
形成
G-
四链体的
DNA
或
RNA
序列,参与许多重要
的生理和病理过程
[4]
。此外,人们发现化学合成的
G-
四链体也具有多种生物学活性,如抑制肿瘤增
殖活性
[5]
,抑制
1
型人类免疫缺陷性病毒整合酶
(HIV-1 integrase)
的活性
[6]
等。由于
G-
四链体具有重
要的生物功能和分子识别特性,其结构和功能研
究成为化学与生物学研究的热点。
2007
年至今,
国际上已成功举办了
4
次
G-
四链体大会,聚焦于
G-
四链体和鸟苷自组装领域的研究进展。本文主要
介绍基因中的
G-
四链体
DNA
和
RNA
,以及化学合
收稿日期:2013-09-22
基金项目:北京分子科学国家实验室开放课题基金(2012年度);河南省教育厅科学技术研究重点项目(13A180328)
*通信作者:E-mail: changtj@
· 386 ·《生命的化学》2014年34卷3期综述
(A)G-
四分体
(
左
)
和
G-
四链体
(
右
)
。图中灰色或黑色球为一价阳离子;右图为人端粒
G-
四链体在
K
+
条件下的晶体结构
[2]
。
(B)G-
四链体的拓扑
结构:平行
(
左
)
、反平行
(
中
)
和混合平行
(
右
)
。
图
1
G-
四链体及其拓扑结构
[1,2]
成的
G-
四链体的生物功能,并简要介绍我们在
G-
四链体领域的研究进展。
形成
G-
四链体,需要解旋酶将它们解链。已发现
的能解链
G-
四链体的解旋酶大多数与遗传不稳定
的人类疾病有关,包括
RecQ
解旋酶
WRN(
与早老
病相关
)
和
BLM(
增加患癌风险
)
,以及
FANCJ(
增加
患癌风险
)
和
PIF1(
增加患癌风险
)
[14]
。最近,
Gray
等
[15]
发现转录解旋酶
XPB
和
XPD
在基因组中的结
合位点有
40%
与形成
G-
四链体的序列重叠,这些
解旋酶为以
G-
四链体为靶的癌症治疗策略提供了
新途径。此外,许多核蛋白在体外能选择性结合
G-
四链体,如核蛋白
Ku70/Ku86
及核内不均一核糖
核蛋白
1(heterogeneous nuclear ribonucleoprotein A1,
HNRNPA1)
等均能结合原癌基因
KRAS
启动子区的
G-
四链体序列,且
HNRNPA1
能解链
G-
四链体
DNA
,激活
KRAS
的转录
[16]
;核仁素是在细胞核中
表达的重要蛋白质,也能高亲和力地结合
c-Myc
启
动子区的
G-
四链体序列,且能抑制有该启动子控
制的基因表达
[16]
。这些研究表明,基因可通过形
成
G-
四链体结构,并在一系列
G-
四链体结合蛋白
的作用下来调节其复制或转录。
Brooks
等
[17]
总结发现,在癌的转化和恶性增
殖期间,
6
个关键的细胞和微环境过程中关键基因
的核心区或启动子区都有能形成
G-
四链体的序列
(
图
2)
。这些发现,对研究和发现新的受
G-
四链体
调节功能的基因有重要指导意义。由于与癌症的
密切联系,基因启动子
G-
四链体序列已成为抗癌
药物开发的重要靶点。
1 体内G-四链体核酸的生物学功能
1.1 基因中的G-四链体DNA的生物学功能
20
世纪
90
年代以来,人们发现端粒重复序列
能形成
G-
四链体结构,对维持染色体稳定有重要
作用,且与癌症发生、发展密切相关
[7]
。目前已有
文献综述了端粒
G-
四链体的功能
[8]
,本文主要探讨
基因中
G-
四链体的功能。科学家们利用生物信息
学手段,发现人类基因组中有近
300 000
个能形成
G-
四链体的序列
[9]
,
40%
以上的人类基因组启动子
区域含有
1
个或
1
个以上
G-
四链体序列
[10]
。但形成
G-
四链体的序列在肿瘤抑制基因中很少,而在促
进肿瘤发生或增殖的原癌基因中比例很高,可能
影响基因表达或导致基因组不稳定
[11]
。如原癌基
因
c-Myc
启动子区的
G-
四链体序列发生突变,可破
坏
G-
四链体的结构,使该基因转录活性提高
3
倍,
而稳定
G-
四链体结构的小分子则抑制该基因的转
录
[12]
。研究还发现转录起始位点
(2 kb
内
)
的上下游
序列都有富含
G
的序列,上游富
G
序列已被证实为
在双链中起调节作用的元件,如发生甲基化的
CpG
岛以及转录因子识别位点;而下游富
G
序列主
要在非模板链,位于第一个基因内含子内,有
16%
与已知的基因表达调控规律不同
[13]
。
这些富
G
序列,在
DNA
复制或转录过程中可
常天俊, 等. G-四链体核酸的生物学功能· 387 ·
图2 癌症的6个特点与对应基因启动子区域形成G-四链体的关联性
[17]
除原癌基因启动子区外,科学家还发现很多其
它基因存在可形成
G-
四链体的序列,如脆性
X
综合
征
(fragile-x syndrome)
基因
[18]
、人基因启动子微卫
星区的重复序列
[19]
、肌萎缩性脊髓侧索硬化症和额
颞痴呆相关基因
C9orf72
的
6
碱基重复区域
(GGGG-
CC)
n
[20]
,人乳头瘤病毒
(human papilloma virus, HPV)
基因组
[21]
、
HIV-1
病毒启动子区域的富
G
序列
(
HIV-
PRO1
)
[22]
等。最近,
Lexa
等
[23]
发现植物逆转录转座
子的长末端重复序列
(LTR)
存在能形成
G-
四链体的
序列,分布于启动子的上下游区域,其中上游多
在
DNA
负链,下游多在
DNA
正链上,表明这些序
列可在转录和转录后加工水平起作用。我们也尝
试开展玉米基因组中
G-
四链体序列分布规律的研
究,发现
G-
四链体序列分布密度少于人类基因
组,但在某些基因中分布相对集中,提示这些序
列可能与基因功能有关。迄今为止,科学家已发
现大量基因中存在
G-
四链体,但仅有少数基因中
G-
四链体的功能得到详细研究,研究对象也集中
在人类基因组中的
G-
四链体,对于其它生物基因
组中的
G-
四链体研究相对较少。
一段含有
UG
4
U
的
19
个碱基能被
K
+
稳定形成
G-
四链
体
[24]
。
Bugaut
等
[25]
发现由
RNA
聚合酶
II
转录端粒富
C
链产生的富
G
序列能形成
RNA G-
四链体,这个
G-
四链体
RNA
研究中的重要进展,使得
G-
四链体
RNA
开始引起了科学家的关注。
基因中存在大量的
G-
四链体
DNA
序列,那
么,由基因转录产生的富
G RNA
是否也能形成
RNA G-
四链体?
2007
年,
Kumari
等
[26]
发现原癌基
因
NRAS
的
5′-UTR
的富
G
序列能形成稳定的
G-
四链
体
RNA
结构,稳定
G-
四链体的小分子可抑制该蛋
白的表达;在人类转录组的
5′-UTR
区域中,有大
约
3 000
个包含
1
个或
1
个以上
G-
四链体形成序列,
其中还包括除
NRAS
外的其他几个原癌基因。与全
转录组相比,
G-
四链体
RNA
形成序列集中分布于
人类基因的
5′-UTR
区,拟南芥
(Arabidopsis thaliana)
转录组中可形成
G-
四链体的
RNA
序列分布规律与
之相似
[25]
。
目前,文献已报道了不少分布在基因的
5′-UTR
区的富
G
序列形成稳定
RNA G-
四链体结构,可抑
制基因的表达,如人
Zic-1
、基质金属蛋白酶
MT3-
MMP
、雌激素受体
ESR1
、凋亡调节因子
BCL2
以及
端粒保护蛋白
TRF2
等基因
[25]
。用反义核酸破坏
mRNA
的
G-
四链体结构,则能上调相应
mRNA
的翻
1.2 G-四链体RNA的生物学功能
富
G
的
RNA
序列也能形成稳定的
G-
四链体结
构。早在
1991
年人们就发现了大肠杆菌
5S RNA
的
· 388 ·《生命的化学》2014年34卷3期综述
译
[27]
。因此,位于疾病相关基因
5′-UTR
区的
G-
四
链体形成序列也是抗癌药物设计的重要靶标。除
了具有调节基因表达功能外,人们还发现有的
RNA G-
四链体能起到翻译起始或神经突定位信号
分子的功能
[28,29]
。
相对于
G-
四链体
DNA
,
G-
四链体
RNA
结合蛋
白的报道较少。
FMRP
蛋白家族是目前研究较多的
G-
四链体
RNA
结合蛋白,该蛋白质可结合
5′-UTR
区的
G-
四链体
RNA
,并抑制其翻译
[25,30]
。
RNA
解
旋酶
RHAU
也可在体外高亲和力地结合
G-
四链体
RNA
,且具有高效的
G-
四链体解旋能力,细胞水
平的研究也表明
G-
四链体
RAN
是胞内
RHAU
解旋
酶作用的靶分子
[26]
。
与基因组中
G-
四链体
DNA
相比,
G-
四链体
RNA
在体内缺少互补链竞争,且在热力学上比同
序列的
DNA
更稳定
[31]
,因此,
G-
四链体
RNA
更有
可能在体内自组装成
G-
四链体结构,执行相应的
生物功能。
G-
四链体
RNA
的研究将成为
G-
四链体
研究的另一热点。
1.3 DNA:RNA杂合G-四链体的生物学功能
两个或两个以上的富
G
核酸序列通过
Hoog-
steen
氢键可形成分子间
G-
四链体
(intermolecular
G-quadruplex)
,其中
DNA
与
RNA
之间可形成杂合
的分子间
G-
四链体。
Xu
等
[32]
发现人端粒
RNA
与
DNA
序列能形成杂合的分子间
G-
四链体,可抑制
染色体末端融合和抑制细胞衰老,进而对端粒起
保护作用。科学家还发现转录产生的富
G RNA
可
与非模板链的富
G DNA
作用,形成杂合
G-
四链
体,可作为
DNA
复制或转录的调控元件
[33,34]
。
Xiao
等
[35]
研究发现,能形成杂合
G-
四链体的序列在真
核生物基因组中非常普遍;从温血动物中的两栖
动物开始,这样的序列就集中分布在紧邻转录起
始位点下游
1 000
个核苷酸的区域,表明具有潜在
的转录调控功能。这些序列具有强烈的偏好分布
在转录的非模板链上,与
Eddy
等
[13]
发现的可形成
分子内
G-
四链体的序列分布规律相吻合,但转录
中可形成杂合
G-
四链体的序列远比后者更为普遍
和丰富
[35]
。该研究结果提示:形成
DNA:RNA
杂合
的分子间
G-
四链体
(
而不是分子内
G-
四链体
)
更有可
能是
G-
四链体调控基因复制或转录的结构模式。
然而,在低等的鱼类和后生动物基因组中,能形
成杂合
G-
四链体的序列在模板链分布较多,与哺
乳动物等高等的温血动物相反,表明形成杂合
G-
四链体调控
DNA
转录可能是进化的选择。该研究
从进化生物学的角度理解
G-
四链体序列在基因组
中的分布及功能,为
G-
四链体生物学研究指明了
一个新的方向。
1.4 G-四链体的分离与活体检测
G-
四链体还具有很强的抗核酸酶活性
[36]
,暗
示体内核酸代谢后,有可能存在较高丰度的
G-
四
链体序列。由于
G-
四链体与很多疾病密切相关,
若能在血液或体液中发现
G-
四链体,并阐明是否
与疾病有关,对于疾病的诊断将有重要意义。事
实上,
G-
四链体是否真实存在于体内一直是
G-
四
链体生物学研究要解决的问题。选择性分离并检
测到生物体内存在
G-
四链体,将为证实这些猜测
提供坚实的证据。本课题组
[37]
和
Balasubramanian
课题组
[38]
利用特异性识别
G-
四链体的小分子探针作
为亲和配基,尝试用亲和方法分离
G-
四链体核酸,
并初步建立了复杂体系中
G-
四链体的选择性富集分
离方法。
Balasubramanian
课题组在细胞水平对
G-
四
链体进行了系统研究,用
G-
四链体
DNA
的抗体
hf2
从癌细胞中分离和检测
G-
四链体
DNA
,证实了
G-
四链体在人基因组中稳定存在且可检测
[39]
;用
G-
四
链体
RNA
的抗体
BG4
对细胞质中的
G-
四链体
RNA
进行成像
[40]
。
Henderson
等
[41]
也开发了能特异性识
别
G-
四链体
DNA
的抗体
1H6
,可用于哺乳动物细
胞中
G-
四链体的检测。但能否从血液或体液中分
离并检测代谢的
G-
四链体,尚未有文献报道。
2 化学合成G-四链体核酸的生物学功能
2.1 抗肿瘤增殖活性
科学家们研究核酸药物时,发现了化学合成的
G-
四链体在体内也具有多种生物学活性。我们已对
G-
四链体核酸的抗肿瘤增殖活性进行了综述
[42]
,这
里不再赘述。目前研究的抗肿瘤增殖的
G-
四链体
核酸多为
DNA
分子。
Sanders
等
[43]
研究了
G-
四链体
RNA
的生物学活性,发现其转染入
HEK293
细胞,
不影响细胞活力,但上调了
EGFR1
和
FOS
基因的
表达。该研究结果虽然指出
G-
四链体
RNA
不影响
正常细胞活力,但并不清楚是否能抑制肿瘤增
殖。
常天俊, 等. G-四链体核酸的生物学功能· 389 ·
2.2 细胞识别活性
外源
G-
四链体核酸若能选择性结合肿瘤细
胞,并被细胞选择性摄取,将对于肿瘤的靶向治
疗有重要意义。最近,我们系统比较了
G-
四链体
DNA
序列
(
包括
AS1411)
与多种细胞的识别特征,
发现形成平行结构的
G-
四链体,包括核酸适体、
基因启动子序列及设计的
G-
四链体序列,具有普
遍的细胞识别活性,对很多肿瘤细胞系以及正常
细胞系有很强的结合能力,但不结合
Jurkat E6-
1(
一株白血病细胞系
)
;而不形成
G-
四链体的序列
或者反平行
G-
四链体结构的序列,对这些细胞结
合能力很弱。同时,我们发现具有不同
loop
组成的
平行
G-
四链体也有不同的细胞结合能力。我们推
测平行的
G-
四链体结构模块是其分子识别的基
础,而
loop
组成对其亲和力有重要作用。通过进一
步研究,我们发现
G-
四链体核酸能被细胞选择性
摄取,但不依赖于与细胞的结合,表明这些
G-
四
链体核酸的内吞并非由受体介导;并且我们发现
包括基因中
G-
四链体序列在内的多个
G-
四链体序
列都有抑制肿瘤增殖活性
[44]
。目前,
AS1411
作为
核仁素核酸适体在靶向肿瘤细胞的药物运输、成
像以及细胞捕获释放等领域有较多应用。然而,
我们发现了其对有些正常细胞
(
如胚肾成纤维细胞
HEK293)
也有很强的结合能力,提示该核酸的上
述应用存在一定的风险。
2.3 蛋白质识别活性
除了抗肿瘤增殖活性外,有些
G-
四链体
DNA(
如
T30923)
还具有抑制
HIV-1
整合酶的功能,
可抑制
HIV
感染
[6]
。
Magbanua
等
[45]
通过体外筛选
(systematic evolution of ligands by exponential en-
richment, SELEX)
得到了高亲和力结合白介素
-6
受
体
(interleukin 6 receptor, IL-6R)
的核酸适体
AID-1
[d(G3T)4]
,其与
T30923
序列相同,也能以
G-
四链
体结构与
IL-6R
结合;而且同样序列的
RNA
也能以
G-
四链体结构结合
IL-6R
,而且这两个序列都具有
HIV-1
整合酶抑制剂的功能,也能抑制
HIV
感染。
说明
G-
四链体与这些蛋白的识别具有结构或序列
选择性,且与核酸中核糖组成关系不大。有意思的
是,不少通过
SELEX
技术筛选得到的核酸适体能
形成
G-
四链体结构,如癌蛋白
Shp2
[46]
、凝血酶
[47]
等
的核酸适体与靶蛋白结合可抑制蛋白质的功能。
由于许多蛋白质的核酸适体能形成
G-
四链体结
构,
Yoshida
等
[48]
认为
G-
四链体结构是极佳的核酸
适体与靶蛋白识别的结构元件;此外,由于胰岛
素基因启动子区
G-
四链体序列能结合胰岛素,他
们提出了基因启动子区域的
G-
四链体可作为其表
达蛋白质的核酸适体的猜测,并设计了“基于
G-
四链体启动子的核酸适体筛选”方法,发现几个
其他基因启动子区的
G-
四链体序列的确可识别其
表达的蛋白质分子。基因启动子的
G-
四链体能结
合其表达产物可能是一种对基因表达的反馈调控
模式,该发现为
G-
四链体在体内功能研究提供了
新思路。
外源
G-
四链体核酸具有多种生物功能,是治
疗人类重大疾病如癌症、艾滋病等的潜在药物,
因此挑选有代表性的
G-
四链体核酸序列,深入研
究其在体内的分子识别谱,对于理解其在体内如
何行使功能,以及设计和开发
G-
四链体核酸药物
有重要意义。而且外源
G-
四链体在体内的分子识
别谱研究,对于理解基因组中
G-
四链体序列的功
能也有重要的指导意义。
3 小结
G-
四链体与双链核酸不同,可通过链内或链
间
G
碱基的相互识别自发折叠形成高级结构。在生
命过程中,基因可通过形成
DNA
、
RNA
以及
DNA:RNA
杂合的
G-
四链体,在复制、转录及翻译
等水平主动调节其表达。生物信息学方法被引入
G-
四链体研究中,使人们发现到从低等生物到高
等动物的基因中都存在大量
G-
四链体序列,并且
有些已被证实调节基因的表达,这表明了基因通
过形成
G-
四链体进行主动调控可能是一种普遍模
式。事实上,除了对基因的表达调控外,
G-
四链
体还具有许多其他复杂功能,如作为信号分子
等。然而,目前对
G-
四链体生物功能的研究主要
集中在人类基因组的端粒和少数原癌基因,绝大
多数分布于其他基因中的
G-
四链体结构和功能有
待进一步研究。由于
G-
四链体结构的稳定需要较
高浓度的
Na
+
或
K
+
,农作物的耐盐或耐旱基因是否
与
G-
四链体有关也是值得关注的对象。体内
G-
四
链体
DNA
的形成需要克服互补链的竞争,
G-
四链
体
DNA
在体内是否存在或以何种结构存在仍是
G-
· 390 ·《生命的化学》2014年34卷3期综述
四链体研究的难点。亲和分离并检测细胞或体液
中代谢的
DNA
中是否存在
G-
四链体,将可能为该
问题提供线索。另外,我们发现了包括基因中的
形成平行结构的
G-
四链体序列,具有普遍的细胞
识别和抑制肿瘤增殖活性,深入研究这些序列在
细胞内的分子识别谱,将有助于理解基因中
G-
四
链体的功能。
参 考 文 献
[1] Keniry MA. Quadruplex structures in nucleic acids. Bio-
polymers, 2000, 56: 123-146
[2] Parkinson GN, Lee MP, Neidle S. Crystal structure of
parallel quadruplexes from human telomeric DNA. Nature,
2002, 417: 876-880
[3] Gellert M, Lipsett MN, Davies DR. Helix Formation by
Guanylic Acid. Proc Natl Acad Sci USA, 1962, 48: 2013-
2018
[4] Patel DJ, Phan AT, Kuryavyi V. Human telomere, on-
cogenic promoter and 5’-UTR G-quadruplexes: diverse
higher order DNA and RNA targets for cancer therapeu-
tics. Nucleic Acids Res, 2007, 35: 7429-7455
[5] Bates PJ, Laber DA, Miller DM, et al. Discovery and
development of the G-rich oligonucleotide AS1411 as a
novel treatment for cancer. Exp Mol Pathol, 2009, 86:
151-164
[6] Do NQ, Lim KW, Teo MH, et al. Stacking of G-quadru-
plexes: NMR structure of a G-rich oligonucleotide with
potential anti-HIV and anticancer activity. Nucleic Acids
Res, 2011, 39: 9448-9457
[7] Blackburn EH, Greider CW, Szostak JW. Telomeres and
telomerase: the path from maize, Tetrahymena and yeast
to human cancer and aging. Nat Med, 2006, 12: 1133-1138
[8] Xu Y. Chemistry in human telomere biology: structure,
function and targeting of telomere DNA/RNA. Chem
Soc Rev, 2011, 40: 2719-2740
[9] Huppert JL, Balasubramanian S. Prevalence of quadru-
plexes in the human genome. Nucleic Acids Res, 2005,
33: 2908-2916
[10] Huppert JL, Balasubramanian S. G-quadruplexes in
promoters throughout the human genome. Nucleic Acids
Res, 2007, 35: 406-413
[11] Eddy J, Maizels N. Gene function correlates with poten-
tial for G4 DNA formation in the human genome. Nucleic
Acids Res, 2006, 34: 3887-3896
[12] Siddiqui-Jain A, Grand CL, Bearss DJ, et al. Direct
evidence for a G-quadruplex in a promoter region and
its targeting with a small molecule to repress c-MYC
transcription. Proc Natl Acad Sci USA, 2002, 99: 11593-
11598
[13] Eddy J, Maizels N. Conserved elements with potential to
form polymorphic G-quadruplex structures in the first in-
tron of human genes. Nucleic Acids Res, 2008, 36: 1321-
1333
[14] Bochman ML, Paeschke K, Zakian VA. DNA secondary
structures: stability and function of G-quadruplex struc-
tures. Nat Rev Genet, 2012, 13: 770-780
[15] Gray LT, Vallur AC, Eddy J, et al. G quadruplexes are
genomewide targets of transcriptional helicases XPB and
XPD. Nat Chem Biol, 2014, 10: 313-318
[16] Wu Y, Brosh RM. G-quadruplex nucleic acids and human
disease. FEBS J, 2010, 277: 3470-3488
[17] Brooks TA, Hurley LH. The role of supercoiling in tran-
scriptional control of MYC and its importance in molec-
ular therapeutics. Nat Rev Cancer, 2009, 9: 849-861
[18] Kettani A, Kumar RA, Patel DJ. Solution Structure of a
DNA quadruplex containing the fragile-X syndrome trip-
let repeat. J Mol Biol, 1995, 254: 638-656
[19] Sawaya S, Bagshaw A, Buschiazzo E, et al. Microsat-
ellite tandem repeats are abundant in human promoters
and are associated with regulatory elements. PLoS One,
2013, 8: e54710
[20] Haeusler AR, Donnelly CJ, Periz G, et al. C9orf72 nu-
cleotide repeat structures initiate molecular cascades of
disease. Nature, 2014, 507: 195-200
[21] Tlučková K, Marušič M, Tóthová P, et al. Human pap-
illomavirus G-quadruplexes. Biochemistry, 2013, 52:
7207-7216
[22] Amrane S, Kerkour A, Bedrat A, et al. Topology of a
DNA G-quadruplex structure formed in the HIV-1 pro-
moter: a potential target for anti-HIV drug development.
J Am Chem Soc, 2014, 136: 5249-5252
[23] Lexa M, Kejnovsky E, Steflova P, et al. Quadru-
plex-forming sequences occupy discrete regions inside
plant LTR retrotransposons. Nucleic Acids Res, 2014,
42: 968-978
[24] Kim J, Cheong C, Moore PB. Tetramerization of an RNA
oligonucleotide containing a GGGG sequence. Nature,
1991, 351: 331 - 332
[25] Bugaut A, Balasubramanian S. 5’-UTR RNA G-quadru-
plexes: translation regulation and targeting. Nucleic Ac-
ids Res, 2012, 40: 4727-4741
[26] Kumari S, Bugaut A, Huppert JL, et al. An RNA G-qua-
druplex in the 5’ UTR of the NRAS proto-oncogene
modulates translation. Nat Chem Biol, 2007, 3: 218-221
[27] Murat P, Zhong J, Lekieffre L, et al. G-quadruplexes
regulate Epstein-Barr virus-encoded nuclear antigen 1
mRNA translation. Nat Chem Biol, 2014, 10: 358-364
[28] Morris MJ, Negishi Y, Pazsint C, et al. An RNA G-qua-
druplex is essential for Cap-independent translation initi-
常天俊, 等. G-四链体核酸的生物学功能· 391 ·
ation in human VEGF IRES. J Am Chem Soc, 2010, 132:
17831-17839
[29] Subramanian M, Rage F, Tabet R, et al. G-quadruplex
RNA structure as a signal for neurite mRNA targeting.
Embo Rep, 2011, 12: 697-704
[30] Blice-Baum AC, Mihailescu MR. Biophysical character-
ization of G-quadruplex forming FMR1 mRNA and of
its interactions with different fragile X mental retardation
protein isoforms. RNA, 2014, 20: 103-114
[31] Joachimi A, Benz A, Hartig JS. A comparison of DNA
and RNA quadruplex structures and stabilities. Bioorg
Med Chem, 2009, 17: 6811-6815
[32] Xu Y, Ishizuka T, Yang J, et al. Oligonucleotide models
of telomeric DNA and RNA form a hybrid G-quadruplex
structure as a potential component of telomeres. J Biol
Chem, 2012, 287: 41787-41796
[33] Wanrooij PH, Uhler JP, Shi YH, et al. A hybrid G-qua-
druplex structure formed between RNA and DNA ex-
plains the extraordinary stability of the mitochondrial
R-loop. Nucleic Acids Res, 2012, 40: 10334-10344
[34] Zheng KW, Xiao S, Liu JQ, et al. Co-transcriptional for-
mation of DNA:RNA hybrid G-quadruplex and potential
function as constitutional cis element for transcription
control. Nucleic Acids Res, 2013, 41: 5533-5541
[35] Xiao S, Zhang JY, Zheng KW, et al. Bioinformatic analy-
sis reveals an evolutional selection for DNA:RNA hybrid
G-quadruplex structures as putative transcription regula-
tory elements in warm-blooded animals. Nucleic Acids
Res, 2013, 41: 10379-10390
[36] Cao ZH, Huang CC, Tan WH. Nuclease resistance of
telomere-like oligonucleotides monitored in live cells by
fluorescence anisotropy imaging. Anal Chem, 2006, 78:
1478-1484
[37] Chang TJ, Liu XJ, Cheng XH, et al. Selective isolation of
G-quadruplexes by affinity chromatography. J Chromato-
gr A, 2012, 1246: 62-68
[38] Muller S, Kumari S, Rodriguez R, et al. Small-mole-
cule-mediated G-quadruplex isolation from human cells.
Nat Chem, 2010, 2: 1095-1098
[39] Lam EY, Beraldi D, Tannahill D, et al. G-quadruplex
structures are stable and detectable in human genomic
DNA. Nat Commun, 2013, 4: 1796
[40] Biffi G, Di Antonio M, Tannahill D, et al. Visualization
and selective chemical targeting of RNA G-quadruplex
structures in the cytoplasm of human cells. Nat Chem,
2014, 6: 75-80
[41] Henderson A, Wu Y, Huang YC, et al. Detection of
G-quadruplex DNA in mammalian cells. Nucleic Acids
Res, 2014, 42: 860-869
[42]
常天俊, 龚红梅, 李卫国
.
具抗肿瘤活性的
G-
四链体核
酸研究进展
.
河南理工大学学报
(
自然科学版
), 2012,
31: 627-632
[43] Sanders PG, Cotterell J, Sharpe J, et al. Transfecting
RNA quadruplexes results in few transcriptome perturba-
tions. RNA Biol, 2013, 10: 205-210
[44] Chang TJ, Qi C, Meng J, et al. General cell-binding
activity of intramolecular G-quadruplexes with parallel
structure. PLoS One, 2013, 8: e62348
[45] Magbanua E, Zivkovic T, Hansen B, et al. d(GGGT)
4
and
r(GGGU)
4
are both HIV-1 inhibitors and interleukin-6
receptor aptamers. RNA Biol, 2013, 10: 216-227
[46] Hu J, Wu J, Li C, et al. A G-quadruplex aptamer inhibits
the phosphatase activity of oncogenic protein Shp2 in
vitro. Chembiochem, 2011, 12: 424-430
[47] Kim Y, Cao ZH, Tan WH. Molecular assembly for
high-performance bivalent nucleic acid inhibitor. P Natl
Acad Sci USA, 2008, 105: 5664-5669
[48] Yoshida W, Saito T, Yokoyama T, et al. Aptamer selec-
tion based on g4-forming promoter region. PLoS One,
2013, 8: e65497
2024年4月1日发(作者:邴雍)
生命的化学, 2014, 34(3): 385-391 常天俊, 等. 四链体核酸的生物学功能 doi: 10.13488/.20140309· 385 ·
G-四链体核酸的生物学功能
常天俊
*
,李 刚,李卫国
(河南理工大学资源环境学院,焦作 454000)
摘要:
G-
四链体是由富含鸟嘌呤的
DNA
或
RNA
折叠形成的高级结构。可形成
G-
四链体的序列在人基
因组中广泛分布,涉及
DNA
复制、端粒维持、基因表达与调控以及遗传不稳定性等过程。研究发现有
些化学合成的
G-
四链体序列也具有生物活性,如核仁素的核酸适体
AS1411
具有抑制恶性肿瘤增殖活
性。
G-
四链体的生物学功能研究对于恶性疾病的发病机理和靶向治疗,以及设计开发核酸类抗癌药物
有重要意义。
关键词:
G-
四链体;功能核酸;核酸适体;分子识别
The biological functions of G-quadruplex nucleic acids
CHANG Tianjun
*
, LI Gang, LI Weiguo
(School of Resources and Environment Engineering, He’nan Polytechnic University, Jiaozuo 454000, China)
Abstract: G-quadruplexes (G4s) are four-stranded DNA or RNA secondary structures formed in special
G-riching sequences. Putative G-quadruplex-forming sequences are highly prevalent in human genome, involved
in DNA replication, telomere maintenance, gene expression and regulation, and genetic instability. Synthetic
G-quadruplexes also have important biological functions, e.g., AS1411 is reported as an anti-nucleolin aptamer
and has cancer-selective antiproliferative activity. Therefore, studying the biological functions of G-quadruplexes
is very important for the pathogenesis and targeted therapy of malignancies, and for the design and development
of nucleic acids anti-cancer drugs.
Key Words: G-quadruplex; functional nucleic acid; aptamer; molecular recognition
G-
四链体
(G-quadruplex)
是由富含串联重复鸟
嘌呤
(G)
的
DNA
或
RNA
折叠形成的高级结构。
G-
四
分体
(G-quartet)
是四链体的结构单元,由
Hoogsteen
氢键连接
4
个
G
形成环状平面,两层或以上的四分
体通过
π
-
π
堆积形成四链体
(
图
1)
[1]
。
G-
四链体一般
需要一价阳离子如
Na
+
或
K
+
来稳定其结构
(
图
1A)
:
Na
+
位于
G-
四链体的四分体平面内,而
K
+
位于两层
四分体之间。根据
G
-
四链体主链的走向,可将其
分为平行、反平行和混合平行三种构型
(
图
1B)
[1]
。
1962
年,
Gellert
等
[3]
首次报道了
G-
四链体结
构。自
20
世纪
90
年代开始,研究人员陆续发现了
人端粒及基因启动子区以及
RNA
的
5′-UTR
存在可
形成
G-
四链体的
DNA
或
RNA
序列,参与许多重要
的生理和病理过程
[4]
。此外,人们发现化学合成的
G-
四链体也具有多种生物学活性,如抑制肿瘤增
殖活性
[5]
,抑制
1
型人类免疫缺陷性病毒整合酶
(HIV-1 integrase)
的活性
[6]
等。由于
G-
四链体具有重
要的生物功能和分子识别特性,其结构和功能研
究成为化学与生物学研究的热点。
2007
年至今,
国际上已成功举办了
4
次
G-
四链体大会,聚焦于
G-
四链体和鸟苷自组装领域的研究进展。本文主要
介绍基因中的
G-
四链体
DNA
和
RNA
,以及化学合
收稿日期:2013-09-22
基金项目:北京分子科学国家实验室开放课题基金(2012年度);河南省教育厅科学技术研究重点项目(13A180328)
*通信作者:E-mail: changtj@
· 386 ·《生命的化学》2014年34卷3期综述
(A)G-
四分体
(
左
)
和
G-
四链体
(
右
)
。图中灰色或黑色球为一价阳离子;右图为人端粒
G-
四链体在
K
+
条件下的晶体结构
[2]
。
(B)G-
四链体的拓扑
结构:平行
(
左
)
、反平行
(
中
)
和混合平行
(
右
)
。
图
1
G-
四链体及其拓扑结构
[1,2]
成的
G-
四链体的生物功能,并简要介绍我们在
G-
四链体领域的研究进展。
形成
G-
四链体,需要解旋酶将它们解链。已发现
的能解链
G-
四链体的解旋酶大多数与遗传不稳定
的人类疾病有关,包括
RecQ
解旋酶
WRN(
与早老
病相关
)
和
BLM(
增加患癌风险
)
,以及
FANCJ(
增加
患癌风险
)
和
PIF1(
增加患癌风险
)
[14]
。最近,
Gray
等
[15]
发现转录解旋酶
XPB
和
XPD
在基因组中的结
合位点有
40%
与形成
G-
四链体的序列重叠,这些
解旋酶为以
G-
四链体为靶的癌症治疗策略提供了
新途径。此外,许多核蛋白在体外能选择性结合
G-
四链体,如核蛋白
Ku70/Ku86
及核内不均一核糖
核蛋白
1(heterogeneous nuclear ribonucleoprotein A1,
HNRNPA1)
等均能结合原癌基因
KRAS
启动子区的
G-
四链体序列,且
HNRNPA1
能解链
G-
四链体
DNA
,激活
KRAS
的转录
[16]
;核仁素是在细胞核中
表达的重要蛋白质,也能高亲和力地结合
c-Myc
启
动子区的
G-
四链体序列,且能抑制有该启动子控
制的基因表达
[16]
。这些研究表明,基因可通过形
成
G-
四链体结构,并在一系列
G-
四链体结合蛋白
的作用下来调节其复制或转录。
Brooks
等
[17]
总结发现,在癌的转化和恶性增
殖期间,
6
个关键的细胞和微环境过程中关键基因
的核心区或启动子区都有能形成
G-
四链体的序列
(
图
2)
。这些发现,对研究和发现新的受
G-
四链体
调节功能的基因有重要指导意义。由于与癌症的
密切联系,基因启动子
G-
四链体序列已成为抗癌
药物开发的重要靶点。
1 体内G-四链体核酸的生物学功能
1.1 基因中的G-四链体DNA的生物学功能
20
世纪
90
年代以来,人们发现端粒重复序列
能形成
G-
四链体结构,对维持染色体稳定有重要
作用,且与癌症发生、发展密切相关
[7]
。目前已有
文献综述了端粒
G-
四链体的功能
[8]
,本文主要探讨
基因中
G-
四链体的功能。科学家们利用生物信息
学手段,发现人类基因组中有近
300 000
个能形成
G-
四链体的序列
[9]
,
40%
以上的人类基因组启动子
区域含有
1
个或
1
个以上
G-
四链体序列
[10]
。但形成
G-
四链体的序列在肿瘤抑制基因中很少,而在促
进肿瘤发生或增殖的原癌基因中比例很高,可能
影响基因表达或导致基因组不稳定
[11]
。如原癌基
因
c-Myc
启动子区的
G-
四链体序列发生突变,可破
坏
G-
四链体的结构,使该基因转录活性提高
3
倍,
而稳定
G-
四链体结构的小分子则抑制该基因的转
录
[12]
。研究还发现转录起始位点
(2 kb
内
)
的上下游
序列都有富含
G
的序列,上游富
G
序列已被证实为
在双链中起调节作用的元件,如发生甲基化的
CpG
岛以及转录因子识别位点;而下游富
G
序列主
要在非模板链,位于第一个基因内含子内,有
16%
与已知的基因表达调控规律不同
[13]
。
这些富
G
序列,在
DNA
复制或转录过程中可
常天俊, 等. G-四链体核酸的生物学功能· 387 ·
图2 癌症的6个特点与对应基因启动子区域形成G-四链体的关联性
[17]
除原癌基因启动子区外,科学家还发现很多其
它基因存在可形成
G-
四链体的序列,如脆性
X
综合
征
(fragile-x syndrome)
基因
[18]
、人基因启动子微卫
星区的重复序列
[19]
、肌萎缩性脊髓侧索硬化症和额
颞痴呆相关基因
C9orf72
的
6
碱基重复区域
(GGGG-
CC)
n
[20]
,人乳头瘤病毒
(human papilloma virus, HPV)
基因组
[21]
、
HIV-1
病毒启动子区域的富
G
序列
(
HIV-
PRO1
)
[22]
等。最近,
Lexa
等
[23]
发现植物逆转录转座
子的长末端重复序列
(LTR)
存在能形成
G-
四链体的
序列,分布于启动子的上下游区域,其中上游多
在
DNA
负链,下游多在
DNA
正链上,表明这些序
列可在转录和转录后加工水平起作用。我们也尝
试开展玉米基因组中
G-
四链体序列分布规律的研
究,发现
G-
四链体序列分布密度少于人类基因
组,但在某些基因中分布相对集中,提示这些序
列可能与基因功能有关。迄今为止,科学家已发
现大量基因中存在
G-
四链体,但仅有少数基因中
G-
四链体的功能得到详细研究,研究对象也集中
在人类基因组中的
G-
四链体,对于其它生物基因
组中的
G-
四链体研究相对较少。
一段含有
UG
4
U
的
19
个碱基能被
K
+
稳定形成
G-
四链
体
[24]
。
Bugaut
等
[25]
发现由
RNA
聚合酶
II
转录端粒富
C
链产生的富
G
序列能形成
RNA G-
四链体,这个
G-
四链体
RNA
研究中的重要进展,使得
G-
四链体
RNA
开始引起了科学家的关注。
基因中存在大量的
G-
四链体
DNA
序列,那
么,由基因转录产生的富
G RNA
是否也能形成
RNA G-
四链体?
2007
年,
Kumari
等
[26]
发现原癌基
因
NRAS
的
5′-UTR
的富
G
序列能形成稳定的
G-
四链
体
RNA
结构,稳定
G-
四链体的小分子可抑制该蛋
白的表达;在人类转录组的
5′-UTR
区域中,有大
约
3 000
个包含
1
个或
1
个以上
G-
四链体形成序列,
其中还包括除
NRAS
外的其他几个原癌基因。与全
转录组相比,
G-
四链体
RNA
形成序列集中分布于
人类基因的
5′-UTR
区,拟南芥
(Arabidopsis thaliana)
转录组中可形成
G-
四链体的
RNA
序列分布规律与
之相似
[25]
。
目前,文献已报道了不少分布在基因的
5′-UTR
区的富
G
序列形成稳定
RNA G-
四链体结构,可抑
制基因的表达,如人
Zic-1
、基质金属蛋白酶
MT3-
MMP
、雌激素受体
ESR1
、凋亡调节因子
BCL2
以及
端粒保护蛋白
TRF2
等基因
[25]
。用反义核酸破坏
mRNA
的
G-
四链体结构,则能上调相应
mRNA
的翻
1.2 G-四链体RNA的生物学功能
富
G
的
RNA
序列也能形成稳定的
G-
四链体结
构。早在
1991
年人们就发现了大肠杆菌
5S RNA
的
· 388 ·《生命的化学》2014年34卷3期综述
译
[27]
。因此,位于疾病相关基因
5′-UTR
区的
G-
四
链体形成序列也是抗癌药物设计的重要靶标。除
了具有调节基因表达功能外,人们还发现有的
RNA G-
四链体能起到翻译起始或神经突定位信号
分子的功能
[28,29]
。
相对于
G-
四链体
DNA
,
G-
四链体
RNA
结合蛋
白的报道较少。
FMRP
蛋白家族是目前研究较多的
G-
四链体
RNA
结合蛋白,该蛋白质可结合
5′-UTR
区的
G-
四链体
RNA
,并抑制其翻译
[25,30]
。
RNA
解
旋酶
RHAU
也可在体外高亲和力地结合
G-
四链体
RNA
,且具有高效的
G-
四链体解旋能力,细胞水
平的研究也表明
G-
四链体
RAN
是胞内
RHAU
解旋
酶作用的靶分子
[26]
。
与基因组中
G-
四链体
DNA
相比,
G-
四链体
RNA
在体内缺少互补链竞争,且在热力学上比同
序列的
DNA
更稳定
[31]
,因此,
G-
四链体
RNA
更有
可能在体内自组装成
G-
四链体结构,执行相应的
生物功能。
G-
四链体
RNA
的研究将成为
G-
四链体
研究的另一热点。
1.3 DNA:RNA杂合G-四链体的生物学功能
两个或两个以上的富
G
核酸序列通过
Hoog-
steen
氢键可形成分子间
G-
四链体
(intermolecular
G-quadruplex)
,其中
DNA
与
RNA
之间可形成杂合
的分子间
G-
四链体。
Xu
等
[32]
发现人端粒
RNA
与
DNA
序列能形成杂合的分子间
G-
四链体,可抑制
染色体末端融合和抑制细胞衰老,进而对端粒起
保护作用。科学家还发现转录产生的富
G RNA
可
与非模板链的富
G DNA
作用,形成杂合
G-
四链
体,可作为
DNA
复制或转录的调控元件
[33,34]
。
Xiao
等
[35]
研究发现,能形成杂合
G-
四链体的序列在真
核生物基因组中非常普遍;从温血动物中的两栖
动物开始,这样的序列就集中分布在紧邻转录起
始位点下游
1 000
个核苷酸的区域,表明具有潜在
的转录调控功能。这些序列具有强烈的偏好分布
在转录的非模板链上,与
Eddy
等
[13]
发现的可形成
分子内
G-
四链体的序列分布规律相吻合,但转录
中可形成杂合
G-
四链体的序列远比后者更为普遍
和丰富
[35]
。该研究结果提示:形成
DNA:RNA
杂合
的分子间
G-
四链体
(
而不是分子内
G-
四链体
)
更有可
能是
G-
四链体调控基因复制或转录的结构模式。
然而,在低等的鱼类和后生动物基因组中,能形
成杂合
G-
四链体的序列在模板链分布较多,与哺
乳动物等高等的温血动物相反,表明形成杂合
G-
四链体调控
DNA
转录可能是进化的选择。该研究
从进化生物学的角度理解
G-
四链体序列在基因组
中的分布及功能,为
G-
四链体生物学研究指明了
一个新的方向。
1.4 G-四链体的分离与活体检测
G-
四链体还具有很强的抗核酸酶活性
[36]
,暗
示体内核酸代谢后,有可能存在较高丰度的
G-
四
链体序列。由于
G-
四链体与很多疾病密切相关,
若能在血液或体液中发现
G-
四链体,并阐明是否
与疾病有关,对于疾病的诊断将有重要意义。事
实上,
G-
四链体是否真实存在于体内一直是
G-
四
链体生物学研究要解决的问题。选择性分离并检
测到生物体内存在
G-
四链体,将为证实这些猜测
提供坚实的证据。本课题组
[37]
和
Balasubramanian
课题组
[38]
利用特异性识别
G-
四链体的小分子探针作
为亲和配基,尝试用亲和方法分离
G-
四链体核酸,
并初步建立了复杂体系中
G-
四链体的选择性富集分
离方法。
Balasubramanian
课题组在细胞水平对
G-
四
链体进行了系统研究,用
G-
四链体
DNA
的抗体
hf2
从癌细胞中分离和检测
G-
四链体
DNA
,证实了
G-
四链体在人基因组中稳定存在且可检测
[39]
;用
G-
四
链体
RNA
的抗体
BG4
对细胞质中的
G-
四链体
RNA
进行成像
[40]
。
Henderson
等
[41]
也开发了能特异性识
别
G-
四链体
DNA
的抗体
1H6
,可用于哺乳动物细
胞中
G-
四链体的检测。但能否从血液或体液中分
离并检测代谢的
G-
四链体,尚未有文献报道。
2 化学合成G-四链体核酸的生物学功能
2.1 抗肿瘤增殖活性
科学家们研究核酸药物时,发现了化学合成的
G-
四链体在体内也具有多种生物学活性。我们已对
G-
四链体核酸的抗肿瘤增殖活性进行了综述
[42]
,这
里不再赘述。目前研究的抗肿瘤增殖的
G-
四链体
核酸多为
DNA
分子。
Sanders
等
[43]
研究了
G-
四链体
RNA
的生物学活性,发现其转染入
HEK293
细胞,
不影响细胞活力,但上调了
EGFR1
和
FOS
基因的
表达。该研究结果虽然指出
G-
四链体
RNA
不影响
正常细胞活力,但并不清楚是否能抑制肿瘤增
殖。
常天俊, 等. G-四链体核酸的生物学功能· 389 ·
2.2 细胞识别活性
外源
G-
四链体核酸若能选择性结合肿瘤细
胞,并被细胞选择性摄取,将对于肿瘤的靶向治
疗有重要意义。最近,我们系统比较了
G-
四链体
DNA
序列
(
包括
AS1411)
与多种细胞的识别特征,
发现形成平行结构的
G-
四链体,包括核酸适体、
基因启动子序列及设计的
G-
四链体序列,具有普
遍的细胞识别活性,对很多肿瘤细胞系以及正常
细胞系有很强的结合能力,但不结合
Jurkat E6-
1(
一株白血病细胞系
)
;而不形成
G-
四链体的序列
或者反平行
G-
四链体结构的序列,对这些细胞结
合能力很弱。同时,我们发现具有不同
loop
组成的
平行
G-
四链体也有不同的细胞结合能力。我们推
测平行的
G-
四链体结构模块是其分子识别的基
础,而
loop
组成对其亲和力有重要作用。通过进一
步研究,我们发现
G-
四链体核酸能被细胞选择性
摄取,但不依赖于与细胞的结合,表明这些
G-
四
链体核酸的内吞并非由受体介导;并且我们发现
包括基因中
G-
四链体序列在内的多个
G-
四链体序
列都有抑制肿瘤增殖活性
[44]
。目前,
AS1411
作为
核仁素核酸适体在靶向肿瘤细胞的药物运输、成
像以及细胞捕获释放等领域有较多应用。然而,
我们发现了其对有些正常细胞
(
如胚肾成纤维细胞
HEK293)
也有很强的结合能力,提示该核酸的上
述应用存在一定的风险。
2.3 蛋白质识别活性
除了抗肿瘤增殖活性外,有些
G-
四链体
DNA(
如
T30923)
还具有抑制
HIV-1
整合酶的功能,
可抑制
HIV
感染
[6]
。
Magbanua
等
[45]
通过体外筛选
(systematic evolution of ligands by exponential en-
richment, SELEX)
得到了高亲和力结合白介素
-6
受
体
(interleukin 6 receptor, IL-6R)
的核酸适体
AID-1
[d(G3T)4]
,其与
T30923
序列相同,也能以
G-
四链
体结构与
IL-6R
结合;而且同样序列的
RNA
也能以
G-
四链体结构结合
IL-6R
,而且这两个序列都具有
HIV-1
整合酶抑制剂的功能,也能抑制
HIV
感染。
说明
G-
四链体与这些蛋白的识别具有结构或序列
选择性,且与核酸中核糖组成关系不大。有意思的
是,不少通过
SELEX
技术筛选得到的核酸适体能
形成
G-
四链体结构,如癌蛋白
Shp2
[46]
、凝血酶
[47]
等
的核酸适体与靶蛋白结合可抑制蛋白质的功能。
由于许多蛋白质的核酸适体能形成
G-
四链体结
构,
Yoshida
等
[48]
认为
G-
四链体结构是极佳的核酸
适体与靶蛋白识别的结构元件;此外,由于胰岛
素基因启动子区
G-
四链体序列能结合胰岛素,他
们提出了基因启动子区域的
G-
四链体可作为其表
达蛋白质的核酸适体的猜测,并设计了“基于
G-
四链体启动子的核酸适体筛选”方法,发现几个
其他基因启动子区的
G-
四链体序列的确可识别其
表达的蛋白质分子。基因启动子的
G-
四链体能结
合其表达产物可能是一种对基因表达的反馈调控
模式,该发现为
G-
四链体在体内功能研究提供了
新思路。
外源
G-
四链体核酸具有多种生物功能,是治
疗人类重大疾病如癌症、艾滋病等的潜在药物,
因此挑选有代表性的
G-
四链体核酸序列,深入研
究其在体内的分子识别谱,对于理解其在体内如
何行使功能,以及设计和开发
G-
四链体核酸药物
有重要意义。而且外源
G-
四链体在体内的分子识
别谱研究,对于理解基因组中
G-
四链体序列的功
能也有重要的指导意义。
3 小结
G-
四链体与双链核酸不同,可通过链内或链
间
G
碱基的相互识别自发折叠形成高级结构。在生
命过程中,基因可通过形成
DNA
、
RNA
以及
DNA:RNA
杂合的
G-
四链体,在复制、转录及翻译
等水平主动调节其表达。生物信息学方法被引入
G-
四链体研究中,使人们发现到从低等生物到高
等动物的基因中都存在大量
G-
四链体序列,并且
有些已被证实调节基因的表达,这表明了基因通
过形成
G-
四链体进行主动调控可能是一种普遍模
式。事实上,除了对基因的表达调控外,
G-
四链
体还具有许多其他复杂功能,如作为信号分子
等。然而,目前对
G-
四链体生物功能的研究主要
集中在人类基因组的端粒和少数原癌基因,绝大
多数分布于其他基因中的
G-
四链体结构和功能有
待进一步研究。由于
G-
四链体结构的稳定需要较
高浓度的
Na
+
或
K
+
,农作物的耐盐或耐旱基因是否
与
G-
四链体有关也是值得关注的对象。体内
G-
四
链体
DNA
的形成需要克服互补链的竞争,
G-
四链
体
DNA
在体内是否存在或以何种结构存在仍是
G-
· 390 ·《生命的化学》2014年34卷3期综述
四链体研究的难点。亲和分离并检测细胞或体液
中代谢的
DNA
中是否存在
G-
四链体,将可能为该
问题提供线索。另外,我们发现了包括基因中的
形成平行结构的
G-
四链体序列,具有普遍的细胞
识别和抑制肿瘤增殖活性,深入研究这些序列在
细胞内的分子识别谱,将有助于理解基因中
G-
四
链体的功能。
参 考 文 献
[1] Keniry MA. Quadruplex structures in nucleic acids. Bio-
polymers, 2000, 56: 123-146
[2] Parkinson GN, Lee MP, Neidle S. Crystal structure of
parallel quadruplexes from human telomeric DNA. Nature,
2002, 417: 876-880
[3] Gellert M, Lipsett MN, Davies DR. Helix Formation by
Guanylic Acid. Proc Natl Acad Sci USA, 1962, 48: 2013-
2018
[4] Patel DJ, Phan AT, Kuryavyi V. Human telomere, on-
cogenic promoter and 5’-UTR G-quadruplexes: diverse
higher order DNA and RNA targets for cancer therapeu-
tics. Nucleic Acids Res, 2007, 35: 7429-7455
[5] Bates PJ, Laber DA, Miller DM, et al. Discovery and
development of the G-rich oligonucleotide AS1411 as a
novel treatment for cancer. Exp Mol Pathol, 2009, 86:
151-164
[6] Do NQ, Lim KW, Teo MH, et al. Stacking of G-quadru-
plexes: NMR structure of a G-rich oligonucleotide with
potential anti-HIV and anticancer activity. Nucleic Acids
Res, 2011, 39: 9448-9457
[7] Blackburn EH, Greider CW, Szostak JW. Telomeres and
telomerase: the path from maize, Tetrahymena and yeast
to human cancer and aging. Nat Med, 2006, 12: 1133-1138
[8] Xu Y. Chemistry in human telomere biology: structure,
function and targeting of telomere DNA/RNA. Chem
Soc Rev, 2011, 40: 2719-2740
[9] Huppert JL, Balasubramanian S. Prevalence of quadru-
plexes in the human genome. Nucleic Acids Res, 2005,
33: 2908-2916
[10] Huppert JL, Balasubramanian S. G-quadruplexes in
promoters throughout the human genome. Nucleic Acids
Res, 2007, 35: 406-413
[11] Eddy J, Maizels N. Gene function correlates with poten-
tial for G4 DNA formation in the human genome. Nucleic
Acids Res, 2006, 34: 3887-3896
[12] Siddiqui-Jain A, Grand CL, Bearss DJ, et al. Direct
evidence for a G-quadruplex in a promoter region and
its targeting with a small molecule to repress c-MYC
transcription. Proc Natl Acad Sci USA, 2002, 99: 11593-
11598
[13] Eddy J, Maizels N. Conserved elements with potential to
form polymorphic G-quadruplex structures in the first in-
tron of human genes. Nucleic Acids Res, 2008, 36: 1321-
1333
[14] Bochman ML, Paeschke K, Zakian VA. DNA secondary
structures: stability and function of G-quadruplex struc-
tures. Nat Rev Genet, 2012, 13: 770-780
[15] Gray LT, Vallur AC, Eddy J, et al. G quadruplexes are
genomewide targets of transcriptional helicases XPB and
XPD. Nat Chem Biol, 2014, 10: 313-318
[16] Wu Y, Brosh RM. G-quadruplex nucleic acids and human
disease. FEBS J, 2010, 277: 3470-3488
[17] Brooks TA, Hurley LH. The role of supercoiling in tran-
scriptional control of MYC and its importance in molec-
ular therapeutics. Nat Rev Cancer, 2009, 9: 849-861
[18] Kettani A, Kumar RA, Patel DJ. Solution Structure of a
DNA quadruplex containing the fragile-X syndrome trip-
let repeat. J Mol Biol, 1995, 254: 638-656
[19] Sawaya S, Bagshaw A, Buschiazzo E, et al. Microsat-
ellite tandem repeats are abundant in human promoters
and are associated with regulatory elements. PLoS One,
2013, 8: e54710
[20] Haeusler AR, Donnelly CJ, Periz G, et al. C9orf72 nu-
cleotide repeat structures initiate molecular cascades of
disease. Nature, 2014, 507: 195-200
[21] Tlučková K, Marušič M, Tóthová P, et al. Human pap-
illomavirus G-quadruplexes. Biochemistry, 2013, 52:
7207-7216
[22] Amrane S, Kerkour A, Bedrat A, et al. Topology of a
DNA G-quadruplex structure formed in the HIV-1 pro-
moter: a potential target for anti-HIV drug development.
J Am Chem Soc, 2014, 136: 5249-5252
[23] Lexa M, Kejnovsky E, Steflova P, et al. Quadru-
plex-forming sequences occupy discrete regions inside
plant LTR retrotransposons. Nucleic Acids Res, 2014,
42: 968-978
[24] Kim J, Cheong C, Moore PB. Tetramerization of an RNA
oligonucleotide containing a GGGG sequence. Nature,
1991, 351: 331 - 332
[25] Bugaut A, Balasubramanian S. 5’-UTR RNA G-quadru-
plexes: translation regulation and targeting. Nucleic Ac-
ids Res, 2012, 40: 4727-4741
[26] Kumari S, Bugaut A, Huppert JL, et al. An RNA G-qua-
druplex in the 5’ UTR of the NRAS proto-oncogene
modulates translation. Nat Chem Biol, 2007, 3: 218-221
[27] Murat P, Zhong J, Lekieffre L, et al. G-quadruplexes
regulate Epstein-Barr virus-encoded nuclear antigen 1
mRNA translation. Nat Chem Biol, 2014, 10: 358-364
[28] Morris MJ, Negishi Y, Pazsint C, et al. An RNA G-qua-
druplex is essential for Cap-independent translation initi-
常天俊, 等. G-四链体核酸的生物学功能· 391 ·
ation in human VEGF IRES. J Am Chem Soc, 2010, 132:
17831-17839
[29] Subramanian M, Rage F, Tabet R, et al. G-quadruplex
RNA structure as a signal for neurite mRNA targeting.
Embo Rep, 2011, 12: 697-704
[30] Blice-Baum AC, Mihailescu MR. Biophysical character-
ization of G-quadruplex forming FMR1 mRNA and of
its interactions with different fragile X mental retardation
protein isoforms. RNA, 2014, 20: 103-114
[31] Joachimi A, Benz A, Hartig JS. A comparison of DNA
and RNA quadruplex structures and stabilities. Bioorg
Med Chem, 2009, 17: 6811-6815
[32] Xu Y, Ishizuka T, Yang J, et al. Oligonucleotide models
of telomeric DNA and RNA form a hybrid G-quadruplex
structure as a potential component of telomeres. J Biol
Chem, 2012, 287: 41787-41796
[33] Wanrooij PH, Uhler JP, Shi YH, et al. A hybrid G-qua-
druplex structure formed between RNA and DNA ex-
plains the extraordinary stability of the mitochondrial
R-loop. Nucleic Acids Res, 2012, 40: 10334-10344
[34] Zheng KW, Xiao S, Liu JQ, et al. Co-transcriptional for-
mation of DNA:RNA hybrid G-quadruplex and potential
function as constitutional cis element for transcription
control. Nucleic Acids Res, 2013, 41: 5533-5541
[35] Xiao S, Zhang JY, Zheng KW, et al. Bioinformatic analy-
sis reveals an evolutional selection for DNA:RNA hybrid
G-quadruplex structures as putative transcription regula-
tory elements in warm-blooded animals. Nucleic Acids
Res, 2013, 41: 10379-10390
[36] Cao ZH, Huang CC, Tan WH. Nuclease resistance of
telomere-like oligonucleotides monitored in live cells by
fluorescence anisotropy imaging. Anal Chem, 2006, 78:
1478-1484
[37] Chang TJ, Liu XJ, Cheng XH, et al. Selective isolation of
G-quadruplexes by affinity chromatography. J Chromato-
gr A, 2012, 1246: 62-68
[38] Muller S, Kumari S, Rodriguez R, et al. Small-mole-
cule-mediated G-quadruplex isolation from human cells.
Nat Chem, 2010, 2: 1095-1098
[39] Lam EY, Beraldi D, Tannahill D, et al. G-quadruplex
structures are stable and detectable in human genomic
DNA. Nat Commun, 2013, 4: 1796
[40] Biffi G, Di Antonio M, Tannahill D, et al. Visualization
and selective chemical targeting of RNA G-quadruplex
structures in the cytoplasm of human cells. Nat Chem,
2014, 6: 75-80
[41] Henderson A, Wu Y, Huang YC, et al. Detection of
G-quadruplex DNA in mammalian cells. Nucleic Acids
Res, 2014, 42: 860-869
[42]
常天俊, 龚红梅, 李卫国
.
具抗肿瘤活性的
G-
四链体核
酸研究进展
.
河南理工大学学报
(
自然科学版
), 2012,
31: 627-632
[43] Sanders PG, Cotterell J, Sharpe J, et al. Transfecting
RNA quadruplexes results in few transcriptome perturba-
tions. RNA Biol, 2013, 10: 205-210
[44] Chang TJ, Qi C, Meng J, et al. General cell-binding
activity of intramolecular G-quadruplexes with parallel
structure. PLoS One, 2013, 8: e62348
[45] Magbanua E, Zivkovic T, Hansen B, et al. d(GGGT)
4
and
r(GGGU)
4
are both HIV-1 inhibitors and interleukin-6
receptor aptamers. RNA Biol, 2013, 10: 216-227
[46] Hu J, Wu J, Li C, et al. A G-quadruplex aptamer inhibits
the phosphatase activity of oncogenic protein Shp2 in
vitro. Chembiochem, 2011, 12: 424-430
[47] Kim Y, Cao ZH, Tan WH. Molecular assembly for
high-performance bivalent nucleic acid inhibitor. P Natl
Acad Sci USA, 2008, 105: 5664-5669
[48] Yoshida W, Saito T, Yokoyama T, et al. Aptamer selec-
tion based on g4-forming promoter region. PLoS One,
2013, 8: e65497