2024年6月4日发(作者:出洁玉)
第26卷 第6期
2014年6月
生命科学
Chinese Bulletin of Life Sciences
Vol. 26, No. 6
Jun., 2014
DOI: 10.13376//2014082
文章编号:1004-0374(2014)06-0571-12
夏昆,教授,博士生导师。国家“973”项目首席科学家,国务院政府特
殊津贴获得者,新世纪百千万人才工程国家级人选,教育部新世纪优秀人才,
教育部创新团队带头人,美国中华医学基金会杰出教授,科技部中青年科技
创新领军人才。夏昆课题组主要致力于开展儿童孤独症的遗传基础及致病机
制研究。主要利用基因组学技术,如全基因组关联/拷贝数变异研究及重测
序等,鉴定孤独症的易感或致病基因以及相关的神经生物学通路,探索常见
变异和罕见或新发变异在孤独症发病机制中的作用。同时,利用果蝇和小鼠
等动物模型探索孤独症易感或致病基因参与疾病发生的分子致病机制和相关
的神经环路。此外,夏昆课题组还致力于某些神经精神性单基因遗传疾病的
致病基因的鉴定及发病机制研究。
孤独症的遗传病因学研究进展及基因型
-
表型关联研究计划
郭 辉
1,2
,胡正茂
1,2
,夏 昆
1,2
*
(
1
中南大学医学遗传学国家重点实验室,长沙
410078
;
2
中南大学生命科学学院,长沙
410013
)
摘 要:孤独症谱系障碍是一组严重影响儿童健康,具有高度临床和病因异质性的神经发育障碍性疾病,
其典型的临床症状包括社会交往障碍,语言交流障碍以及刻板、重复的行为。近年来依靠基因组学研究的
发展,孤独症的遗传学研究取得了巨大进展。主要体现在利用基因组学方法对大样本量的孤独症散发患者
和家系进行全基因组关联研究、拷贝数变异研究以及外显子组或全基因组测序研究,鉴定了一大批孤独症
的易感或致病基因以及位点。虽然取得了瞩目的进展,但这些研究的结果也提出了极具挑战性的问题,即
高度的遗传异质性。将对孤独症已有的遗传学研究进展做一综述,并基于已有的研究进展提出几种孤独症
的病因学模型。同时,为了解决遗传异质性的问题,提出了孤独症基因型-表型关联研究计划。这一计划
将是孤独症下一步临床遗传学研究的重点方向。
ASD
;
GPCA
;
ACGC
关键词:孤独症;遗传病因;罕见变异;常见变异;基因型
-
表型关联;
A
中图分类号:Q987;R748;R596 文献标志码:
Progress of the genetic etiology of autism spectrum disorders and
the proposed genotype and phenotype correlation project
GUO Hui
1,2
, HU Zheng-Mao
1,2
, XIA Kun
1,2
*
(1 State Key Laboratory of Medical Genetics, Central South University, Changsha 410078, China; 2 School of Life
Sciences, Central South University, Changsha 410013, China)
Abstract: Autism spectrum disorders (ASDs) are a group of neurodevelopmental disorders with impairments in
收稿日期:2014-05-22
基金项目:国家重点基础研究发展计划(“973”项目)(2012CB517902);国家自然科学基金项目(81330027,
81161120544)
*通信作者:E-mail: xiakun@
572
脑科学研究专刊第26卷
reciprocal social interaction and communication, and the presence of restricted and repetitive behaviors.
Epidemiology study has demonstrated that ASD has a high heritability. In the last decades, the genetic study of ASD
has progressed strikingly, and more than hundreds of genes or loci have been identified by large cohort studies, such
as genome wide association study, copy number variation study, whole exome or genome sequencing study.
Although the progress is striking and the achievement is fruitful, a very challenging issue was emphasized: the
extremely high genetic heterogeneity. In this paper, the recent progress of autism genetic study systematically are
reviewed, and several genetic etiology models based on the existed progress are suggested. Lastly and most
importantly, a project called “Genotype and Phenotype Correlation for Autism (GPCA)” aiming to resolve the
genetic heterogeneity problem is proposed. This proposal will be the direction of ASD genetic study in the near
future.
Key words: autism; ASD; genetic etiology; rare variant; common variant; genotype and phenotype correlation;
GPCA; ACGC
孤独症谱系障碍(
autistic spectrum disorder
,
ASD
)
是一组严重影响儿童健康,具有高度临床和病因异
质性的神经发育障碍性疾病
[1]
。
ASD
起病于婴幼儿
期,一般三岁前发病,男性发病率为女性的
4~5
倍,
其典型的临床症状包括社会交往障碍,语言交流障
碍以及刻板、重复的行为
。美国精神病学诊断手
册第四版修订版(
DSM-IV-TR
),国际疾病分类第十
版(
ICD-10
)和中国精神障碍诊断与分类标准第三版
(
CCMD-3
)将
ASD
分为五个亚类,即典型的孤独症
(
autistic disorder
)、阿斯伯格综合征(
Asperger’s
syndrome
)、其他待分类的广泛发育障碍(
pervasive
developmental disorder-not otherwise specified PDD-
NOS)
、雷特综合征(
Rett’s syndrome
)以及童年瓦解
性障碍
(childhood disintegrative disorder)
。
2013
年,
[2]
新出版的美国精神病学诊断手册第五版(
DSM-V
)
对
ASD
进行了重新定义,删除了原来的
5
种分类,
将其统一归类为孤独症谱系障碍,而且将
ASD
在
DSM-IV-TR
中的三个主要的临床症状减少到了两
个,排除了语言发育障碍,只包括社交障碍以及刻
板、重复的行为。
ASD
的患病率近年呈急剧上升趋势。美国疾
病控制中心(
CDC
)调查显示在过去
10
年的时间中
ASD
的发病率增加了
2.2
倍(图
1
)。(
2001~2010
年),
2014
年
,
美国
CDC
报道2010年每
68
个儿童中就
有1个患有
ASD
(
1.47%
)。其他国家也陆续有
ASD
2009
年,英国报道大约
64
个儿童发病率的报道:
2011
年韩国的一项
中有
1
个患有
ASD
(
1.57%
)
[3]
;
流行病学调查报道每
38
个儿童中就有一个罹患
ASD
(
2.64%
)
[4]
(图
1
)。我国缺少广泛严格的
ASD
流行病学调查,只有个别地区的零星报告:天津市
2004
年报告患病率为
1.1‰
[5]
;北京市
2007
年报
[1]
告患病率达
1.34‰
[6]
;台湾
2011
年报道的患病
率为
2.9‰
[7]
(图
1
)。国家统计局数据显示,截止
2011
年末,我国
0~14
岁的人口总数为
22 164
万。
如果按照目前各国普遍发病率计算,我国的儿童
ASD
患者约为
300
万
~600
万。这些数字显示
ASD
已成为危害严重的全球公共健康问题。
ASD
是一个累及遗传和环境病因的复杂疾病。
流行病学调查显示,遗传因素在
ASD
的发病中起
到非常重要的作用。双生子研究显示,同卵双生共
患
ASD
的几率为
60%~80%
,异卵双生的共患率为
3%~10%
。家族聚集性研究显示,同胞患
ASD
的几
率为
3%~5%
,是群体中
ASD
患病率的
50~100
倍
[8]
。
根据同卵双生、异卵双生共患的差异以及患者同胞
再患的危险度推断,
ASD
的遗传度在
90%
以上
[9]
。
因此,
ASD
的遗传学研究受到了高度重视。近
10
年来主要从经典细胞遗传学、全基因组连锁分析、
候选基因重测序和关联分析、全基因组关联分析、
全基因组拷贝数变异研究、外显子组和全基因组测
序等方面对
ASD
的遗传病因进行研究,取得了显
著进展,发现了大批易感或致病基因。
遗传变异的频率和变异对疾病(表型)的贡献
度或外显率成正比,高频率的遗传变异的效应值
(
effect size by odds ratio
)较低,因此对表型的贡献
度或外显率(
penetrance
)较小;低频率的遗传变异
的效应值较高,因此对疾病的贡献度或外显率较
[10]
大
。针对
ASD
的遗传学研究也主要集中在这种
遗传变异频率谱的两端,即罕见变异和常见风险变
异(图
2
)。下面将从高外显率的罕见变异(包括传
递的(
transmitted
)和新发的(
de novo
))以及常见风险
变异两个方面对
ASD
的遗传病因学研究进展进行
阐述,随后提出几种
ASD
的病因学模型,并探讨
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
573
蓝色线条表示1975年至2014年美国CDC报道的ASD发病率的情况。橙色方框内的数据为迄今为止报道的发病率最高的几个
地区。其中,2011年韩国的ASD流行病学调查数据显示,每38个儿童中就有1个患有ASD,这是迄今为止ASD最高的发病率报
道。中国几个地区的流行病学调查均为小范围的时点调查报告,更加严格和广泛的中国人群ASD流行病学调查研究急需出台。
图
1
不同地区
ASD
发病率
下一步
ASD
遗传学研究的方向。
与
ASD
连锁的位点几乎遍及了每一条染色体。然而,
这些位点中只有少数的几个能够在其他的独立研究
中得到重复(如
7q22-7q31
、
7q34-7q36
、
17q11-17q21
),
而且大多数连锁分析研究结果的
LOD
值并未达到
全基因组完全连锁
(LOD>3)
水平。这一方面说明这
些位点中的相关变异的外显率相对单基因遗传效应
较低,没有达到完全外显;另一方面也说明
ASD
具有高度的遗传异质性,每个遗传变异或基因只能
解释极少部分患者或家系的病因,多个不同遗传病
因的家系或同胞对降低了连锁分析的统计效能。尽
管如此,几个能够在不同小组中验证的连锁区间为
后期寻找
ASD
的候选基因提供了很好的位点,如
后期的候选重测序及细胞遗传学研究确定了连锁区
[27]
间
7q22-7q31
内的
CNTNAP2
为
ASD
的易感基因
,
该基因的敲除小鼠模型也表现出了孤独症样的行为
1
孤独症相关的罕见和新发变异的遗传学研
究进展
1.1
全基因组连锁研究定位高致病效应遗传变异的
连锁区间
连锁研究主要是利用患者同胞对或家系对疾病
的高致病效应位点进行基因组定位的一种方法。第
一篇
ASD
全基因组连锁研究的文章发表在
1998
年,
国际孤独症分子遗传学研究小组(
IMGSAC
)首次对
87
个含有孪生同胞和
12
个含有非孪生同胞的
99
个
ASD
家系进行连锁分析,在
4
、
7
、
10
、
16
、
19
和
22
号染色体上得到大于
1
的多点最大
LOD
值
[11]
。
紧接着多个研究小组利用
ASD
家系进行了全基因
组连锁分析
[12-26]
。至今,全基因组连锁研究发现了
574
脑科学研究专刊第26卷
高频率的遗传变异的效应值较低,因此对表型的贡献度或外显率较小;低频率的遗传变异的效应值较高,因此对疾病的贡献
度或外显率较大。目前针对ASD的遗传学研究主要集中在等位基因频率谱的两端。罕见变异主要是利用异常核型、拷贝数变
异、外显子组和全基因组测序的方法进行鉴定,而常见变异主要利用候选基因和全基因组关联研究的方法进行鉴定。(图片
修改自
[10]
)
图
2
遗传变异等位基因频率与遗传效应强度或外显率成正相关
学表型
[28]
。
1.2
染色体核型分析和重测序鉴定高致病效应的断
裂位点和致病基因
细胞遗传学研究表明,极少数的
ASD
患者携
带了疾病相关的异常核型,如大片段的重复或缺
失、异位和倒位等。这些罕见的携带异常核型的
患者为鉴定
ASD
高外显率的致病基因提供了特殊
的样本。通过对携带异常核型患者的断裂点定位
或候选突变筛查,已经鉴定了多个
ASD
的致病基
因,如
NLGN4
、
NLGN3
、
SHANK3
、
CNTNAP2
、
NRXN1
等
[27,29-31]
患者进行了核型筛查,发现有
10
例患者携带异常
核型,比例约为
1.4%
。经典的细胞遗传学结合新
一代的高通量测序技术为鉴定趋于单基因遗传效应
的
ASD
致病基因提供了契机。
2012
年,
Talkowski
通过对携带新发平衡异位或倒位等异常核型
的
ASD
患者和
ASD
相关的发育异常患者进行高
等
通量测序,定位了这些平衡异位或倒位的断裂位点,
这些断裂位点所累及的基因大多与神经发育相关,
如
FOXP1
、
CDKL5
、
MBD5
、
CHD8
、
ZNF507
、
TCF4
、
ZNF804A
、
PDE10A
、
GRIN2B
以及
ANK3
等。
这些基因参与的神经生物学机制的异常可能是
ASD
发生的重要分子致病机制。
1.3
全基因组拷贝数变异研究鉴定罕见和新发的拷
贝数变异
基于大样本量高通量技术的全基因组拷贝数变
异研究被认为是目前
ASD
遗传学研究最为显著的
进展。第一篇系统的对
ASD
进行拷贝数变异研究
[34]
通过分析
118
的论文发表在
2007
年。
Sebat
等
个
ASD
单患家系和
47
个多患家系以及
99
个对照
家系的全基因组拷贝数变异(copy number variation,
CNV),首次报道
ASD
与新发
CNVs
显著相关,而
[33]
。这些基因在后期大样本量的突变筛查和
拷贝数变异研究中也得到了证实。由于这些基因的
ASD
相关变异是通过异常核型的鉴定和突变筛查等
验证发现的,因此,这些基因在疾病发生中的外显
率很高,很多变异趋于单基因遗传效应,因此这些
基因也成为构建
ASD
动物模型研究其发病机制的
目标基因。近两年,已经有多篇文章报道了这些基
因的敲除小鼠模型
[28,32]
,而且大多数的小鼠模型都
表现出了一个或多个孤独症的行为学异常表型。目
前认为核型异常在
ASD
患者中所占的比例大约在
1%~3%
左右,我们的前期研究对大约
700
例
ASD
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
575
且新发
CNVs
倾向于发生在单患(
simplex family
)家
系中,多患家系(
multiplex family
)新发
CNVs
较少。
这一研究同时发现了几个
ASD
相关的拷贝数变异
[35]
发现染色体
和易感基因。
2008
年,
Weiss
等
16p11.2
区间约
500 kb
的新发拷贝数缺失和重复与
ASD
的发生相关,这一结果在多个独立的样本中
得到验证。随后,多个研究小组分别进行了大样本
量的全基因组拷贝数变异研究(表
1
),发现了多个
频发的新发缺失
/
重复位点或基因,如
7q11.23
、
15q11- 13
、
16p11.2
、
15q24
、
NRXN1
、
CNTN4
、
NLGN1
、
ASTN2
、
UBE3A
、
PARK2
、
RFWD2
、
FBXO40
、
SHANK3
、
NLGN4X
、
DPP6
、
DPP10
、
PCDH9
、
ANKRD11
、
DPYD
、
PTCHD1
、
SHANK2
、
SYNGAP1
、
DLGAP2
以及
DDX53-PTCHD1
等
[23,36-41]
。
目前为止,约
7%~20%
的
ASD
患者携带疾病相关
罕见或新发
CNVs
,这些
CNVs
几乎遍及所有的染
色体
。本实验室对
400
个中国人群的孤独症核
心家系进行了拷贝数变异研究,验证了
15q11-13
、
NRXN1
、
SHANK3
、
NLGN4X
以及
CNTN4
等多个已
经发现的罕见或新发
CNVs
,同时在
2
、
3
、
5
、
10
、
15
号等染色体发现了几个新的候选位点或基因;整
合了这几个拷贝数变异研究的结果,发现这些新发
或罕见的拷贝数变异的突变频率非常低,大多数
CNVs
只出现在一个患者中,频发的
CNVs
最多也
只能解释大约
1%
的患者。因此,罕见和新发的拷
[42]
贝数变异研究也表明
ASD
具有高度的遗传异质性。
1.4
基因组测序研究鉴定罕见和新发的单核苷酸变
异或小的插入
/
缺失
拷贝数变异研究的成果促使研究人员将
ASD
相关的变异类型缩小到了罕见或新发的单核苷酸突
变和小片段的插入或缺失。近年来,新一代高通量
测序技术被应用到复杂疾病,特别是神经精神性疾
病的遗传学研究,鉴定罕见和新发的单核苷酸变异
或小的插入
/
缺失。
2011
年,
O'Roak
等
[43]
首次通
过对
20
个
ASD
散发患者及其父母进行外显子组测
序,在
4
个患者中发现可能与
ASD
相关的新发突变,
发现了几个
ASD
候选易感基因
FOXP1
、
GRIN2B
、
SCN1A
和
LAMC3
。
2012
年,四个独立的研究小组
利用外显子组测序技术对一共
965
个
ASD
家系进
行外显子组测序发现了类似的结果,即新发变异与
ASD
发病风险显著相关,并且与患者父亲的生育年
龄成正相关
[44-47]
(表
2
),其中两个小组还发现
ASD
患者罕见传递变异的发生率与对照也存在显著性的
差异。这
4
项研究同时鉴定了几个比较可信的频
发新发变异和基因,如
CHD8
、
SCN2A
、
KATNAL2
、
NTNG1
、
POGZ
、
DYRK1A
等。随后,其中一个研
究小组对其前期发现的
44
个候选基因在
2 446
个
ASD
患者中进行突变筛查,验证了六个频发的新发
变异基因
CHD8
、
DYRK1A
、
GRIN2B
、
TBR1
、
PTEN
和
TBL1XR1
,并且发现这
6
个基因大概能够解释约
表
1
已发表的几个大样本量的拷贝数变异研究
样本来源
SFARI
SFARI
AGP
AGRE
AGRE
UToronto
AGRE and NIMH
样本数目
1 124 families
915 families
996 case VS 1 287 controls
119 simplex families
1 638 multiplex families
859 cases VS 1 409 control
1 336 cases VS 1 110 controls
427 cases VS 1 652 controls
118 simplex families
47 multiplex families
99 control families
参考文献
Sanders et al.
[36]
Levy et al.
[37]
Pinto et al.
[38]
Itsara et al.
[40]
Glessner et al.
[39]
Marshall et al.
[41]
Sebat et al.
[34]
表
2
四个大样本量的外显子组测序研究的样本描述
家系 Neale et al.
[44]
Sanders et al.
[46]
O
'
Roak et al.
[45]
Iossifov et al.
[47]
Trios
a
175 38 159 0
b
Quarters0 200 50 343
总数 175 238 209 343
注:a,核心家系,即一个患者和正常表型的父母亲;b,四人家系,即一个患者和一个未患病的同胞以及父母亲。
总数
372
593
965
576
脑科学研究专刊第26卷
1%
的
ASD
患者
[48]
。通过结合临床表型分析,他们
还发现
CHD8
和
DYRK1A
两个的突变与患者头围相
关,
CHD8
突变患者头围显著大于正常对照,而
DYRK1A
患者头围显著小于正常对照。另外,利用
这批外显子组测序的数据,
Lim
等
[49]
发现,
ASD
患者携带纯合或复合杂合的功能缺失变异是正常对
照的
2
倍,这些变异对发病风险的贡献度约为
3%
,
并且这一结果在另外一批独立的样本中得到验证。
[50]
与此同时,利用近亲结婚的特殊家系,
Yu
等
利
用外显子组测序鉴定了几个隐性遗传的
ASD
致病
AH
、
POMGNT1
)。基因(
AMT
、
PEX7
、
SYNE1
、
VPS13B
、
P
这两项研究结果说明,隐性突变在
ASD
的遗传病
因中也起到重要作用,部分患者由于某些基因的隐
性突变致病或增加了患病风险。
8 695
个病例
-
对照样本分别进行家系传递不平
衡检验和病例对照关联分析,发现染色体
5p14.1
区
域的
6
个
SNPs
与
ASD
显著相关,并且在其他两组
独立的样本中得到验证。这
6
个
SNPs
位于一个介
于神经粘附分子
CDH9
和
CDH10
之间约
100 kb
的
[25]
连锁不平衡区间。与此同时,
Weiss
等
通过对来
自
AGRE
的
1 031
个家系和来自于
NIMH
的
341
个
家系进行核心家系的传递不平衡关联分析,发现位
于染色体
5p15
区域的一个
SNP
与
ASD
显著相关,
该
SNP
位于基因
SEMA5A
和
TAS2R1
之间。基因表
达分析发现,
SEMA5A
在
ASD
患者脑中表达下降,
提示
SEMA5A
可能是
ASD
的易感基因。这两项研
究是最早的关于
ASD
的全基因组关联研究。
2010
[61]
年,
Anney
等
利用来自
AGP
的样本,通过
GWAS
发现
MACROD2
的常见变异与
ASD
显著相关。随后,
2
孤独症相关的常见变异的遗传学研究进展
常见风险变异与复杂疾病的关系主要依靠常见
变异与疾病的关联研究鉴定。在全基因组关联研究
ASD
的关联研究主要依靠功能候选策略,出现之前,
挑选
ASD
的一个或几个候选基因进行与疾病的相
关性分析。
ASD
的候选基因关联研究发现了一大批
候选易感基因,但绝大多数的阳性结果无法在其他
研究小组独立的研究样本中验证。尽管如此,
MET
、
EN2
和
CNTNAP2
这三个基因的常见变异在
多个独立的且样本量较大的研究样本中能够被重复
验证,并且功能机制研究也支持这些常见变异与
ASD
发生的关系
[51-59]
。
全基因组关联研究(
genome wide association
study, GWAS
)已经成为目前研究复杂疾病常见风险
变异的成熟方法,很多复杂疾病的
GWAS
取得了
很大进展。目前为止,国际上已经发表了
4
项大样
本量的孤独症
GWAS
(表
3
)。这
4
项研究的样本主
要来自美国的两个最大的
ASD
遗传资源样本库
(
AGRE
和
AGP
)和中国孤独症
973
项目收集的临床
[60]
通
遗传学样本库(
SKLMG
)。
2009
年,
Wang
等
过对来自于
AGRE
的
780
个家系和来自于
ACC
的
他们又对
AGP
的样本进行了第二期
GWAS
研究,
新增了
1 301
个家系。第二期样本的关联分析发现,
位于
CNTNAP2
基因内部的一个
SNP
与
ASD
的表
型达到了全基因组显著相关水平。但是新增加的样
[62]
2013
年,
本没能验证第一期中
MACROD2
的结果
。
本研究组利用中国人群的
290
个孤独症核心家系和
1 280
个病例对照样本进行了全基因组关联研究,
发现位于染色体,
1p13.2
区域的一个连锁不平衡区
间内的多个
SNP
与孤独症接近全基因组显著相关,
结合其他三个欧美人群孤独症
GWAS
数据的
META
分析发现
1p13.2
区间的多个
SNPs
达到了全基因组
显著关联水平。单体型分析和表达定量性状位点及
基因差异表达分析发现,这个区间内的几个基因
(
TRIM33
、
CSDE1
、
NRAS
、
AMPD1
)可能与孤独症
发病风险相关
[63]
。
与其他复杂疾病相比,
ASD
的全基因组关联
研究发现的风险变异似乎较少,而且不同独立研究
样本之间的结果很难重复验证。与常见风险变异相
比,
ASD
罕见和新发变异似乎在疾病的发生过程中
贡献度更大。但是,目前的
GWAS
研究都是基于
单点的关联分析,而且没有考虑环境与基因以及不
表
3
已经完成的全基因组关联研究及发现的易感位点或基因
主要样本来源
a
样本数目
b
位点或基因 参考文献
et al
.
[60]
AGRE 780 families 5p14.1/
CDH9
、
CDH10
Wang
et al
.
[25]
AGRE 1 031 families 5p15/
SEMA5A
Weiss
et al
.
[61]
MACROD2
Anney AGP Stage 1 1 558 families
et al
.
[62]
CNTNAP2
Anney AGP Stage 2 1 558+1 301 families
et al
.
[63]
SKLMG 275 trios+1 120 cc 1p13.2/
TRIM33
、
CSDE1
、
AMPD1
、
NRAS
Xia
注:a,只列出用于第一阶段discovery的样本来源;b,只列出用于第一阶段discovery的样本数目。
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
577
同基因之间的交互作用,这可能会低估了常见变异
在
ASD
发病中的作用。有研究人员利用复杂的多
位点关联研究统计模型对常见变异进行整合分析,
发现多个常见变异的累积增大了
ASD
的发病风
险
。另外,尽管
GWAS
的研究结果相互之间无
法验证,但
GWAS
研究得到的候选易感基因在罕
见变异研究中多次被发现。如已有的大样本量的拷
贝数变异研究在
ASD
患者中发现了
MACROD2
的
罕见新发拷贝数变异
[36,38]
[64]
的高外显率的罕见变异并没有表现出完全外显的现
象,如染色体
16p11.2
位点缺失和重复在极少数表
型正常的个体中也被发现
[35]
,某些大的拷贝数变异
是由正常表型的父亲或母亲传递的,如
CNTN4
[65]
。
这些现象说明除了这种具有高外显率的变异外,其
他因素也参与了孤独症表型的发生。在这其中可能
会有其他具有高外显率的罕见变异的参与(图
3
,
Model 2
),也可能存在其他的易感遗传背景或常见
风险遗传变异(图
3
,
Model 3
)。第三,尽管罕见变
异的遗传学研究已经解释了一部分患者的遗传病
因,但还有绝大部分患者的遗传病因(
~70%
)未知。
这部分患者的病因模型可能是之前的几种
Model
,
只是目前尚未发现致病或易感基因,也可能存在另
外两种病因学模型:(
1)
多个常见变异的累积导致
Model 4
);孤独症表型的发生(图
3
,(
2)
复杂的病因,
包括常见风险变异造成的遗传背景,加上环境和
/
或由环境或其他因素导致的表观遗传变异等因素等
(图
3
,
Model 5
)。当然还可能有其他未知的病因学
模型,但随着
ASD
遗传学研究的不断深入,本研
究组提出的病因学模型会逐渐被验证,新的病因学
模型也可能被逐渐揭示,各种病因学模型导致的患
者比例也会逐渐明朗。
大样本量的拷贝数变异和外显子组测序研究提
示,罕见和新发变异在
ASD
的病因中似乎起到更
为重要的作用。这将为验证
ASD
的病因学模型提
供切入点。由于罕见和新发变异具有较高的外显率,
可以先从
Model 1
、
Model 2
和
Model 3
开始,鉴定
。笔者研究小组在前期的
拷贝数变异研究中也发现一个孤独症患者携带了罕
见的拷贝数变异打断了
CHD10
基因。另外,一个
大样本量的外显子组测序研究在一个孤独症家系中
[46]
发现了
CSDE1
的一个新发终止突变
。
3
基于已有研究进展假设的几种孤独症病因
学模型
基于已有的遗传学研究进展,本研究组认为
ASD
的病因可能包括以下几个病因学模型。首先,
多种
ASD
相关的单基因综合征致病基因(如
FMR1
、
PTEN
、
TSC1
等)突变会表现出
ASD
的多
种临床表型,而这些综合征的致病基因在散发的
ASD
患者中也被发现有新发或罕见的突变。某些拷
贝数变异(如
15q11-13
拷贝数重复)和单基因新发
功能缺失突变(如
CHD8
新发框移或终止突变)的
外显率为
100%
,接近于完全外显。因此,某些染
色体拷贝数变异或单基因突变可以直接导致孤独症
表型的发生(图
3
,
Model 1
)。第二,某些极其罕见
ASD的遗传结构非常复杂,患者个体的病因学模型也很难确定。基于目前的研究进展,本研究组认为ASD的病因模型主要集
中在该图描述的5种类型。Model 1为单基因遗传模式,单个遗传变异直接导致ASD表型的发生。Model 2为two-hit或multiple-hit
模式,即两个或多个具有高致病效应的罕见变异共同导致表型发生。Model 3为一个罕见高致病效应的主效变异加上常见风
险变异的背景基因型共同导致疾病表型。Model 4为多个常见变异共同导致表型发生。Model 5为复杂的遗传病因:常见易感
变异加上环境风险因素以及表观遗传变异等共同导致了表型的发生。
图
3
假设的
ASD
病因学模型
578
脑科学研究专刊第26卷
由这
3
种模型导致的
ASD
患者。下面将要提出的
基因型
-
表型关联研究计划也需要以这
3
种模型为
出发点。
for autism, GPCA
)。
GPCA
研究计划的提出旨在解
决如何将
ASD
的遗传病因和它们表现出的不同临
床亚型进行关联研究。该计划也是国家重点基础
研究发展计划“儿童孤独症的遗传基础及其发病
的机制研究”后三年的主要研究内容之一。 本研究
组提出从两个对立但同时又互补的方向对这一计划
进行研究:即“从表型到基因型(
From Phenotype to
Genotype
)”和“从基因型到表型(
From Genotype to
Phenotype
)”(图
5
)。从表型到基因型的思路为:首
先对大样本量的
ASD
患者进行临床表型研究,分
类出不同的
ASD
临床亚型,如伴发睡眠障碍、大
头或小头畸形、代谢异常以及胃肠道共发病等,然
后针对不同的临床亚型进行高通量测序等遗传学分
析,找出相同临床表型患者可能共同的遗传病因,
例如相同基因的变异,或具有相同功能(如处于同
一个功能网络)的一组基因的变异(图
5
左);从基
因型到表型的研究思路为:首先通过新一代测序等
技术对大样本量的
ASD
患者进行外显子组或全基
因组测序,分析具有共同遗传病因的患者(如相同
基因的变异或相同生物学功能的一组基因的变异)
的表型,找出表型的共性从而对这部分患者进行临
床亚型分类(图
5
右)。
相信
GPCA
研究计划将是
ASD
遗传学研究下
4
孤独症遗传学研究的方向:基因型
-
表型关
联研究计划
毫无疑问,
ASD
的遗传学研究已经取得了巨
大成功,鉴定了超过
100
多个易感基因
[66]
。但不管
是罕见变异研究还是常见风险变异研究都提示了一
个当前急需解决而又极具挑战性的问题:高度的遗
传异质性。目前所发现的罕见或新发变异
/
基因或
位点单独最多只能够解释
1%~2%
的患者,所有已
发现的新发或罕见遗传变异也只能解释大约
30%
的
ASD
患者。高度的临床异质性是
ASD
遗传异质
性的主要原因。除核心症状外,
ASD
绝大多数还伴
发其他并发症状,如头围异常、睡眠障碍、癫痫、
[1]
胃肠道疾病、免疫失调、代谢异常等
。这些不同
的临床表型可能具有不同的遗传病因(图
4
),因此
造成了高度的遗传异质性。如
CNTNAP2
常见风险
[51,67]
,
CHD8
和
DYRK1A
变异已发现与语言发育相关
与头围大小有关
[48]
(图
4
)。为了解决
ASD
高度遗
传异质性的问题,本研究组在此提出
ASD
基因型
-
表型关联研究计划(
genotype and phenotype correlation
左侧为临床表型谱,右侧为基因型谱。关联研究已经发现
CNTNAP2
常见风险变异与ASD语言发育障碍表型相关(从临床表型
到基因型);外显子组和候选重测序发现
CHD8
和
DYRK1A
新发突变与ASD患者头围相关,
CHD8
新发突变携带患者头围显著
大于正常值,而
DYRK1A
新发突变携带患者头围显著小于正常值(从基因型到临床表型)。其他ASD合并症状,如运动异常、
癫痫、睡眠障碍以及胃肠道疾病等,可能与某个或某些特定的基因突变相关。而已经发现的ASD致病或风险变异,如15q11-
13、
SHANK3
、
GRIN2B
等可能与某个或某些特定的临床表型相关。
图
4 ASD
临床表型与基因型对应关系示意图
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
579
左侧为“从基因型到表型”研究策略:首先对大样本量的ASD患者进行临床表型研究,分类出不同的临床亚型,然后针对不
同的临床亚型进行遗传学研究,找出相同临床表型患者可能的共同遗传病因。右侧为“从表型到基因型”研究策略:首先通
过新一代测序等方法对大样本量的ASD患者进行外显子组测序,分析具有共同遗传病因患者的表型,找出表型的共性,从而
对这部分患者进行临床亚型分类。
图
5 GPCA
方案示意图
临床遗传学样本的收集覆盖了全国东(南京)、西(重庆)、南(广州、长沙)、北(黑龙江)的五个地区,长沙和北京为主要的遗传
学研究基地。随着GPCA的逐步实施,更多的临床和遗传学研究单位将不断加入这一网络,中国孤独症临床遗传学资源数据
库(Autism Clinical and Genetic Resources in China, ACGC)也将不断得到完善。
图
6
儿童孤独症
973
计划项目的临床和遗传学研究基地分布
580
脑科学研究专刊
[6]
第26卷
刘靖
,
杨晓玲
,
贾美
. 2004
年北京市
2~6
岁儿童广泛性发
育障碍的现况调查
.
中国心理卫生杂志
, 2007, 21(5):
290-3
Chien IC, Lin CH, Chou YJ, et al. Prevalence and
incidence of autism spectrum disorders among national
health insurance enrollees in Taiwan from 1996 to 2005. J
Child Neurol, 2011, 26(7): 830-4
Muhle R, Trentacoste SV, Rapin I. The genetics of autism.
Pediatrics, 2004, 113(5): e472-86
Bailey A, Le Couteur A, Gottesman I, et al. Autism as a
strongly genetic disorder: evidence from a British twin
study. Psychol Med, 1995, 25(1): 63-77
Manolio TA, Collins FS, Cox NJ, et al. Finding the
missing heritability of complex diseases. Nature, 2009,
461(7265): 747-53
A full genome screen for autism with evidence for linkage
to a region on chromosome 7q. International Molecular
Genetic Study of Autism Consortium. Hum Mol Genet,
1998, 7(3): 571-8
Barrett S, Beck JC, Bernier R, et al. An autosomal
genomic screen for autism. Collaborative linkage study of
autism. Am J Med Genet, 1999, 88(6): 609-15
Philippe A, Martinez M, Guilloud-Bataille M, et al.
Genome-wide scan for autism susceptibility genes. Paris
Autism Research International Sibpair Study. Human Mol
Genet, 1999, 8(5): 805-12
Buxbaum JD, Silverman JM, Smith CJ, et al. Evidence for
a susceptibility gene for autism on chromosome 2 and for
genetic heterogeneity. Am J Hum Genet, 2001, 68(6):
1514-20
International Molecular Genetic Study of Autism
Consortism. Further characterization of the autism
susceptibility locus AUTS1 on chromosome 7q. Hum Mol
Genet, 2001, 10(9): 973-82
Liu J, Nyholt DR, Magnussen P, et al. A genomewide
screen for autism susceptibility loci. Am J Hum Genet,
2001, 69(2): 327-40
Auranen M, Vanhala R, Varilo T, et al. A genomewide
screen for autism-spectrum disorders: evidence for a major
susceptibility locus on chromosome 3q25-27. Am J Hum
Genet, 2002, 71(4): 777-90
Badner JA, Gershon ES. Regional meta-analysis of
published data supports linkage of autism with markers on
chromosome 7. Mol Psychiatry, 2002, 7(1): 56-66
Shao Y, Raiford KL, Wolpert CM, et al. Phenotypic
homogeneity provides increased support for linkage on
chromosome 2 in autistic disorder. Am J Hum Genet,
2002, 70(4): 1058-61
Shao Y, Wolpert CM, Raiford KL, et al. Genomic screen
and follow-up analysis for autistic disorder. Am J Hum
Genet, 2002, 114(1): 99-105
Yonan AL, Alarcon M, Cheng R, et al. A genomewide
screen of 345 families for autism-susceptibility loci. Am J
Hum Genet, 2003, 73(4): 886-97
Cantor RM, Kono N, Duvall JA, et al. Replication of
autism linkage: fine-mapping peak at 17q21. Am J Hum
Genet, 2005, 76(6): 1050-6
一步的重点方向。由于
ASD
遗传病因和临床表型
具有高度的异质性,因此不管从表型到基因型还是
从基因型到表型,
GPCA
计划的顺利实施都需要收
集非常大的样本量,这要求多个
ASD
临床实验室
的共同参与。另外,这一计划需要
ASD
遗传研究
实验室和临床研究实验室的紧密结合,特别是对临
床表型的收集和分析要有规范化的标准,制定一套
对表型进行全面评估的量表,并整合脑成像、神经
电生理、生化代谢等指标开展临床亚型的分型工作。
同时,收集的患者要保证能够顺利的回访和长期跟
踪,这对从基因型到表型研究策略尤为重要。很多
表型在临床诊断时未被纳入量表,但当找到共同的
遗传病因以后重新回访,可能会发现一些表型上的
共性。
我国目前
ASD
的临床遗传学研究已逐渐与国
际接轨。临床和遗传学研究实验室也已经开展了紧
密的合作(图
6
)。下一步本研究组将努力构建中国
孤独症
GPCA
的研究网络,从正在开展的
973
项目
内的临床和遗传学研究实验室开始,逐步扩大覆盖
至全国,利用
973
项目制定的统一标准收集
ASD
的临床遗传资源并构建中国孤独症临床遗传资源
数据库(
autism clinical and genetic resources in China
,
ACGC
)。相信随着
GPCA
研究计划的实施,将会鉴
定出一批新的表型特异的
ASD
致病或易感基因,
并分类出一批新的
ASD
临床亚型。这些成果一方
面将有助于孤独症儿童的早期诊断和筛查从而进行
早期干预;另一方面,随着
ASD
遗传病因的阐明,
其分子发病机制也将逐渐被揭示,新的治疗方法也
会被不断提出,而
GPCA
研究计划的成果将对未来
不同临床亚型孤独症患者的个体化治疗起到至关重
要的作用。
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[参 考 文 献]
[1]
[2]
Lai MC, Lombardo MV, Baron-Cohen S. Autism. Lancet,
2014, 383(9920): 896-910
American Psychiatric Association. Diagnostic and
statistical manual of mental disorders[M]. 5th edn.
Arlington, VA: American Psychiatric Publishing, 2013
Baron-Cohen S, Scott FJ, Allison C, et al. Prevalence of
autism-spectrum conditions: UK school-based population
study. British J Psychiatry, 2009, 194(6): 500-9
Kim YS, Leventhal BL, Koh YJ, et al. Prevalence of
autism spectrum disorders in a total population sample.
Am J Psychiatry, 2011, 168(9): 904-12
郭荣
.
天津市
5000
名
0~6
岁儿童中儿童孤独症的流行病
学调查
.
中国临床康复
, 2004, 8(6): 1122-3
[19]
[20]
[3]
[21]
[4]
[22]
[5]
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
581
[23] Autism Genome Project Consortium, Szatmari P, Paterson
AD, et al. Mapping autism risk loci using genetic linkage
and chromosomal rearrangements. Nat Genet, 2007,
39(3): 319-28
[24] Kilpinen H, Ylisaukko-oja T, Rehnstrom K, et al. Linkage
and linkage disequilibrium scan for autism loci in an
extended pedigree from Finland. Hum Mol Genet, 2009,
18(15): 2912-21
[25] Weiss LA, Arking DE, Gene Discovery Project of Johns
Hopkins & the Autism Consortium, et al. A genome-wide
linkage and association scan reveals novel loci for autism.
Nature, 2009, 461(7265): 802-8
[26] Strom SP, Stone JL, Ten Bosch JR, et al. High-density
SNP association study of the 17q21 chromosomal region
linked to autism identifies CACNA1G as a novel
candidate gene. Mol Psychiatry, 2010, 15(10): 996-1005
[27] Bakkaloglu B, O'Roak BJ, Louvi A, et al. Molecular
cytogenetic analysis and resequencing of contactin
associated protein-like 2 in autism spectrum disorders. Am
J Hum Genet, 2008, 82(1): 165-73
[28] Penagarikano O, Abrahams BS, Herman EI, et al. Absence
of CNTNAP2 leads to epilepsy, neuronal migration
abnormalities, and core autism-related deficits. Cell, 2011,
147(1): 235-46
[29] Kim HG, Kishikawa S, Higgins AW, et al. Disruption of
neurexin 1
associated with autism spectrum disorder. Am J
Hum Genet, 2008, 82(1): 199-207
[30] Durand CM, Betancur C, Boeckers TM, et al. Mutations
in the gene encoding the synaptic scaffolding protein
SHANK3 are associated with autism spectrum disorders.
Nat Genet, 2007, 39(1): 25-7
[31] Jamain S, Quach H, Betancur C, et al. Mutations of the
X-linked genes encoding neuroligins NLGN3 and NLGN4
are associated with autism. Nat Genet, 2003, 34(1): 27-9
[32] Peca J, Feliciano C, Ting JT, et al. Shank3 mutant mice
display autistic-like behaviours and striatal dysfunction.
Nature, 2011, 472(7344): 437-42
[33] Talkowski ME, Rosenfeld JA, Blumenthal I, et al.
Sequencing chromosomal abnormalities reveals neuro-
developmental loci that confer risk across diagnostic
boundaries. Cell, 2012, 149(3): 525-37
[34] Sebat J, Lakshmi B, Malhotra D, et al. Strong association
of
de novo
copy number mutations with autism. Science,
2007, 316(5823): 445-9
[35] Weiss LA, Shen Y, Korn JM, et al. Association between
microdeletion and microduplication at 16p11.2 and
autism. New Eng J Med, 2008, 358(7): 667-75
[36] Sanders SJ, Ercan-Sencicek AG, Hus V, et al. Multiple
recurrent
de novo
CNVs, including duplications of the
7q11.23 Williams syndrome region, are strongly
associated with autism. Neuron, 2011, 70(5): 863-85
[37] Levy D, Ronemus M, Yamrom B, et al. Rare
de novo
and
transmitted copy-number variation in autistic spectrum
disorders. Neuron, 2011, 70(5): 886-97
[38] Pinto D, Pagnamenta AT, Klei L, et al. Functional impact
of global rare copy number variation in autism spectrum
disorders. Nature, 2010, 466(7304): 368-72
[39] Glessner JT, Wang K, Cai G, et al. Autism genome-wide
copy number variation reveals ubiquitin and neuronal
genes. Nature, 2009, 459(7246): 569-73
[40] Itsara A, Wu H, Smith JD, et al.
De novo
rates and
selection of large copy number variation. Genome Res,
2010, 20(11): 1469-81
[41] Marshall CR, Noor A, Vincent JB, et al. Structural
variation of chromosomes in autism spectrum disorder.
Am J Hum Genet, 2008, 82(2): 477-88
[42] Schaaf CP, Zoghbi HY. Solving the autism puzzle a few
pieces at a time. Neuron, 2011, 70(5): 806-8
[43] O'Roak BJ, Deriziotis P, Lee C, et al. Exome sequencing
in sporadic autism spectrum disorders identifies severe
de
novo
mutations. Nat Genet, 2011, 43(6): 585-9
[44] Neale BM, Kou Y, Liu L, et al. Patterns and rates of
exonic
de novo
mutations in autism spectrum disorders.
Nature, 2012, 485(7397): 242-5
[45] O'Roak BJ, Vives L, Girirajan S, et al. Sporadic autism
exomes reveal a highly interconnected protein network of
de novo
mutations. Nature, 2012, 485(7397): 246-50
[46] Sanders SJ, Murtha MT, Gupta AR, et al.
De novo
mutations revealed by whole-exome sequencing are
strongly associated with autism. Nature, 2012, 485(7397):
237-41
[47] Iossifov I, Ronemus M, Levy D, et al.
De novo
gene
disruptions in children on the autistic spectrum. Neuron,
2012, 74(2): 285-99
[48] O'Roak BJ, Vives L, Fu W, et al. Multiplex targeted
sequencing identifies recurrently mutated genes in autism
spectrum disorders. Science, 2012, 338(6114): 1619-22
[49] Lim ET, Raychaudhuri S, Sanders SJ, et al. Rare complete
knockouts in humans: population distribution and
significant role in autism spectrum disorders. Neuron,
2013, 77(2): 235-42
[50] Yu TW, Chahrour MH, Coulter ME, et al. Using whole-
exome sequencing to identify inherited causes of autism.
Neuron, 2013, 77(2): 259-73
[51] Alarcon M, Abrahams BS, Stone JL, et al. Linkage,
association, and gene-expression analyses identify
CNTNAP2 as an autism-susceptibility gene. Am J Hum
Genet, 2008, 82(1): 150-9
[52] Arking DE, Cutler DJ, Brune CW, et al. A common
genetic variant in the neurexin superfamily member
CNTNAP2 increases familial risk of autism. Am J Hum
Genet, 2008, 82(1): 160-4
[53] Benayed R, Gharani N, Rossman I, et al. Support for the
homeobox transcription factor gene ENGRAILED 2 as an
autism spectrum disorder susceptibility locus. Am J Hum
Genet, 2005, 77(5): 851-68
[54] Campbell DB, Li C, Sutcliffe JS, et al. Genetic evidence
implicating multiple genes in the MET receptor tyrosine
kinase pathway in autism spectrum disorder. Autism Res,
2008, 1(3): 159-68
[55] Jackson PB, Boccuto L, Skinner C, et al. Further evidence
that the rs1858830 C variant in the promoter region of the
MET gene is associated with autistic disorder. Autism Res,
2009, 2(4): 232-6
582
脑科学研究专刊第26卷
[56] Benayed R, Choi J, Matteson PG, et al. Autism-associated
haplotype affects the regulation of the homeobox gene,
ENGRAILED 2. Biol Psychiatry, 2009, 66(10): 911-7
[57] Sousa I, Clark TG, Toma C, et al. MET and autism
susceptibility: family and case-control studies. Eur J Hum
Genet, 2009, 17(6): 749-58
[58] Gharani N, Benayed R, Mancuso V, et al. Association of
the homeobox transcription factor, ENGRAILED 2, 3,
with autism spectrum disorder. Mol Psychiatry, 2004,
9(5): 474-84
[59] Campbell DB, Sutcliffe JS, Ebert PJ, et al. A genetic
variant that disrupts MET transcription is associated with
autism. Proc Natl Acade Sci USA, 2006, 103(45): 16834-
9
[60] Wang K, Zhang H, Ma D, et al. Common genetic variants
on 5p14.1 associate with autism spectrum disorders.
Nature, 2009, 459(7246): 528-33
[61] Anney R, Klei L, Pinto D, et al. A genome-wide scan for
common alleles affecting risk for autism. Hum Mol
Genetics, 2010, 19(20): 4072-82
[62] Anney R, Klei L, Pinto D, et al. Individual common
variants exert weak effects on the risk for autism spectrum
disorderspi. Hum Mol Genet, 2012, 21(21): 4781-92
[63] Xia K, Guo H, Hu Z, et al. Common genetic variants on
1p13.2 associate with risk of autism. Mol Psychiatry,
2013 [Epub ahead of print]
[64] Klei L, Sanders SJ, Murtha MT, et al. Common genetic
variants, acting additively, are a major source of risk for
autism. Mol Autism, 2012, 3(1): 9
[65] Roohi J, Montagna C, Tegay DH, et al. Disruption of
contactin 4 in three subjects with autism spectrum
disorder. J Med Genetics, 2009, 46(3): 176-82
[66] Betancur C. Etiological heterogeneity in autism spectrum
disorders: more than 100 genetic and genomic disorders
and still counting. Brain Res, 2011, 1380: 42-77
[67] Alarcon M, Yonan AL, Gilliam TC, et al. Quantitative
genome scan and Ordered-Subsets Analysis of autism
endophenotypes support language QTLs. Mol Psychiatry,
2005, 10(8): 747-57
2024年6月4日发(作者:出洁玉)
第26卷 第6期
2014年6月
生命科学
Chinese Bulletin of Life Sciences
Vol. 26, No. 6
Jun., 2014
DOI: 10.13376//2014082
文章编号:1004-0374(2014)06-0571-12
夏昆,教授,博士生导师。国家“973”项目首席科学家,国务院政府特
殊津贴获得者,新世纪百千万人才工程国家级人选,教育部新世纪优秀人才,
教育部创新团队带头人,美国中华医学基金会杰出教授,科技部中青年科技
创新领军人才。夏昆课题组主要致力于开展儿童孤独症的遗传基础及致病机
制研究。主要利用基因组学技术,如全基因组关联/拷贝数变异研究及重测
序等,鉴定孤独症的易感或致病基因以及相关的神经生物学通路,探索常见
变异和罕见或新发变异在孤独症发病机制中的作用。同时,利用果蝇和小鼠
等动物模型探索孤独症易感或致病基因参与疾病发生的分子致病机制和相关
的神经环路。此外,夏昆课题组还致力于某些神经精神性单基因遗传疾病的
致病基因的鉴定及发病机制研究。
孤独症的遗传病因学研究进展及基因型
-
表型关联研究计划
郭 辉
1,2
,胡正茂
1,2
,夏 昆
1,2
*
(
1
中南大学医学遗传学国家重点实验室,长沙
410078
;
2
中南大学生命科学学院,长沙
410013
)
摘 要:孤独症谱系障碍是一组严重影响儿童健康,具有高度临床和病因异质性的神经发育障碍性疾病,
其典型的临床症状包括社会交往障碍,语言交流障碍以及刻板、重复的行为。近年来依靠基因组学研究的
发展,孤独症的遗传学研究取得了巨大进展。主要体现在利用基因组学方法对大样本量的孤独症散发患者
和家系进行全基因组关联研究、拷贝数变异研究以及外显子组或全基因组测序研究,鉴定了一大批孤独症
的易感或致病基因以及位点。虽然取得了瞩目的进展,但这些研究的结果也提出了极具挑战性的问题,即
高度的遗传异质性。将对孤独症已有的遗传学研究进展做一综述,并基于已有的研究进展提出几种孤独症
的病因学模型。同时,为了解决遗传异质性的问题,提出了孤独症基因型-表型关联研究计划。这一计划
将是孤独症下一步临床遗传学研究的重点方向。
ASD
;
GPCA
;
ACGC
关键词:孤独症;遗传病因;罕见变异;常见变异;基因型
-
表型关联;
A
中图分类号:Q987;R748;R596 文献标志码:
Progress of the genetic etiology of autism spectrum disorders and
the proposed genotype and phenotype correlation project
GUO Hui
1,2
, HU Zheng-Mao
1,2
, XIA Kun
1,2
*
(1 State Key Laboratory of Medical Genetics, Central South University, Changsha 410078, China; 2 School of Life
Sciences, Central South University, Changsha 410013, China)
Abstract: Autism spectrum disorders (ASDs) are a group of neurodevelopmental disorders with impairments in
收稿日期:2014-05-22
基金项目:国家重点基础研究发展计划(“973”项目)(2012CB517902);国家自然科学基金项目(81330027,
81161120544)
*通信作者:E-mail: xiakun@
572
脑科学研究专刊第26卷
reciprocal social interaction and communication, and the presence of restricted and repetitive behaviors.
Epidemiology study has demonstrated that ASD has a high heritability. In the last decades, the genetic study of ASD
has progressed strikingly, and more than hundreds of genes or loci have been identified by large cohort studies, such
as genome wide association study, copy number variation study, whole exome or genome sequencing study.
Although the progress is striking and the achievement is fruitful, a very challenging issue was emphasized: the
extremely high genetic heterogeneity. In this paper, the recent progress of autism genetic study systematically are
reviewed, and several genetic etiology models based on the existed progress are suggested. Lastly and most
importantly, a project called “Genotype and Phenotype Correlation for Autism (GPCA)” aiming to resolve the
genetic heterogeneity problem is proposed. This proposal will be the direction of ASD genetic study in the near
future.
Key words: autism; ASD; genetic etiology; rare variant; common variant; genotype and phenotype correlation;
GPCA; ACGC
孤独症谱系障碍(
autistic spectrum disorder
,
ASD
)
是一组严重影响儿童健康,具有高度临床和病因异
质性的神经发育障碍性疾病
[1]
。
ASD
起病于婴幼儿
期,一般三岁前发病,男性发病率为女性的
4~5
倍,
其典型的临床症状包括社会交往障碍,语言交流障
碍以及刻板、重复的行为
。美国精神病学诊断手
册第四版修订版(
DSM-IV-TR
),国际疾病分类第十
版(
ICD-10
)和中国精神障碍诊断与分类标准第三版
(
CCMD-3
)将
ASD
分为五个亚类,即典型的孤独症
(
autistic disorder
)、阿斯伯格综合征(
Asperger’s
syndrome
)、其他待分类的广泛发育障碍(
pervasive
developmental disorder-not otherwise specified PDD-
NOS)
、雷特综合征(
Rett’s syndrome
)以及童年瓦解
性障碍
(childhood disintegrative disorder)
。
2013
年,
[2]
新出版的美国精神病学诊断手册第五版(
DSM-V
)
对
ASD
进行了重新定义,删除了原来的
5
种分类,
将其统一归类为孤独症谱系障碍,而且将
ASD
在
DSM-IV-TR
中的三个主要的临床症状减少到了两
个,排除了语言发育障碍,只包括社交障碍以及刻
板、重复的行为。
ASD
的患病率近年呈急剧上升趋势。美国疾
病控制中心(
CDC
)调查显示在过去
10
年的时间中
ASD
的发病率增加了
2.2
倍(图
1
)。(
2001~2010
年),
2014
年
,
美国
CDC
报道2010年每
68
个儿童中就
有1个患有
ASD
(
1.47%
)。其他国家也陆续有
ASD
2009
年,英国报道大约
64
个儿童发病率的报道:
2011
年韩国的一项
中有
1
个患有
ASD
(
1.57%
)
[3]
;
流行病学调查报道每
38
个儿童中就有一个罹患
ASD
(
2.64%
)
[4]
(图
1
)。我国缺少广泛严格的
ASD
流行病学调查,只有个别地区的零星报告:天津市
2004
年报告患病率为
1.1‰
[5]
;北京市
2007
年报
[1]
告患病率达
1.34‰
[6]
;台湾
2011
年报道的患病
率为
2.9‰
[7]
(图
1
)。国家统计局数据显示,截止
2011
年末,我国
0~14
岁的人口总数为
22 164
万。
如果按照目前各国普遍发病率计算,我国的儿童
ASD
患者约为
300
万
~600
万。这些数字显示
ASD
已成为危害严重的全球公共健康问题。
ASD
是一个累及遗传和环境病因的复杂疾病。
流行病学调查显示,遗传因素在
ASD
的发病中起
到非常重要的作用。双生子研究显示,同卵双生共
患
ASD
的几率为
60%~80%
,异卵双生的共患率为
3%~10%
。家族聚集性研究显示,同胞患
ASD
的几
率为
3%~5%
,是群体中
ASD
患病率的
50~100
倍
[8]
。
根据同卵双生、异卵双生共患的差异以及患者同胞
再患的危险度推断,
ASD
的遗传度在
90%
以上
[9]
。
因此,
ASD
的遗传学研究受到了高度重视。近
10
年来主要从经典细胞遗传学、全基因组连锁分析、
候选基因重测序和关联分析、全基因组关联分析、
全基因组拷贝数变异研究、外显子组和全基因组测
序等方面对
ASD
的遗传病因进行研究,取得了显
著进展,发现了大批易感或致病基因。
遗传变异的频率和变异对疾病(表型)的贡献
度或外显率成正比,高频率的遗传变异的效应值
(
effect size by odds ratio
)较低,因此对表型的贡献
度或外显率(
penetrance
)较小;低频率的遗传变异
的效应值较高,因此对疾病的贡献度或外显率较
[10]
大
。针对
ASD
的遗传学研究也主要集中在这种
遗传变异频率谱的两端,即罕见变异和常见风险变
异(图
2
)。下面将从高外显率的罕见变异(包括传
递的(
transmitted
)和新发的(
de novo
))以及常见风险
变异两个方面对
ASD
的遗传病因学研究进展进行
阐述,随后提出几种
ASD
的病因学模型,并探讨
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
573
蓝色线条表示1975年至2014年美国CDC报道的ASD发病率的情况。橙色方框内的数据为迄今为止报道的发病率最高的几个
地区。其中,2011年韩国的ASD流行病学调查数据显示,每38个儿童中就有1个患有ASD,这是迄今为止ASD最高的发病率报
道。中国几个地区的流行病学调查均为小范围的时点调查报告,更加严格和广泛的中国人群ASD流行病学调查研究急需出台。
图
1
不同地区
ASD
发病率
下一步
ASD
遗传学研究的方向。
与
ASD
连锁的位点几乎遍及了每一条染色体。然而,
这些位点中只有少数的几个能够在其他的独立研究
中得到重复(如
7q22-7q31
、
7q34-7q36
、
17q11-17q21
),
而且大多数连锁分析研究结果的
LOD
值并未达到
全基因组完全连锁
(LOD>3)
水平。这一方面说明这
些位点中的相关变异的外显率相对单基因遗传效应
较低,没有达到完全外显;另一方面也说明
ASD
具有高度的遗传异质性,每个遗传变异或基因只能
解释极少部分患者或家系的病因,多个不同遗传病
因的家系或同胞对降低了连锁分析的统计效能。尽
管如此,几个能够在不同小组中验证的连锁区间为
后期寻找
ASD
的候选基因提供了很好的位点,如
后期的候选重测序及细胞遗传学研究确定了连锁区
[27]
间
7q22-7q31
内的
CNTNAP2
为
ASD
的易感基因
,
该基因的敲除小鼠模型也表现出了孤独症样的行为
1
孤独症相关的罕见和新发变异的遗传学研
究进展
1.1
全基因组连锁研究定位高致病效应遗传变异的
连锁区间
连锁研究主要是利用患者同胞对或家系对疾病
的高致病效应位点进行基因组定位的一种方法。第
一篇
ASD
全基因组连锁研究的文章发表在
1998
年,
国际孤独症分子遗传学研究小组(
IMGSAC
)首次对
87
个含有孪生同胞和
12
个含有非孪生同胞的
99
个
ASD
家系进行连锁分析,在
4
、
7
、
10
、
16
、
19
和
22
号染色体上得到大于
1
的多点最大
LOD
值
[11]
。
紧接着多个研究小组利用
ASD
家系进行了全基因
组连锁分析
[12-26]
。至今,全基因组连锁研究发现了
574
脑科学研究专刊第26卷
高频率的遗传变异的效应值较低,因此对表型的贡献度或外显率较小;低频率的遗传变异的效应值较高,因此对疾病的贡献
度或外显率较大。目前针对ASD的遗传学研究主要集中在等位基因频率谱的两端。罕见变异主要是利用异常核型、拷贝数变
异、外显子组和全基因组测序的方法进行鉴定,而常见变异主要利用候选基因和全基因组关联研究的方法进行鉴定。(图片
修改自
[10]
)
图
2
遗传变异等位基因频率与遗传效应强度或外显率成正相关
学表型
[28]
。
1.2
染色体核型分析和重测序鉴定高致病效应的断
裂位点和致病基因
细胞遗传学研究表明,极少数的
ASD
患者携
带了疾病相关的异常核型,如大片段的重复或缺
失、异位和倒位等。这些罕见的携带异常核型的
患者为鉴定
ASD
高外显率的致病基因提供了特殊
的样本。通过对携带异常核型患者的断裂点定位
或候选突变筛查,已经鉴定了多个
ASD
的致病基
因,如
NLGN4
、
NLGN3
、
SHANK3
、
CNTNAP2
、
NRXN1
等
[27,29-31]
患者进行了核型筛查,发现有
10
例患者携带异常
核型,比例约为
1.4%
。经典的细胞遗传学结合新
一代的高通量测序技术为鉴定趋于单基因遗传效应
的
ASD
致病基因提供了契机。
2012
年,
Talkowski
通过对携带新发平衡异位或倒位等异常核型
的
ASD
患者和
ASD
相关的发育异常患者进行高
等
通量测序,定位了这些平衡异位或倒位的断裂位点,
这些断裂位点所累及的基因大多与神经发育相关,
如
FOXP1
、
CDKL5
、
MBD5
、
CHD8
、
ZNF507
、
TCF4
、
ZNF804A
、
PDE10A
、
GRIN2B
以及
ANK3
等。
这些基因参与的神经生物学机制的异常可能是
ASD
发生的重要分子致病机制。
1.3
全基因组拷贝数变异研究鉴定罕见和新发的拷
贝数变异
基于大样本量高通量技术的全基因组拷贝数变
异研究被认为是目前
ASD
遗传学研究最为显著的
进展。第一篇系统的对
ASD
进行拷贝数变异研究
[34]
通过分析
118
的论文发表在
2007
年。
Sebat
等
个
ASD
单患家系和
47
个多患家系以及
99
个对照
家系的全基因组拷贝数变异(copy number variation,
CNV),首次报道
ASD
与新发
CNVs
显著相关,而
[33]
。这些基因在后期大样本量的突变筛查和
拷贝数变异研究中也得到了证实。由于这些基因的
ASD
相关变异是通过异常核型的鉴定和突变筛查等
验证发现的,因此,这些基因在疾病发生中的外显
率很高,很多变异趋于单基因遗传效应,因此这些
基因也成为构建
ASD
动物模型研究其发病机制的
目标基因。近两年,已经有多篇文章报道了这些基
因的敲除小鼠模型
[28,32]
,而且大多数的小鼠模型都
表现出了一个或多个孤独症的行为学异常表型。目
前认为核型异常在
ASD
患者中所占的比例大约在
1%~3%
左右,我们的前期研究对大约
700
例
ASD
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
575
且新发
CNVs
倾向于发生在单患(
simplex family
)家
系中,多患家系(
multiplex family
)新发
CNVs
较少。
这一研究同时发现了几个
ASD
相关的拷贝数变异
[35]
发现染色体
和易感基因。
2008
年,
Weiss
等
16p11.2
区间约
500 kb
的新发拷贝数缺失和重复与
ASD
的发生相关,这一结果在多个独立的样本中
得到验证。随后,多个研究小组分别进行了大样本
量的全基因组拷贝数变异研究(表
1
),发现了多个
频发的新发缺失
/
重复位点或基因,如
7q11.23
、
15q11- 13
、
16p11.2
、
15q24
、
NRXN1
、
CNTN4
、
NLGN1
、
ASTN2
、
UBE3A
、
PARK2
、
RFWD2
、
FBXO40
、
SHANK3
、
NLGN4X
、
DPP6
、
DPP10
、
PCDH9
、
ANKRD11
、
DPYD
、
PTCHD1
、
SHANK2
、
SYNGAP1
、
DLGAP2
以及
DDX53-PTCHD1
等
[23,36-41]
。
目前为止,约
7%~20%
的
ASD
患者携带疾病相关
罕见或新发
CNVs
,这些
CNVs
几乎遍及所有的染
色体
。本实验室对
400
个中国人群的孤独症核
心家系进行了拷贝数变异研究,验证了
15q11-13
、
NRXN1
、
SHANK3
、
NLGN4X
以及
CNTN4
等多个已
经发现的罕见或新发
CNVs
,同时在
2
、
3
、
5
、
10
、
15
号等染色体发现了几个新的候选位点或基因;整
合了这几个拷贝数变异研究的结果,发现这些新发
或罕见的拷贝数变异的突变频率非常低,大多数
CNVs
只出现在一个患者中,频发的
CNVs
最多也
只能解释大约
1%
的患者。因此,罕见和新发的拷
[42]
贝数变异研究也表明
ASD
具有高度的遗传异质性。
1.4
基因组测序研究鉴定罕见和新发的单核苷酸变
异或小的插入
/
缺失
拷贝数变异研究的成果促使研究人员将
ASD
相关的变异类型缩小到了罕见或新发的单核苷酸突
变和小片段的插入或缺失。近年来,新一代高通量
测序技术被应用到复杂疾病,特别是神经精神性疾
病的遗传学研究,鉴定罕见和新发的单核苷酸变异
或小的插入
/
缺失。
2011
年,
O'Roak
等
[43]
首次通
过对
20
个
ASD
散发患者及其父母进行外显子组测
序,在
4
个患者中发现可能与
ASD
相关的新发突变,
发现了几个
ASD
候选易感基因
FOXP1
、
GRIN2B
、
SCN1A
和
LAMC3
。
2012
年,四个独立的研究小组
利用外显子组测序技术对一共
965
个
ASD
家系进
行外显子组测序发现了类似的结果,即新发变异与
ASD
发病风险显著相关,并且与患者父亲的生育年
龄成正相关
[44-47]
(表
2
),其中两个小组还发现
ASD
患者罕见传递变异的发生率与对照也存在显著性的
差异。这
4
项研究同时鉴定了几个比较可信的频
发新发变异和基因,如
CHD8
、
SCN2A
、
KATNAL2
、
NTNG1
、
POGZ
、
DYRK1A
等。随后,其中一个研
究小组对其前期发现的
44
个候选基因在
2 446
个
ASD
患者中进行突变筛查,验证了六个频发的新发
变异基因
CHD8
、
DYRK1A
、
GRIN2B
、
TBR1
、
PTEN
和
TBL1XR1
,并且发现这
6
个基因大概能够解释约
表
1
已发表的几个大样本量的拷贝数变异研究
样本来源
SFARI
SFARI
AGP
AGRE
AGRE
UToronto
AGRE and NIMH
样本数目
1 124 families
915 families
996 case VS 1 287 controls
119 simplex families
1 638 multiplex families
859 cases VS 1 409 control
1 336 cases VS 1 110 controls
427 cases VS 1 652 controls
118 simplex families
47 multiplex families
99 control families
参考文献
Sanders et al.
[36]
Levy et al.
[37]
Pinto et al.
[38]
Itsara et al.
[40]
Glessner et al.
[39]
Marshall et al.
[41]
Sebat et al.
[34]
表
2
四个大样本量的外显子组测序研究的样本描述
家系 Neale et al.
[44]
Sanders et al.
[46]
O
'
Roak et al.
[45]
Iossifov et al.
[47]
Trios
a
175 38 159 0
b
Quarters0 200 50 343
总数 175 238 209 343
注:a,核心家系,即一个患者和正常表型的父母亲;b,四人家系,即一个患者和一个未患病的同胞以及父母亲。
总数
372
593
965
576
脑科学研究专刊第26卷
1%
的
ASD
患者
[48]
。通过结合临床表型分析,他们
还发现
CHD8
和
DYRK1A
两个的突变与患者头围相
关,
CHD8
突变患者头围显著大于正常对照,而
DYRK1A
患者头围显著小于正常对照。另外,利用
这批外显子组测序的数据,
Lim
等
[49]
发现,
ASD
患者携带纯合或复合杂合的功能缺失变异是正常对
照的
2
倍,这些变异对发病风险的贡献度约为
3%
,
并且这一结果在另外一批独立的样本中得到验证。
[50]
与此同时,利用近亲结婚的特殊家系,
Yu
等
利
用外显子组测序鉴定了几个隐性遗传的
ASD
致病
AH
、
POMGNT1
)。基因(
AMT
、
PEX7
、
SYNE1
、
VPS13B
、
P
这两项研究结果说明,隐性突变在
ASD
的遗传病
因中也起到重要作用,部分患者由于某些基因的隐
性突变致病或增加了患病风险。
8 695
个病例
-
对照样本分别进行家系传递不平
衡检验和病例对照关联分析,发现染色体
5p14.1
区
域的
6
个
SNPs
与
ASD
显著相关,并且在其他两组
独立的样本中得到验证。这
6
个
SNPs
位于一个介
于神经粘附分子
CDH9
和
CDH10
之间约
100 kb
的
[25]
连锁不平衡区间。与此同时,
Weiss
等
通过对来
自
AGRE
的
1 031
个家系和来自于
NIMH
的
341
个
家系进行核心家系的传递不平衡关联分析,发现位
于染色体
5p15
区域的一个
SNP
与
ASD
显著相关,
该
SNP
位于基因
SEMA5A
和
TAS2R1
之间。基因表
达分析发现,
SEMA5A
在
ASD
患者脑中表达下降,
提示
SEMA5A
可能是
ASD
的易感基因。这两项研
究是最早的关于
ASD
的全基因组关联研究。
2010
[61]
年,
Anney
等
利用来自
AGP
的样本,通过
GWAS
发现
MACROD2
的常见变异与
ASD
显著相关。随后,
2
孤独症相关的常见变异的遗传学研究进展
常见风险变异与复杂疾病的关系主要依靠常见
变异与疾病的关联研究鉴定。在全基因组关联研究
ASD
的关联研究主要依靠功能候选策略,出现之前,
挑选
ASD
的一个或几个候选基因进行与疾病的相
关性分析。
ASD
的候选基因关联研究发现了一大批
候选易感基因,但绝大多数的阳性结果无法在其他
研究小组独立的研究样本中验证。尽管如此,
MET
、
EN2
和
CNTNAP2
这三个基因的常见变异在
多个独立的且样本量较大的研究样本中能够被重复
验证,并且功能机制研究也支持这些常见变异与
ASD
发生的关系
[51-59]
。
全基因组关联研究(
genome wide association
study, GWAS
)已经成为目前研究复杂疾病常见风险
变异的成熟方法,很多复杂疾病的
GWAS
取得了
很大进展。目前为止,国际上已经发表了
4
项大样
本量的孤独症
GWAS
(表
3
)。这
4
项研究的样本主
要来自美国的两个最大的
ASD
遗传资源样本库
(
AGRE
和
AGP
)和中国孤独症
973
项目收集的临床
[60]
通
遗传学样本库(
SKLMG
)。
2009
年,
Wang
等
过对来自于
AGRE
的
780
个家系和来自于
ACC
的
他们又对
AGP
的样本进行了第二期
GWAS
研究,
新增了
1 301
个家系。第二期样本的关联分析发现,
位于
CNTNAP2
基因内部的一个
SNP
与
ASD
的表
型达到了全基因组显著相关水平。但是新增加的样
[62]
2013
年,
本没能验证第一期中
MACROD2
的结果
。
本研究组利用中国人群的
290
个孤独症核心家系和
1 280
个病例对照样本进行了全基因组关联研究,
发现位于染色体,
1p13.2
区域的一个连锁不平衡区
间内的多个
SNP
与孤独症接近全基因组显著相关,
结合其他三个欧美人群孤独症
GWAS
数据的
META
分析发现
1p13.2
区间的多个
SNPs
达到了全基因组
显著关联水平。单体型分析和表达定量性状位点及
基因差异表达分析发现,这个区间内的几个基因
(
TRIM33
、
CSDE1
、
NRAS
、
AMPD1
)可能与孤独症
发病风险相关
[63]
。
与其他复杂疾病相比,
ASD
的全基因组关联
研究发现的风险变异似乎较少,而且不同独立研究
样本之间的结果很难重复验证。与常见风险变异相
比,
ASD
罕见和新发变异似乎在疾病的发生过程中
贡献度更大。但是,目前的
GWAS
研究都是基于
单点的关联分析,而且没有考虑环境与基因以及不
表
3
已经完成的全基因组关联研究及发现的易感位点或基因
主要样本来源
a
样本数目
b
位点或基因 参考文献
et al
.
[60]
AGRE 780 families 5p14.1/
CDH9
、
CDH10
Wang
et al
.
[25]
AGRE 1 031 families 5p15/
SEMA5A
Weiss
et al
.
[61]
MACROD2
Anney AGP Stage 1 1 558 families
et al
.
[62]
CNTNAP2
Anney AGP Stage 2 1 558+1 301 families
et al
.
[63]
SKLMG 275 trios+1 120 cc 1p13.2/
TRIM33
、
CSDE1
、
AMPD1
、
NRAS
Xia
注:a,只列出用于第一阶段discovery的样本来源;b,只列出用于第一阶段discovery的样本数目。
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
577
同基因之间的交互作用,这可能会低估了常见变异
在
ASD
发病中的作用。有研究人员利用复杂的多
位点关联研究统计模型对常见变异进行整合分析,
发现多个常见变异的累积增大了
ASD
的发病风
险
。另外,尽管
GWAS
的研究结果相互之间无
法验证,但
GWAS
研究得到的候选易感基因在罕
见变异研究中多次被发现。如已有的大样本量的拷
贝数变异研究在
ASD
患者中发现了
MACROD2
的
罕见新发拷贝数变异
[36,38]
[64]
的高外显率的罕见变异并没有表现出完全外显的现
象,如染色体
16p11.2
位点缺失和重复在极少数表
型正常的个体中也被发现
[35]
,某些大的拷贝数变异
是由正常表型的父亲或母亲传递的,如
CNTN4
[65]
。
这些现象说明除了这种具有高外显率的变异外,其
他因素也参与了孤独症表型的发生。在这其中可能
会有其他具有高外显率的罕见变异的参与(图
3
,
Model 2
),也可能存在其他的易感遗传背景或常见
风险遗传变异(图
3
,
Model 3
)。第三,尽管罕见变
异的遗传学研究已经解释了一部分患者的遗传病
因,但还有绝大部分患者的遗传病因(
~70%
)未知。
这部分患者的病因模型可能是之前的几种
Model
,
只是目前尚未发现致病或易感基因,也可能存在另
外两种病因学模型:(
1)
多个常见变异的累积导致
Model 4
);孤独症表型的发生(图
3
,(
2)
复杂的病因,
包括常见风险变异造成的遗传背景,加上环境和
/
或由环境或其他因素导致的表观遗传变异等因素等
(图
3
,
Model 5
)。当然还可能有其他未知的病因学
模型,但随着
ASD
遗传学研究的不断深入,本研
究组提出的病因学模型会逐渐被验证,新的病因学
模型也可能被逐渐揭示,各种病因学模型导致的患
者比例也会逐渐明朗。
大样本量的拷贝数变异和外显子组测序研究提
示,罕见和新发变异在
ASD
的病因中似乎起到更
为重要的作用。这将为验证
ASD
的病因学模型提
供切入点。由于罕见和新发变异具有较高的外显率,
可以先从
Model 1
、
Model 2
和
Model 3
开始,鉴定
。笔者研究小组在前期的
拷贝数变异研究中也发现一个孤独症患者携带了罕
见的拷贝数变异打断了
CHD10
基因。另外,一个
大样本量的外显子组测序研究在一个孤独症家系中
[46]
发现了
CSDE1
的一个新发终止突变
。
3
基于已有研究进展假设的几种孤独症病因
学模型
基于已有的遗传学研究进展,本研究组认为
ASD
的病因可能包括以下几个病因学模型。首先,
多种
ASD
相关的单基因综合征致病基因(如
FMR1
、
PTEN
、
TSC1
等)突变会表现出
ASD
的多
种临床表型,而这些综合征的致病基因在散发的
ASD
患者中也被发现有新发或罕见的突变。某些拷
贝数变异(如
15q11-13
拷贝数重复)和单基因新发
功能缺失突变(如
CHD8
新发框移或终止突变)的
外显率为
100%
,接近于完全外显。因此,某些染
色体拷贝数变异或单基因突变可以直接导致孤独症
表型的发生(图
3
,
Model 1
)。第二,某些极其罕见
ASD的遗传结构非常复杂,患者个体的病因学模型也很难确定。基于目前的研究进展,本研究组认为ASD的病因模型主要集
中在该图描述的5种类型。Model 1为单基因遗传模式,单个遗传变异直接导致ASD表型的发生。Model 2为two-hit或multiple-hit
模式,即两个或多个具有高致病效应的罕见变异共同导致表型发生。Model 3为一个罕见高致病效应的主效变异加上常见风
险变异的背景基因型共同导致疾病表型。Model 4为多个常见变异共同导致表型发生。Model 5为复杂的遗传病因:常见易感
变异加上环境风险因素以及表观遗传变异等共同导致了表型的发生。
图
3
假设的
ASD
病因学模型
578
脑科学研究专刊第26卷
由这
3
种模型导致的
ASD
患者。下面将要提出的
基因型
-
表型关联研究计划也需要以这
3
种模型为
出发点。
for autism, GPCA
)。
GPCA
研究计划的提出旨在解
决如何将
ASD
的遗传病因和它们表现出的不同临
床亚型进行关联研究。该计划也是国家重点基础
研究发展计划“儿童孤独症的遗传基础及其发病
的机制研究”后三年的主要研究内容之一。 本研究
组提出从两个对立但同时又互补的方向对这一计划
进行研究:即“从表型到基因型(
From Phenotype to
Genotype
)”和“从基因型到表型(
From Genotype to
Phenotype
)”(图
5
)。从表型到基因型的思路为:首
先对大样本量的
ASD
患者进行临床表型研究,分
类出不同的
ASD
临床亚型,如伴发睡眠障碍、大
头或小头畸形、代谢异常以及胃肠道共发病等,然
后针对不同的临床亚型进行高通量测序等遗传学分
析,找出相同临床表型患者可能共同的遗传病因,
例如相同基因的变异,或具有相同功能(如处于同
一个功能网络)的一组基因的变异(图
5
左);从基
因型到表型的研究思路为:首先通过新一代测序等
技术对大样本量的
ASD
患者进行外显子组或全基
因组测序,分析具有共同遗传病因的患者(如相同
基因的变异或相同生物学功能的一组基因的变异)
的表型,找出表型的共性从而对这部分患者进行临
床亚型分类(图
5
右)。
相信
GPCA
研究计划将是
ASD
遗传学研究下
4
孤独症遗传学研究的方向:基因型
-
表型关
联研究计划
毫无疑问,
ASD
的遗传学研究已经取得了巨
大成功,鉴定了超过
100
多个易感基因
[66]
。但不管
是罕见变异研究还是常见风险变异研究都提示了一
个当前急需解决而又极具挑战性的问题:高度的遗
传异质性。目前所发现的罕见或新发变异
/
基因或
位点单独最多只能够解释
1%~2%
的患者,所有已
发现的新发或罕见遗传变异也只能解释大约
30%
的
ASD
患者。高度的临床异质性是
ASD
遗传异质
性的主要原因。除核心症状外,
ASD
绝大多数还伴
发其他并发症状,如头围异常、睡眠障碍、癫痫、
[1]
胃肠道疾病、免疫失调、代谢异常等
。这些不同
的临床表型可能具有不同的遗传病因(图
4
),因此
造成了高度的遗传异质性。如
CNTNAP2
常见风险
[51,67]
,
CHD8
和
DYRK1A
变异已发现与语言发育相关
与头围大小有关
[48]
(图
4
)。为了解决
ASD
高度遗
传异质性的问题,本研究组在此提出
ASD
基因型
-
表型关联研究计划(
genotype and phenotype correlation
左侧为临床表型谱,右侧为基因型谱。关联研究已经发现
CNTNAP2
常见风险变异与ASD语言发育障碍表型相关(从临床表型
到基因型);外显子组和候选重测序发现
CHD8
和
DYRK1A
新发突变与ASD患者头围相关,
CHD8
新发突变携带患者头围显著
大于正常值,而
DYRK1A
新发突变携带患者头围显著小于正常值(从基因型到临床表型)。其他ASD合并症状,如运动异常、
癫痫、睡眠障碍以及胃肠道疾病等,可能与某个或某些特定的基因突变相关。而已经发现的ASD致病或风险变异,如15q11-
13、
SHANK3
、
GRIN2B
等可能与某个或某些特定的临床表型相关。
图
4 ASD
临床表型与基因型对应关系示意图
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
579
左侧为“从基因型到表型”研究策略:首先对大样本量的ASD患者进行临床表型研究,分类出不同的临床亚型,然后针对不
同的临床亚型进行遗传学研究,找出相同临床表型患者可能的共同遗传病因。右侧为“从表型到基因型”研究策略:首先通
过新一代测序等方法对大样本量的ASD患者进行外显子组测序,分析具有共同遗传病因患者的表型,找出表型的共性,从而
对这部分患者进行临床亚型分类。
图
5 GPCA
方案示意图
临床遗传学样本的收集覆盖了全国东(南京)、西(重庆)、南(广州、长沙)、北(黑龙江)的五个地区,长沙和北京为主要的遗传
学研究基地。随着GPCA的逐步实施,更多的临床和遗传学研究单位将不断加入这一网络,中国孤独症临床遗传学资源数据
库(Autism Clinical and Genetic Resources in China, ACGC)也将不断得到完善。
图
6
儿童孤独症
973
计划项目的临床和遗传学研究基地分布
580
脑科学研究专刊
[6]
第26卷
刘靖
,
杨晓玲
,
贾美
. 2004
年北京市
2~6
岁儿童广泛性发
育障碍的现况调查
.
中国心理卫生杂志
, 2007, 21(5):
290-3
Chien IC, Lin CH, Chou YJ, et al. Prevalence and
incidence of autism spectrum disorders among national
health insurance enrollees in Taiwan from 1996 to 2005. J
Child Neurol, 2011, 26(7): 830-4
Muhle R, Trentacoste SV, Rapin I. The genetics of autism.
Pediatrics, 2004, 113(5): e472-86
Bailey A, Le Couteur A, Gottesman I, et al. Autism as a
strongly genetic disorder: evidence from a British twin
study. Psychol Med, 1995, 25(1): 63-77
Manolio TA, Collins FS, Cox NJ, et al. Finding the
missing heritability of complex diseases. Nature, 2009,
461(7265): 747-53
A full genome screen for autism with evidence for linkage
to a region on chromosome 7q. International Molecular
Genetic Study of Autism Consortium. Hum Mol Genet,
1998, 7(3): 571-8
Barrett S, Beck JC, Bernier R, et al. An autosomal
genomic screen for autism. Collaborative linkage study of
autism. Am J Med Genet, 1999, 88(6): 609-15
Philippe A, Martinez M, Guilloud-Bataille M, et al.
Genome-wide scan for autism susceptibility genes. Paris
Autism Research International Sibpair Study. Human Mol
Genet, 1999, 8(5): 805-12
Buxbaum JD, Silverman JM, Smith CJ, et al. Evidence for
a susceptibility gene for autism on chromosome 2 and for
genetic heterogeneity. Am J Hum Genet, 2001, 68(6):
1514-20
International Molecular Genetic Study of Autism
Consortism. Further characterization of the autism
susceptibility locus AUTS1 on chromosome 7q. Hum Mol
Genet, 2001, 10(9): 973-82
Liu J, Nyholt DR, Magnussen P, et al. A genomewide
screen for autism susceptibility loci. Am J Hum Genet,
2001, 69(2): 327-40
Auranen M, Vanhala R, Varilo T, et al. A genomewide
screen for autism-spectrum disorders: evidence for a major
susceptibility locus on chromosome 3q25-27. Am J Hum
Genet, 2002, 71(4): 777-90
Badner JA, Gershon ES. Regional meta-analysis of
published data supports linkage of autism with markers on
chromosome 7. Mol Psychiatry, 2002, 7(1): 56-66
Shao Y, Raiford KL, Wolpert CM, et al. Phenotypic
homogeneity provides increased support for linkage on
chromosome 2 in autistic disorder. Am J Hum Genet,
2002, 70(4): 1058-61
Shao Y, Wolpert CM, Raiford KL, et al. Genomic screen
and follow-up analysis for autistic disorder. Am J Hum
Genet, 2002, 114(1): 99-105
Yonan AL, Alarcon M, Cheng R, et al. A genomewide
screen of 345 families for autism-susceptibility loci. Am J
Hum Genet, 2003, 73(4): 886-97
Cantor RM, Kono N, Duvall JA, et al. Replication of
autism linkage: fine-mapping peak at 17q21. Am J Hum
Genet, 2005, 76(6): 1050-6
一步的重点方向。由于
ASD
遗传病因和临床表型
具有高度的异质性,因此不管从表型到基因型还是
从基因型到表型,
GPCA
计划的顺利实施都需要收
集非常大的样本量,这要求多个
ASD
临床实验室
的共同参与。另外,这一计划需要
ASD
遗传研究
实验室和临床研究实验室的紧密结合,特别是对临
床表型的收集和分析要有规范化的标准,制定一套
对表型进行全面评估的量表,并整合脑成像、神经
电生理、生化代谢等指标开展临床亚型的分型工作。
同时,收集的患者要保证能够顺利的回访和长期跟
踪,这对从基因型到表型研究策略尤为重要。很多
表型在临床诊断时未被纳入量表,但当找到共同的
遗传病因以后重新回访,可能会发现一些表型上的
共性。
我国目前
ASD
的临床遗传学研究已逐渐与国
际接轨。临床和遗传学研究实验室也已经开展了紧
密的合作(图
6
)。下一步本研究组将努力构建中国
孤独症
GPCA
的研究网络,从正在开展的
973
项目
内的临床和遗传学研究实验室开始,逐步扩大覆盖
至全国,利用
973
项目制定的统一标准收集
ASD
的临床遗传资源并构建中国孤独症临床遗传资源
数据库(
autism clinical and genetic resources in China
,
ACGC
)。相信随着
GPCA
研究计划的实施,将会鉴
定出一批新的表型特异的
ASD
致病或易感基因,
并分类出一批新的
ASD
临床亚型。这些成果一方
面将有助于孤独症儿童的早期诊断和筛查从而进行
早期干预;另一方面,随着
ASD
遗传病因的阐明,
其分子发病机制也将逐渐被揭示,新的治疗方法也
会被不断提出,而
GPCA
研究计划的成果将对未来
不同临床亚型孤独症患者的个体化治疗起到至关重
要的作用。
[7]
[8]
[9]
[10]
[11]
[12]
[13]
[14]
[15]
[16]
[17]
[18]
[参 考 文 献]
[1]
[2]
Lai MC, Lombardo MV, Baron-Cohen S. Autism. Lancet,
2014, 383(9920): 896-910
American Psychiatric Association. Diagnostic and
statistical manual of mental disorders[M]. 5th edn.
Arlington, VA: American Psychiatric Publishing, 2013
Baron-Cohen S, Scott FJ, Allison C, et al. Prevalence of
autism-spectrum conditions: UK school-based population
study. British J Psychiatry, 2009, 194(6): 500-9
Kim YS, Leventhal BL, Koh YJ, et al. Prevalence of
autism spectrum disorders in a total population sample.
Am J Psychiatry, 2011, 168(9): 904-12
郭荣
.
天津市
5000
名
0~6
岁儿童中儿童孤独症的流行病
学调查
.
中国临床康复
, 2004, 8(6): 1122-3
[19]
[20]
[3]
[21]
[4]
[22]
[5]
第6期郭 辉,等:孤独症的遗传病因学研究进展及基因型-表型关联研究计划
581
[23] Autism Genome Project Consortium, Szatmari P, Paterson
AD, et al. Mapping autism risk loci using genetic linkage
and chromosomal rearrangements. Nat Genet, 2007,
39(3): 319-28
[24] Kilpinen H, Ylisaukko-oja T, Rehnstrom K, et al. Linkage
and linkage disequilibrium scan for autism loci in an
extended pedigree from Finland. Hum Mol Genet, 2009,
18(15): 2912-21
[25] Weiss LA, Arking DE, Gene Discovery Project of Johns
Hopkins & the Autism Consortium, et al. A genome-wide
linkage and association scan reveals novel loci for autism.
Nature, 2009, 461(7265): 802-8
[26] Strom SP, Stone JL, Ten Bosch JR, et al. High-density
SNP association study of the 17q21 chromosomal region
linked to autism identifies CACNA1G as a novel
candidate gene. Mol Psychiatry, 2010, 15(10): 996-1005
[27] Bakkaloglu B, O'Roak BJ, Louvi A, et al. Molecular
cytogenetic analysis and resequencing of contactin
associated protein-like 2 in autism spectrum disorders. Am
J Hum Genet, 2008, 82(1): 165-73
[28] Penagarikano O, Abrahams BS, Herman EI, et al. Absence
of CNTNAP2 leads to epilepsy, neuronal migration
abnormalities, and core autism-related deficits. Cell, 2011,
147(1): 235-46
[29] Kim HG, Kishikawa S, Higgins AW, et al. Disruption of
neurexin 1
associated with autism spectrum disorder. Am J
Hum Genet, 2008, 82(1): 199-207
[30] Durand CM, Betancur C, Boeckers TM, et al. Mutations
in the gene encoding the synaptic scaffolding protein
SHANK3 are associated with autism spectrum disorders.
Nat Genet, 2007, 39(1): 25-7
[31] Jamain S, Quach H, Betancur C, et al. Mutations of the
X-linked genes encoding neuroligins NLGN3 and NLGN4
are associated with autism. Nat Genet, 2003, 34(1): 27-9
[32] Peca J, Feliciano C, Ting JT, et al. Shank3 mutant mice
display autistic-like behaviours and striatal dysfunction.
Nature, 2011, 472(7344): 437-42
[33] Talkowski ME, Rosenfeld JA, Blumenthal I, et al.
Sequencing chromosomal abnormalities reveals neuro-
developmental loci that confer risk across diagnostic
boundaries. Cell, 2012, 149(3): 525-37
[34] Sebat J, Lakshmi B, Malhotra D, et al. Strong association
of
de novo
copy number mutations with autism. Science,
2007, 316(5823): 445-9
[35] Weiss LA, Shen Y, Korn JM, et al. Association between
microdeletion and microduplication at 16p11.2 and
autism. New Eng J Med, 2008, 358(7): 667-75
[36] Sanders SJ, Ercan-Sencicek AG, Hus V, et al. Multiple
recurrent
de novo
CNVs, including duplications of the
7q11.23 Williams syndrome region, are strongly
associated with autism. Neuron, 2011, 70(5): 863-85
[37] Levy D, Ronemus M, Yamrom B, et al. Rare
de novo
and
transmitted copy-number variation in autistic spectrum
disorders. Neuron, 2011, 70(5): 886-97
[38] Pinto D, Pagnamenta AT, Klei L, et al. Functional impact
of global rare copy number variation in autism spectrum
disorders. Nature, 2010, 466(7304): 368-72
[39] Glessner JT, Wang K, Cai G, et al. Autism genome-wide
copy number variation reveals ubiquitin and neuronal
genes. Nature, 2009, 459(7246): 569-73
[40] Itsara A, Wu H, Smith JD, et al.
De novo
rates and
selection of large copy number variation. Genome Res,
2010, 20(11): 1469-81
[41] Marshall CR, Noor A, Vincent JB, et al. Structural
variation of chromosomes in autism spectrum disorder.
Am J Hum Genet, 2008, 82(2): 477-88
[42] Schaaf CP, Zoghbi HY. Solving the autism puzzle a few
pieces at a time. Neuron, 2011, 70(5): 806-8
[43] O'Roak BJ, Deriziotis P, Lee C, et al. Exome sequencing
in sporadic autism spectrum disorders identifies severe
de
novo
mutations. Nat Genet, 2011, 43(6): 585-9
[44] Neale BM, Kou Y, Liu L, et al. Patterns and rates of
exonic
de novo
mutations in autism spectrum disorders.
Nature, 2012, 485(7397): 242-5
[45] O'Roak BJ, Vives L, Girirajan S, et al. Sporadic autism
exomes reveal a highly interconnected protein network of
de novo
mutations. Nature, 2012, 485(7397): 246-50
[46] Sanders SJ, Murtha MT, Gupta AR, et al.
De novo
mutations revealed by whole-exome sequencing are
strongly associated with autism. Nature, 2012, 485(7397):
237-41
[47] Iossifov I, Ronemus M, Levy D, et al.
De novo
gene
disruptions in children on the autistic spectrum. Neuron,
2012, 74(2): 285-99
[48] O'Roak BJ, Vives L, Fu W, et al. Multiplex targeted
sequencing identifies recurrently mutated genes in autism
spectrum disorders. Science, 2012, 338(6114): 1619-22
[49] Lim ET, Raychaudhuri S, Sanders SJ, et al. Rare complete
knockouts in humans: population distribution and
significant role in autism spectrum disorders. Neuron,
2013, 77(2): 235-42
[50] Yu TW, Chahrour MH, Coulter ME, et al. Using whole-
exome sequencing to identify inherited causes of autism.
Neuron, 2013, 77(2): 259-73
[51] Alarcon M, Abrahams BS, Stone JL, et al. Linkage,
association, and gene-expression analyses identify
CNTNAP2 as an autism-susceptibility gene. Am J Hum
Genet, 2008, 82(1): 150-9
[52] Arking DE, Cutler DJ, Brune CW, et al. A common
genetic variant in the neurexin superfamily member
CNTNAP2 increases familial risk of autism. Am J Hum
Genet, 2008, 82(1): 160-4
[53] Benayed R, Gharani N, Rossman I, et al. Support for the
homeobox transcription factor gene ENGRAILED 2 as an
autism spectrum disorder susceptibility locus. Am J Hum
Genet, 2005, 77(5): 851-68
[54] Campbell DB, Li C, Sutcliffe JS, et al. Genetic evidence
implicating multiple genes in the MET receptor tyrosine
kinase pathway in autism spectrum disorder. Autism Res,
2008, 1(3): 159-68
[55] Jackson PB, Boccuto L, Skinner C, et al. Further evidence
that the rs1858830 C variant in the promoter region of the
MET gene is associated with autistic disorder. Autism Res,
2009, 2(4): 232-6
582
脑科学研究专刊第26卷
[56] Benayed R, Choi J, Matteson PG, et al. Autism-associated
haplotype affects the regulation of the homeobox gene,
ENGRAILED 2. Biol Psychiatry, 2009, 66(10): 911-7
[57] Sousa I, Clark TG, Toma C, et al. MET and autism
susceptibility: family and case-control studies. Eur J Hum
Genet, 2009, 17(6): 749-58
[58] Gharani N, Benayed R, Mancuso V, et al. Association of
the homeobox transcription factor, ENGRAILED 2, 3,
with autism spectrum disorder. Mol Psychiatry, 2004,
9(5): 474-84
[59] Campbell DB, Sutcliffe JS, Ebert PJ, et al. A genetic
variant that disrupts MET transcription is associated with
autism. Proc Natl Acade Sci USA, 2006, 103(45): 16834-
9
[60] Wang K, Zhang H, Ma D, et al. Common genetic variants
on 5p14.1 associate with autism spectrum disorders.
Nature, 2009, 459(7246): 528-33
[61] Anney R, Klei L, Pinto D, et al. A genome-wide scan for
common alleles affecting risk for autism. Hum Mol
Genetics, 2010, 19(20): 4072-82
[62] Anney R, Klei L, Pinto D, et al. Individual common
variants exert weak effects on the risk for autism spectrum
disorderspi. Hum Mol Genet, 2012, 21(21): 4781-92
[63] Xia K, Guo H, Hu Z, et al. Common genetic variants on
1p13.2 associate with risk of autism. Mol Psychiatry,
2013 [Epub ahead of print]
[64] Klei L, Sanders SJ, Murtha MT, et al. Common genetic
variants, acting additively, are a major source of risk for
autism. Mol Autism, 2012, 3(1): 9
[65] Roohi J, Montagna C, Tegay DH, et al. Disruption of
contactin 4 in three subjects with autism spectrum
disorder. J Med Genetics, 2009, 46(3): 176-82
[66] Betancur C. Etiological heterogeneity in autism spectrum
disorders: more than 100 genetic and genomic disorders
and still counting. Brain Res, 2011, 1380: 42-77
[67] Alarcon M, Yonan AL, Gilliam TC, et al. Quantitative
genome scan and Ordered-Subsets Analysis of autism
endophenotypes support language QTLs. Mol Psychiatry,
2005, 10(8): 747-57