最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

QSAR

IT圈 admin 27浏览 0评论

2024年4月3日发(作者:蓝高超)

QSAR

1 什么是QSAR?

(Q)SAR是一种借助分子理化性质参数或结构参数,以数学和统计学手段定量研究有机

小分子与生物大分子相互作用、有机小分子在生物体内吸收、分布、代谢、排泄等生理相

关性质的方法。预测化合物的生理活性或某些性质,等等。该方法起始于药物设计领域,

通过研究生物活性和理化参数之间的相关性预测新化学物质的活性,指导新药和杀虫剂的

合成。在环境化学领域,QSAR可用来预测化学品在环境中的暴露水平,同时又可对其生

物活性作出评价。

这种方法广泛应用于药物、农药、化学毒剂等生物活性分子的合理设计,在早期的药

物设计中,定量构效关系方法占据主导地位,90年代以来随着计算机计算能力的提高和众

多生物大分子三维结构的准确测定,基于结构的药物设计逐渐取代了定量构效关系在药物

设计领域的主导地位,但QSAR在药学研究中仍然发挥着非常重要的作用。

2 QSAR研究现状与需求

2.1 研究现状

经济合作与发展组织(Organization for Economic Cooperation and

Development, OECD)

OECD围绕化学品的安全性问题,开展了(Q)SAR技术的应用研究。2004年11月,

OECD提出了验证(Q)SARs模型的原则,围绕(Q)SARs在现有和新化学品管理中的应用,

1

组织开展了案例研究。涉及的国家包括澳大利亚、加拿大、捷克共和国、丹麦、德国、意

大利、日本、荷兰、美国、英国和欧盟委员会。

欧盟委员会(European Commission)

联合研究中心(Joint Research Centre, JRC)和欧洲化学品管理署(European

Chemicals Agency, ECHA)是欧盟负责有害化学品风险评价的核心官方机构,负责实施

REACH法规的技术支持,近年来围绕(Q)SAR技术的开发和应用,开展了大量的研究工作,

涉及(Q)SAR技术在不同目标层面上的应用。

美国环境保护局(U.S. Environmental Protection Agency, US EPA)

2002年,US EPA在国会的要求下加强了计算毒理学的研究工作,核心是开发和验证

用于化学品筛选和确定优先污染物的非动物试验方法,主要是(Q)SAR方法在US EPA专门

成立了国家计算毒理学研究中心(National Center for Computational Toxicology,

NCCT)。

2.2 法规需求

中国新化学物质申报指南申报数据质量要求中估算与引用数据一节,在无法进行实际

测试的特殊情况下,允许采用国际通用的估算方法,如结构活性定量估算(QSAR,

Quantitative Structure Activity Relationships)、交叉参照(Read-Acorss)以及查阅引

用权威性文献等方法获得数据,同时应充分说明理由、方法或数据来源、依据等。

欧盟REACH法规1907/2006(EC)中的附录XI中,针对附录VII到附录X中规定的不

2

同年产量的生产和进口的化学品的测试方法要求,明确规定欧盟REACH法规要求的化学

品注册信息可来源于定量结构-活性关系方法((Q)SAR)。其中总则第(40)条尤其强调规定

“欧盟委员会、成员国、产业界以及其他利益相关方面应继续致力于在国际和国家层面上

替代动物试验方法的研究和使用,包括计算机方法…”。

联合国GHS指南的“第四部分 环境危害”的“4.1.2 物质分类标准”中明确规定“如

果没有实验数据,那么可在分类过程中使用有效的水生毒性定量结构活性关系(QSARs)和

logKow。并在“附件9 水生环境危害指导”中,“A9.6 QSAR的使用”专门对QSARs

的使用做出了明确和详细的规定。

3 发展历史

定量构效关系是在传统构效关系的基础上,结合物理化学中常用的经验方程的数学方

法出现的,其理论历史可以追溯到1868年提出的Crum-Brown方程,该方程认为化合物

的生理活性可以用化学结构的函数来表示,但是并未建立明确的函数模型。最早的可以实

施的定量构效关系方法是美国波蒙拿学院的Hansch在1962年提出的Hansch方程。

Hansch方程脱胎于1935年英国物理化学家哈密顿提出的哈密顿方程以及改进的塔夫托

方程。哈密顿方程是一个计算取代苯甲酸解离常数的经验方程,这个方程将取代苯甲酸解

离常数的对数值与取代基团的电性参数建立了线性关系,塔夫托方程是在哈密顿方程的基

础上改进形成的计算脂肪族酯类化合物水解反应速率常数的经验方程,它将速率常数的对

数与电性参数和立体参数建立了线性关系。

Hansch方程在形式上与哈密顿方程和塔夫托方程非常接近,以生理活性物质的半数

有效量作为活性参数,以分子的电性参数、立体参数和疏水参数作为线性回归分析的变量,

随后,Hansch和日本访问学者藤田稔夫等人一道改进了Hansch方程的数学模型,引入

3

了指示变量、抛物线模型和双线性模型等修正,使得方程的预测能力有所提高。

几乎在Hansch方法发表的同时,Free等人发表了Free-Wilson方法,这种方法直接

以分子结构作为变量对生理活性进行回归分析。其在药物化学中的应用范围远不如Hansch

方法广泛。Hansch方法、Free-Wilson方法等方法均是将分子作为一个整体考虑其性质,

并不能细致地反应分子的三维结构与生理活性之间的关系,因而又被称作二维定量构效关

系。

二维定量构效关系出现之后,在药物化学领域产生了很大影响,人们对构效关系的认

识从传统的定性水平上升到定量水平。定量的结构活性关系也在一定程度上揭示了药物分

子与生物大分子结合的模式。在Hansch方法的指导下,人们成功地设计了诺氟沙星等喹

诺酮类抗菌药。

由于二维定量不能精确描述分子三维结构与生理活性之间的关系,1980年代前后人们

开始探讨基于分子构象的三维定量构效关系的可行性。1979年,Crippen提出“距离几何

学的3D-QSAR”;1980年hopfinger等人提出“分子形状分析方法”;1988年Cramer

等人提出了“比较分子场方法”(CoMFA)。比较分子场方法一经提出便席卷药物设计领

域,成为应用最广泛的基于定量构效关系的药物设计方法;1990年代,又出现了在比较分

子场方法基础上改进的“比较分子相似性方法”以及在“距离几何学的3D-QSAR”基础

上发展的“虚拟受体方法”等新的三维定量构效关系方法,但是老牌的CoMFA依然是使

用最广泛的定量构效关系方法。

4 常用(Q)SAR方法

4.1 二维定量构效关系方法(2D-(Q)SAR)

4

二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归

分析,建立化学结构与生理活性相关性模型的一种模型设计方法。

二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归

分析,建立化学结构与生理活性相关性模型的一种药物设计方法,常见的二维定量构效关

系方法有Hansch方法、Free-Wilson方法、分子连接性方法等,最为著名和应用最广泛

的是Hansch方法。

Hansch方法

用疏水性、电性、立体性等化合物的结构参数与生物活性相关,建立QSAR方程,由

于所有的参数都与系统的自由能相关,故Hansch方法又称为线性自由能相关(Liner free

energy relationships, LFER)

线性模型:

lg 1/C

=

algP

+

+

cEs

+ … +

constant

抛物线模型:

lg 1/C

=

a(lgP)

2

+

blgP + cσ

+ … +

constant

统计方法:最小二乘法(PLS)

相关理化参数

5

(1)活性参数

活性参数是构成二维定量构效关系的要素之一,人们根据研究的体系选择不同的活性

参数,常见的活性参数有:半数有效量、半数有效浓度、半数抑菌浓度、半数致死量、最

小抑菌浓度等,所有活性参数均必须采用物质的量作为计量单位,以便消除分子量的影响,

从而真实地反应分子水平的生理活性。为了获得较好的数学模型,活性参数在二维定量构

效关系中一般取负对数后进行统计分析。

(2)结构参数

结构参数是构成定量构效关系的另一大要素,常见的结构参数有:疏水参数、电性参

数、立体参数、几何参数、拓扑参数、理化性质参数以及纯粹的结构参数等。

疏水参数:药物在体内吸收和分布的过程与其疏水性密切相关,因而疏水性是影响药

物生理活性的一个重要性质,在二维定量构效关系中采用的疏水参数最常见的是脂水分配

系数,其定义为分子在正辛醇与水中分配的比例,对于分子母环上的取代基,脂水分配系

数的对数值具有加和性,可以通过简单的代数计算获得某一取代结构的疏水参数。

电性参数:二维定量构效关系中的电性参数直接继承了哈密顿公式和塔夫托公式中的

电性参数的定义,用以表征取代基团对分子整体电子分配的影响,其数值对于取代基也具

有加和性。

立体参数:立体参数可以表征分子内部由于各个基团相互作用对药效构象产生的影响

以及对药物和生物大分子结合模式产生的影响,常用的立体参数有塔夫托立体参数、摩尔

折射率、范德华半径等。

6

几何参数:几何参数是与分子构象相关的立体参数,因为这类参数常常在定量构效关

系中占据一定地位,故而将其与立体参数分割考虑,常见的几何参数有分子表面积、溶剂

可及化表面积、分子体积、多维立体参数等。

拓扑参数:在分子连接性方法中使用的结构参数,拓扑参数根据分子的拓扑结构将各

个原子编码,用形成的代码来表征分子结构。

理化性质参数:偶极矩、分子光谱数据、前线轨道能级、酸碱解离常数等理化性质参

数有时也用做结构参数参予定量构效关系研究。

纯粹的结构参数:在Free-Wilson方法中,使用纯粹的结构参数,这种参数以某一特

定结构的分子为参考标准,依照结构母环上功能基团的有无对分子结构进行编码,进行回

归分析,为每一个功能基团计算出回归系数,从而获得定量构效关系模型。

4.2 三维定量构效关系方法(3D-(Q)SAR)

与2D-(Q)SAR比较,3D-(Q)SAR方法在物理化学上的意义更为明确,能间接反映化

合物分子和靶点之间的非键相互作用特征。

三维定量构效关系(3D-QSAR)是引入了分子三维结构信息进行定量构效关系研究的

方法。这种方法间接地反映了分子与生物大分子相互作用过程中两者之间的非键相互作用

特征,相对于二维定量构效关系有更加明确的物理意义和更丰富的信息量。

(1)3D-QSAR的基本原理

主要是利用数学模式对药物的化学结构信息(如各种取代基参数,拓扑指数以及量子化

7

学与分子力学计算参数)与其生物活性之间的关系进行定量分析,找出结构与活性间的量变

规律,然后根据这种规律及未知化合物的结构预测未知化合物的性能。

它建筑在以下观念上:(1) 分子的形状在一定程度上影响其生物活性,分子的活性构

象是研究3D-QSAR的关键;(2) 药物分子与受体之间的相互作用是借助可逆的、非共价

结合的弱作用力实现的,如静电引力、疏水作用、氢键、范德华引力等。由于3D-QSAR

直接反映药物分子与受体三维空间上的互补性,更准确表达了药物与受体之间的相互作用,

因此,近十多年来3D-QSAR方法得到了迅速的发展。

(2)3D-QSAR研究方法

比较分子场(CoMFA)法、假设活性网格法(HASL)、比较分子矩分析法(CoMMA)、

比较分子相似性指数分析法(CoMSIA)、距离几何学三位定量构效关系(DG 3D-QSAR)、

分子形状分析(MSA)、虚拟受体(FR)等方法等。

分子形状分析(MSA)方法

分子形状分析(MSA)方法认为柔性分子有多种构象,每种构象可视为一种形状,药物

的活性与这些形状对受体的活性部位的适应能力有关。Koehler等人就利用MSA法对利什

曼原虫二氢叶酸还原酶(DHFR)抑制剂的三嗪类化合物进行了三维定量构效关系分析,成功

建立了3D-QSAR方程;MSA法的缺点也是很明显的:由于该法仅仅只是在2D-QSAR的

基础上引入了重叠体积等参数作为变量,而且这些参数的物理意义并不是很明确,所以它

只能看作一种初级的3D-QSAR研究。

距离几何学三维定量构效关系(DG 3D-QSAR)

8

距离几何学三维定量构效关系(DG 3D-QSAR)严格来讲是一种介于二维和三维之间的

QSAR方法。这种方法将药物分子划分为若干功能区块定义药物分子活性位点,计算低能

构象时各个活性位点之间的距离,形成距离矩阵;同时定义受体分子的结合位点,获得结

合位点的距离矩阵,通过活性位点和结合位点的匹配为每个分子生成结构参数,对生理活

性数据进行统计分析。利用距离几何学三维定量构效关系方法,crippen等人对DHFR抑

制剂分别作了研究,得到了各自构效关系模型,Ghose等又根据这三类化合物均作用于

DHFR受体这一特点,进一步得到了一个包含三类化合物的综合模型,其相关性也非常好,

这些都表明距离几何学方法是成功的。

比较分子力场分析方法(CoMFA)

比较分子力场分析方法(CoMFA),是目前最为成熟且应用最为广泛的方法。比较分子

场方法将具有相同结构母环的分子在空间中叠合,使其空间取向尽量一致,然后用一个探

针粒子在分子周围的空间中游走,计算探针粒子与分子之间的相互作用,并记录下空间不

同坐标中相互作用的能量值,从而获得分子场数据。不同的探针粒子可以探测分子周围不

同性质的分子场,甲烷分子作为探针可以探测立体场,水分子作为探针可以探测疏水场,

氢离子作为探针可以探测静电场等等,一些成熟的比较分子场程序可以提供数十种探针粒

子供用户选择。

它的基本原理是如果一组相似化合物以同样的方式与受体部位发生相互作用,那么它

们的生物活性的强弱就取决于每个化合物周围分子场的差别,这种分子场可以反映药物分

子和受体之间非键相互作用特性。马翼等人采用CoFMA方法对N-(4-取代嘧啶-2-基)苄基

磺酰脲和苯氧基磺酰脲类化合物进行三维定量构效关系研究,建立了一个较为可靠的预测

模型。近年来,研究人员对传统的CoMFIA进行了大量的改进,其中涉及到活性构象的确

定,分子叠加规则、分子场势函数的定义以及分子场变量的选取等等,在很大程度上提高

9

了CoMFA计算的成功率。

比较分子相似性指数分析法(CoMSIA)

比较分子相似性指数分析法(CoMSIA)是对CoMFA方法的改进,他改变了探针粒子

与药物分子相互作用能量的计算公式,从而获得更好的分子场参数。CoMSIA方法中共定

义五种分子场的特征,包括立体场、静电场、疏水场以及氢键场(包括氢键给体场和氢键受

体场)。CoMsIA方法中,可避免在原子附近数值的奇异性以及分子表面附近格点处势能的

急剧变化,等势图克服了coMFA的不足,其可视性、揭示构效关系和对新化合物活性的

预测均得到了改善。在一般情况下,CoMSIA认计算会得到更加满意的3DQSAR模型。

虚拟受体方法(FR)

虚拟受体方法(FR)是DG 3D-QSAR和CoMFA方法的延伸与发展,其基本思路是

采用多种探针粒子在药物分子周围建立一个虚拟的受体环境,以此研究不同药物分子之间

活性与结构的相关性。其原理较之CoMFA方法更加合理,是目前定量构效关系研究的热

点之一。

(3)应用

微观方面的应用

① 药物设计

近年来,分子生物学和计算机科学的迅速发展,使得计算机辅助药物设计(CADD)在

新药物开发中起着非常重要的作用。按照是否已知受体的三维结构,可把这些方法分为两

10

大类,一类是直接药物设计,用于受体靶点三维结构已知的情况下,研究药物与受体的相

互作用,根据受体受点的形状和性质设计新的药物,如:对DHFR抑制剂、人体免疫缺陷

病毒(HIV-1)蛋白酶抑制剂、5-羟色胺(5-HT)受体拮抗剂等的研究;另一类是间接药

物设计,当受体的三维结构未知时,采用对一组具有类似活性的化合物建立定量结构-活性

关系模型,根据QSAR计算结果的指导药物化学家可以更有目的性地对生理活性物质进行

结构改造。

CoMFA和CoMISA是应用最广泛的合理药物设计方法之一,这种方法认为,药物分

子与受体间的相互作用取决于化合物周围分子场的差别,以定量化的分子场参数作为变量,

对药物活性进行回归分析便可以反应药物与生物大分子之间的相互作用模式进而有选择地

设计新药。

② 模拟污染物对酶、生物作用的动力学过程

3D-QSAR发展至今,已称为计算机辅助农药设计的基本手段与分析方法。同时,在

生物化学、生物医学和生物毒理学方面,3D-QSAR可用于研究酶的活性、生物体抗病毒

能力的强弱、化合物的致癌致畸性等。

具体来说,3D-QSAR已用来研究多种酶(如水解酶、氧化还原酶、连接酶)的作用

物和抑制剂,受体(如5-HT受体、GHRH受体等)和运输载体。此外,3D-QSAR在肿

瘤学、抗菌剂、新陈代谢方面也有一些应用。

宏观方面的应用—模拟持久性有机物在空间上的迁移

3D-QSAR模拟多环芳烃由内陆向偏远地区的迁移。

11

3D-QSAR模拟二恶英在我国的迁移。

利用3D-QSAR解决环境化学问题才刚刚起步。目前,对于一些除草剂,如光系统Ⅱ

(PSⅡ)抑制剂、氰基内稀酸酯类化学物、光合作用抑制剂嘧啶硫苯甲酸类化合物等,已

研究了其三维定量构效关系。

如何将3D-QSAR研究深入,在环境化学中发挥更大作用,是迫切需要解决的问题。

3D-QSAR与传统QSAR相结合,研究污染物水解、光解、生物降解以及土壤吸附等环境

行为,将有助于更加深入的探讨这些环境行为的作用机理。同时,对于广泛使用却污染严

重的化合物(如除草剂、杀虫剂、洗涤剂等),在已有的2D-QSAR研究基础上,进行

3D-QSAR分析,进而了解化合物产生毒性的部位和发挥用途的机制,挑选出高效低毒的

化合物,可达到减少污染的目的。使用3D-QSAR的方法,还可以了解污染物在与蛋白质

和核酸等生物大分子结合、作用(从而导致癌变等病理情况)的过程中其三维结构所扮演

的角色,更加深入的研究污染物在生物体内的作用途径,这对揭示人类的衰老、疾病机制,

维护人类健康将发挥重要作用。

5 展望

(1) 应用领域广泛,但活性数据需不断扩充

(Q)SAR现在已广泛应用于多个研究领域并日趋完善,包括用于政府管理部门的化合物

风险评价中,但(Q)SAR研究需要以大量高质量的活性数据为基础,才能保证预测数据的可

靠性和准确性。

(2) 多学科集成性,但需不断建立新型(Q)SAR模型

12

建立新型分子描述符和模型,以符合不同学科研究和应用的需要,推动(Q)SAR技术的

不断发展。

(3) 模型智能化程度提高,但模型稳定性验证需加强

(Q)SAR模型应该给出详细的验证说明和适用范围,以便使用者能够科学合理的应用

(Q)SAR模型和预测结果,以推广(Q)SAR的使用。

13

2024年4月3日发(作者:蓝高超)

QSAR

1 什么是QSAR?

(Q)SAR是一种借助分子理化性质参数或结构参数,以数学和统计学手段定量研究有机

小分子与生物大分子相互作用、有机小分子在生物体内吸收、分布、代谢、排泄等生理相

关性质的方法。预测化合物的生理活性或某些性质,等等。该方法起始于药物设计领域,

通过研究生物活性和理化参数之间的相关性预测新化学物质的活性,指导新药和杀虫剂的

合成。在环境化学领域,QSAR可用来预测化学品在环境中的暴露水平,同时又可对其生

物活性作出评价。

这种方法广泛应用于药物、农药、化学毒剂等生物活性分子的合理设计,在早期的药

物设计中,定量构效关系方法占据主导地位,90年代以来随着计算机计算能力的提高和众

多生物大分子三维结构的准确测定,基于结构的药物设计逐渐取代了定量构效关系在药物

设计领域的主导地位,但QSAR在药学研究中仍然发挥着非常重要的作用。

2 QSAR研究现状与需求

2.1 研究现状

经济合作与发展组织(Organization for Economic Cooperation and

Development, OECD)

OECD围绕化学品的安全性问题,开展了(Q)SAR技术的应用研究。2004年11月,

OECD提出了验证(Q)SARs模型的原则,围绕(Q)SARs在现有和新化学品管理中的应用,

1

组织开展了案例研究。涉及的国家包括澳大利亚、加拿大、捷克共和国、丹麦、德国、意

大利、日本、荷兰、美国、英国和欧盟委员会。

欧盟委员会(European Commission)

联合研究中心(Joint Research Centre, JRC)和欧洲化学品管理署(European

Chemicals Agency, ECHA)是欧盟负责有害化学品风险评价的核心官方机构,负责实施

REACH法规的技术支持,近年来围绕(Q)SAR技术的开发和应用,开展了大量的研究工作,

涉及(Q)SAR技术在不同目标层面上的应用。

美国环境保护局(U.S. Environmental Protection Agency, US EPA)

2002年,US EPA在国会的要求下加强了计算毒理学的研究工作,核心是开发和验证

用于化学品筛选和确定优先污染物的非动物试验方法,主要是(Q)SAR方法在US EPA专门

成立了国家计算毒理学研究中心(National Center for Computational Toxicology,

NCCT)。

2.2 法规需求

中国新化学物质申报指南申报数据质量要求中估算与引用数据一节,在无法进行实际

测试的特殊情况下,允许采用国际通用的估算方法,如结构活性定量估算(QSAR,

Quantitative Structure Activity Relationships)、交叉参照(Read-Acorss)以及查阅引

用权威性文献等方法获得数据,同时应充分说明理由、方法或数据来源、依据等。

欧盟REACH法规1907/2006(EC)中的附录XI中,针对附录VII到附录X中规定的不

2

同年产量的生产和进口的化学品的测试方法要求,明确规定欧盟REACH法规要求的化学

品注册信息可来源于定量结构-活性关系方法((Q)SAR)。其中总则第(40)条尤其强调规定

“欧盟委员会、成员国、产业界以及其他利益相关方面应继续致力于在国际和国家层面上

替代动物试验方法的研究和使用,包括计算机方法…”。

联合国GHS指南的“第四部分 环境危害”的“4.1.2 物质分类标准”中明确规定“如

果没有实验数据,那么可在分类过程中使用有效的水生毒性定量结构活性关系(QSARs)和

logKow。并在“附件9 水生环境危害指导”中,“A9.6 QSAR的使用”专门对QSARs

的使用做出了明确和详细的规定。

3 发展历史

定量构效关系是在传统构效关系的基础上,结合物理化学中常用的经验方程的数学方

法出现的,其理论历史可以追溯到1868年提出的Crum-Brown方程,该方程认为化合物

的生理活性可以用化学结构的函数来表示,但是并未建立明确的函数模型。最早的可以实

施的定量构效关系方法是美国波蒙拿学院的Hansch在1962年提出的Hansch方程。

Hansch方程脱胎于1935年英国物理化学家哈密顿提出的哈密顿方程以及改进的塔夫托

方程。哈密顿方程是一个计算取代苯甲酸解离常数的经验方程,这个方程将取代苯甲酸解

离常数的对数值与取代基团的电性参数建立了线性关系,塔夫托方程是在哈密顿方程的基

础上改进形成的计算脂肪族酯类化合物水解反应速率常数的经验方程,它将速率常数的对

数与电性参数和立体参数建立了线性关系。

Hansch方程在形式上与哈密顿方程和塔夫托方程非常接近,以生理活性物质的半数

有效量作为活性参数,以分子的电性参数、立体参数和疏水参数作为线性回归分析的变量,

随后,Hansch和日本访问学者藤田稔夫等人一道改进了Hansch方程的数学模型,引入

3

了指示变量、抛物线模型和双线性模型等修正,使得方程的预测能力有所提高。

几乎在Hansch方法发表的同时,Free等人发表了Free-Wilson方法,这种方法直接

以分子结构作为变量对生理活性进行回归分析。其在药物化学中的应用范围远不如Hansch

方法广泛。Hansch方法、Free-Wilson方法等方法均是将分子作为一个整体考虑其性质,

并不能细致地反应分子的三维结构与生理活性之间的关系,因而又被称作二维定量构效关

系。

二维定量构效关系出现之后,在药物化学领域产生了很大影响,人们对构效关系的认

识从传统的定性水平上升到定量水平。定量的结构活性关系也在一定程度上揭示了药物分

子与生物大分子结合的模式。在Hansch方法的指导下,人们成功地设计了诺氟沙星等喹

诺酮类抗菌药。

由于二维定量不能精确描述分子三维结构与生理活性之间的关系,1980年代前后人们

开始探讨基于分子构象的三维定量构效关系的可行性。1979年,Crippen提出“距离几何

学的3D-QSAR”;1980年hopfinger等人提出“分子形状分析方法”;1988年Cramer

等人提出了“比较分子场方法”(CoMFA)。比较分子场方法一经提出便席卷药物设计领

域,成为应用最广泛的基于定量构效关系的药物设计方法;1990年代,又出现了在比较分

子场方法基础上改进的“比较分子相似性方法”以及在“距离几何学的3D-QSAR”基础

上发展的“虚拟受体方法”等新的三维定量构效关系方法,但是老牌的CoMFA依然是使

用最广泛的定量构效关系方法。

4 常用(Q)SAR方法

4.1 二维定量构效关系方法(2D-(Q)SAR)

4

二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归

分析,建立化学结构与生理活性相关性模型的一种模型设计方法。

二维定量构效关系方法是将分子整体的结构性质作为参数,对分子生理活性进行回归

分析,建立化学结构与生理活性相关性模型的一种药物设计方法,常见的二维定量构效关

系方法有Hansch方法、Free-Wilson方法、分子连接性方法等,最为著名和应用最广泛

的是Hansch方法。

Hansch方法

用疏水性、电性、立体性等化合物的结构参数与生物活性相关,建立QSAR方程,由

于所有的参数都与系统的自由能相关,故Hansch方法又称为线性自由能相关(Liner free

energy relationships, LFER)

线性模型:

lg 1/C

=

algP

+

+

cEs

+ … +

constant

抛物线模型:

lg 1/C

=

a(lgP)

2

+

blgP + cσ

+ … +

constant

统计方法:最小二乘法(PLS)

相关理化参数

5

(1)活性参数

活性参数是构成二维定量构效关系的要素之一,人们根据研究的体系选择不同的活性

参数,常见的活性参数有:半数有效量、半数有效浓度、半数抑菌浓度、半数致死量、最

小抑菌浓度等,所有活性参数均必须采用物质的量作为计量单位,以便消除分子量的影响,

从而真实地反应分子水平的生理活性。为了获得较好的数学模型,活性参数在二维定量构

效关系中一般取负对数后进行统计分析。

(2)结构参数

结构参数是构成定量构效关系的另一大要素,常见的结构参数有:疏水参数、电性参

数、立体参数、几何参数、拓扑参数、理化性质参数以及纯粹的结构参数等。

疏水参数:药物在体内吸收和分布的过程与其疏水性密切相关,因而疏水性是影响药

物生理活性的一个重要性质,在二维定量构效关系中采用的疏水参数最常见的是脂水分配

系数,其定义为分子在正辛醇与水中分配的比例,对于分子母环上的取代基,脂水分配系

数的对数值具有加和性,可以通过简单的代数计算获得某一取代结构的疏水参数。

电性参数:二维定量构效关系中的电性参数直接继承了哈密顿公式和塔夫托公式中的

电性参数的定义,用以表征取代基团对分子整体电子分配的影响,其数值对于取代基也具

有加和性。

立体参数:立体参数可以表征分子内部由于各个基团相互作用对药效构象产生的影响

以及对药物和生物大分子结合模式产生的影响,常用的立体参数有塔夫托立体参数、摩尔

折射率、范德华半径等。

6

几何参数:几何参数是与分子构象相关的立体参数,因为这类参数常常在定量构效关

系中占据一定地位,故而将其与立体参数分割考虑,常见的几何参数有分子表面积、溶剂

可及化表面积、分子体积、多维立体参数等。

拓扑参数:在分子连接性方法中使用的结构参数,拓扑参数根据分子的拓扑结构将各

个原子编码,用形成的代码来表征分子结构。

理化性质参数:偶极矩、分子光谱数据、前线轨道能级、酸碱解离常数等理化性质参

数有时也用做结构参数参予定量构效关系研究。

纯粹的结构参数:在Free-Wilson方法中,使用纯粹的结构参数,这种参数以某一特

定结构的分子为参考标准,依照结构母环上功能基团的有无对分子结构进行编码,进行回

归分析,为每一个功能基团计算出回归系数,从而获得定量构效关系模型。

4.2 三维定量构效关系方法(3D-(Q)SAR)

与2D-(Q)SAR比较,3D-(Q)SAR方法在物理化学上的意义更为明确,能间接反映化

合物分子和靶点之间的非键相互作用特征。

三维定量构效关系(3D-QSAR)是引入了分子三维结构信息进行定量构效关系研究的

方法。这种方法间接地反映了分子与生物大分子相互作用过程中两者之间的非键相互作用

特征,相对于二维定量构效关系有更加明确的物理意义和更丰富的信息量。

(1)3D-QSAR的基本原理

主要是利用数学模式对药物的化学结构信息(如各种取代基参数,拓扑指数以及量子化

7

学与分子力学计算参数)与其生物活性之间的关系进行定量分析,找出结构与活性间的量变

规律,然后根据这种规律及未知化合物的结构预测未知化合物的性能。

它建筑在以下观念上:(1) 分子的形状在一定程度上影响其生物活性,分子的活性构

象是研究3D-QSAR的关键;(2) 药物分子与受体之间的相互作用是借助可逆的、非共价

结合的弱作用力实现的,如静电引力、疏水作用、氢键、范德华引力等。由于3D-QSAR

直接反映药物分子与受体三维空间上的互补性,更准确表达了药物与受体之间的相互作用,

因此,近十多年来3D-QSAR方法得到了迅速的发展。

(2)3D-QSAR研究方法

比较分子场(CoMFA)法、假设活性网格法(HASL)、比较分子矩分析法(CoMMA)、

比较分子相似性指数分析法(CoMSIA)、距离几何学三位定量构效关系(DG 3D-QSAR)、

分子形状分析(MSA)、虚拟受体(FR)等方法等。

分子形状分析(MSA)方法

分子形状分析(MSA)方法认为柔性分子有多种构象,每种构象可视为一种形状,药物

的活性与这些形状对受体的活性部位的适应能力有关。Koehler等人就利用MSA法对利什

曼原虫二氢叶酸还原酶(DHFR)抑制剂的三嗪类化合物进行了三维定量构效关系分析,成功

建立了3D-QSAR方程;MSA法的缺点也是很明显的:由于该法仅仅只是在2D-QSAR的

基础上引入了重叠体积等参数作为变量,而且这些参数的物理意义并不是很明确,所以它

只能看作一种初级的3D-QSAR研究。

距离几何学三维定量构效关系(DG 3D-QSAR)

8

距离几何学三维定量构效关系(DG 3D-QSAR)严格来讲是一种介于二维和三维之间的

QSAR方法。这种方法将药物分子划分为若干功能区块定义药物分子活性位点,计算低能

构象时各个活性位点之间的距离,形成距离矩阵;同时定义受体分子的结合位点,获得结

合位点的距离矩阵,通过活性位点和结合位点的匹配为每个分子生成结构参数,对生理活

性数据进行统计分析。利用距离几何学三维定量构效关系方法,crippen等人对DHFR抑

制剂分别作了研究,得到了各自构效关系模型,Ghose等又根据这三类化合物均作用于

DHFR受体这一特点,进一步得到了一个包含三类化合物的综合模型,其相关性也非常好,

这些都表明距离几何学方法是成功的。

比较分子力场分析方法(CoMFA)

比较分子力场分析方法(CoMFA),是目前最为成熟且应用最为广泛的方法。比较分子

场方法将具有相同结构母环的分子在空间中叠合,使其空间取向尽量一致,然后用一个探

针粒子在分子周围的空间中游走,计算探针粒子与分子之间的相互作用,并记录下空间不

同坐标中相互作用的能量值,从而获得分子场数据。不同的探针粒子可以探测分子周围不

同性质的分子场,甲烷分子作为探针可以探测立体场,水分子作为探针可以探测疏水场,

氢离子作为探针可以探测静电场等等,一些成熟的比较分子场程序可以提供数十种探针粒

子供用户选择。

它的基本原理是如果一组相似化合物以同样的方式与受体部位发生相互作用,那么它

们的生物活性的强弱就取决于每个化合物周围分子场的差别,这种分子场可以反映药物分

子和受体之间非键相互作用特性。马翼等人采用CoFMA方法对N-(4-取代嘧啶-2-基)苄基

磺酰脲和苯氧基磺酰脲类化合物进行三维定量构效关系研究,建立了一个较为可靠的预测

模型。近年来,研究人员对传统的CoMFIA进行了大量的改进,其中涉及到活性构象的确

定,分子叠加规则、分子场势函数的定义以及分子场变量的选取等等,在很大程度上提高

9

了CoMFA计算的成功率。

比较分子相似性指数分析法(CoMSIA)

比较分子相似性指数分析法(CoMSIA)是对CoMFA方法的改进,他改变了探针粒子

与药物分子相互作用能量的计算公式,从而获得更好的分子场参数。CoMSIA方法中共定

义五种分子场的特征,包括立体场、静电场、疏水场以及氢键场(包括氢键给体场和氢键受

体场)。CoMsIA方法中,可避免在原子附近数值的奇异性以及分子表面附近格点处势能的

急剧变化,等势图克服了coMFA的不足,其可视性、揭示构效关系和对新化合物活性的

预测均得到了改善。在一般情况下,CoMSIA认计算会得到更加满意的3DQSAR模型。

虚拟受体方法(FR)

虚拟受体方法(FR)是DG 3D-QSAR和CoMFA方法的延伸与发展,其基本思路是

采用多种探针粒子在药物分子周围建立一个虚拟的受体环境,以此研究不同药物分子之间

活性与结构的相关性。其原理较之CoMFA方法更加合理,是目前定量构效关系研究的热

点之一。

(3)应用

微观方面的应用

① 药物设计

近年来,分子生物学和计算机科学的迅速发展,使得计算机辅助药物设计(CADD)在

新药物开发中起着非常重要的作用。按照是否已知受体的三维结构,可把这些方法分为两

10

大类,一类是直接药物设计,用于受体靶点三维结构已知的情况下,研究药物与受体的相

互作用,根据受体受点的形状和性质设计新的药物,如:对DHFR抑制剂、人体免疫缺陷

病毒(HIV-1)蛋白酶抑制剂、5-羟色胺(5-HT)受体拮抗剂等的研究;另一类是间接药

物设计,当受体的三维结构未知时,采用对一组具有类似活性的化合物建立定量结构-活性

关系模型,根据QSAR计算结果的指导药物化学家可以更有目的性地对生理活性物质进行

结构改造。

CoMFA和CoMISA是应用最广泛的合理药物设计方法之一,这种方法认为,药物分

子与受体间的相互作用取决于化合物周围分子场的差别,以定量化的分子场参数作为变量,

对药物活性进行回归分析便可以反应药物与生物大分子之间的相互作用模式进而有选择地

设计新药。

② 模拟污染物对酶、生物作用的动力学过程

3D-QSAR发展至今,已称为计算机辅助农药设计的基本手段与分析方法。同时,在

生物化学、生物医学和生物毒理学方面,3D-QSAR可用于研究酶的活性、生物体抗病毒

能力的强弱、化合物的致癌致畸性等。

具体来说,3D-QSAR已用来研究多种酶(如水解酶、氧化还原酶、连接酶)的作用

物和抑制剂,受体(如5-HT受体、GHRH受体等)和运输载体。此外,3D-QSAR在肿

瘤学、抗菌剂、新陈代谢方面也有一些应用。

宏观方面的应用—模拟持久性有机物在空间上的迁移

3D-QSAR模拟多环芳烃由内陆向偏远地区的迁移。

11

3D-QSAR模拟二恶英在我国的迁移。

利用3D-QSAR解决环境化学问题才刚刚起步。目前,对于一些除草剂,如光系统Ⅱ

(PSⅡ)抑制剂、氰基内稀酸酯类化学物、光合作用抑制剂嘧啶硫苯甲酸类化合物等,已

研究了其三维定量构效关系。

如何将3D-QSAR研究深入,在环境化学中发挥更大作用,是迫切需要解决的问题。

3D-QSAR与传统QSAR相结合,研究污染物水解、光解、生物降解以及土壤吸附等环境

行为,将有助于更加深入的探讨这些环境行为的作用机理。同时,对于广泛使用却污染严

重的化合物(如除草剂、杀虫剂、洗涤剂等),在已有的2D-QSAR研究基础上,进行

3D-QSAR分析,进而了解化合物产生毒性的部位和发挥用途的机制,挑选出高效低毒的

化合物,可达到减少污染的目的。使用3D-QSAR的方法,还可以了解污染物在与蛋白质

和核酸等生物大分子结合、作用(从而导致癌变等病理情况)的过程中其三维结构所扮演

的角色,更加深入的研究污染物在生物体内的作用途径,这对揭示人类的衰老、疾病机制,

维护人类健康将发挥重要作用。

5 展望

(1) 应用领域广泛,但活性数据需不断扩充

(Q)SAR现在已广泛应用于多个研究领域并日趋完善,包括用于政府管理部门的化合物

风险评价中,但(Q)SAR研究需要以大量高质量的活性数据为基础,才能保证预测数据的可

靠性和准确性。

(2) 多学科集成性,但需不断建立新型(Q)SAR模型

12

建立新型分子描述符和模型,以符合不同学科研究和应用的需要,推动(Q)SAR技术的

不断发展。

(3) 模型智能化程度提高,但模型稳定性验证需加强

(Q)SAR模型应该给出详细的验证说明和适用范围,以便使用者能够科学合理的应用

(Q)SAR模型和预测结果,以推广(Q)SAR的使用。

13

发布评论

评论列表 (0)

  1. 暂无评论