2024年6月14日发(作者:堵天赋)
氨基供体存在下,将结构式(II)的酮底物:
与转氨酶多肽接触,其中所述转氨酶多肽是本文所述的工程化的转氨酶。 在一些
实施方案中,所述转氨酶多肽与SEQ ID NO:4具有至少80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%或更高的氨基酸序列同一性并能够以与SEQ ID NO:2的转氨酶相比提高的比
率转化式(II)的酮底物为式(I)的胺产物。
在一些实施方案中,所述转氨酶多肽与SEQ ID NO:58、72、74、80、86、96、
98、100或102具有至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性并
能够以与SEQ ID NO:2的转氨酶相比提高的比率转化酮底物为胺产物。用于该方
法的工程化的转氨酶的具体实施方案在详述中进一步提供。
在一些实施方案中,工程化的转氨酶具有SEQ ID NO:74的至少5%、10%、
20%、30%、40%、50%或更大活性。
在一些实施方案中,胺产物以至少70%、80%、85%、90%、95%、96%、97%、
96%或99%或更大的对映体过量产生。在上述方法的一些实施方案中,胺产物以
至少99%对映体过量产生。
如上所述,可用于本公开内容的方法中的转氨酶多肽可按照其转化西他列汀酮酰胺
底物为西他列汀的能力来表征。因此,在本文公开的方法的任何实施方案中,可进
行该方法,其中转氨酶多肽能够以与SEQ ID NO:2的转氨酶相比提高的比率转化
西他列汀酮酰胺底物为西他列汀,并与SEQ ID NO:4具有至少80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%或更大的氨基酸序列同一性。
在上述方法的一些实施方案中,R1是任选地取代的苯基。在一些实施
方案中,R1是任选地取代的吡啶基。在一些实施方案中,
R1是取代的芳基或杂芳基。在一些实施方案中,对芳基或杂芳基的取
代选自C1-C4烃基、-OR’、-SR’、-NR’R’、-
NO2、-NO、-CN、-CF3、卤素(如,-F、-Cl、-Br和-I)、-
C(O)R’、-C(O)OR’、-C(O)NR’、-S(O)2R’、-S(O)2NR’R”,
其中每个R’和R”独立地选自氢和(C1-C4)烃基组成的组。
在一些实施方案中,(C1-C4)烃基是卤素取代的烃基。
在一些实施方案中,R2是C1-C4烃基或卤素
取代的C1-C4烃基,尤其是甲基、卤素取代的甲基、丙基
或卤素取代的丙基。在一些实施方案中,R2是CF2H或
CF3。
在R2的一些实施方案中,对C1-C6烃基和
R3基团的取代选自卤素、OH、NR5R6或
OR8,其中R3、R6和R8如以上
定义的。在一些实施方案中,在上述方法中产生的式(I)化合物是基本上手性纯的化
合物。在某些实施方案中,在上述方法中产生的式(I)化合物是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9是H、Cl、Br、F、CH3、CF3、
NH2、NO2、CN、SCN、OCF3或
OCH3,R2是任选地取代的C1-C6
烃基,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9是H、Cl、Br、F、CH3、CF3、
NH2、NO2、CN、SCN、OCF3或
OCH3,且式(II)的酮底物是:
在一些实施方案中,R9是H、Br、CH3或CF3。
在一些实施方案中,R9是在苯基环的对位。在一些实施方案中,上述
方法中的胺产物以至少70%、80%、85%、90%、95%、96%、97%、96%或99%
或更大的对映体过量产生。在一些实施方案中,在上述方法中产生的化合物是基本
上手性纯的化合物。在一些实施方案中,在上述方法中产生的化合物是手性纯的化
合物。
在该方法的一些实施方案中,式(I)的胺产物是(S)-1-(4-溴苯基)-2,2,2-三氟乙
胺:
且式(II)的酮底物是1-(4-溴苯基)-2,2,2-三氟乙酮:
在该方法的一些实施方案中,(S)-1-(4-溴苯基)-2,2,2-三氟乙胺以至少70%、
80%、85%、90%、95%、96%、97%、96%或99%或更大的对映体过量产生。
在一些实施方案中,产生的(S)-1-(4-溴苯基)-2,2,2-三氟乙胺是基本上手性纯的
化合物。在某些实施方案中,该方法中产生的(S)-1-(4-溴 苯基)-2,2,2-三氟乙胺
是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是(S)-2,2,2-三氟-1-对甲苯基乙胺:
且式(II)的酮底物是2,2,2-三氟-1-对甲苯基乙酮:
在一些实施方案中,(S)-2,2,2-三氟-1-对甲苯基乙胺以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,产生的(S)-2,2,2-三氟-1-对甲苯基乙胺是基本上手性纯的。在某些实施方
案中,该方法中产生的(S)-2,2,2-三氟-1-对甲苯基乙胺是手性纯的。
在该方法的一些实施方案中,式(I)的产物胺是(S)-2,2,2-三氟-1-(4-(三氟甲基)苯
基)乙胺:
且式(II)的酮底物是2,2,2-三氟-1-(4-(三氟甲基)苯基)乙酮:
在一些实施方案中,(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基)乙胺以至少70%、80%、
85%、90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些
实施方案中,产生的(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基) 乙胺是基本上手性纯的。
在某些实施方案中,该方法中产生的(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基)乙胺是
手性纯的。
在该方法的一些实施方案中,式(I)的产物胺是:
且式(II)的酮底物是:
其中R7是任选地取代的C1-C4烃基且
R10是氢、卤素、氨基或取代的氨基、C1-C4
烃基、卤素取代的C1-C4烃基、硝基、氰基、氰硫基或烃
氧基。在一些实施方案中,R10是上述的R9。在一些实施
方案中,R10是H或F。在一些实施方案中,R7是
C1-C4烃基。
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯:
且式(II)的酮底物是3-氧-3-(吡啶-2-基)丙酸乙酯:
在一些实施方案中,(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,产生的(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯是基本上手性纯的。在某些实施方
案中,该方法中产生的(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R11是卤素、OH、-C(O)R4、-OC(O)R5
或NR6R7,其中R4、R5、
R6、R7和R10如以上定义的,且式(II)的酮底
物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在一些实施方案中,式(I)的胺产物是(S)-4-氯-1-(2-氟苯基)丁-1-胺:
且式(II)的酮底物是4-氯-1-(2-氟苯基)丁-1-酮:
在一些实施方案中,(S)-4-氯-1-(2-氟苯基)丁-1-胺以至少70%、80%、85%、90%、
95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,
产生的(S)-4-氯-1-(2-氟苯基)丁-1-胺是基本上手性纯的。在某些实施方案中,该方
法中产生的(S)-4-氯-1-(2-氟苯基)丁-1-胺是手性纯。
在一些实施方案中,利用转氨酶生物催化剂的方法可用于制备式(III)化合物:
所述式(III)化合物在标为*的立体中心具有所示的立体化学构型,且所述式(III)化合
物与相对的对映异构体相比为对映体过量,其中R10如以上定义的。
制备式(III)的胺产物的方法可包括:
(a)在适于转化下式酮底物:
为下式胺产物:
的反应条件下,在氨基供体存在下,将所述酮底物与本文所述的转氨酶多肽接触,
其中R10和R11如以上定义的;
并
(b)在适当条件下环化所述胺产物以形成式(III)化合物。
在一些实施方案中,上述方法中式(III)的环化胺产物以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,在上述方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,
在上述方法中产生的化合物是手性纯的化合物。
在一些实施方案中,酮底物是4-氯-1-(2-氟苯基)丁-1-酮:
且胺产物是(S)-4-氯-1-(2-氟苯基)丁-1-胺:
从而形成对映体过量的(R)-2-(2-氟苯基)吡咯烷:
在一些实施方案中,(R)-2-(2-氟苯基)吡咯烷以至少70%、80%、85%、90%、
95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,
产生的(R)-2-(2-氟苯基)吡咯烷是基本上手性纯的。在某些实施 方案中,该方法中
产生的(R)-2-(2-氟苯基)吡咯烷是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
如本文所述,上述方法在适于转化酮底物为对映体过量的相应的手性胺产物的反应
条件中进行。在一些实施方案中,反应条件包括约20℃至约65℃的温度。在一些
实施方案中,反应条件包括约40℃至约65℃的温度。在一些实施方案中,反应条
件包括约50℃至约65℃的温度。例如,对于利用以下酮底物的方法:
反应条件包括40℃至65℃的温度。示例的温度是60℃。
在一些实施方案中,进行上述方法的反应条件包括pH约7.0至约11.0。在一些实
施方案中,反应条件包括pH约7.0至约9.0。在一些实施方案中,该方法的反应条
件是pH约8.5。尽管pH可在该方法过程中利用任何碱和/或酸来调整,在一些实
施方案中,pH可通过添加异丙胺来维持,异丙胺还提供氨基供体来源以推动反应
平衡朝向胺产物形成。
各种有机溶剂可用在该方法中以促进酶反应并使得底物和/或产物在溶液中。在该
方法的一些实施方案中,有机溶剂包括极性溶剂,诸如甲醇或二甲基亚砜(DMSO)。
在一些实施方案中,有机溶剂是DMSO,其可以约10%至约40%体积/体积(v/v)存
在。在一些实施方案中,有机溶剂是DMSO,其可以约10%至约50%体积/体积
(v/v)存在。在一些实施方案中,DMSO以约40%v/v存在。
如以上讨论的,该方法中所用的氨基供体可以是手性胺或非手性胺。非手性氨基供
体具有的益处是不限制其反应于特定的立体异构体,从而需要的氨基供体较少。可
使用多种适合的氨基供体,包括例如但不限于,异丙胺(也称为2-氨基丙烷)、L、
D或DL丙氨酸、苯丙氨酸、谷氨酸、谷氨酰胺、亮氨酸(或任何其他适合的α-氨
基酸)、3-氨基丁酸(或任何其他适合的β-氨基酸)和甲基苄胺。在一些实施方案中,
氨基供体是异丙胺。在一些实施方案中,可使用其他氨基供体,包括但不限于α-
苯乙胺(也称为1-苯基乙胺)和其对映异构体(S)-1-苯基乙胺和(R)-1-苯基乙胺、2-氨
基-4-苯基丁烷、甘氨酸、L-谷氨酰胺、L-谷氨酸、谷氨酸单钠、L-天冬氨酸、L-赖
氨酸、L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺、1,6-己二
胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-
1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-
羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、 1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-
氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-
苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、
1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-
2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊
胺、2-甲基环己胺、3-甲基环己胺、1-氨基萘满、2-氨基萘满、2-氨基-5-甲氧基萘
满和1-氨基茚满,可能时包括(R)和(S)单独异构体,并包括这些胺的所有可能的
盐。
在以上方法的一些实施方案中,该方法中的步骤还可包括去除当氨基被转移到氨基
受体时从氨基供体形成的羰基副产物。这种原位去除可减少副反应率,从而正向反
应占主导,因此更多底物被转化为产物。
羰基副产物的去除可以许多方式进行。当氨基供体是氨基酸诸如丙氨酸时,羰基副
产物是酮酸,可通过与过氧化物反应来去除(参见如,US 2008/0213845,通过引用
并入本文)。可使用的过氧化物包括但不限于过氧化氢;过氧酸类(过酸)诸如过乙酸
(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸;有机过氧化
物诸如叔丁基过氧化物((CH3)3COOH)或其他选择性氧化
剂诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相
关化合物。可选地,丙酮酸的去除可通过利用乳酸脱氢酶将其还原为乳酸来实现,
以将平衡转向产物胺(参见如,Koszelewski等,2008,.350:2761-
2766)。丙酮酸的去除还可通过利用丙酮酸脱羧酶将其脱羧为二氧化碳和乙醛来实
现(参见如, 等,2008,ChemBioChem9:363-365)。
在一些实施方案中,当选择的氨基供体产生的羰基副产物比水的蒸气压高时(如,
低沸点副产品诸如挥发性有机羰基化合物),羰基副产物可通过向反应溶液充入非
反应性气体,或通过施加真空来降低反应压力,并去除气相中存在的羰基副产物来
去除。非反应性气体是不与反应组分起反应的任何气体。各种非反应性气体包括氮
气和稀有气体(如,惰性气体)。在一些实施方案中,非反应性气体是氮气。
在一些实施方案中,该方法中使用的氨基酸供体是异丙胺,其在向氨基受体转移氨
基时形成羰基副产物丙酮。丙酮可通过向反应溶液充入氮气 或施加真空,并通过
丙酮捕集器,诸如冷凝器或其他冷捕集器从气相去除丙酮来去除。可选地,丙酮可
通过利用酮还原酶还原为异丙醇来去除。
在其中去除羰基副产物的以上方法的一些实施方案中,在转氨基反应期间可加入相
应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供体还将平衡向产物形
成转移,从而增加底物向产物的转化。因此,在其中氨基供体是异丙胺并且丙酮产
物被原位去除的一些实施方案中,可向溶液加入异丙胺以补充丙酮去除期间失去的
氨基供体并维持反应的pH(如,在约8.5)。可选地,在氨基酸用作氨基供体的实施
方案中,酮酸羰基副产物可通过利用适当的氨基酸脱氢酶与氨和NADH反应来再
循环为氨基酸,从而补充氨基供体。
酮底物可以适当的量存在,取决于例如但不限于以下因素:溶剂性质、转氨酶对反
应温度的稳定性、酶的量和活性。在一些实施方案中,底物以5至50g/L存在。在
一些实施方案中,底物以5-25g/L存在。
在一些实施方案中,上述方法包括,在约1M至约2M的异丙胺存在下,在pH 7.5
至9.0和40至60℃的温度的反应条件下,将约10至50g/L的酮底物与约1至
20g/L的本文所述转氨酶接触,其中在24小时内至少80%、85%、90%、92%、
94%、96%或98%或更多的底物被转化为产物。在一些实施方案中,能够进行上
述反应的转氨酶多肽包括对应SEQ ID NO:58、72、74、80、86、96、98、100、
102、110或166的氨基酸序列。
在一些实施方案中,以上方法还可包括从反应混合物分离胺产物,诸如结构式(I)、
(III)或(V)的胺产物的步骤。
本文还提供了转氨酶与底物/产物的组合物。在一些实施方案中,组合物可包括结
构式(I)、(III)或(V)的胺产物、和本公开内容的转氨酶。任何一种或多种工程化的
转氨酶可以是组合物的部分。
在一些实施方案中,组合物还可包括氨基供体。在组合物的一些实施方案中,氨基
供体可包括异丙胺、丙氨酸、3-氨基丁酸或甲基苄胺。在组合物的一些实施方案中,
氨基供体是异丙胺。
本公开内容的方法可用于产生用于合成药物分子的异构体和衍生物 的各种中间产
物。例如,本公开内容的产生式(I)化合物的方法可用于合成分子诸如Odanacatib
或相关衍生物,Odanacatib是一种研究的选择性组织蛋白酶K抑制剂,用于阻止癌
症患者的骨转换。Odanacatib具有以下结构:
产生式(I)化合物的方法可用于制造用于合成某些噻二唑类(thiadaizoles),诸如以下
分子的中间产物。噻二唑类是CXC-和CC-趋化因子受体配体,据说具有抗炎和抗
肿瘤性质(WO 2005/066147)。
本公开内容产生式(V)化合物的方法可用于合成化合物,诸如:
WO 2008/128647公开了作为P2Y12拮抗剂的相似的喹啉-羧酰胺衍生物,其可能可
用于治疗心血管疾患。
5.4转氨酶多肽和多核苷酸
如上所述,上述方法中使用的转氨酶多肽最初是基于其转化酮酰胺底物4-氧-4-[3-
(三氟甲基)-5,6-二氢[1,2,4]三唑并[4,3-a]吡嗪-7(8H)-基]-1-(2,4,5-三氟苯基)
丁-2-酮(“西他列汀酮酰胺底物”)为产物(2R)-4-氧-4-[3-(三氟甲基)-5,6-二氢[1,2,
4]三唑并[4,3-a]吡嗪-7(8H)-基]-1-(2,4,5-三氟苯基)丁-2-胺以合成西他列汀的能
力来鉴定的。SEQ ID NO;2的转氨酶多肽不能有效地进行转氨基反应。这些转氨
酶多肽可关于其对西他列汀酮酰胺底物或对本文所述的底物的活性来描述。
转氨酶,包括本文所述的转氨酶,通常包含参与转氨基反应的辅酶吡哆醛磷酸
(PLP)。PLP可由在其中合成多肽的宿主细胞提供,或通过向多肽溶液加入PLP来
提供。尽管转氨酶是关于氨基酸序列描述的,本领域技术人员将理解,活性多肽包
含PLP或适当的类似物作为辅酶。
如上所述,在一些实施方案中,转氨酶多肽与SEQ ID NO:4具有至少80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或更大的氨基酸序列同一性,并能够以与SEQ ID NO:2的转氨
酶相比提高的比率转化酮底物为胺产物。
在一些实施方案中,转氨酶多肽与SEQ ID NO:58、72、74、80、86、96、98、
100或102具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或更大的氨基酸序列同一性,并能够
以与SEQ ID NO:2的转氨酶相比提高的比率转化酮底物为胺产物。
在一些实施方案中,工程化转氨酶多肽包括与转氨酶参考序列相比具有一个或多个
残基差异的氨基酸序列。残基差异可以是非保守取代、保守取代、或非保守取代与
保守取代的组合。关于残基差异和残基位置的描述,本文提供的转氨酶可参照以下
氨基酸序列来描述:节杆菌属KNKl68的天然产生的转氨酶、或SEQ ID NO:2的
转氨酶、或另一种工程化转氨酶,诸如SEQ ID NO:4多肽。对于本文的描述,参
考序列中的氨基酸残基位置在转氨酶中从起始甲硫氨酸(M)残基开始确定(即,M代
表残基位置1),尽管本领域技术人员将理解,这一起始的甲硫氨酸残基可能被诸
如宿主细胞或体外翻译系统中的生物加工机制去除以产生缺少起始甲硫氨酸残基的
成熟蛋白。
存在特定氨基酸或氨基酸改变(“残基差异”)的多肽序列位置有时在本文描述为“Xn”
或“位置n”,其中n是指参照参考序列的残基位置。
特定取代突变是参考序列中的特定残基被不同的特定残基代替,可用常规符号
“X(数字)Y”表示,其中X是参考序列中残基的单字母标识符,“数字”是参考序列
中的残基位置,Y是工程化序列中残基取代的单字母标识符。
在一些实施方案中,残基差异可发生在以下残基位置的一个或多个:X4;X5;X8;
X18;X25;X26;X27;X28;X30;X41;X42;X48;X49;X50;X54;X55;
X60;X61;X62;X65;X69;X81;X94;X96;X102;X117;X120;X122;
X124;X126;X136;X137;X138;X146;X148;X150;X152;X155;X156;
X160;X163;X164;X169;X174;X178;X195;X199;X204;X208;X209;
X211;X215;X217;X223;X225;X230;X252;X269;X273;X282;X284;
X292;X297;X302;X306;X321和X329。在一些实施 方案中,残基差异或其
组合伴随着改进的酶特性。在一些实施方案中,转氨酶多肽可在以上列的“Xn”表
示的那些特定位置以外的残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异数目
可以是在其他氨基酸残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,在其他残基位置的残基差异包括以保守氨基酸残基取代。
在本文的实施方案中,与SEQ ID NO:2相比,在转氨酶上影响底物结合的残基位
置的残基差异允许适应各种酮酰胺底物。不受理论限制,至少两个区域,即第一底
物结合区和第二底物结合区与酮酰胺底物的不同结构元件相互作用。第一结合区包
括残基位置X62、X136、X137、X195、X199、X208、X209、X223、X225和
X282,而第二结合区包括残基位置X69、X122和X284。因此,本文的转氨酶多
肽在包括X62、X69、X122、X136、X137、X195、X199、X208、X209、X223、
X225、X282和X284的残基位置具有一个或多个残基差异。在一些实施方案中,
本文的转氨酶多肽在与底物结合相关的特定残基位置具有至少两个或更多、三个或
更多、四个或更多、五个或更多、或六个或更多个残基差异。
在一些实施方案中,与SEQ ID NO:2相比的残基差异是在形成包括残基位置X62、
X136、X137、X195、X199、X208、X209、X223、X225和X282的第一底物结合
区的残基位置的一个或多个。因此,在一些实施方案中,工程化转氨酶包括包含与
SEQ ID NO:2相比,在残基位置X62、X136、X137、X195、X199、X208、X209、
X223、X225和X282的至少一个残基差异的氨基酸序列。
在一些实施方案中,与SEQ ID NO:2相比的残基差异是在形成包括残基位置X69、
X122和X284的第二底物结合区的残基位置的一个或多个。因此,在一些实施方
案中,工程化转氨酶包括包含与SEQ ID NO:2相比在残基位置X69、X122和
X284的至少一个残基差异的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含在第一结合区的残基差异 连同在第二
结合区的残基差异的氨基酸序列。因此,在一些实施方案中,工程化转氨酶包括包
含与SEQ ID NO:2相比,在残基位置X62、X136、X137、X195、X199、X208、
X209、X223、X225和X282的一个或多个残基差异,连同与SEQ ID NO:2相比,
在残基位置X69、X122和X284的一个或多个残基差异的氨基酸序列。
在本公开内容的工程化转氨酶的一些实施方案中,在一个残基位置的氨基酸残基可
以根据可在该位置表现出的氨基酸“特征”(如,氨基酸类型或特性)来定义。因此,
在一些实施方案中,在以上指定的位置的氨基酸残基可选自以下特征:X4是芳香
族残基;X5是碱性残基;X8是受限制的残基;X18是半胱氨酸(C)或脂肪族残基;
X25是极性残基;X26是芳香族或受限制的残基;X27是极性残基;X28是受限制
的残基;X30是极性或非极性残基;X41是受限制的或极性残基;X42是非极性残
基;X48是极性、酸性、脂肪族或非极性残基;X49是极性残基;X50是脂肪族残
基;X54是受限制的残基;X55是脂肪族残基;X60是芳香族残基;X61是芳香族
残基;X62是芳香族或极性残基;X65是脂肪族残基;X69是半胱氨酸(C)或非极
性、极性或脂肪族残基;X81是非极性残基;X94是脂肪族残基;X96是脂肪族残
基;X102是脂肪族或碱性残基;X117是非极性残基;X120是芳香族残基;X122
是受限制的、非极性或脂肪族残基;X124是极性或受限制的残基;X126是极性残
基;X136是芳香族残基;X137是极性或脂肪族残基;X138是碱性或受限制的残
基;X146是碱性残基;X148是脂肪族或芳香族残基;X150是芳香族、受限制的
或极性残基;X152是半胱氨酸(C)、非极性、脂肪族或极性残基;X155是非极性
或极性残基;X156是极性残基;X160是脂肪族残基;X163是脂肪族或受限制的
残基;X164是脂肪族或受限制的残基;X169是脂肪族残基;X174是脂肪族残基;
X178是极性残基;X195是芳香族或极性残基;X199是脂肪族或芳香族残基;
X204是脂肪族残基;X208是半胱氨酸(C)或受限制的、非极性、芳香族、极性或
碱性残基;X209是脂肪族残基;X211是脂肪族残基;X215是半胱氨酸(C);X217
是极性残基;X223是受限制的残基;X225是芳香族残基;X230是脂肪族残基;
X252是芳香族或脂肪族残基;X269是受限制的残基;X273是芳香族残基;X282
是极性残基; X284是非极性残基;X292是极性残基;X297是极性残基;X302是
脂肪族残基;X306是脂肪族残基;X321是受限制的残基;和X329是受限制的或
芳香族残基。在一些实施方案中,当在参考序列的对应残基位置的氨基酸残基被本
文对指定位置描述的氨基酸类别涵盖时,可按照本文提供的指导使用在该氨基酸类
别中的不同氨基酸。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X4是
Y、F或W,尤其是Y;X5是K或R,尤其是K;X8是H或P,尤其是P;X18
是C、A、V或I,尤其是C或I;X25是N、Q、S或T,尤其是Q;X26是F、W、
H或P,尤其是H;X27是N、Q、S或T,尤其是T;X28是P或H,尤其是P;
X30是N、Q、S、T、G、M、A、V、L或I,尤其是Q或M;X41是P、H、N、
Q、S或T,尤其是H或S;X42是G、M、A、V、L或I,尤其是G;X48是N、
Q、S、T、D、E、G、M、A、V、L或I,尤其是Q、D、V、G或A;X49是N、
Q或T,尤其是T;X50是A、V、L或I,尤其是L;X54是P或H;X55是A、
V或L,尤其是V;X60是F或W,尤其是F;X61是Y、F或W,尤其是Y;
X62是S、T、N、Q、Y、F或W,尤其是T、Y或F;X65是A、L或I,尤其是
A;X69是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X81
是G、M、A、V、L、I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是
A、V或L,尤其是L;X102是A、V、L、I、K或R,尤其是L或K;X117是G、
M、A、V、L或I,尤其是G;X120是Y、W或F,尤其是Y;X122是G、M、
A、V、I、L、P或H,尤其是M、I、L、V或H;X124是T、N、Q、P或H,尤
其是T、H或N;X126是N、Q或T,尤其是T;X136是Y、F或W,尤其是Y
或F;X137是S、T、N、Q、A、V、L或I,尤其是T或I;X138是K、P或H,
尤其是K或P;X146是K或R,尤其是R;X148是A、V、L、I、W或F,尤其
是A或F;X150是F、W、H、P、S、T、N或Q,尤其是F、H或S;X152是C、
G、M、A、L、I、S、T、N或Q,尤其是I、L、S或C;X155是N、S、T、G、
M、A、V、L或I,尤其是M、V或T;X156是N、Q、S或T,尤其是Q;X160
是A、V、L或I,尤其是L;X163是P、H、A、V或L,尤其是H或V;X164是
A、V、L、I、P或 H,尤其是V或P;X169是V、L或I,尤其是L;X174是A、
V、L或I,尤其是A;X178是S、N或Q,尤其是S;X195是F、Y、W、S、T、
N或Q,尤其是F或Q;X199是A、L、I、Y、F、W,尤其是W或I;X204是A、
V、L或I,尤其是A;X208是H、C、G、K、N、Y、D或S;X209是V、L或I,
尤其是L;X211是A、V或I,尤其是I;X215是C;X217是S、T、N或Q,尤
其是N;X223是H或P,尤其是P;X225是W或Y,尤其是Y;X230是A、V
或L,尤其是V;X252是A、V、I、Y、F或W,尤其是F;X269是H或P,尤
其是P;X273是Y、F或W,尤其是Y;X282是S、N或Q,尤其是S;X284是
G、M、V、L或I,尤其是G;X292是T、N或Q,尤其是T;X297是S、T、N
或Q,尤其是S;X302是A、L或I,尤其是A;X306是A、L或I,尤其是L;
X321是H或P,尤其是P;和X329是H、P、Y、F或W,尤其是H。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X4是
Y;X5是K;X8是P;X18是C或I;X25是Q;X26是H;X27是T;X28是P;
X30是Q或M;X41是H或S;X42是G;X48是Q、D、V、G或A;X49是T;
X50是L;X54是P或H;X55是V;X60是F;X61是Y;X62是T、Y或F;
X65是A;X69是G、C、T、A或S;X81是G;X94是I或L;X96是L;X102
是L或K;X117是G;X120是Y;X122是M、I、L、V或H;X124是T、H或
N;X126是T;X136是Y或F;X137是T或I;X138是K或P;X146是R;
X148是A或F;X150是F、H或S;X152是I、L、S或C;X155是M、V或T;
X156是Q;X160是L;X163是H或V;X164是V或P;X169是L;X174是A;
X178是S;X195是F或Q;X199是W或I;X204是A、V、L或I,尤其是A;
X208是H、C、G、K、N、Y、D或S;X209是L;X211是I;X215是C;X217
是N;X223是P;X225是Y;X230是V;X252是F;X269是P;X273是Y;
X282是S;X284是G;X292是T;X297是S;X302是A;X306是L;X321是
P;且X329是H。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X8是
P;X60是F;X61是Y;X62是T、Y或F;X65是A; X69是G、C、T、A或S;
X81是G;X94是I或L;X96是L;X122是M、I、L、V或H;X124是T、H或
N;X136是Y或F;X169是L;X178是S;X199是W或I;X209是L;X215是
C;X217是N;X223是P;X269是P;X273是Y;X282是S;X284是G;X297
是S;X321是P且X329是H。
在一些实施方案中,工程化转氨酶多肽包括包含以下特征的一个或多个的氨基酸序
列:对应X69的残基是半胱氨酸(C)或非极性、极性或脂肪族残基;对应X122的
残基是受限制的、非极性或脂肪族残基;对应X223的残基是受限制的残基;和对
应X284的残基是非极性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:(1)
对应X69的残基是C或非极性、脂肪族或极性残基,和/或对应X284的残基是非
极性残基;(2)对应X122的残基是受限制的、非极性或脂肪族残基;和(3)对应
X223的残基是受限制的残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或非极性、脂肪族或极性残基;X122是受限制的、非极性或脂肪族残基;和
X223是受限制的残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X122是G、
M、A、V、L、I、P或H,尤其是M、I、V、L或H;和X223是H或P,尤其是
P。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:
X122是受限制的、非极性或脂肪族残基;X223是受限制的残基;和X284是非极
性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:
X122是G、M、A、V、L、I、P或H,尤其是M、I、V、L或H;X223是H或P,
尤其是P;和X284是G、M、V、L或I,尤其是G。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或非极性、极性或脂肪族残基;X122是受限制的、非 极性或脂肪族残基;
X223是受限制的残基;和X284是非极性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X122是G、
M、A、V、L、I、P或H,尤其是M、I、V、L或H;X223是H或P,尤其是P;
和X284是G、M、A、V、L或I,尤其是G。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或T;X122是M或I;X223是P;和X284是G。
在一些实施方案中,在残基位置X69、X122、X223和X284具有一个或多个指定
特征或特征组合的工程化转氨酶多肽,与SEQ ID NO:2相比在以下残基位置可另
外具有一个或多个残基差异:X4;X5;X8;X18;X25;X26;X27;X28;X30;
X41;X42;X48;X49;X50;X54;X55;X60;X61;X62;X65;X81;X94;
X96;X102;X117;X120;X124;X126;X136;X137;X138;X146;X148;
X150;X152;X155;X156;X160;X163;X164;X169;X174;X178;X195;
X199;X204;X208;X209;X211;X215;X217;X225;X230;X252;X269;
X273;X282、X292;X297;X306;X321和X329。除了残基位置X69、X122、
X223和X284以外,这些其他残基位置与对转氨酶多肽不同特性的作用相关,因
此可具有与SEQ ID NO:2相比的残基差异以实现酶特性的期望改变。
如上所述,残基位置X62、X136、X137、X195、X199、X208、X209、X225和
X282以及残基位置X69、X122、X223和X284与底物对酶的结合相关,因此转氨
酶多肽可在这些列举的位置具有与SEQ ID NO:2相比的残基差异以实现酶特性的
期望改变。
残基位置X4、X5、X8、X26、X48、X60、X65、X81、X96、X102、X124、X160、
X163、X169、X174、X178、X211、X217、X225、X230、X252、X269、X273、
X292、X297、X306、X321、X329也与酶活性的其他增加相关,因此转氨酶多肽
可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现酶活性的其他期
望改变,例如在高底物负荷条件下转化效率的增加。
残基位置X18、X25、X27、X28、X30、X41、X42、X49、X50、X54、X55、
X117、X120、X126、X138、X146、X148、X150、X152、X155、X156、X164、
X204、X302也与热稳定性和/或溶剂诸如DMSO稳定性的增加相关,因此转氨酶
多肽可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现热稳定性和
/或溶剂稳定性的期望改变。
残基位置X61、X94、X215也与在高浓度氨基供体异丙胺时进行反应的能力相关,
因此转氨酶多肽可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现
在高(如,1-2M)浓度异丙胺时转化效率的增加。
应理解的是,在与酶的不同特性相关的残基位置与SEQ ID NO:2的残基差异可以
不同组合使用以形成具有期望酶促特征的转氨酶多肽,所述酶促特征例如酶活性、
溶剂稳定性和温度(temperate)稳定性、以及氨基供体的利用增加的组合。示例性的
组合在本文描述。
在一些实施方案中,用于指定残基位置的氨基酸残基可根据以上描述选择。例如,
氨基酸残基可基于以下特征选择:X4是芳香族残基;X5是碱性残基;X8是受限
制的残基;X18是半胱氨酸(C)或脂肪族残基;X25是极性残基;X26是芳香族或
受限制的残基;X27是极性残基;X28是受限制的残基;X30是极性或非极性残基;
X41是受限制的或极性残基;X42是非极性残基;X48是极性、酸性、脂肪族或非
极性残基;X49是极性残基;X50是脂肪族残基;X54是受限制的残基;X55是脂
肪族残基;X60是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;
X65是脂肪族残基;X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;
X102是脂肪族或碱性残基;X117是非极性残基;X120是芳香族残基;X124是极
性或受限制的残基;X126是极性残基;X136是芳香族残基;X137是极性或脂肪
族残基;X138是碱性或受限制的残基;X146是碱性残基;X148是脂肪族或芳香
族残基;X150是芳香族、受限制的或极性残基;X152是C、非极性、脂肪族或极
性残基;X155是非极性或极性残基;X156是极性残基;X160是脂肪族残基;
X163是脂肪族或受限制的残基;X164是脂肪族或受限制的残基;X169是脂肪族
残基;X174是脂肪族残基;X178是极性残基;X195是芳香族或极性残基;X199
是脂肪族或芳香族残基; X204是脂肪族残基;X208是半胱氨酸(C)或受限制的、
非极性、芳香族、极性或碱性残基;X209是脂肪族残基;X211是脂肪族残基;
X215是C;X217是极性残基;X225是芳香族残基;X230是脂肪族残基;X252
是芳香族或脂肪族残基;X269是受限制的残基;X273是芳香族残基;X282是极
性残基;X292是极性残基;X297是极性残基;X302是脂肪族残基;X306是脂肪
族残基;X321是受限制的残基;和X329是受限制的或芳香族残基。在这些残基
位置可使用的具体氨基酸残基在以上描述。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶可另外具有以下特征的一个或多个:X26是芳香族或受
限制的残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X94是脂肪族残基;X136是芳香族残基;X137是极性或脂肪族残基;X199是脂
肪族或芳香族残基;X209是脂肪族残基;X215是C;和X282是极性残基。
在一些实施方案中,除了上述特征以外,转氨酶的氨基酸序列可另外包括以下特征
的一个或多个:X8是受限制的残基;X60是芳香族残基;X81是非极性或小的残
基;X96是脂肪族残基;X124是极性或受限制的残基;X169是脂肪族残基;X217
是极性残基;X269是受限制的残基;X273是芳香族残基;X297是极性残基;和
X321是受限制的残基。
在一些实施方案中,除了上述特征以外,转氨酶的氨基酸序列可另外包括以下特征
的一个或多个:X4是芳香族残基;X48是极性、酸性、脂肪族或非极性残基;
X102是脂肪族或碱性残基;X150是芳香族、受限制的或极性残基;X152是C或
非极性、脂肪族或极性残基;X160是脂肪族残基;X163是脂肪族或受限制的残基;
X174是脂肪族残基;X178是极性残基;X195是芳香族或极性残基;X208是C或
受限制的、非极性、芳香族、极性或碱性残基;X211是脂肪族残基;X225是芳香
族残基;X230是脂肪族残基;X252是芳香族或脂肪族残基;X292是极性残基;
X306是脂肪族残基;和X329是受限制的或芳香族残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征或特征组合的工程化转氨酶包括至少以下另外的特 征:X26是芳香族
或受限制的残基,和/或X62是芳香族或极性残基;X65是脂肪族残基;X136是芳
香族残基;X199是脂肪族或芳香族残基;和X209是脂肪族残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X61是芳香族残基;X62是
芳香族或极性残基;X65是脂肪族残基;X94是脂肪族残基;X136是芳香族残基;
X199是脂肪族或芳香族残基;X209是脂肪族残基;X215是C;和X282是极性残
基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X61
是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;X81是非极性或小
的残基;X94是脂肪族残基;X136是芳香族残基;X199是脂肪族或芳香族残基;
X209是脂肪族残基;X215是C;X217是极性残基;X269是受限制的残基;X282
是极性残基;X297是极性残基;和X321是受限制的残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X60
是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;X124是极性或受限
制的残基;X136是芳香族残基;X169是脂肪族残基;X199是脂肪族或芳香族残
基;X209是脂肪族残基;X215是C;X217是极性残基;X269是受限制的残基;
X273是芳香族残基。X282是极性残基;X297是极性残基;和X321是受限制的残
基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X60
是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;X124是极性或受限
制的残基;X126是极性残基;X136是芳香族残基;X150是芳香族、受限制的或
极性残基;X152是半胱氨酸 (C)、非极性、脂肪族或极性残基;X169是脂肪族残
基;X199是脂肪族或芳香族残基;X209是脂肪族残基;X215是C;X217是极性
残基;X269是受限制的残基;X273是芳香族残基。X282是极性残基;X297是极
性残基;和X321是受限制的残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X26是P、H、F或W,尤
其是H,和/或X62是S、T、N、Q、Y、F或W,尤其是T或F;X65是A、L或
I,尤其是A;X136是Y、F或W,尤其是Y或F;X199是A、L、I、Y、F或W,
尤其是W或I;和X209是V、L或I,尤其是L。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X61是Y、F或W,尤其是
Y;X62是S、T、N、Q、Y、F或W,尤其是T或F;X65是A、L或I,尤其是
A;X94是A、V、L或I,尤其是I或L;X136是Y、F或W,尤其是Y或F;
X199是A、L、I、Y、F或W,尤其是W或I;X209是V、L或I,尤其是L;
X215是C;和X282是S、N或Q,尤其是S。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X61是Y、F或W,尤其是Y;X62是S、T、N、Q、Y、F或W,尤其是T或F;
X65是A、L或I,尤其是A;X81是G、M、A、V、L或I,尤其是G;X94是A、
V、L或I,尤其是I或L;X136是Y、F或W,尤其是Y或F;X199是A、L、I、
Y、F或W,尤其是W或I;X209是V、L或I,尤其是L;X215是C;X217是S、
T、N或Q,尤其是N;X269是H或P,尤其是P;X282是S、N或Q,尤其是S。
X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是P。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X60是F或W,尤其是F;X61是Y、F或W,尤 其是Y;X62是Y、F、W、S、
T、N或Q,尤其是T或F;X65是A、L或I,尤其是A;X81是G、M、A、V、
L或I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是A、V或L,尤其
是L;X124是P、H、T、N或Q,尤其是T、H或N;X136是Y、F或W,尤其
是Y或F;X169是V、L或I,尤其是L;X199是Y、F、W、A、L或I,尤其是
W或I;X209是V、L或I,尤其是L;X215是C;X217是S、T、N或Q,尤其
是N;X269是H或P,尤其是P;X273是Y、F或W,尤其是Y;X282是S、N
或Q,尤其是S;X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是
P。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X60是F或W,尤其是F;X61是Y、F或W,尤其是Y;X62是Y、F、W、S、
T、N或Q,尤其是T或F;X65是A、L或I,尤其是A;X81是G、M、A、V、
L或I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是A、V或L,尤其
是L;X124是P、H、T、N或Q,尤其是T、H或N;X126是N、Q或T,尤其
是T;X136是Y、F或W,尤其是Y或F;X150是F、W、H、P、S、T、N或Q,
尤其是F、H或S;X152是C、G、M、A、L、I、S、T、N或Q,尤其是G、I、
L、S或C;X169是V、L或I,尤其是L;X199是Y、F、W、A、L或I,尤其是
W或I;X209是V、L或I,尤其是L;X215是C;X217是S、T、N或Q,尤其
是N;X269是H或P,尤其是P;X273是Y、F或W,尤其是Y;X282是S、N
或Q,尤其是S;X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是
P。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残
基,尤其是P;X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽
可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、
1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、
1-50、1-55或1-60个残基差 异。在一些实施方案中,差异的数目可以是在其他残
基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化
转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置(即,X122;
X223和X284)描述的特征的参考氨基酸序列(如,SEQ ID NO:8或10)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X69是C
或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非
极性或脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残基,尤其是P;
和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置(即,X69;X122;X223和
X284)描述的特征的参考序列(如,SEQ ID NO:4)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括具有至少对指定残基
描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X65是脂
肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、
A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;和
X223是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:6)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化
转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:6至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X174是脂肪族残基,
尤其是A;X223是受限制的残基,尤其是P;和X284是非极性残基,尤其是G。
在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、
1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-
24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施
方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、
11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60个残
基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具
有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:12)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:12至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残基,尤其是P;和
X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位
置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:14)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:14至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其是W或I,
尤其是X223是受限制的残基,尤其是P;X225是芳香族残基,尤其是Y,X282
是极性残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,
转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、
1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、
1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中, 差异的数目可
以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、
18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方
案中,工程化转氨酶多肽可包括与基于SEQID NO:2、具有对以上指定残基位置
描述的特征的参考序列(如,SEQ ID NO:16)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:16至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X199是脂肪族或芳香族残基,尤其是W
或I;X209是脂肪族残基,尤其是L;X223是受限制的残基,尤其是P;X225是
芳香族残基,尤其是Y;X282是极性残基,尤其是S;和X284是非极性残基,尤
其是G。在一些实施方案中,转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:18)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转
氨酶多肽可包括与参考序列SEQ ID NO:18至少约80%、85%、86%、
87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或
I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
20、22、28、30、32、34、38或40)至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:20、22、28、30、32、34、38或40至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极 性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或
I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X223是受限制的残基,尤其是P;X225是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶
多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、
1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:24)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨
基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:
24至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;
X137是极性或脂肪族残基,尤其是T或I;X174是脂肪族残基,尤其是A;X199
是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X223是
受限制的残基,尤其是P;X230是脂肪族残基,尤其是V;和X284是非极性残基,
尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、
1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、 5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:26)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:26至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X61是芳香族残基,尤其是Y;X62是芳香族或
极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、
脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或脂肪
族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是
极性或脂肪族残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X223是受限制的残基,尤其是P;X282是极性残
基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多
肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-
11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ IDNO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:36)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的
氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:36至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X4是芳
香族残基,尤其是Y;X26是芳香族或受限制的残基,尤其是H;X62是芳香族或
极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、
脂肪族或极性残基,尤其是G、C、T、A或S;X94是脂肪族残基,尤其是I或L;
X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香
族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或I;X199是脂肪
族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
42)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶
多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方
案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:42至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X62是芳香族
或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X94是脂肪族残基,尤其是I
或L;X122是受限制的、非极性或脂肪族残 基,尤其是M、I、L、V或H;X136
是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或I;X199
是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是
C;X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非
极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
44、46或48)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化
转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:44、46或48至少
约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族
残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A
或S;X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,
尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂
肪族残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;X209是
脂肪族残基,尤其是L;X215是半胱氨酸(C);X223是受限制的残基,尤其是P;
X282是极性残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案
中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在 一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:50)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:50至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X152是C、非极性、脂肪族或极性残基,尤其是G、I、L、
S或C;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其
是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;
和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ IDNO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:52)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化 转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:52至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪
族残基,尤其是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残
基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多
肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-
11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:54或56)至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:54或56至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y 或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X199是脂肪族或芳香
族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X223是受
限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极性残基,尤
其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:58或60)至少
约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包
括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,
工程化转氨酶多肽可包括与参考序列SEQ ID NO:58或60至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X160是脂肪族残基,尤其是L;X169是脂肪族残基,尤其
是L;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是
L;X215是C;X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是
P;X282是极性残基,尤其是S;和X284是非极性残基,尤其是G。 在一些实施
方案中,转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-4、1-5、1-6、1-7、
1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、
1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差
异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定
残基位置描述的特征的参考序列(如,SEQ ID NO:62)至少约80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指
定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与
参考序列SEQ ID NO:62至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残
基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X223是受限制
的残基,尤其是P;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
和X306是脂肪族残基,尤其是L。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:64)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:64至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X102是脂肪族或碱性残基,尤其是L或K;
X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香
族残基,尤其是Y或F;X150是芳香族、受限制的或极性残基,尤其是F、H或S;
X152是C、非极性、脂肪族或极性残基,尤其是G、I、L、S或C;X199是脂肪
族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
66)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶
多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方
案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:66至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、 98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X48是极性、酸性、脂肪族或非极性残基,尤其是D、V、G、
Q或A;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y
或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤
其是G、C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其
是I或L;X96是脂肪族残基,尤其是L;X102是脂肪族或碱性残基,尤其是L或
K;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X163是脂肪族或受限制的残基,尤其是H或V;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X211是脂肪族残基,尤其是I;X215是C;X217是极性残基,尤其是N;X223
是受限制的残基,尤其是P;X252是芳香族或脂肪族残基,尤其是F;X273是芳
香族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是
G;和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其
他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、
1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:68)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:68至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X48是极性、酸性、脂肪族或非极性残基,尤其是A;X61是
芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂
肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、
A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其是I或L;X122
是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残
基,尤其是Y或F;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,
尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,
尤其是N;X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;
X282是极性残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,
尤其是S;和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽
可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、
1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、
1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残
基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化
转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的
参考序列(如,SEQ ID NO:70)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸
序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:70
至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤
其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极
性残基,尤其是G、C、T、A或S;X94是脂 肪族残基,尤其是I或L;X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,
尤其是Y或F;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,
尤其是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残基,尤其
是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其
他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、
1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:72)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:72至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤
其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极
性残基,尤其是G、C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族
残基,尤其是I或L;X96是脂肪族残基,尤其是L;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;
X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209
是脂肪族残基,尤其是L;X215是C;X223是受限制的残基,尤其是P;X269是
受限制的残基,尤其是P;X282是极性残基,尤其是S;X284是非极性残基,尤
其是G;X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一
些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、 1-3、1-4、1-5、1-6、
1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、
1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案
中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、
12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差
异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对
以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:74)至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残
基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与
参考序列SEQ ID NO:74至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X152是C或非极性、脂肪族或极性残基,尤其是G、
I、L、S或C;X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其
是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其
是N;X223是受限制的残基,尤其是P;X252是芳香族或脂肪族残基,尤其是F;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在 一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:76)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:76至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X178是极性残基,
尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤
其是L;X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其
是P;X269是受限制的残基,尤其是P;X282是极性残基,尤其是S;X284是非
极性残基,尤其是G;X292是极性残基,尤其是T;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基 于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:78)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:78至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X199是脂肪族或芳
香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是
极性残基,尤其是N;X223是受限制的残基,尤其是P;X269是受限制的残基,
尤其是P;X273是芳香族残基,尤其是Y;X282是极性残基,尤其是S;X284是
非极性残基,尤其是G;X297是极性残基,尤其是S;和X321是受限制的残基,
尤其是P。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、
1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:80)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对
指定残基位置描述的特征的氨基酸序列。在一些实施 方案中,工程化转氨酶多肽
可包括与参考序列SEQ ID NO:80至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X178是极性残基,
尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤
其是L;X215是C;X223是受限制的残基,尤其是P;X269是受限制的残基,尤
其是P;X273是芳香族残基,尤其是Y;X282是极性残基,尤其是S;X284是非
极性残基,尤其是G;X297是极性残基,尤其是S;和X321是受限制的残基,尤
其是P。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:82)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对
指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可
包括与参考序列SEQ ID NO:82至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;X223
是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香族残
基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:84、86、88、96、98或100)至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含
至少对指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:84、86、88、96、98或100至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65 是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X150是芳香族、受限制的或极性残基,尤其是F、H
或S;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或
I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:90)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:90至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、 V或H;X124是极性或受限制的残基,尤其是T、
H或N;X136是芳香族残基,尤其是Y或F;X150是芳香族、受限制的或极性残
基,尤其是F、H或S;X152是C或非极性、脂肪族或极性残基,尤其是G、I、L、
S或C;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W
或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:92)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:92至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X150是芳香族、 受限制的或极性残基,尤其是F、H或S;X152是C或非极性、
脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其是L;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:94)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:94至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223 是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;X321是受限制的残基,尤其是P;和X329是受限
制的或芳香族残基,尤其是H。在一些实施方案中,转氨酶多肽可在其他残基位置
另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-
15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:102)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:102至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X150是芳香族、受限制的或极性残基,尤其是S;X152是半胱氨酸(C)、非极性、
脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其是L;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其 是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:110)至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条
件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:110至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X49是极性残基,尤其是T;X60是芳香族残基,尤其是F;
X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其是I或L;
X96是脂肪族残基,尤其是L;X117是非极性残基,尤其是G;X122是受限制的、
非极性或脂肪族残基,尤其是M、I、L、V或H;X124是极性或受限制的残基,
尤其是T、H或N;X126是极性残基,尤其是T;X136是芳香族残基,尤其是Y
或F;X150是芳香族、受限制的或极性残基,尤其是S;X152是半胱氨酸(C)、非
极性、脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其
是L;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是
L;X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其 是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
X302是脂肪族残基,尤其是A;和X321是受限制的残基,尤其是P。在一些实施
方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、
1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、
1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差
异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定
残基位置描述的特征的参考序列(如,SEQ ID NO:166)至少约80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:166至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
以下表2提供示例性的工程化转氨酶多肽,每一行列出两个SEQ ID NO,奇数是
指编码由偶数提供的氨基酸序列的核苷酸序列。残基差异是基于与参考序列
SEQ ID NO:2比较,该参考序列是源自于节杆菌属KNK168的转氨酶,与天然产
生的酶不同的是在残基位置X306以缬氨酸(V)取代异亮氨酸(I)。在活性列中,增
加的活性水平(即,“+”、“++”、“+++”等等)定义如下:“+”表示至少等于但不大于
SEQ ID NO:4活性的2倍(测定条件:2g/L酮酰胺底物、0.5M异丙胺、22℃、
pH 7.5、5%DMSO、100μM PLP);“++”表示大于SEQ ID NO:4活性的约50至
100倍(测定条件:2g/L酮酰胺底物、0.5M异丙胺、22℃、pH 7.5、5%MeOH、
100μM PLP);“+++”表示大于SEQ ID NO:22活性的约1.1至约5倍(测定条件:5-
10g/L酮酰胺底物、0.5-1M异丙胺、22-30℃、pH 7.5、5%MeOH、100μM PLP);
“++++”表示大于SEQ ID NO:48活性约1.1至5倍(测定条件:10-40g/L酮酰胺底
物、1M异丙胺、30-45℃、pH 8.5、10%MeOH、100μM PLP);“+++++”表示
SEQ ID NO:58活性的约1.1至5倍或更大(测定条件:40-100 g/L酮酰胺底物、
1M异丙胺、45℃、pH 8.5、10%MeOH-25%DMSO、250μM PLP);“++++++”表示
SEQ ID NO:104活性的约1.1至5倍或更大(测定条件:40-100g/L酮酰胺底物、
1M异丙胺、45℃、pH 8.5、50%DMSO、1000μM PLP)。利用甲醇和DMSO测量
活性的示例性测定条件描述在实施例6-11。
表2
如上所述,在一些实施方案中,转氨酶多肽可包括的氨基酸序列与参考序列
SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、
38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、
74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、
108、110、112、114、116、118、120、122、124、126、128、130、132、134、
136、138、140、142、144、146、148、150、152、154、156、158、160、162、
164、166或168至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更大地相同。在一些实施方
案中,与SEQ ID NO:2代表的天然存在的转氨酶相比,转氨酶多肽可具有1-2、
1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、
1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。
在一些实施方案中,与SEQ ID NO:2相比,残基差异的数目可以是1、2、3、 4、
5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、
45、50、55或60个差异。
在一些实施方案中,转氨酶多肽包括的氨基酸序列与参考序列SEQ ID NO:58、
72、74、80、86、96、98、100或102至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大地
相同。在一些实施方案中,与SEQ ID NO:2代表的天然存在的转氨酶相比,转氨
酶多肽可具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,与SEQ ID NO:2相比,残基差异的数
目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个差异。
在一些实施方案中,转氨酶多肽包括的氨基酸序列与基于SEQ ID NO:4、6、8、
10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、
46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、
142、144、146、148、150、152、154、156、158、160、162、164、166或168的
参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%相同,条件是,与SEQ ID NO:2
相比,转氨酶氨基酸序列包括表2中列出的多肽序列任一种中包含的任一组残基差
异。在一些实施方案中,与参考序列相比,转氨酶多肽可在其他氨基酸残基位置另
外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、
1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-
60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、
4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、
45、50、55或60个残基差异。在一些实施方案中,在其他残基位置的残基差异包
括用保守氨基酸残基取代。
如以上指出的,在一些实施方案中,转氨酶多肽还能够转化酮底物为至少70%、
80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%
对映体过量的胺产物。具有指定水平的对映体选择性的示例性转氨酶多肽可包括对
应SEQ ID NO:58、72、74、80、86、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括本文所述的工程化转氨酶多肽的缺失。
因此,对于本公开内容的转氨酶多肽的每一个实施方案,只要保持该转氨酶活性的
功能活性,缺失可以包括一个或更多个氨基酸、2个或更多个氨基酸、3个或更多
个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个
或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个
氨基酸、高达转氨酶多肽的氨基酸总数的10%、高达氨基酸总数的10%、高达氨
基酸总数的20%、或高达氨基酸的总数的30%。在一些实施方案中,缺失可以包
括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11
个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-
26个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个氨基酸残基。
在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、
8个、9个、10个、11个、12个、14个、15个、16个、18个、20个、22个、24
个、26个、30个、35个、40个、45个、50个、55个或60个氨基酸。在一些实施
方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10
个、11个、12个、13个、14个、15个、16个、18个、20个、22个、24个、26
个、28个或30个氨基酸残基的缺失。
如本文所述,本公开内容的转氨酶多肽可以是融合多肽的形式,其中转氨酶多肽与
其他多肽融合,所述其他多肽诸如但不限于抗体标签(如,myc表位)、纯化序列(如,
用于结合金属的His标签)和细胞定位信号(如,分泌信号)。因此,转氨酶多肽可与
其他多肽融合或不融合地使用。
本文所述的多肽不受限于遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文所
述的多肽可以总体上或部分上由天然存在的和/或合成的非编码氨基酸组成。本文
所述的多肽可包含的某些常见非编码氨基酸可以包括但不限于:遗传编码的氨基酸
的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);
δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸
(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘
氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸
(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸
(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨
酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-
硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨
酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);
3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘
苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯
丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙
氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸
(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);
噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);
高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,
3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹
啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸
(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸
苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;
哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸
(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸 (hLeu);
高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,
4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸
(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文所述多肽可包
含的另外的非编码氨基酸将对本领域技术人员是明显的(参见,例如,在Fasman,
1989,CRC Practical Handbook of Biochemistry and Molecular Biology(CRC生物化学
和分子生物学实用手册),CRC Press,Boca Raton,FL,在第3-70页及其中引用的
参考文献中提供的多种氨基酸,该文献以及其中所引用的参考文献全部通过引用并
入本文)。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以构成本文所述的
多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括
(在圆括号中列出保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶亚氧硫
基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、
His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
本文所述多肽可包含的构型上受限制的非编码氨基酸包括但不限于N-甲基氨基酸
(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨
酸(hPro);以及1-氨基环戊烷-3-羧酸。
如上所述,被引入天然存在的多肽以产生工程化转氨酶的各种修饰可以被定向至该
酶的具体特性。
另一方面,本公开内容提供了编码改进的转氨酶多肽的多核苷酸。可以将所述多核
苷酸可操作地连接至控制基因表达的一种或多种异源调节序列以产生能够表达转氨
酶多肽的重组多核苷酸。可以将包含编码工程化转氨酶的异源多核苷酸的表达构建
体引入适当的宿主细胞中来表达对应的转氨酶多肽。
由于对各种氨基酸所对应的密码子的了解,蛋白序列的可用性提供了对能够编码该
主题的所有多核苷酸的描述。其中相同氨基酸由替代的或同义的密码子编码的遗传
密码的简并性允许极大数目的核酸被制出,所有这 些核酸编码本文所公开的改进
的转氨酶多肽。因此,如果已识别了具体的氨基酸序列,本领域技术人员能够以不
改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任意
数目的不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选
择的组合制出的多核苷酸的每一种可能的改变,并且所有这些改变将被认为对本文
公开的任何多肽明确地公开,所述本文公开的任何多肽包括在表2中提供的氨基酸
序列。
在一些实施方案中,可选择多核苷酸和/或使之工程化以包括被偏爱性地选择以适
合在其中产生蛋白的宿主细胞的密码子。例如,在细菌中使用的偏爱密码子用于在
细菌中表达基因;在酵母中使用的偏爱密码子用于酵母中的表达;并且在哺乳动物
中使用的偏爱密码子用于哺乳动物细胞中的表达。因为不必替换所有密码子来优化
转氨酶的密码子使用(如,由于天然序列可具有偏爱密码子并且因为偏爱密码子的
使用可能并不是所有氨基酸残基所需的),编码转氨酶多肽的密码子优化的多核苷
酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位
置包含偏爱密码子。
在一些实施方案中,多核苷酸编码包含与参考序列SEQ ID NO:58、72、74、80、
86、96、98、100或102至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更大地相同的氨基酸序列的
转氨酶多肽,其中该多肽能够以与节杆菌属KNK168的天然存在的转氨酶或
SEQ ID NO:2的转氨酶的活性相比改进的活性转化酮底物为胺产物。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与包括对应SEQID NO:4、6、
8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、
44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、
80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168的氨基酸序列的 多肽具有至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大序列同
一性的氨基酸序列,其中在氨基供体存在时,该多肽在转化酮底物为胺产物方面具
有一种或多种改进的特性。在一些实施方案中,编码的转氨酶多肽具有的活性等于
或大于SEQ ID NO:2多肽的活性。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与参考序列SEQ ID NO:4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、
44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、
80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%或99%相同的氨基酸序列。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与基于SEQ ID NO:4、6、8、
10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、
46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、
142、144、146、148、150、152、154、156、158、160、162、164、166或168的
参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是,与
SEQ ID NO:2相比,改进的转氨酶氨基酸序列包括表2中列出的多肽序列任一种
中包含的任一组残基差异。
在一些实施方案中,编码改进的转氨酶多肽的多核苷酸选自SEQ ID NO:3、5、7、
9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、
45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、
81、83、85、87、89、91、93、95、97、 99、101、103、105、107、109、111、
113、115、117、119、121、123、125、127、129、131、133、135、137、139、
141、143、145、147、149、151、153、155、157、159、161、163、165或167。
在一些实施方案中,多核苷酸能够在高度严格条件下与包括SEQ ID NO:3、5、7、
9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、
45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、
81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、
113、115、117、119、121、123、125、127、129、131、133、135、137、139、
141、143、145、147、149、151、153、155、157、159、161、163、165或167的
多核苷酸或其互补物杂交,其中高度严格杂交的多核苷酸编码的转氨酶多肽在氨基
供体存在下,能够以与SEQ ID NO:2多肽相比改进的活性转化式(II)化合物为式(I)
的胺产物。
在一些实施方案中,多核苷酸编码本文所述的多肽,但在核苷酸水平,与编码本文
所述的工程化转氨酶的参考多核苷酸具有约80%或更大序列同一性、约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更大序列同一性。在一些实施方案中,参考多核苷酸选自
SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、
35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、
71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、
105、107、109、111、113、115、117、119、121、123、125、127、129、131、
133、135、137、139、141、143、145、147、149、151、153、155、157、159、
161、163、165或167。
可以用多种方式操作编码改进的转氨酶多肽的分离的多核苷酸以提供该多肽的表达。
在一些实施方案中,编码工程化转氨酶多肽的多核苷酸可作为表达载体提供,其中
存在一个或多个控制序列以调节多核苷酸的表达。取决于表达载体,所分离的多核
苷酸在其插入载体中之前的操作可能是令人期望的或必要的。利用重组DNA方法
修饰多核苷酸和核酸序列的 技术是本领域公知的。在Sambrook等人,2001,
Molecular Cloning:A Laboratory Manual(分子克隆实验室指南),第3版,
Cold Spring Harbor Laboratory Press;以及Current Protocols in Molecular Biology(分
子生物学最新实验方案),Ausubel.F.编,Greene ates,1998,更新至
2006中提供了指导。
在一些实施方案中,除了其他以外,控制序列包括启动子、前导序列、多腺苷酸化
序列、前肽序列、信号肽序列和转录终止子。对于细菌宿主细胞,用于指导本公开
内容的核酸构建体转录的适宜启动子包括从大肠杆菌lac操纵子、大肠杆菌trp操
纵子、噬菌体λ、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草
芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌
(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌
(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌
(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因
(penP)、枯草芽孢杆菌xylA基因和xylB基因、以及原核β-内酰胺酶基因(Villa-
Kamaroff等人,1978, 75:3727-3731)获得的启动子以及
tac启动子(DeBoer等人,1983, 80:21-25)。
对于丝状真菌宿主细胞而言,用于指导本公开内容的核酸构建体转录的适宜启动子
包括从米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天
冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、
黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、
米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺
酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见如,WO 96/00787,
通过引用并入本文)的基因获得的启动子以及NA2-tpi启动子(来自黑曲霉中性α-淀
粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和它们突变的、截短
的及杂合的启动子。
在酵母宿主中,有用的启动子可以来自酿酒酵母(Saccharomyces cerevisiae)烯醇化
酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵 母醇脱氢酶/甘油醛-3-磷酸脱氢
酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸酯激酶的基因。Romanos等人,1992,
Yeast 8:423-488描述了酵母宿主细胞其他有用的启动子。
控制序列也可以是适宜的转录终止子序列,即由宿主细胞识别的终止转录的序列。
终止子序列被可操作地连接于编码多肽的核酸序列的3′端。在本发明中可以使用在
选择的宿主细胞中有功能的任何终止子。
例如,丝状真菌宿主细胞的示例性转录终止子可以从米曲霉TAKA淀粉酶、黑曲
霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌
胰蛋白酶样蛋白酶的基因中获得。
酵母宿主细胞的示例性终止子可以从酿酒酵母烯醇化酶、酿酒酵母细胞色素
C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因中获得。上述Romanos等人,
1992对酵母宿主细胞其他有用的终止子进行了描述。
控制序列也可以是适宜的前导序列,一种对宿主细胞翻译而言重要的mRNA的非
翻译区。前导序列被可操作地连接于编码多肽的核酸序列的5′端。可以使用在选择
的宿主细胞中有功能的任何前导序列。丝状真菌宿主细胞的示例性前导序列是从米
曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因中获得。酵母宿主细胞适宜
的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵
母α-因子以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因中获
得。
控制序列也可以是聚腺苷酸化序列,即可操作地连接于核酸序列的3′端并且当转录
时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。在本发明中
可以使用在选择的宿主细胞中有功能的任何聚腺苷酸化序列。丝状真菌宿主细胞的
示例性聚腺苷酸化序列可以从米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢
曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基
因中获得。Guo和Sherman,1995,Mol Cell Bio 15:5983-5990描述了酵母宿主细
胞的有用的聚腺苷酸化序列。
控制序列也可以是编码与多肽的氨基端连接的氨基酸序列并引导该 编码多肽进入
细胞分泌途径的信号肽编码区。核酸序列的编码序列的5′端可以固有地包含翻译阅
读框中与编码分泌的多肽的编码区区段天然连接的信号肽编码区。可选地,编码序
列的5′端可以包含对编码序列而言为外来的信号肽编码区。在编码序列天然不包含
信号肽编码区时可能需要外来的信号肽编码区。
细菌宿主细胞有效的信号肽编码区是从芽孢杆菌NClB 11837生麦芽糖淀粉酶、嗜
热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰
胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的
基因中获得的信号肽编码区。Simonen和Palva,1993,Microbiol Rev 57:109-137
描述了其他的信号肽。
丝状真菌宿主细胞有效的信号肽编码区可以是从米曲霉TAKA淀粉酶、黑曲霉中
性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉
(Humicola insolens)纤维素酶以及柔毛腐质酶(Humicola lanuginosa)脂肪酶的基因中
获得的信号肽编码区。
酵母宿主细胞有用的信号肽可以来自酿酒酵母α-因子和酿酒酵母转化酶的基因。
上述Romanos等人,1992对其他有用的信号肽编码区进行了描述。
控制序列也可以是编码位于多肽氨基端的氨基酸序列的前肽编码区。生成的多肽被
称为酶原(proenzyme)或多肽原(或在某些情况下称为酶原(zymogen))。多肽原一般
是无活性的,并且可以通过前肽从多肽原的催化裂解或自身催化裂解转化为成熟的
活性多肽。前肽编码区可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性
蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉
(Myceliophthora thermophila)乳糖酶的基因获得(参见如WO 95/33836,通过引用并
入本文)。
在信号肽和前肽区都存在于多肽的氨基端时,前肽区被定位于紧挨着多肽的氨基端
并且信号肽区被定位于紧挨着前肽区的氨基端。
添加调节序列可能也是令人期望的,所述调节序列允许相对于宿主细 胞的生长调
节多肽的表达。调节系统的实例是响应于化学刺激或物理刺激(包括调节化合物的
存在)而促使基因的表达被打开或关闭的那些调节系统。在原核宿主细胞中,适宜
的调节序列包括1ac、tac以及trp操纵子系统。在酵母宿主细胞中,适宜的调节系
统包括,例如ADH2系统或GAL1系统。在丝状真菌中,适宜的调节序列包括
TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子以及米曲霉葡萄糖淀粉酶启动
子。
调节序列的其他实例是那些允许基因扩增的调节序列。在真核系统中,这些调节序
列包括在甲氨蝶呤的存在下扩增的二氢叶酸还原酶基因和用重金属扩增的金属硫蛋
白基因。在这些情况下,编码本发明的转氨酶多肽的核酸序列将与调节序列可操作
地连接。
因此,在另一个实施方案中,本公开内容也涉及重组表达载体,所述重组表达载体
包含编码工程化转氨酶多肽或其变体的多核苷酸以及一个或更多个表达调节区,诸
如启动子和终止子、复制起点等等,这取决于表达调节区被引入的宿主的类型。可
以将上述多种核酸和控制序列连接在一起产生如下重组表达载体:所述重组表达载
体可以包括一个或更多个便利的限制性位点以允许在这些位点插入或取代编码多肽
的核酸序列。可选地,本公开内容的核酸序列可以通过将该核酸序列或包含该序列
的核酸构建体插入用于表达的适当载体中来表达。在表达载体的创建中,编码序列
位于载体中以使得该编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是能够便利地进行重组DNA步骤并且能够导致多核苷酸序列表
达的任何载体(例如质粒或病毒)。载体的选择将通常取决于载体与该载体要引入的
宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。
表达载体可以是自主复制的载体,即作为染色体外的实体而存在、其复制独立于染
色体复制的载体,例如质粒、染色体外的元件、微型染色体或人工染色体。载体可
以包含用于确保自我复制的任何手段。可选地,载体可以是在引入宿主细胞中时被
整合到基因组并与它所整合的染色体一起复制的载体。此外,可以使用单种载体或
质粒,或者一起包含要引入到 宿主细胞基因组中的总DNA的两种或更多种载体或
质粒,或转座子。
本发明的表达载体优选地包含一种或多种选择性标记,所述选择性标记使得容易选
择转化的细胞。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、
对重金属的耐受性、针对营养缺陷型的原养型等。细菌的选择性标记的实例是来自
枯草芽孢杆菌或地衣芽孢杆菌的da1基因,或是赋予抗生素抗性诸如氨苄西林、卡
那霉素、氯霉素或四环素抗性的标记。酵母宿主细胞的适宜标记是ADE2、HIS3、
LEU2、LYS2、MET3、TRP1和URA3。
在丝状真菌宿主细胞中使用的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟
氨酸氨基甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、
niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、
以及trpC(邻氨基苯甲酸合酶)以及它们的等同物。在曲霉属细胞中使用的实施方案
包括构巢曲霉或米曲霉的amdS基因和pyrG基因,以及吸水链霉菌
(Streptomyces hygroscopicus)的bar基因。
用于表达转氨酶的表达载体可包含允许载体整合到宿主细胞基因组中或允许该载体
在细胞中独立于基因组而自主复制的元件。对于整合到宿主细胞基因组中,载体可
以依赖于编码多肽的核酸序列或载体的任何其他元件通过同源重组或非同源重组将
载体整合到基因组中。
可选地,表达载体可以包含用于指导通过同源重组整合到宿主细胞基因组中的另外
的核酸序列。所述另外的核酸序列使载体能够在染色体中的精确位置被整合到宿主
细胞基因组中。为了提高在精确位置整合的可能性,整合元件应该优选地包含与对
应的靶序列高度同源的数目足够的核酸,诸如100到10,000个碱基对,优选400
到10,000个碱基对,以及最优选800到10,000个碱基对,以增强同源重组的机率。
整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件
可以是非编码核酸序列或编码核酸序列。另一方面,可以通过非同源重组将载体整
合到宿主细胞的基因组中。
对于自主复制,载体还可以包括使该载体能在要考虑的宿主细胞中自 主复制的复
制起点。细菌复制起点的实例是允许在大肠杆菌中复制的P15Aori、或质粒
pBR322、pUC19、pACYC177(该质粒具有P15A ori)或质粒pACYC184的复制起点,
以及允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。
在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4,ARS1
和CEN3的组合,以及ARS4和CEN6的组合。复制起点可以是具有突变的复制起
点,所述突变使其在宿主细胞中以温度敏感的方式起作用(参见,例如Ehrlich,
1978,Proc Natl Acad 75:1433)。
可以将多于一个拷贝的本发明的核酸序列插入宿主细胞中以提高基因产物的生产量。
核酸序列拷贝数的增加可以通过如下方式获得:通过将该序列的至少一个另外拷贝
整合到宿主细胞基因组中,或者通过使该核酸序列包括可扩增的选择性标记基因,
其中可以通过在适当选择剂的存在下培养细胞来选择包含该选择性标记基因的扩增
拷贝和由此包含该核酸序列的另外拷贝的细胞。
在本发明中使用的许多表达载体可商购获得。适宜的商业表达载体包括来自
Sigma-Aldrich Chemicals, MO.的p3xFLAGTMTM表达载体,
它包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH多腺苷酸化位点以
及用于在大肠杆菌中扩增的pBR322复制起点和氨苄西林抗性标记。其他适宜的表
达载体是可以从Stratagene,LaJolla CA商购获得的pBluescriptII SK(-)和pBK-
CMV,以及源自于pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、
pCEP4(Invitrogen)或pPoly(Lathe等人,1987,Gene 57:193-201)的质粒。
另一方面,本公开内容提供了包含编码本公开内容的改进转氨酶多肽的多核苷酸的
宿主细胞,该多核苷酸与用于在该宿主细胞中表达转氨酶的一个或更多个控制序列
可操作地连接。在由本发明的表达载体所编码的转氨酶多肽的表达中使用的宿主细
胞是本领域公知的并且包括但不限于:细菌细胞,诸如大肠杆菌、乳杆菌属、链霉
菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞
(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登记号201178));昆虫细
胞诸如 果蝇S2细胞和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、
293和Bowes黑色素瘤细胞;以及植物细胞。用于上述宿主细胞的适当培养基和生
长条件是本领域公知的。
可以通过本领域已知的多种方法将用于表达转氨酶的多核苷酸引入细胞中。技术包
括但不限于电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质
体融合。用于将多核苷酸引入细胞中的多种方法将对技术人员是明显的。
示例性宿主细胞是大肠杆菌W3110。通过将编码改进的转氨酶的多核苷酸可操作
地连入质粒pCK110900而产生表达载体,该多核苷酸与在1acI阻抑物的控制下的
1ac启动子可操作地连接。该表达载体也包含P15a复制起点和氯霉素抗性基因。
通过对在大肠杆菌W3110中包含主题多核苷酸的细胞进行氯霉素选择来分离这些
细胞。
改进的转氨酶或编码这种多肽的多核苷酸可利用本领域技术人员常用的方法制备。
如以上指出的,亲本序列SEQ ID NO:2源自于的节杆菌属KNK168转氨酶的天然
存在的氨基酸序列(在本文以SEQ ID NO:2代表)和编码节杆菌属KNK168转氨酶
的相应多核苷酸在美国专利号7,169,592可获得,其通过引用并入本文。在一些
实施方案中,对亲本多核苷酸序列进行密码子优化以增强转氨酶在指定的宿主细胞
中的表达。命名为SEQ ID NO:1的多核苷酸序列是用作大多数实验和工程化转氨
酶的文库构建的起点的亲本序列。
通过使编码天然存在的转氨酶的多核苷酸经历诱变和/或定向进化方法,可以获得
工程化转氨酶。示例性定向进化技术是如在Stemmer,1994,
Proc Natl Acad Sci USA 91:10747-10751;WO 95/22625;WO 97/0078;
WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利
6,537,746(其每一个通过引用并入本文)中所述的诱变和/或DNA改组。
其他可以使用的定向进化方案包括但不限于:交错延伸过程(StEP)、体外重组
(Zhao等人,1998,hnol.16:258-261)、诱变PCR(Caldwell等人,1994,
PCR Methods Appl.3:S136-S140)和盒式诱变(Black 等人,1996,
Proc Natl Acad Sci USA 93:3525-3529)。为了本文的目的可使 用的诱变和定向进
化技术还在以下参考文献中描述:Ling等,1997,“Approaches to DNA mutagenesis:
an overview(DNA诱变方法:概述),”m.254(2):157-78;Dale等,
1996,“Oligonucleotide-
directed random mutagenesis using the phosphorothioate method(利用磷硫酰方法的寡
核苷酸定向随机诱变),”Methods .57:369-74;Smith,1985,
“In vitro mutagenesis(体外诱变),”.19:423-462;Botstein等,1985,
“Strategies and applications of in vitro mutagenesis(体外诱变的策略和应
用),”Science 229:1193-1201;Carter,1986,“Site-directed mutagenesis(定位诱
变),”Biochem.J.237:1-7;Kramer等,1984,“Point Mismatch Repair(点错配修
复),”Cell 38:879-887;Wells等,1985,“Cassette mutagenesis:
an efficient method for generation of multiple mutations at defined sites(盒式诱变:用
于在指定位点产生多个突变的高效方法),”Gene 34:315-323;Minshull等,1999,
“Protein evolution by molecular breeding(通过分子育种的蛋白演
化),”Curr Opin Chem Biol 3:284-290;Christians等,1999,
“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shu
fling(利用DNA家族改组对腺苷激酶AZT磷酸化的定向进化),”Nature Biotech 17:
259-264;Crameri等,1998,
“DNA shuffling of a family of genes from diverse species accelerates directed evolution(
从多种物种的基因家族DNA改组加速定向进化),”Nature 391:288-291;Crameri
等,1997,
“Molecular evolution of an arsenate detoxification pathway by DNA shuffling(通过
DNA改组分子进化砷酸解毒途径),”Nature Biotech 15:436-438;Zhang等,1997,
“Directed evolution of an effective fructosidase from a galactosidase by DNA shuffling a
nd screening(通过DNA改组和筛选从半乳糖苷酶定向进化有效的果糖苷
酶),”Proc Natl Acad Sci USA 94:45-4-4509;Crameri等,1996,
“Improved green fluorescent protein by molecular evolution using DNA shuffling(利用
DNA改组通过分子进化改进的绿色荧光蛋白),’Nature Biotech 14:315-319;和
Stemmer,1994,“Rapid evolution of a protein in vitro by DNA shuffling(通过DNA改
组蛋白的体外快速进化),”Nature 370:389-391。所有出版物通过引用并入本文。
在一些实施方案中,对诱变处理后获得的克隆筛选具有期望的改进酶 特性的转氨
酶。测量来自表达文库的转氨酶酶活性可以使用标准技术进行,诸如分离产物(如,
通过HPLC)和通过测量分离的底物和产物的UV吸光度来检测产物和/或通过利用
串联质谱(如,MS/MS)检测。示例性的测定在以下实施例4描述。每单位时间期望
产物的增加比率指示在固定量的裂解物(或由其制成的冻干粉末)中转氨酶多肽的相
对(酶)活性。在期望的改进酶特性是热稳定性的情况下,可以在使酶制品经历限定
的温度并测量热处理后剩余的酶活性的量之后测量酶活性。然后对包含编码期望的
转氨酶的多核苷酸的克隆进行分离,测序,以识别核苷酸序列的改变(如果有的话),
并将这些克隆用于在宿主细胞中表达酶。
在工程化多肽的序列为已知的情况下,可以根据已知的合成方法通过标准固相方法
制备编码酶的多核苷酸。在一些实施方案中,高达大约100个碱基的片段能够单独
合成,然后连接(例如,通过酶连接或化学连接方法或聚合酶介导的方法)形成任何
期望的连续序列。例如,可以使用例如由Beaucage等人,1981,Tet Lett 22:
1859-69所描述的经典亚磷酰胺方法或由Matthes等人,1984,EMBO J.3:801-05
所描述的方法(例如,像它通常在自动化合成方法中实施的那样)通过化学合成来制
备本发明的多核苷酸和寡核苷酸。根据亚磷酰胺方法,例如在自动化DNA合成器
中合成寡核苷酸,纯化,退火,连接并克隆在适当载体中。此外,基本上任何核酸
都可以从各种商业来源中的任何一种获得,The Great American Gene Company,
Ramona,CA、ExpressGen o,IL、Operon Technologies Inc.,Alameda,
CA以及许多其他来源。
在宿主细胞中表达的工程化转氨酶可以使用任何一种或多种公知的蛋白质纯化技术
从这些细胞中和或培养基中回收,所述公知的蛋白质纯化技术包括但不限于溶菌酶
处理、超声处理、过滤、盐析、超离心和色谱。用于裂解和从细菌诸如大肠杆菌中
高效提取蛋白的适宜溶液是从 MO的Sigma-Aldrich以商品名
CelLytic BTM可商业途径获得的。
用于分离转氨酶多肽的色谱技术包括但不限于反相色谱、高效液相色谱、离子交换
色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分取决于如下因素:诸如
净电荷、疏水性、亲水性、分子量、分子形状等等, 并且将对本领域技术人员是
明显的。在一些实施方案中,工程化转氨酶可表达为与纯化标签或用于结合抗体的
抗体标签如myc表位标签的融合蛋白,纯化标签诸如具有对金属的亲和力的His-
标签。
在一些实施方案中,亲和技术可以用于分离改进的转氨酶。对于亲和色谱纯化,可
以使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生,可以通过用工程化多
肽注射来免疫多种宿主动物,包括但不限于兔、小鼠、大鼠等等。可以将该多肽与
适宜载体(诸如BSA)通过侧链官能基团或与侧链官能基团相连的连接物相连。多种
佐剂可根据宿主物种用于提高免疫应答,包括但不限于弗氏(完全或不完全)佐剂,
矿物凝胶诸如氢氧化铝,表面活性物质诸如溶血卵磷脂,多聚醇,聚阴离子,肽,
油乳剂,匙孔血蓝蛋白,二硝基苯酚,以及可能有用的人佐剂诸如BCG(卡介苗)和
短小棒状杆菌(Corynebacterium parvum)。
6.实施例
本公开内容的多个特征和实施方案在以下代表性实施例中被举例说明,这些代表性
实施例旨在举例说明而不是限制性的。
实施例1:野生型转氨酶基因的获取和表达载体的构建
基于报道的转氨酶的氨基酸序列和美国专利申请公开2(其通过引用并
入本文)实施例1所述的密码子优化算法,为在大肠杆菌中表达而设计转氨酶(TA)
编码基因。基因利用通常包括42个核苷酸的寡核苷酸合成,将基因克隆到表达载
体pCK110700(描绘为美国专利申请公开2的图1,其通过引用并入本
文)或pCK110900(描绘为美国专利申请公开2的图3,其通过引用并入
本文)中处于lac启动子控制下。这一表达载体还包含P15a复制起点和氯霉素抗性
基因。利用标准方法将所得质粒转化到大肠杆菌W3110中。密码子优化的基因和
编码的多肽列在表2中,其序列以SEQ ID NO:1和SEQ ID NO:2提供。
同样地,将编码本公开内容的工程化转氨酶、列在表2的基因(SEQ ID NO:3-168)
克隆到载体pCK110700或pCK110900以在大肠杆菌W3110 中表达。
实施例2:转氨酶粉末的产生-摇瓶方案
将包含编码目标转氨酶的质粒的大肠杆菌的单个微生物菌落接种到含30μg/mL氯
霉素和1%葡萄糖的50mL Luria Bertani肉汤中。细胞在培养箱(incubator)中在30℃
生长过夜(至少16小时),伴随以250rpm摇动。将培养物稀释到1升烧瓶中含
30μg/mL氯霉素和100μM吡多辛的250mL M9YE(1.0g/L氯化铵、0.5g/L氯化钠、
6.0g/L磷酸氢二钠、3.0g/L磷酸二氢钾、2.0g/L Tastone-154酵母提取物、1L/L去离
子水)中,至600nm的光密度(OD600)为0.2,并允许在30℃生长。当培养物的
OD600是0.6至0.8时,通过加入异丙基βD-硫代半乳糖苷(IPTG)至终浓度1mM来
诱导转氨酶基因的表达,然后培养持续过夜(至少16小时)。通过离心(5000rpm、
15min、4℃)收集细胞,丢弃上清液。将细胞沉淀重悬在等体积的冷的(4℃)含
100μM吡哆醛5’-磷酸(PLP)的100mM三乙醇胺(氯化物)缓冲液、pH 7.5中,如上
述通过离心收集。将洗涤的细胞重悬在两体积的冷的含PLP的三乙醇胺(氯化物)缓
冲液中,以12,000psi通过French Press两次并保持在4℃。通过离心(9000rpm、
45min.、4℃)去除细胞碎片。收集澄清的裂解物上清液,储存在-20℃。对冷冻的澄
清裂解物的冷冻干燥提供了粗制转氨酶干粉。可选地,细胞沉淀(洗涤前或洗涤后)
可储存在4℃或80℃。
实施例3:转氨酶的产生-发酵方案
将包含带有目标转氨酶基因的质粒的大肠杆菌的单个微生物菌落接种到含30μg/mL
氯霉素和1%葡萄糖的2mL M9YE肉汤(1.0g/L氯化铵、0.5g/L氯化钠、6.0g/L磷酸
氢二钠、3.0g/L磷酸二氢钾、2.0g/L Tastone-154酵母提取物、1L/L去离子水)中。
细胞在培养箱中在37℃生长过夜(至少12小时),伴随以250rpm摇动。过夜生长后,
将0.5mL的此培养物稀释到1升烧瓶中含30μg/ml氯霉素和1%葡萄糖的
250ml M9YE肉汤中,允许在37℃生长,伴随以250rpm摇动。当培养物的OD600
是0.5至1.0时,从培养箱取出细胞,立即使用或储存在4℃。
小型发酵利用6.0L生长培养基(0.88g/L硫酸铵、0.98g/L柠檬酸钠; 12.5g/L磷酸氢
二钾三水合物、6.25g/L磷酸二氢钾、3.3g/L Tastone-154酵母提取物、0.083g/L柠
檬酸铁铵、和8.3ml/L含2g/L氯化钙二水合物、2.2g/L硫酸锌七水合物、0.5g/L硫
酸锰一水合物、1g/L硫酸亚铜七水合物、0.1g/L钼酸铵四水合物和0.02g/L四硼酸
钠的微量元素溶液)在通气、搅动的15L发酵罐中在30℃进行。在121℃和15PSI
将容器灭菌30分钟,灭菌后加入100μM吡多辛。向发酵罐接种包含编码目标转氨
酶基因的质粒的大肠杆菌W3110的指数晚期培养物(生长在如上述的摇瓶中至初始
OD600为0.5至1.0)。以250-1250rpm搅动发酵罐,以0.6-25L/min向发酵容器供
应空气以保持溶解氧水平为50%饱和或更大。通过加入20%v/v氢氧化铵保持培养
物的pH在7.0。培养物的生长通过加入含500g/L工业葡萄糖右旋糖、12g/L氯化
铵和5.1g/L硫酸镁七水合物的进料溶液来维持。培养物达到OD600为
70+-10后,通过加入异丙基-β-D-硫代半乳糖苷(IPTG)至终浓度1mM来诱导转氨酶
的表达,发酵继续另外的18小时。然后将培养物冷却到4℃,保持在这一温度直
到收获。通过在Sorval RC12BP离心机中在4℃以5000G离心40分钟来收集细胞。
收获的细胞直接用于以下下游回收工艺,或可在4℃储存或在-80℃冷冻直到这样
使用。
在4℃将细胞沉淀以每体积的湿细胞糊重悬在2体积的含100μM吡哆醛5’-磷酸
(PLP)的100mM三乙醇胺(氯化物)缓冲液、pH 7.5中。利用12000psig的压力将悬
液通过配备有两阶段匀浆阀组件的匀浆器来从细胞释放细胞内转氨酶。破裂后立即
将细胞匀浆冷却到-20℃。向裂解物加入11%w/v聚乙烯亚胺pH 7.2溶液至终浓度
为0.5%w/v。向裂解物加入1MNa2SO4溶液至终浓度为
100mM。然后搅拌裂解物30分钟。通过在Sorval RC12BP离心机中在4℃以
5000G离心30分钟来澄清所得的悬液。澄清上清液被倾析,并利用分子量截留为
30kD的纤维素超滤膜浓缩10倍。将最终浓缩物分配到浅容器中,在-20℃冷冻并
冻干为粉末。将转氨酶粉末在-80℃冷冻。
实施例4:用于鉴定能够立体选择性地转化西他列汀酮酰胺底物为西他列
汀的节杆菌属KNK168转氨酶变体的高通量筛选
确定西他列汀酮酰胺底物向西他列汀转化的非手性HPLC方法:西他 列汀
酮酰胺底物(如美国专利号7,326,708中所述地制备)向西他列汀的酶促转化利用配
备有Agilent Eclipse XDB-C8柱(4.6×150mm、5μm)的Agilent 1200HPLC确定,利
用45:55的10mM NH4Ac/MeCN作为洗脱液,流速为1.5ml/min,柱
温度为40℃。保留时间:西他列汀酮酰胺底物:1.4min;西他列汀:1.7min。洗脱
物中的西他列汀酮酰胺底物和产物确定为在210nm或286nm处的峰面积,光程长
为1cm。利用这些条件,西他列汀的检测限是5μg/mL。通常,210nm的入射波长
用于活性类似或等于SEQ ID NO:4的转氨酶的活性测量。
确定西他列汀的立体纯度的手性HPLC方法:西他列汀的立体异构纯度利
用配备有Daicel Chiralpak AD-H柱(4.6×150mm、5μm)的Agilent 1200HPLC确定,
利用60∶40∶0.1∶0.1的EtOH/庚烷/二乙胺/水作为洗脱液,流速为0.8ml/min,柱
温度为35℃。保留时间:西他列汀酮酰胺底物:6.3min;(S)-对映异构体:8.4min;
西他列汀:10.8min。西他列汀酮酰胺底物和产物确定为在210nm或286nm处的峰
面积,光程长为1cm。
检测西他列汀酮酰胺底物向西他列汀的低水平转化的液相色谱-质谱(LC/MS)方
法:西他列汀酮酰胺底物向西他列汀的低水平酶促转化利用LC/MS/MS方法
确定。将5毫升样品上样到Eclipse XDB-C8HPLC柱(4.6×150mm),用0.2%甲酸铵
和甲醇的40∶60流动相以1.0mL/min等度(isocratically)洗脱。在35℃,西他列汀
的保留时间是1.5分钟。质谱法用来在Waters Quattro triple quadruple上检测。Q1
设置为通过408.1AMU的M+H离子,Q3设置为通过235.1AMU的子离子。碰撞
室(Q2)具有的碰撞能量是17.0,氩气流是0.3mL/min。离子化是通过APCI,电晕
放电为5μA,源温度是130℃,探测温度是600℃。去溶剂化的气流是100L/分钟,
锥孔气流设置为50L/分钟。利用这些条件,西他列汀的检测限是71pg/mL。
实施例5:用于鉴定能够立体选择性地转化西他列汀酮酰胺底物为西他列
汀的节杆菌属KNK168转氨酶变体的高通量筛选
利用上述方法诱变如实施例1所述地构建的编码转氨酶的基因,改变的DNA分子
群体用于转化适当的大肠杆菌宿主菌株。选择和加工抗生素 抗性转化体以鉴定表
达具有在适当的氨基供体(即,异丙胺)存在下,将西他列汀酮酰胺底物立体选择性
地转氨基为西他列汀的改进的能力的转氨酶的转化体。细胞选择、生长、诱导转氨
酶变体酶表达和收集细胞沉淀如以下所述。
利用 自动菌落挑取器(Genetix USA,Inc.,Boston,MA)将携带编码转氨酶的基因
的重组大肠杆菌菌落挑取到96孔的浅孔微量滴定板,每孔中包含180μL LB肉汤、
1%葡萄糖和30μg/mL氯霉素(CAM)。细胞在30℃生长过夜,伴随以200rpm摇动。
然后将此培养物的10μL等份转移到包含390μL M9YE肉汤、100μM吡多辛和
30μg/mL CAM的96-深孔板中。在30℃伴随以250rpm摇动培养深孔板2-3小时后,
通过加入IPTG至终浓度1mM来诱导培养细胞中的重组基因表达。然后在30℃伴
随以250rpm摇动培养板18小时。
细胞通过离心(4000RPM,10min,4℃)沉淀,重悬在200μL裂解缓冲液中,通过在
室温摇动2小时而裂解。裂解缓冲液包含100mM三乙醇胺(氯化物)缓冲液、pH 7.5
或8.5、1mg/mL溶菌酶、500μg/mL硫酸多粘菌素B(PMBS)和250μM PLP。用铝/
聚苯乙烯薄片热封带(Velocity 11,Menlo Park,CA,目录号06643-001)密封板后,
在室温剧烈摇动板2小时。细胞碎片通过离心(4000RPM,10min.,4℃)沉淀,直
接检验澄清上清液,或在4℃储存直到使用。
对于在pH 7.5的甲醇或DMSO中筛选早期工程化转氨酶(即,早期“进化子”),将
西他列汀酮酰胺底物(40mg/mL)在甲醇或DMSO中的溶液的10μL等份加入 深孔板
的每个孔,随后利用Biomek NXp自动仪器(Beckman Coulter,Fullerton,CA)加入
90μL 1.1M异丙胺盐酸盐。然后,随后也利用Biomek NXp进行100μL回收的裂解
物上清液的加入,以提供包括2mg/ml西他列汀酮酰胺底物、500mM异丙胺盐酸盐、
50mM三乙醇胺pH 7.5和5%甲醇或DMSO(v/v)的反应。在175℃用铝/聚苯乙烯薄
片热封带(Velocity 11,Menlo Park,CA,目录号06643-001)热密封板2.5秒,然后
在30℃摇动过夜(至少16小时)。通过利用Phoenix液体操纵系统
(Art Robbins Instruments,Sunnyvale,CA)加入1ml乙腈来猝灭反 应。重新密封板,
摇动5min,然后以4000rpm离心10min。将澄清的反应混合物的200等份转移到
新的浅孔聚丙烯板(Costar#3365),如实施例4所述地密封和分析。
对于在pH 8.5的DMSO中筛选晚期工程化转氨酶(即,晚期“进化子”),将西他列
汀酮酰胺底物(400mg/mL)在二甲基亚砜(DMSO)中的溶液的50μL等份加入 深孔板
的每个孔,随后利用Biomek NXp自动仪器(Beckman Coulter,Fullerton,CA)加入
50μL 4M异丙胺盐酸盐。然后,随后也利用Biomek NX进行100μL回收的裂解物
上清液的加入,以提供包括100mg/ml西他列汀酮酰胺底物、1M异丙胺盐酸盐、
50mM三乙醇胺pH 8.5和25%DMSO(v/v)的反应。在175℃用铝/聚苯乙烯薄片热
封带(Velocity 11,Menlo Park,CA,目录号06643-001)热密封板2.5秒,然后在45℃
摇动过夜(至少16小时)。通过利用Phoenix液体操纵系统(Art Robbins Instruments,
Sunnyvale,CA)加入1ml乙腈来猝灭反应。重新密封板,摇动5min,然后以
4000rpm离心10min。将澄清的反应混合物的10μL等份转移到含190μL乙腈的新
的浅孔聚丙烯板(Costar#3365),如实施例4所述地密封和分析。
利用实施例4的检测方法,如实施例1和2中表达的SEQ ID NO:2的转氨酶表现
出对西他列汀酮酰胺底物没有可检测的活性。利用以上公开的方法和方案鉴定能够
转化西他列汀酮酰胺底物为西他列汀的节杆菌属KNK168转氨酶的变体。这些方
法的多次迭代,其中来自一轮的一个或多个改进的分离株用作下一轮诱变和筛选的
起始材料,用来开发或“进化”具有立体选择性地还原西他列汀酮酰胺底物为西他列
汀的改进的能力的节杆菌属KNK168转氨酶变体。
实施例6:在甲醇中西他列汀酮酰胺底物被源自于节杆菌属KNK168转氨
酶的表2中的工程化转氨酶立体选择性地转氨基
源自于节杆菌属KNK168转氨酶、在表2中标为“+”的改进的转氨酶以制备规模在
DMSO中如下评价。向配备有磁性搅拌棒的5mL反应瓶加入500μL转氨酶变体
(20mg/mL)在100mM三乙醇胺-氯化物缓冲液pH7.5中的溶液和250μM吡哆醛5’-
磷酸。随后,向转氨酶溶液加入450μL 1.1 M异丙胺盐酸盐,随后加入50μL西他
列汀酮酰胺底物(40mg/mL)在DMSO中的溶液。在22℃搅拌反应,通过对从反应
混合物定期获取的样品进行HPLC分析来监测反应(分析条件参见实施例4)。表2
提供对应标为“+”的转氨酶变体的SEQ ID NO.、与野生型转氨酶相比的氨基酸残基
差异数目、和各自与具有氨基酸序列SEQ ID NO:4的酶相比针对西他列汀酮酰胺
底物的活性。
在表2中标为“++”、“+++”、“++++”和“+++++”的改进的转氨酶以如下调整的条件
检验:“++”:2g/L西他列汀酮酰胺底物、0.5M异丙胺、22℃、pH 7.5、5%MeOH;
“+++”:5-10g/L西他列汀酮酰胺底物、0.5-1M异丙胺、22-30℃、pH 7.5、5%
MeOH;“++++”:10-40g/L西他列汀酮酰胺底物、1M异丙胺、30-45℃、pH 8.5、
10%MeOH;“+++++”:40-100g/L西他列汀酮酰胺底物、1M异丙胺、45℃、
pH 8.5、10%MeOH-25%DMSO;和“++++++”:40-100g/L酮酰胺底物、1M异丙
胺、45℃、pH8.5、50%DMSO、1000μM PLP。标为“+++”、“++++”、“+++++”、
“++++++”的改进的转氨酶的相对活性分别相对于SEQ ID NO:22、SEQ ID NO:
48、SEQ ID NO:58和SEQ ID NO:104的活性确定。
对于许多工程化转氨酶,西他列汀酮酰胺底物向西他列汀的转化还可利用以适当浓
度的氨基供体诸如D-丙氨酸、3-氨基丁酸或α-甲基苄胺来实现。
实施例7:从2,2,2-三氟-1-苯基乙酮制备(S)-2,2,2-三氟-1-苯基乙胺
(S)-2,2,2-三氟-1-苯基乙胺的制备如下阐明:
2,2,2-三氟-1-苯基乙酮 (S)-2,2,2-三氟-1-苯基乙胺
方法.将1.4g异丙胺盐酸盐加到14mL pH 8.5的0.1M三乙醇胺缓冲液中。
溶解异丙胺盐酸盐后,加入20mg PLP和100mg SEQ ID NO:74的转氨酶,以
400rpm轻柔搅动来溶解。将反应器加热到60℃,用5N NaOH 调整溶液的pH到
pH 8.5。将约400mg 2,2,2-三氟-1-苯基乙酮酮底物溶解在6mL DMSO中,经2
小时逐滴加入溶液。然后以500RPM、60℃搅拌反应器,pH设置在8.5持续24h。
24h后,反应已经达到99%转化为(S)-2,2,2-三氟-1-苯基乙胺产物。在后处理
(workup)期间,反应的温度降低到45℃,逐滴加入2N HCl以降低反应的pH到
pH 2。允许反应搅拌1小时,将沉淀经装有棉毛巾的玻璃烧结漏斗过滤。用
10mL 0.1N HCl洗涤沉淀3次。合并含水滤液,用5N NaOH提高pH到pH 11,随
后用2×100mL IPAC萃取。用25mL盐水洗涤IPAC层,以MgSO4干
燥,过滤,浓缩为(S)-2,2,2-三氟-1-苯基乙胺产物的油。
实施例8:从4-氯-1-(2-氟苯基)丁-1-酮制备(R)-2-(2-氟苯基)吡咯烷(R)-2-(2-
氟苯基)吡咯烷的制备如下阐明:
4-氯-1-(2-氟苯基)丁-1-酮 (R)-2-(2-氟苯基)吡咯烷
方法.向HPLC小瓶加入充入10μL酮和200μL DMSO。向50mLFalcon管加
入3.75g异丙胺-HCl和30mL 0.1M TEA缓冲液。加入约37.5mg PLP,涡旋反应混
合物以混合。向15mL Falcon管加入25mg SEQ ID NO:80的转氨酶。将
5mL PLP/缓冲液的溶液加入含酶的管,涡旋以溶解酶。将1.0mL酶溶液加入含4-
氯-1-(2-氟苯基)丁-1-酮酮底物和DMSO的LC小瓶,将小瓶置于45℃,在恒温混
匀器(thermomixer)上以1000rpm混合。数天后,LCMS分析显示53LCAP转化为产
物,M+1质量为166。共注入期望的(R)-2-(2-氟苯基)吡咯烷产物的可信标准品证实
了该峰的身份。用1.0mL EtOAC萃取反应混合物。浓缩样品,然后用甲醇稀释。
利用ChiralPak AD-H柱作为固定相的SFC检验显示(R)-2-(2-氟苯基)吡咯烷为95%
对映体过量。
实施例9:从3-氧-3-(吡啶-2-基)丙酸乙酯制备(R)-3-氨基-3-(吡啶-2-基)丙酸
乙酯
(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯的制备如下阐明:
3-氧-3-(吡啶-2-基)丙酸乙酯 (R)-3-氨基-3-(吡啶-2-基)丙酸乙酯
方法/材料:反应在带有pH监测器、上方的搅拌、加热罩和热电偶的3L
圆底烧瓶中进行。将约100g3-氧-3-(吡啶-2-基)丙酸乙酯酮酯底物溶解在
800mL DMSO中,这产生绿色的溶液。在含有100g/L异丙胺-HCl的1.2L 0.5M三
乙醇胺缓冲液pH 8.4中准备约4g维生素-B6(“PLP”)。加入后,pH为8.3。通过加
入3mL 20wt%KOH调整pH到pH 8.8。在缓冲液中准备SEQ ID NO:86的转氨酶
多肽(2g),混合直到完全溶解。溶液的pH是8.77,将溶液保持在21.7℃。将在
DMSO母液中准备的酮酯底物一次直接加入批次中。
反应:反应是放热的,从而加热批次温度到38.1℃,而溶液的pH是8.45,
表现为浅绿色浆液。将溶液加热到50℃。在47℃的温度,溶液的pH是8.31,然
后通过加入2mL 20wt%KOH调整pH到8.6。加入底物2小时后,pH为8.07,通
过加入4mL 4M异丙胺溶液调整pH到9.02。加入底物6小时后,pH是8.05,通
过加入4mL 4M异丙胺溶液调整pH到8.9。允许反应孵育过夜。加入底物15小时
后,pH是7.4,加入47.6mL水,增加搅拌(体积减少~25%)。加入约8mL 4M异
丙胺以调整pH到8.85。17.25小时后,pH是8.5,允许反应进行而不进一步调整
pH。在18.33小时,pH是8.27,在RP-HPLC上检验而确定反应完成。
反应后处理:在室温向溶液加入2g Solka 冷却后溶液的pH增加到9.2,因
为缓冲液存在温度依赖性pH变化。随着加入4.5mL浓
H2SO4调整溶液的pH到1.8,熟化1小时。然后将溶液真
空过滤通过带有5μm滤布的过滤瓶和烧结滤器(60mL-40M)。过滤进行1.5小时。
通过与洗液物理混合,用50.6g稀H2SO4(pH 1.6)洗涤滤饼。
过滤进行约20min。用50g稀酸性溶液再次洗涤滤饼,随后经<5min快速过滤。
合并第一次 的洗液和第一次的酸性水溶液,一次地加入67mL庚烷和3.3mL甲苯。
彻底混合溶液,在分液漏斗中分层。第一次的酸性水溶液产生合并的(R)-3-氨基-3-
(吡啶-2-基)丙酸乙酯氨基酸/氨基酯产物的理论产率的约63%的回收率。第一次的
酸性洗液产生约27%的回收率,而第二次的酸性洗液产生约10%的回收率。
向溶液加入约99.4g 20wt%KOH以调整pH到13,在50℃孵育溶液。20min后,
加入另外11.8g 20wt%KOH以调整pH从12.1到13。另外20min后,pH稳定在
12.8,HPLC确定水解完成。观察到固体从溶液沉淀出。在烧结漏斗上过滤碱性溶
液(固体溶解在水中,表现为无机的,因为仅观察到少量产物,固体不溶于MeCN)。
在旋转蒸发器上浓缩碱性溶液,产生(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯的粗制钾盐
溶液,75%产率。
在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有目的均通过引
用以其整体并入本文,其程度如同分别指出将每个单独的出版物、专利、专利申请
或其他文件出于所有目的通过引用并入一样。
尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本
发明的精神和范围。
2024年6月14日发(作者:堵天赋)
氨基供体存在下,将结构式(II)的酮底物:
与转氨酶多肽接触,其中所述转氨酶多肽是本文所述的工程化的转氨酶。 在一些
实施方案中,所述转氨酶多肽与SEQ ID NO:4具有至少80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%或更高的氨基酸序列同一性并能够以与SEQ ID NO:2的转氨酶相比提高的比
率转化式(II)的酮底物为式(I)的胺产物。
在一些实施方案中,所述转氨酶多肽与SEQ ID NO:58、72、74、80、86、96、
98、100或102具有至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更高的氨基酸序列同一性并
能够以与SEQ ID NO:2的转氨酶相比提高的比率转化酮底物为胺产物。用于该方
法的工程化的转氨酶的具体实施方案在详述中进一步提供。
在一些实施方案中,工程化的转氨酶具有SEQ ID NO:74的至少5%、10%、
20%、30%、40%、50%或更大活性。
在一些实施方案中,胺产物以至少70%、80%、85%、90%、95%、96%、97%、
96%或99%或更大的对映体过量产生。在上述方法的一些实施方案中,胺产物以
至少99%对映体过量产生。
如上所述,可用于本公开内容的方法中的转氨酶多肽可按照其转化西他列汀酮酰胺
底物为西他列汀的能力来表征。因此,在本文公开的方法的任何实施方案中,可进
行该方法,其中转氨酶多肽能够以与SEQ ID NO:2的转氨酶相比提高的比率转化
西他列汀酮酰胺底物为西他列汀,并与SEQ ID NO:4具有至少80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%或更大的氨基酸序列同一性。
在上述方法的一些实施方案中,R1是任选地取代的苯基。在一些实施
方案中,R1是任选地取代的吡啶基。在一些实施方案中,
R1是取代的芳基或杂芳基。在一些实施方案中,对芳基或杂芳基的取
代选自C1-C4烃基、-OR’、-SR’、-NR’R’、-
NO2、-NO、-CN、-CF3、卤素(如,-F、-Cl、-Br和-I)、-
C(O)R’、-C(O)OR’、-C(O)NR’、-S(O)2R’、-S(O)2NR’R”,
其中每个R’和R”独立地选自氢和(C1-C4)烃基组成的组。
在一些实施方案中,(C1-C4)烃基是卤素取代的烃基。
在一些实施方案中,R2是C1-C4烃基或卤素
取代的C1-C4烃基,尤其是甲基、卤素取代的甲基、丙基
或卤素取代的丙基。在一些实施方案中,R2是CF2H或
CF3。
在R2的一些实施方案中,对C1-C6烃基和
R3基团的取代选自卤素、OH、NR5R6或
OR8,其中R3、R6和R8如以上
定义的。在一些实施方案中,在上述方法中产生的式(I)化合物是基本上手性纯的化
合物。在某些实施方案中,在上述方法中产生的式(I)化合物是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9是H、Cl、Br、F、CH3、CF3、
NH2、NO2、CN、SCN、OCF3或
OCH3,R2是任选地取代的C1-C6
烃基,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9是H、Cl、Br、F、CH3、CF3、
NH2、NO2、CN、SCN、OCF3或
OCH3,且式(II)的酮底物是:
在一些实施方案中,R9是H、Br、CH3或CF3。
在一些实施方案中,R9是在苯基环的对位。在一些实施方案中,上述
方法中的胺产物以至少70%、80%、85%、90%、95%、96%、97%、96%或99%
或更大的对映体过量产生。在一些实施方案中,在上述方法中产生的化合物是基本
上手性纯的化合物。在一些实施方案中,在上述方法中产生的化合物是手性纯的化
合物。
在该方法的一些实施方案中,式(I)的胺产物是(S)-1-(4-溴苯基)-2,2,2-三氟乙
胺:
且式(II)的酮底物是1-(4-溴苯基)-2,2,2-三氟乙酮:
在该方法的一些实施方案中,(S)-1-(4-溴苯基)-2,2,2-三氟乙胺以至少70%、
80%、85%、90%、95%、96%、97%、96%或99%或更大的对映体过量产生。
在一些实施方案中,产生的(S)-1-(4-溴苯基)-2,2,2-三氟乙胺是基本上手性纯的
化合物。在某些实施方案中,该方法中产生的(S)-1-(4-溴 苯基)-2,2,2-三氟乙胺
是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是(S)-2,2,2-三氟-1-对甲苯基乙胺:
且式(II)的酮底物是2,2,2-三氟-1-对甲苯基乙酮:
在一些实施方案中,(S)-2,2,2-三氟-1-对甲苯基乙胺以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,产生的(S)-2,2,2-三氟-1-对甲苯基乙胺是基本上手性纯的。在某些实施方
案中,该方法中产生的(S)-2,2,2-三氟-1-对甲苯基乙胺是手性纯的。
在该方法的一些实施方案中,式(I)的产物胺是(S)-2,2,2-三氟-1-(4-(三氟甲基)苯
基)乙胺:
且式(II)的酮底物是2,2,2-三氟-1-(4-(三氟甲基)苯基)乙酮:
在一些实施方案中,(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基)乙胺以至少70%、80%、
85%、90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些
实施方案中,产生的(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基) 乙胺是基本上手性纯的。
在某些实施方案中,该方法中产生的(S)-2,2,2-三氟-1-(4-(三氟甲基)苯基)乙胺是
手性纯的。
在该方法的一些实施方案中,式(I)的产物胺是:
且式(II)的酮底物是:
其中R7是任选地取代的C1-C4烃基且
R10是氢、卤素、氨基或取代的氨基、C1-C4
烃基、卤素取代的C1-C4烃基、硝基、氰基、氰硫基或烃
氧基。在一些实施方案中,R10是上述的R9。在一些实施
方案中,R10是H或F。在一些实施方案中,R7是
C1-C4烃基。
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯:
且式(II)的酮底物是3-氧-3-(吡啶-2-基)丙酸乙酯:
在一些实施方案中,(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,产生的(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯是基本上手性纯的。在某些实施方
案中,该方法中产生的(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R11是卤素、OH、-C(O)R4、-OC(O)R5
或NR6R7,其中R4、R5、
R6、R7和R10如以上定义的,且式(II)的酮底
物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在一些实施方案中,式(I)的胺产物是(S)-4-氯-1-(2-氟苯基)丁-1-胺:
且式(II)的酮底物是4-氯-1-(2-氟苯基)丁-1-酮:
在一些实施方案中,(S)-4-氯-1-(2-氟苯基)丁-1-胺以至少70%、80%、85%、90%、
95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,
产生的(S)-4-氯-1-(2-氟苯基)丁-1-胺是基本上手性纯的。在某些实施方案中,该方
法中产生的(S)-4-氯-1-(2-氟苯基)丁-1-胺是手性纯。
在一些实施方案中,利用转氨酶生物催化剂的方法可用于制备式(III)化合物:
所述式(III)化合物在标为*的立体中心具有所示的立体化学构型,且所述式(III)化合
物与相对的对映异构体相比为对映体过量,其中R10如以上定义的。
制备式(III)的胺产物的方法可包括:
(a)在适于转化下式酮底物:
为下式胺产物:
的反应条件下,在氨基供体存在下,将所述酮底物与本文所述的转氨酶多肽接触,
其中R10和R11如以上定义的;
并
(b)在适当条件下环化所述胺产物以形成式(III)化合物。
在一些实施方案中,上述方法中式(III)的环化胺产物以至少70%、80%、85%、
90%、95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方
案中,在上述方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,
在上述方法中产生的化合物是手性纯的化合物。
在一些实施方案中,酮底物是4-氯-1-(2-氟苯基)丁-1-酮:
且胺产物是(S)-4-氯-1-(2-氟苯基)丁-1-胺:
从而形成对映体过量的(R)-2-(2-氟苯基)吡咯烷:
在一些实施方案中,(R)-2-(2-氟苯基)吡咯烷以至少70%、80%、85%、90%、
95%、96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,
产生的(R)-2-(2-氟苯基)吡咯烷是基本上手性纯的。在某些实施 方案中,该方法中
产生的(R)-2-(2-氟苯基)吡咯烷是手性纯的。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在该方法的一些实施方案中,式(I)的胺产物是:
其中R9如以上定义的,且式(II)的酮底物是:
在一些实施方案中,上述方法中的胺产物以至少70%、80%、85%、90%、95%、
96%、97%、96%或99%或更大的对映体过量产生。在一些实施方案中,在上述
方法中产生的化合物是基本上手性纯的化合物。在一些实施方案中,在上述方法中
产生的化合物是手性纯的化合物。
如本文所述,上述方法在适于转化酮底物为对映体过量的相应的手性胺产物的反应
条件中进行。在一些实施方案中,反应条件包括约20℃至约65℃的温度。在一些
实施方案中,反应条件包括约40℃至约65℃的温度。在一些实施方案中,反应条
件包括约50℃至约65℃的温度。例如,对于利用以下酮底物的方法:
反应条件包括40℃至65℃的温度。示例的温度是60℃。
在一些实施方案中,进行上述方法的反应条件包括pH约7.0至约11.0。在一些实
施方案中,反应条件包括pH约7.0至约9.0。在一些实施方案中,该方法的反应条
件是pH约8.5。尽管pH可在该方法过程中利用任何碱和/或酸来调整,在一些实
施方案中,pH可通过添加异丙胺来维持,异丙胺还提供氨基供体来源以推动反应
平衡朝向胺产物形成。
各种有机溶剂可用在该方法中以促进酶反应并使得底物和/或产物在溶液中。在该
方法的一些实施方案中,有机溶剂包括极性溶剂,诸如甲醇或二甲基亚砜(DMSO)。
在一些实施方案中,有机溶剂是DMSO,其可以约10%至约40%体积/体积(v/v)存
在。在一些实施方案中,有机溶剂是DMSO,其可以约10%至约50%体积/体积
(v/v)存在。在一些实施方案中,DMSO以约40%v/v存在。
如以上讨论的,该方法中所用的氨基供体可以是手性胺或非手性胺。非手性氨基供
体具有的益处是不限制其反应于特定的立体异构体,从而需要的氨基供体较少。可
使用多种适合的氨基供体,包括例如但不限于,异丙胺(也称为2-氨基丙烷)、L、
D或DL丙氨酸、苯丙氨酸、谷氨酸、谷氨酰胺、亮氨酸(或任何其他适合的α-氨
基酸)、3-氨基丁酸(或任何其他适合的β-氨基酸)和甲基苄胺。在一些实施方案中,
氨基供体是异丙胺。在一些实施方案中,可使用其他氨基供体,包括但不限于α-
苯乙胺(也称为1-苯基乙胺)和其对映异构体(S)-1-苯基乙胺和(R)-1-苯基乙胺、2-氨
基-4-苯基丁烷、甘氨酸、L-谷氨酰胺、L-谷氨酸、谷氨酸单钠、L-天冬氨酸、L-赖
氨酸、L-鸟氨酸、β-丙氨酸、牛磺酸、正辛胺、环己胺、1,4-丁二胺、1,6-己二
胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-
1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-
羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、 1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-
氨基丙烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-
苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、
1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-
2-甲基环己烷、1-氨基-1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊
胺、2-甲基环己胺、3-甲基环己胺、1-氨基萘满、2-氨基萘满、2-氨基-5-甲氧基萘
满和1-氨基茚满,可能时包括(R)和(S)单独异构体,并包括这些胺的所有可能的
盐。
在以上方法的一些实施方案中,该方法中的步骤还可包括去除当氨基被转移到氨基
受体时从氨基供体形成的羰基副产物。这种原位去除可减少副反应率,从而正向反
应占主导,因此更多底物被转化为产物。
羰基副产物的去除可以许多方式进行。当氨基供体是氨基酸诸如丙氨酸时,羰基副
产物是酮酸,可通过与过氧化物反应来去除(参见如,US 2008/0213845,通过引用
并入本文)。可使用的过氧化物包括但不限于过氧化氢;过氧酸类(过酸)诸如过乙酸
(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸;有机过氧化
物诸如叔丁基过氧化物((CH3)3COOH)或其他选择性氧化
剂诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相
关化合物。可选地,丙酮酸的去除可通过利用乳酸脱氢酶将其还原为乳酸来实现,
以将平衡转向产物胺(参见如,Koszelewski等,2008,.350:2761-
2766)。丙酮酸的去除还可通过利用丙酮酸脱羧酶将其脱羧为二氧化碳和乙醛来实
现(参见如, 等,2008,ChemBioChem9:363-365)。
在一些实施方案中,当选择的氨基供体产生的羰基副产物比水的蒸气压高时(如,
低沸点副产品诸如挥发性有机羰基化合物),羰基副产物可通过向反应溶液充入非
反应性气体,或通过施加真空来降低反应压力,并去除气相中存在的羰基副产物来
去除。非反应性气体是不与反应组分起反应的任何气体。各种非反应性气体包括氮
气和稀有气体(如,惰性气体)。在一些实施方案中,非反应性气体是氮气。
在一些实施方案中,该方法中使用的氨基酸供体是异丙胺,其在向氨基受体转移氨
基时形成羰基副产物丙酮。丙酮可通过向反应溶液充入氮气 或施加真空,并通过
丙酮捕集器,诸如冷凝器或其他冷捕集器从气相去除丙酮来去除。可选地,丙酮可
通过利用酮还原酶还原为异丙醇来去除。
在其中去除羰基副产物的以上方法的一些实施方案中,在转氨基反应期间可加入相
应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供体还将平衡向产物形
成转移,从而增加底物向产物的转化。因此,在其中氨基供体是异丙胺并且丙酮产
物被原位去除的一些实施方案中,可向溶液加入异丙胺以补充丙酮去除期间失去的
氨基供体并维持反应的pH(如,在约8.5)。可选地,在氨基酸用作氨基供体的实施
方案中,酮酸羰基副产物可通过利用适当的氨基酸脱氢酶与氨和NADH反应来再
循环为氨基酸,从而补充氨基供体。
酮底物可以适当的量存在,取决于例如但不限于以下因素:溶剂性质、转氨酶对反
应温度的稳定性、酶的量和活性。在一些实施方案中,底物以5至50g/L存在。在
一些实施方案中,底物以5-25g/L存在。
在一些实施方案中,上述方法包括,在约1M至约2M的异丙胺存在下,在pH 7.5
至9.0和40至60℃的温度的反应条件下,将约10至50g/L的酮底物与约1至
20g/L的本文所述转氨酶接触,其中在24小时内至少80%、85%、90%、92%、
94%、96%或98%或更多的底物被转化为产物。在一些实施方案中,能够进行上
述反应的转氨酶多肽包括对应SEQ ID NO:58、72、74、80、86、96、98、100、
102、110或166的氨基酸序列。
在一些实施方案中,以上方法还可包括从反应混合物分离胺产物,诸如结构式(I)、
(III)或(V)的胺产物的步骤。
本文还提供了转氨酶与底物/产物的组合物。在一些实施方案中,组合物可包括结
构式(I)、(III)或(V)的胺产物、和本公开内容的转氨酶。任何一种或多种工程化的
转氨酶可以是组合物的部分。
在一些实施方案中,组合物还可包括氨基供体。在组合物的一些实施方案中,氨基
供体可包括异丙胺、丙氨酸、3-氨基丁酸或甲基苄胺。在组合物的一些实施方案中,
氨基供体是异丙胺。
本公开内容的方法可用于产生用于合成药物分子的异构体和衍生物 的各种中间产
物。例如,本公开内容的产生式(I)化合物的方法可用于合成分子诸如Odanacatib
或相关衍生物,Odanacatib是一种研究的选择性组织蛋白酶K抑制剂,用于阻止癌
症患者的骨转换。Odanacatib具有以下结构:
产生式(I)化合物的方法可用于制造用于合成某些噻二唑类(thiadaizoles),诸如以下
分子的中间产物。噻二唑类是CXC-和CC-趋化因子受体配体,据说具有抗炎和抗
肿瘤性质(WO 2005/066147)。
本公开内容产生式(V)化合物的方法可用于合成化合物,诸如:
WO 2008/128647公开了作为P2Y12拮抗剂的相似的喹啉-羧酰胺衍生物,其可能可
用于治疗心血管疾患。
5.4转氨酶多肽和多核苷酸
如上所述,上述方法中使用的转氨酶多肽最初是基于其转化酮酰胺底物4-氧-4-[3-
(三氟甲基)-5,6-二氢[1,2,4]三唑并[4,3-a]吡嗪-7(8H)-基]-1-(2,4,5-三氟苯基)
丁-2-酮(“西他列汀酮酰胺底物”)为产物(2R)-4-氧-4-[3-(三氟甲基)-5,6-二氢[1,2,
4]三唑并[4,3-a]吡嗪-7(8H)-基]-1-(2,4,5-三氟苯基)丁-2-胺以合成西他列汀的能
力来鉴定的。SEQ ID NO;2的转氨酶多肽不能有效地进行转氨基反应。这些转氨
酶多肽可关于其对西他列汀酮酰胺底物或对本文所述的底物的活性来描述。
转氨酶,包括本文所述的转氨酶,通常包含参与转氨基反应的辅酶吡哆醛磷酸
(PLP)。PLP可由在其中合成多肽的宿主细胞提供,或通过向多肽溶液加入PLP来
提供。尽管转氨酶是关于氨基酸序列描述的,本领域技术人员将理解,活性多肽包
含PLP或适当的类似物作为辅酶。
如上所述,在一些实施方案中,转氨酶多肽与SEQ ID NO:4具有至少80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或更大的氨基酸序列同一性,并能够以与SEQ ID NO:2的转氨
酶相比提高的比率转化酮底物为胺产物。
在一些实施方案中,转氨酶多肽与SEQ ID NO:58、72、74、80、86、96、98、
100或102具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或更大的氨基酸序列同一性,并能够
以与SEQ ID NO:2的转氨酶相比提高的比率转化酮底物为胺产物。
在一些实施方案中,工程化转氨酶多肽包括与转氨酶参考序列相比具有一个或多个
残基差异的氨基酸序列。残基差异可以是非保守取代、保守取代、或非保守取代与
保守取代的组合。关于残基差异和残基位置的描述,本文提供的转氨酶可参照以下
氨基酸序列来描述:节杆菌属KNKl68的天然产生的转氨酶、或SEQ ID NO:2的
转氨酶、或另一种工程化转氨酶,诸如SEQ ID NO:4多肽。对于本文的描述,参
考序列中的氨基酸残基位置在转氨酶中从起始甲硫氨酸(M)残基开始确定(即,M代
表残基位置1),尽管本领域技术人员将理解,这一起始的甲硫氨酸残基可能被诸
如宿主细胞或体外翻译系统中的生物加工机制去除以产生缺少起始甲硫氨酸残基的
成熟蛋白。
存在特定氨基酸或氨基酸改变(“残基差异”)的多肽序列位置有时在本文描述为“Xn”
或“位置n”,其中n是指参照参考序列的残基位置。
特定取代突变是参考序列中的特定残基被不同的特定残基代替,可用常规符号
“X(数字)Y”表示,其中X是参考序列中残基的单字母标识符,“数字”是参考序列
中的残基位置,Y是工程化序列中残基取代的单字母标识符。
在一些实施方案中,残基差异可发生在以下残基位置的一个或多个:X4;X5;X8;
X18;X25;X26;X27;X28;X30;X41;X42;X48;X49;X50;X54;X55;
X60;X61;X62;X65;X69;X81;X94;X96;X102;X117;X120;X122;
X124;X126;X136;X137;X138;X146;X148;X150;X152;X155;X156;
X160;X163;X164;X169;X174;X178;X195;X199;X204;X208;X209;
X211;X215;X217;X223;X225;X230;X252;X269;X273;X282;X284;
X292;X297;X302;X306;X321和X329。在一些实施 方案中,残基差异或其
组合伴随着改进的酶特性。在一些实施方案中,转氨酶多肽可在以上列的“Xn”表
示的那些特定位置以外的残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异数目
可以是在其他氨基酸残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,在其他残基位置的残基差异包括以保守氨基酸残基取代。
在本文的实施方案中,与SEQ ID NO:2相比,在转氨酶上影响底物结合的残基位
置的残基差异允许适应各种酮酰胺底物。不受理论限制,至少两个区域,即第一底
物结合区和第二底物结合区与酮酰胺底物的不同结构元件相互作用。第一结合区包
括残基位置X62、X136、X137、X195、X199、X208、X209、X223、X225和
X282,而第二结合区包括残基位置X69、X122和X284。因此,本文的转氨酶多
肽在包括X62、X69、X122、X136、X137、X195、X199、X208、X209、X223、
X225、X282和X284的残基位置具有一个或多个残基差异。在一些实施方案中,
本文的转氨酶多肽在与底物结合相关的特定残基位置具有至少两个或更多、三个或
更多、四个或更多、五个或更多、或六个或更多个残基差异。
在一些实施方案中,与SEQ ID NO:2相比的残基差异是在形成包括残基位置X62、
X136、X137、X195、X199、X208、X209、X223、X225和X282的第一底物结合
区的残基位置的一个或多个。因此,在一些实施方案中,工程化转氨酶包括包含与
SEQ ID NO:2相比,在残基位置X62、X136、X137、X195、X199、X208、X209、
X223、X225和X282的至少一个残基差异的氨基酸序列。
在一些实施方案中,与SEQ ID NO:2相比的残基差异是在形成包括残基位置X69、
X122和X284的第二底物结合区的残基位置的一个或多个。因此,在一些实施方
案中,工程化转氨酶包括包含与SEQ ID NO:2相比在残基位置X69、X122和
X284的至少一个残基差异的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含在第一结合区的残基差异 连同在第二
结合区的残基差异的氨基酸序列。因此,在一些实施方案中,工程化转氨酶包括包
含与SEQ ID NO:2相比,在残基位置X62、X136、X137、X195、X199、X208、
X209、X223、X225和X282的一个或多个残基差异,连同与SEQ ID NO:2相比,
在残基位置X69、X122和X284的一个或多个残基差异的氨基酸序列。
在本公开内容的工程化转氨酶的一些实施方案中,在一个残基位置的氨基酸残基可
以根据可在该位置表现出的氨基酸“特征”(如,氨基酸类型或特性)来定义。因此,
在一些实施方案中,在以上指定的位置的氨基酸残基可选自以下特征:X4是芳香
族残基;X5是碱性残基;X8是受限制的残基;X18是半胱氨酸(C)或脂肪族残基;
X25是极性残基;X26是芳香族或受限制的残基;X27是极性残基;X28是受限制
的残基;X30是极性或非极性残基;X41是受限制的或极性残基;X42是非极性残
基;X48是极性、酸性、脂肪族或非极性残基;X49是极性残基;X50是脂肪族残
基;X54是受限制的残基;X55是脂肪族残基;X60是芳香族残基;X61是芳香族
残基;X62是芳香族或极性残基;X65是脂肪族残基;X69是半胱氨酸(C)或非极
性、极性或脂肪族残基;X81是非极性残基;X94是脂肪族残基;X96是脂肪族残
基;X102是脂肪族或碱性残基;X117是非极性残基;X120是芳香族残基;X122
是受限制的、非极性或脂肪族残基;X124是极性或受限制的残基;X126是极性残
基;X136是芳香族残基;X137是极性或脂肪族残基;X138是碱性或受限制的残
基;X146是碱性残基;X148是脂肪族或芳香族残基;X150是芳香族、受限制的
或极性残基;X152是半胱氨酸(C)、非极性、脂肪族或极性残基;X155是非极性
或极性残基;X156是极性残基;X160是脂肪族残基;X163是脂肪族或受限制的
残基;X164是脂肪族或受限制的残基;X169是脂肪族残基;X174是脂肪族残基;
X178是极性残基;X195是芳香族或极性残基;X199是脂肪族或芳香族残基;
X204是脂肪族残基;X208是半胱氨酸(C)或受限制的、非极性、芳香族、极性或
碱性残基;X209是脂肪族残基;X211是脂肪族残基;X215是半胱氨酸(C);X217
是极性残基;X223是受限制的残基;X225是芳香族残基;X230是脂肪族残基;
X252是芳香族或脂肪族残基;X269是受限制的残基;X273是芳香族残基;X282
是极性残基; X284是非极性残基;X292是极性残基;X297是极性残基;X302是
脂肪族残基;X306是脂肪族残基;X321是受限制的残基;和X329是受限制的或
芳香族残基。在一些实施方案中,当在参考序列的对应残基位置的氨基酸残基被本
文对指定位置描述的氨基酸类别涵盖时,可按照本文提供的指导使用在该氨基酸类
别中的不同氨基酸。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X4是
Y、F或W,尤其是Y;X5是K或R,尤其是K;X8是H或P,尤其是P;X18
是C、A、V或I,尤其是C或I;X25是N、Q、S或T,尤其是Q;X26是F、W、
H或P,尤其是H;X27是N、Q、S或T,尤其是T;X28是P或H,尤其是P;
X30是N、Q、S、T、G、M、A、V、L或I,尤其是Q或M;X41是P、H、N、
Q、S或T,尤其是H或S;X42是G、M、A、V、L或I,尤其是G;X48是N、
Q、S、T、D、E、G、M、A、V、L或I,尤其是Q、D、V、G或A;X49是N、
Q或T,尤其是T;X50是A、V、L或I,尤其是L;X54是P或H;X55是A、
V或L,尤其是V;X60是F或W,尤其是F;X61是Y、F或W,尤其是Y;
X62是S、T、N、Q、Y、F或W,尤其是T、Y或F;X65是A、L或I,尤其是
A;X69是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X81
是G、M、A、V、L、I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是
A、V或L,尤其是L;X102是A、V、L、I、K或R,尤其是L或K;X117是G、
M、A、V、L或I,尤其是G;X120是Y、W或F,尤其是Y;X122是G、M、
A、V、I、L、P或H,尤其是M、I、L、V或H;X124是T、N、Q、P或H,尤
其是T、H或N;X126是N、Q或T,尤其是T;X136是Y、F或W,尤其是Y
或F;X137是S、T、N、Q、A、V、L或I,尤其是T或I;X138是K、P或H,
尤其是K或P;X146是K或R,尤其是R;X148是A、V、L、I、W或F,尤其
是A或F;X150是F、W、H、P、S、T、N或Q,尤其是F、H或S;X152是C、
G、M、A、L、I、S、T、N或Q,尤其是I、L、S或C;X155是N、S、T、G、
M、A、V、L或I,尤其是M、V或T;X156是N、Q、S或T,尤其是Q;X160
是A、V、L或I,尤其是L;X163是P、H、A、V或L,尤其是H或V;X164是
A、V、L、I、P或 H,尤其是V或P;X169是V、L或I,尤其是L;X174是A、
V、L或I,尤其是A;X178是S、N或Q,尤其是S;X195是F、Y、W、S、T、
N或Q,尤其是F或Q;X199是A、L、I、Y、F、W,尤其是W或I;X204是A、
V、L或I,尤其是A;X208是H、C、G、K、N、Y、D或S;X209是V、L或I,
尤其是L;X211是A、V或I,尤其是I;X215是C;X217是S、T、N或Q,尤
其是N;X223是H或P,尤其是P;X225是W或Y,尤其是Y;X230是A、V
或L,尤其是V;X252是A、V、I、Y、F或W,尤其是F;X269是H或P,尤
其是P;X273是Y、F或W,尤其是Y;X282是S、N或Q,尤其是S;X284是
G、M、V、L或I,尤其是G;X292是T、N或Q,尤其是T;X297是S、T、N
或Q,尤其是S;X302是A、L或I,尤其是A;X306是A、L或I,尤其是L;
X321是H或P,尤其是P;和X329是H、P、Y、F或W,尤其是H。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X4是
Y;X5是K;X8是P;X18是C或I;X25是Q;X26是H;X27是T;X28是P;
X30是Q或M;X41是H或S;X42是G;X48是Q、D、V、G或A;X49是T;
X50是L;X54是P或H;X55是V;X60是F;X61是Y;X62是T、Y或F;
X65是A;X69是G、C、T、A或S;X81是G;X94是I或L;X96是L;X102
是L或K;X117是G;X120是Y;X122是M、I、L、V或H;X124是T、H或
N;X126是T;X136是Y或F;X137是T或I;X138是K或P;X146是R;
X148是A或F;X150是F、H或S;X152是I、L、S或C;X155是M、V或T;
X156是Q;X160是L;X163是H或V;X164是V或P;X169是L;X174是A;
X178是S;X195是F或Q;X199是W或I;X204是A、V、L或I,尤其是A;
X208是H、C、G、K、N、Y、D或S;X209是L;X211是I;X215是C;X217
是N;X223是P;X225是Y;X230是V;X252是F;X269是P;X273是Y;
X282是S;X284是G;X292是T;X297是S;X302是A;X306是L;X321是
P;且X329是H。
在一些实施方案中,在以上指定的残基位置的氨基酸残基可选自以下特征:X8是
P;X60是F;X61是Y;X62是T、Y或F;X65是A; X69是G、C、T、A或S;
X81是G;X94是I或L;X96是L;X122是M、I、L、V或H;X124是T、H或
N;X136是Y或F;X169是L;X178是S;X199是W或I;X209是L;X215是
C;X217是N;X223是P;X269是P;X273是Y;X282是S;X284是G;X297
是S;X321是P且X329是H。
在一些实施方案中,工程化转氨酶多肽包括包含以下特征的一个或多个的氨基酸序
列:对应X69的残基是半胱氨酸(C)或非极性、极性或脂肪族残基;对应X122的
残基是受限制的、非极性或脂肪族残基;对应X223的残基是受限制的残基;和对
应X284的残基是非极性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:(1)
对应X69的残基是C或非极性、脂肪族或极性残基,和/或对应X284的残基是非
极性残基;(2)对应X122的残基是受限制的、非极性或脂肪族残基;和(3)对应
X223的残基是受限制的残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或非极性、脂肪族或极性残基;X122是受限制的、非极性或脂肪族残基;和
X223是受限制的残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X122是G、
M、A、V、L、I、P或H,尤其是M、I、V、L或H;和X223是H或P,尤其是
P。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:
X122是受限制的、非极性或脂肪族残基;X223是受限制的残基;和X284是非极
性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:
X122是G、M、A、V、L、I、P或H,尤其是M、I、V、L或H;X223是H或P,
尤其是P;和X284是G、M、V、L或I,尤其是G。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或非极性、极性或脂肪族残基;X122是受限制的、非 极性或脂肪族残基;
X223是受限制的残基;和X284是非极性残基。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C、G、M、A、L、I、S、T、N或Q,尤其是G、C、T、A或S;X122是G、
M、A、V、L、I、P或H,尤其是M、I、V、L或H;X223是H或P,尤其是P;
和X284是G、M、A、V、L或I,尤其是G。
在一些实施方案中,工程化转氨酶多肽包括包含至少以下特征的氨基酸序列:X69
是C或T;X122是M或I;X223是P;和X284是G。
在一些实施方案中,在残基位置X69、X122、X223和X284具有一个或多个指定
特征或特征组合的工程化转氨酶多肽,与SEQ ID NO:2相比在以下残基位置可另
外具有一个或多个残基差异:X4;X5;X8;X18;X25;X26;X27;X28;X30;
X41;X42;X48;X49;X50;X54;X55;X60;X61;X62;X65;X81;X94;
X96;X102;X117;X120;X124;X126;X136;X137;X138;X146;X148;
X150;X152;X155;X156;X160;X163;X164;X169;X174;X178;X195;
X199;X204;X208;X209;X211;X215;X217;X225;X230;X252;X269;
X273;X282、X292;X297;X306;X321和X329。除了残基位置X69、X122、
X223和X284以外,这些其他残基位置与对转氨酶多肽不同特性的作用相关,因
此可具有与SEQ ID NO:2相比的残基差异以实现酶特性的期望改变。
如上所述,残基位置X62、X136、X137、X195、X199、X208、X209、X225和
X282以及残基位置X69、X122、X223和X284与底物对酶的结合相关,因此转氨
酶多肽可在这些列举的位置具有与SEQ ID NO:2相比的残基差异以实现酶特性的
期望改变。
残基位置X4、X5、X8、X26、X48、X60、X65、X81、X96、X102、X124、X160、
X163、X169、X174、X178、X211、X217、X225、X230、X252、X269、X273、
X292、X297、X306、X321、X329也与酶活性的其他增加相关,因此转氨酶多肽
可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现酶活性的其他期
望改变,例如在高底物负荷条件下转化效率的增加。
残基位置X18、X25、X27、X28、X30、X41、X42、X49、X50、X54、X55、
X117、X120、X126、X138、X146、X148、X150、X152、X155、X156、X164、
X204、X302也与热稳定性和/或溶剂诸如DMSO稳定性的增加相关,因此转氨酶
多肽可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现热稳定性和
/或溶剂稳定性的期望改变。
残基位置X61、X94、X215也与在高浓度氨基供体异丙胺时进行反应的能力相关,
因此转氨酶多肽可在这些所列的位置具有与SEQ ID NO:2相比的残基差异以实现
在高(如,1-2M)浓度异丙胺时转化效率的增加。
应理解的是,在与酶的不同特性相关的残基位置与SEQ ID NO:2的残基差异可以
不同组合使用以形成具有期望酶促特征的转氨酶多肽,所述酶促特征例如酶活性、
溶剂稳定性和温度(temperate)稳定性、以及氨基供体的利用增加的组合。示例性的
组合在本文描述。
在一些实施方案中,用于指定残基位置的氨基酸残基可根据以上描述选择。例如,
氨基酸残基可基于以下特征选择:X4是芳香族残基;X5是碱性残基;X8是受限
制的残基;X18是半胱氨酸(C)或脂肪族残基;X25是极性残基;X26是芳香族或
受限制的残基;X27是极性残基;X28是受限制的残基;X30是极性或非极性残基;
X41是受限制的或极性残基;X42是非极性残基;X48是极性、酸性、脂肪族或非
极性残基;X49是极性残基;X50是脂肪族残基;X54是受限制的残基;X55是脂
肪族残基;X60是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;
X65是脂肪族残基;X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;
X102是脂肪族或碱性残基;X117是非极性残基;X120是芳香族残基;X124是极
性或受限制的残基;X126是极性残基;X136是芳香族残基;X137是极性或脂肪
族残基;X138是碱性或受限制的残基;X146是碱性残基;X148是脂肪族或芳香
族残基;X150是芳香族、受限制的或极性残基;X152是C、非极性、脂肪族或极
性残基;X155是非极性或极性残基;X156是极性残基;X160是脂肪族残基;
X163是脂肪族或受限制的残基;X164是脂肪族或受限制的残基;X169是脂肪族
残基;X174是脂肪族残基;X178是极性残基;X195是芳香族或极性残基;X199
是脂肪族或芳香族残基; X204是脂肪族残基;X208是半胱氨酸(C)或受限制的、
非极性、芳香族、极性或碱性残基;X209是脂肪族残基;X211是脂肪族残基;
X215是C;X217是极性残基;X225是芳香族残基;X230是脂肪族残基;X252
是芳香族或脂肪族残基;X269是受限制的残基;X273是芳香族残基;X282是极
性残基;X292是极性残基;X297是极性残基;X302是脂肪族残基;X306是脂肪
族残基;X321是受限制的残基;和X329是受限制的或芳香族残基。在这些残基
位置可使用的具体氨基酸残基在以上描述。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶可另外具有以下特征的一个或多个:X26是芳香族或受
限制的残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X94是脂肪族残基;X136是芳香族残基;X137是极性或脂肪族残基;X199是脂
肪族或芳香族残基;X209是脂肪族残基;X215是C;和X282是极性残基。
在一些实施方案中,除了上述特征以外,转氨酶的氨基酸序列可另外包括以下特征
的一个或多个:X8是受限制的残基;X60是芳香族残基;X81是非极性或小的残
基;X96是脂肪族残基;X124是极性或受限制的残基;X169是脂肪族残基;X217
是极性残基;X269是受限制的残基;X273是芳香族残基;X297是极性残基;和
X321是受限制的残基。
在一些实施方案中,除了上述特征以外,转氨酶的氨基酸序列可另外包括以下特征
的一个或多个:X4是芳香族残基;X48是极性、酸性、脂肪族或非极性残基;
X102是脂肪族或碱性残基;X150是芳香族、受限制的或极性残基;X152是C或
非极性、脂肪族或极性残基;X160是脂肪族残基;X163是脂肪族或受限制的残基;
X174是脂肪族残基;X178是极性残基;X195是芳香族或极性残基;X208是C或
受限制的、非极性、芳香族、极性或碱性残基;X211是脂肪族残基;X225是芳香
族残基;X230是脂肪族残基;X252是芳香族或脂肪族残基;X292是极性残基;
X306是脂肪族残基;和X329是受限制的或芳香族残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征或特征组合的工程化转氨酶包括至少以下另外的特 征:X26是芳香族
或受限制的残基,和/或X62是芳香族或极性残基;X65是脂肪族残基;X136是芳
香族残基;X199是脂肪族或芳香族残基;和X209是脂肪族残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X61是芳香族残基;X62是
芳香族或极性残基;X65是脂肪族残基;X94是脂肪族残基;X136是芳香族残基;
X199是脂肪族或芳香族残基;X209是脂肪族残基;X215是C;和X282是极性残
基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X61
是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;X81是非极性或小
的残基;X94是脂肪族残基;X136是芳香族残基;X199是脂肪族或芳香族残基;
X209是脂肪族残基;X215是C;X217是极性残基;X269是受限制的残基;X282
是极性残基;X297是极性残基;和X321是受限制的残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X60
是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;X124是极性或受限
制的残基;X136是芳香族残基;X169是脂肪族残基;X199是脂肪族或芳香族残
基;X209是脂肪族残基;X215是C;X217是极性残基;X269是受限制的残基;
X273是芳香族残基。X282是极性残基;X297是极性残基;和X321是受限制的残
基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是受限制的残基;X60
是芳香族残基;X61是芳香族残基;X62是芳香族或极性残基;X65是脂肪族残基;
X81是非极性残基;X94是脂肪族残基;X96是脂肪族残基;X124是极性或受限
制的残基;X126是极性残基;X136是芳香族残基;X150是芳香族、受限制的或
极性残基;X152是半胱氨酸 (C)、非极性、脂肪族或极性残基;X169是脂肪族残
基;X199是脂肪族或芳香族残基;X209是脂肪族残基;X215是C;X217是极性
残基;X269是受限制的残基;X273是芳香族残基。X282是极性残基;X297是极
性残基;和X321是受限制的残基。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X26是P、H、F或W,尤
其是H,和/或X62是S、T、N、Q、Y、F或W,尤其是T或F;X65是A、L或
I,尤其是A;X136是Y、F或W,尤其是Y或F;X199是A、L、I、Y、F或W,
尤其是W或I;和X209是V、L或I,尤其是L。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X61是Y、F或W,尤其是
Y;X62是S、T、N、Q、Y、F或W,尤其是T或F;X65是A、L或I,尤其是
A;X94是A、V、L或I,尤其是I或L;X136是Y、F或W,尤其是Y或F;
X199是A、L、I、Y、F或W,尤其是W或I;X209是V、L或I,尤其是L;
X215是C;和X282是S、N或Q,尤其是S。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X61是Y、F或W,尤其是Y;X62是S、T、N、Q、Y、F或W,尤其是T或F;
X65是A、L或I,尤其是A;X81是G、M、A、V、L或I,尤其是G;X94是A、
V、L或I,尤其是I或L;X136是Y、F或W,尤其是Y或F;X199是A、L、I、
Y、F或W,尤其是W或I;X209是V、L或I,尤其是L;X215是C;X217是S、
T、N或Q,尤其是N;X269是H或P,尤其是P;X282是S、N或Q,尤其是S。
X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是P。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X60是F或W,尤其是F;X61是Y、F或W,尤 其是Y;X62是Y、F、W、S、
T、N或Q,尤其是T或F;X65是A、L或I,尤其是A;X81是G、M、A、V、
L或I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是A、V或L,尤其
是L;X124是P、H、T、N或Q,尤其是T、H或N;X136是Y、F或W,尤其
是Y或F;X169是V、L或I,尤其是L;X199是Y、F、W、A、L或I,尤其是
W或I;X209是V、L或I,尤其是L;X215是C;X217是S、T、N或Q,尤其
是N;X269是H或P,尤其是P;X273是Y、F或W,尤其是Y;X282是S、N
或Q,尤其是S;X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是
P。
在一些实施方案中,在一个或多个残基位置X69、X122、X223和X284具有以上
所述的特征的工程化转氨酶包括至少以下另外的特征:X8是H或P,尤其是P;
X60是F或W,尤其是F;X61是Y、F或W,尤其是Y;X62是Y、F、W、S、
T、N或Q,尤其是T或F;X65是A、L或I,尤其是A;X81是G、M、A、V、
L或I,尤其是G;X94是A、V、L或I,尤其是I或L;X96是A、V或L,尤其
是L;X124是P、H、T、N或Q,尤其是T、H或N;X126是N、Q或T,尤其
是T;X136是Y、F或W,尤其是Y或F;X150是F、W、H、P、S、T、N或Q,
尤其是F、H或S;X152是C、G、M、A、L、I、S、T、N或Q,尤其是G、I、
L、S或C;X169是V、L或I,尤其是L;X199是Y、F、W、A、L或I,尤其是
W或I;X209是V、L或I,尤其是L;X215是C;X217是S、T、N或Q,尤其
是N;X269是H或P,尤其是P;X273是Y、F或W,尤其是Y;X282是S、N
或Q,尤其是S;X297是S、T、N或Q,尤其是S;和X321是H或P,尤其是
P。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残
基,尤其是P;X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽
可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、
1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、
1-50、1-55或1-60个残基差 异。在一些实施方案中,差异的数目可以是在其他残
基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化
转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置(即,X122;
X223和X284)描述的特征的参考氨基酸序列(如,SEQ ID NO:8或10)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X69是C
或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非
极性或脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残基,尤其是P;
和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置(即,X69;X122;X223和
X284)描述的特征的参考序列(如,SEQ ID NO:4)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括具有至少对指定残基
描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X65是脂
肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、
A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;和
X223是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、 1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:6)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化
转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:6至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X174是脂肪族残基,
尤其是A;X223是受限制的残基,尤其是P;和X284是非极性残基,尤其是G。
在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、
1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-
24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施
方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、
11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60个残
基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具
有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:12)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:12至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X223是受限制的残基,尤其是P;和
X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位
置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:14)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:14至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其是W或I,
尤其是X223是受限制的残基,尤其是P;X225是芳香族残基,尤其是Y,X282
是极性残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,
转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、
1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、
1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中, 差异的数目可
以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、
18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方
案中,工程化转氨酶多肽可包括与基于SEQID NO:2、具有对以上指定残基位置
描述的特征的参考序列(如,SEQ ID NO:16)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:16至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X199是脂肪族或芳香族残基,尤其是W
或I;X209是脂肪族残基,尤其是L;X223是受限制的残基,尤其是P;X225是
芳香族残基,尤其是Y;X282是极性残基,尤其是S;和X284是非极性残基,尤
其是G。在一些实施方案中,转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:18)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转
氨酶多肽可包括与参考序列SEQ ID NO:18至少约80%、85%、86%、
87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或
I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
20、22、28、30、32、34、38或40)至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:20、22、28、30、32、34、38或40至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X122是受限制的、非极 性或脂肪族残基,尤其是M、I、L、V或
H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或
I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X223是受限制的残基,尤其是P;X225是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶
多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、
1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:24)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨
基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:
24至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;
X137是极性或脂肪族残基,尤其是T或I;X174是脂肪族残基,尤其是A;X199
是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X223是
受限制的残基,尤其是P;X230是脂肪族残基,尤其是V;和X284是非极性残基,
尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、
1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、 5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:26)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括
包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:26至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X26是芳
香族或受限制的残基,尤其是H;X61是芳香族残基,尤其是Y;X62是芳香族或
极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、
脂肪族或极性残基,尤其是G、C、T、A或S;X122是受限制的、非极性或脂肪
族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是
极性或脂肪族残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X223是受限制的残基,尤其是P;X282是极性残
基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多
肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-
11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ IDNO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:36)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的
氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:36至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含至少以下特征的氨基酸序列:X4是芳
香族残基,尤其是Y;X26是芳香族或受限制的残基,尤其是H;X62是芳香族或
极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、
脂肪族或极性残基,尤其是G、C、T、A或S;X94是脂肪族残基,尤其是I或L;
X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香
族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或I;X199是脂肪
族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
42)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶
多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方
案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:42至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X62是芳香族
或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极
性、脂肪族或极性残基,尤其是G、C、T、A或S;X94是脂肪族残基,尤其是I
或L;X122是受限制的、非极性或脂肪族残 基,尤其是M、I、L、V或H;X136
是芳香族残基,尤其是Y或F;X137是极性或脂肪族残基,尤其是T或I;X199
是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是
C;X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非
极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
44、46或48)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化
转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:44、46或48至少
约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族
残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A
或S;X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,
尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂
肪族残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;X209是
脂肪族残基,尤其是L;X215是半胱氨酸(C);X223是受限制的残基,尤其是P;
X282是极性残基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案
中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在 一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:50)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:50至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X152是C、非极性、脂肪族或极性残基,尤其是G、I、L、
S或C;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其
是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;
和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ IDNO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:52)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化 转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:52至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪
族残基,尤其是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残
基,尤其是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多
肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-
11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、
1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其
他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、
22、24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工
程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特
征的参考序列(如,SEQ ID NO:54或56)至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨
基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:54或56至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y 或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X199是脂肪族或芳香
族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X223是受
限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极性残基,尤
其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:58或60)至少
约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包
括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方案中,
工程化转氨酶多肽可包括与参考序列SEQ ID NO:58或60至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X160是脂肪族残基,尤其是L;X169是脂肪族残基,尤其
是L;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是
L;X215是C;X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是
P;X282是极性残基,尤其是S;和X284是非极性残基,尤其是G。 在一些实施
方案中,转氨酶多肽可另外在其他残基位置具有1-2、1-3、1-4、1-5、1-6、1-7、
1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、
1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差
异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定
残基位置描述的特征的参考序列(如,SEQ ID NO:62)至少约80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括的多肽包括包含至少对指
定残基描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与
参考序列SEQ ID NO:62至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或脂肪族残基,尤其
是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;X137是极性或脂肪族
残基,尤其是T或I;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残
基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X223是受限制
的残基,尤其是P;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
和X306是脂肪族残基,尤其是L。在一些实施方案中,转氨酶多肽可在其他残基
位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:64)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:64至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X61是芳香族
残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残
基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;
X94是脂肪族残基,尤其是I或L;X102是脂肪族或碱性残基,尤其是L或K;
X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香
族残基,尤其是Y或F;X150是芳香族、受限制的或极性残基,尤其是F、H或S;
X152是C、非极性、脂肪族或极性残基,尤其是G、I、L、S或C;X199是脂肪
族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;
X223是受限制的残基,尤其是P;X282是极性残基,尤其是S;和X284是非极
性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有
1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、
1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残
基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、
6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、
50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于
SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:
66)至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶
多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。在一些实施方
案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:66至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、 98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X48是极性、酸性、脂肪族或非极性残基,尤其是D、V、G、
Q或A;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y
或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤
其是G、C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其
是I或L;X96是脂肪族残基,尤其是L;X102是脂肪族或碱性残基,尤其是L或
K;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X163是脂肪族或受限制的残基,尤其是H或V;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X211是脂肪族残基,尤其是I;X215是C;X217是极性残基,尤其是N;X223
是受限制的残基,尤其是P;X252是芳香族或脂肪族残基,尤其是F;X273是芳
香族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是
G;和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其
他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、
1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:68)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括的多肽包括包含至少对指定残基描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:68至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X48是极性、酸性、脂肪族或非极性残基,尤其是A;X61是
芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;X65是脂
肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、
A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其是I或L;X122
是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残
基,尤其是Y或F;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,
尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,
尤其是N;X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;
X282是极性残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,
尤其是S;和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽
可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、
1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、
1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残
基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化
转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的
参考序列(如,SEQ ID NO:70)至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸
序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:70
至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤
其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极
性残基,尤其是G、C、T、A或S;X94是脂 肪族残基,尤其是I或L;X122是
受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,
尤其是Y或F;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,
尤其是L;X215是C;X223是受限制的残基,尤其是P;X282是极性残基,尤其
是S;和X284是非极性残基,尤其是G。在一些实施方案中,转氨酶多肽可在其
他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、
1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:72)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:72至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤
其是T、Y或F;X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极
性残基,尤其是G、C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族
残基,尤其是I或L;X96是脂肪族残基,尤其是L;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、V或H;X136是芳香族残基,尤其是Y或F;
X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209
是脂肪族残基,尤其是L;X215是C;X223是受限制的残基,尤其是P;X269是
受限制的残基,尤其是P;X282是极性残基,尤其是S;X284是非极性残基,尤
其是G;X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一
些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、 1-3、1-4、1-5、1-6、
1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、
1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案
中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、
12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差
异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对
以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:74)至少约80%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残
基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与
参考序列SEQ ID NO:74至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X152是C或非极性、脂肪族或极性残基,尤其是G、
I、L、S或C;X178是极性残基,尤其是S;X199是脂肪族或芳香族残基,尤其
是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其
是N;X223是受限制的残基,尤其是P;X252是芳香族或脂肪族残基,尤其是F;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在 一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:76)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:76至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X178是极性残基,
尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤
其是L;X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其
是P;X269是受限制的残基,尤其是P;X282是极性残基,尤其是S;X284是非
极性残基,尤其是G;X292是极性残基,尤其是T;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基 于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:78)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:78至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X199是脂肪族或芳
香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;X215是C;X217是
极性残基,尤其是N;X223是受限制的残基,尤其是P;X269是受限制的残基,
尤其是P;X273是芳香族残基,尤其是Y;X282是极性残基,尤其是S;X284是
非极性残基,尤其是G;X297是极性残基,尤其是S;和X321是受限制的残基,
尤其是P。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、
1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:80)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对
指定残基位置描述的特征的氨基酸序列。在一些实施 方案中,工程化转氨酶多肽
可包括与参考序列SEQ ID NO:80至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X169是脂肪族残基,尤其是L;X178是极性残基,
尤其是S;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤
其是L;X215是C;X223是受限制的残基,尤其是P;X269是受限制的残基,尤
其是P;X273是芳香族残基,尤其是Y;X282是极性残基,尤其是S;X284是非
极性残基,尤其是G;X297是极性残基,尤其是S;和X321是受限制的残基,尤
其是P。在一些实施方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-
4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、
1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一
些实施方案中,差异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、
10、11、12、14、15、16、18、20、22、24、26、30、35、40、45、50、55或60
个残基差异。在一些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、
具有对以上指定残基位置描述的特征的参考序列(如,SEQ ID NO:82)至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对
指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可
包括与参考序列SEQ ID NO:82至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序
列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;X223
是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香族残
基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:84、86、88、96、98或100)至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含
至少对指定残基位置描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶
多肽可包括与参考序列SEQ ID NO:84、86、88、96、98或100至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65 是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X136是
芳香族残基,尤其是Y或F;X150是芳香族、受限制的或极性残基,尤其是F、H
或S;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或
I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:90)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:90至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X122是受限制的、非极性或
脂肪族残基,尤其是M、I、L、 V或H;X124是极性或受限制的残基,尤其是T、
H或N;X136是芳香族残基,尤其是Y或F;X150是芳香族、受限制的或极性残
基,尤其是F、H或S;X152是C或非极性、脂肪族或极性残基,尤其是G、I、L、
S或C;X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W
或I;X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;和X321是受限制的残基,尤其是P。在一些实施方
案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、
1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、
1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差异的数
目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、15、
16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一些实
施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定残基
位置描述的特征的参考序列(如,SEQ ID NO:92)至少约80%、85%、86%、87%、
88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相
同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的
特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序列
SEQ ID NO:92至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X150是芳香族、 受限制的或极性残基,尤其是F、H或S;X152是C或非极性、
脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其是L;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:94)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:94至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X169是脂肪族残基,尤其是L;X199是脂肪族或芳香族残基,尤其是W或I;
X209是脂肪族残基,尤其是L;X215是C;X217是极性残基,尤其是N;
X223 是受限制的残基,尤其是P;X269是受限制的残基,尤其是P;X273是芳香
族残基,尤其是Y;X282是极性残基,尤其是S;X284是非极性残基,尤其是G;
X297是极性残基,尤其是S;X321是受限制的残基,尤其是P;和X329是受限
制的或芳香族残基,尤其是H。在一些实施方案中,转氨酶多肽可在其他残基位置
另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-
15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、
2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、
35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多肽可
包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列(如,
SEQ ID NO:102)至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条件是,
工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。在一些
实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:102至少约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X60是芳香族残基,尤其是F;X61是芳香族残基,尤其是Y;
X62是芳香族或极性残基,尤其是T、Y或F;X65是脂肪族残基,尤其是A;
X69是C或非极性、脂肪族或极性残基,尤其是G、C、T、A或S;X81是非极性
残基,尤其是G;X94是脂肪族残基,尤其是I或L;X96是脂肪族残基,尤其是
L;X122是受限制的、非极性或脂肪族残基,尤其是M、I、L、V或H;X124是
极性或受限制的残基,尤其是T、H或N;X136是芳香族残基,尤其是Y或F;
X150是芳香族、受限制的或极性残基,尤其是S;X152是半胱氨酸(C)、非极性、
脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其是L;
X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是L;
X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其是P;X273是芳香族残基,尤其 是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
和X321是受限制的残基,尤其是P。在一些实施方案中,转氨酶多肽可在其他残
基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-
14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、
1-55或1-60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置
的1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、
30、35、40、45、50、55或60个残基差异。在一些实施方案中,工程化转氨酶多
肽可包括与基于SEQ ID NO:2、具有对以上指定残基位置描述的特征的参考序列
(如,SEQ ID NO:110)至少约80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列,条
件是,工程化转氨酶多肽包括包含至少对指定残基位置描述的特征的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括与参考序列SEQ ID NO:110至少约
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%相同的氨基酸序列。
在一些实施方案中,工程化转氨酶包括包含以下特征的氨基酸序列:X8是受限制
的残基,尤其是P;X49是极性残基,尤其是T;X60是芳香族残基,尤其是F;
X61是芳香族残基,尤其是Y;X62是芳香族或极性残基,尤其是T、Y或F;
X65是脂肪族残基,尤其是A;X69是C或非极性、脂肪族或极性残基,尤其是G、
C、T、A或S;X81是非极性残基,尤其是G;X94是脂肪族残基,尤其是I或L;
X96是脂肪族残基,尤其是L;X117是非极性残基,尤其是G;X122是受限制的、
非极性或脂肪族残基,尤其是M、I、L、V或H;X124是极性或受限制的残基,
尤其是T、H或N;X126是极性残基,尤其是T;X136是芳香族残基,尤其是Y
或F;X150是芳香族、受限制的或极性残基,尤其是S;X152是半胱氨酸(C)、非
极性、脂肪族或极性残基,尤其是G、I、L、S或C;X169是脂肪族残基,尤其
是L;X199是脂肪族或芳香族残基,尤其是W或I;X209是脂肪族残基,尤其是
L;X215是C;X217是极性残基,尤其是N;X223是受限制的残基,尤其是P;
X269是受限制的残基,尤其 是P;X273是芳香族残基,尤其是Y;X282是极性
残基,尤其是S;X284是非极性残基,尤其是G;X297是极性残基,尤其是S;
X302是脂肪族残基,尤其是A;和X321是受限制的残基,尤其是P。在一些实施
方案中,转氨酶多肽可在其他残基位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、
1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、1-20、1-22、1-24、1-26、
1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。在一些实施方案中,差
异的数目可以是在其他残基位置的1、2、3、4、5、6、7、8、9、10、11、12、14、
15、16、18、20、22、24、26、30、35、40、45、50、55或60个残基差异。在一
些实施方案中,工程化转氨酶多肽可包括与基于SEQ ID NO:2、具有对以上指定
残基位置描述的特征的参考序列(如,SEQ ID NO:166)至少约80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%相同的氨基酸序列,条件是,工程化转氨酶多肽包括包含至少对指定残基位置
描述的特征的氨基酸序列。在一些实施方案中,工程化转氨酶多肽可包括与参考序
列SEQ ID NO:166至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%相同的氨基酸序列。
以下表2提供示例性的工程化转氨酶多肽,每一行列出两个SEQ ID NO,奇数是
指编码由偶数提供的氨基酸序列的核苷酸序列。残基差异是基于与参考序列
SEQ ID NO:2比较,该参考序列是源自于节杆菌属KNK168的转氨酶,与天然产
生的酶不同的是在残基位置X306以缬氨酸(V)取代异亮氨酸(I)。在活性列中,增
加的活性水平(即,“+”、“++”、“+++”等等)定义如下:“+”表示至少等于但不大于
SEQ ID NO:4活性的2倍(测定条件:2g/L酮酰胺底物、0.5M异丙胺、22℃、
pH 7.5、5%DMSO、100μM PLP);“++”表示大于SEQ ID NO:4活性的约50至
100倍(测定条件:2g/L酮酰胺底物、0.5M异丙胺、22℃、pH 7.5、5%MeOH、
100μM PLP);“+++”表示大于SEQ ID NO:22活性的约1.1至约5倍(测定条件:5-
10g/L酮酰胺底物、0.5-1M异丙胺、22-30℃、pH 7.5、5%MeOH、100μM PLP);
“++++”表示大于SEQ ID NO:48活性约1.1至5倍(测定条件:10-40g/L酮酰胺底
物、1M异丙胺、30-45℃、pH 8.5、10%MeOH、100μM PLP);“+++++”表示
SEQ ID NO:58活性的约1.1至5倍或更大(测定条件:40-100 g/L酮酰胺底物、
1M异丙胺、45℃、pH 8.5、10%MeOH-25%DMSO、250μM PLP);“++++++”表示
SEQ ID NO:104活性的约1.1至5倍或更大(测定条件:40-100g/L酮酰胺底物、
1M异丙胺、45℃、pH 8.5、50%DMSO、1000μM PLP)。利用甲醇和DMSO测量
活性的示例性测定条件描述在实施例6-11。
表2
如上所述,在一些实施方案中,转氨酶多肽可包括的氨基酸序列与参考序列
SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、
38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、
74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、
108、110、112、114、116、118、120、122、124、126、128、130、132、134、
136、138、140、142、144、146、148、150、152、154、156、158、160、162、
164、166或168至少约80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更大地相同。在一些实施方
案中,与SEQ ID NO:2代表的天然存在的转氨酶相比,转氨酶多肽可具有1-2、
1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、1-16、1-18、
1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-60个残基差异。
在一些实施方案中,与SEQ ID NO:2相比,残基差异的数目可以是1、2、3、 4、
5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、
45、50、55或60个差异。
在一些实施方案中,转氨酶多肽包括的氨基酸序列与参考序列SEQ ID NO:58、
72、74、80、86、96、98、100或102至少约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大地
相同。在一些实施方案中,与SEQ ID NO:2代表的天然存在的转氨酶相比,转氨
酶多肽可具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、
1-15、1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55
或1-60个残基差异。在一些实施方案中,与SEQ ID NO:2相比,残基差异的数
目可以是1、2、3、4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、
24、26、30、35、40、45、50、55或60个差异。
在一些实施方案中,转氨酶多肽包括的氨基酸序列与基于SEQ ID NO:4、6、8、
10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、
46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、
142、144、146、148、150、152、154、156、158、160、162、164、166或168的
参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%相同,条件是,与SEQ ID NO:2
相比,转氨酶氨基酸序列包括表2中列出的多肽序列任一种中包含的任一组残基差
异。在一些实施方案中,与参考序列相比,转氨酶多肽可在其他氨基酸残基位置另
外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-14、1-15、
1-16、1-18、1-20、1-22、1-24、1-26、1-30、1-35、1-40、1-45、1-50、1-55或1-
60个残基差异。在一些实施方案中,差异的数目可以是在其他残基位置的1、2、3、
4、5、6、7、8、9、10、11、12、14、15、16、18、20、22、24、26、30、35、40、
45、50、55或60个残基差异。在一些实施方案中,在其他残基位置的残基差异包
括用保守氨基酸残基取代。
如以上指出的,在一些实施方案中,转氨酶多肽还能够转化酮底物为至少70%、
80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%
对映体过量的胺产物。具有指定水平的对映体选择性的示例性转氨酶多肽可包括对
应SEQ ID NO:58、72、74、80、86、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168的氨基酸序列。
在一些实施方案中,工程化转氨酶多肽可包括本文所述的工程化转氨酶多肽的缺失。
因此,对于本公开内容的转氨酶多肽的每一个实施方案,只要保持该转氨酶活性的
功能活性,缺失可以包括一个或更多个氨基酸、2个或更多个氨基酸、3个或更多
个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个
或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个
氨基酸、高达转氨酶多肽的氨基酸总数的10%、高达氨基酸总数的10%、高达氨
基酸总数的20%、或高达氨基酸的总数的30%。在一些实施方案中,缺失可以包
括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11
个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-
26个、1-30个、1-35个、1-40个、1-45个、1-50个、1-55个或1-60个氨基酸残基。
在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、
8个、9个、10个、11个、12个、14个、15个、16个、18个、20个、22个、24
个、26个、30个、35个、40个、45个、50个、55个或60个氨基酸。在一些实施
方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10
个、11个、12个、13个、14个、15个、16个、18个、20个、22个、24个、26
个、28个或30个氨基酸残基的缺失。
如本文所述,本公开内容的转氨酶多肽可以是融合多肽的形式,其中转氨酶多肽与
其他多肽融合,所述其他多肽诸如但不限于抗体标签(如,myc表位)、纯化序列(如,
用于结合金属的His标签)和细胞定位信号(如,分泌信号)。因此,转氨酶多肽可与
其他多肽融合或不融合地使用。
本文所述的多肽不受限于遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文所
述的多肽可以总体上或部分上由天然存在的和/或合成的非编码氨基酸组成。本文
所述的多肽可包含的某些常见非编码氨基酸可以包括但不限于:遗传编码的氨基酸
的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);
δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸
(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘
氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸
(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸
(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨
酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-
硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨
酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);
3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘
苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯
丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙
氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸
(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);
噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);
高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,
3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹
啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸
(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸
苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;
哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸
(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸 (hLeu);
高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,
4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸
(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文所述多肽可包
含的另外的非编码氨基酸将对本领域技术人员是明显的(参见,例如,在Fasman,
1989,CRC Practical Handbook of Biochemistry and Molecular Biology(CRC生物化学
和分子生物学实用手册),CRC Press,Boca Raton,FL,在第3-70页及其中引用的
参考文献中提供的多种氨基酸,该文献以及其中所引用的参考文献全部通过引用并
入本文)。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以构成本文所述的
多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括
(在圆括号中列出保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶亚氧硫
基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、
His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
本文所述多肽可包含的构型上受限制的非编码氨基酸包括但不限于N-甲基氨基酸
(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨
酸(hPro);以及1-氨基环戊烷-3-羧酸。
如上所述,被引入天然存在的多肽以产生工程化转氨酶的各种修饰可以被定向至该
酶的具体特性。
另一方面,本公开内容提供了编码改进的转氨酶多肽的多核苷酸。可以将所述多核
苷酸可操作地连接至控制基因表达的一种或多种异源调节序列以产生能够表达转氨
酶多肽的重组多核苷酸。可以将包含编码工程化转氨酶的异源多核苷酸的表达构建
体引入适当的宿主细胞中来表达对应的转氨酶多肽。
由于对各种氨基酸所对应的密码子的了解,蛋白序列的可用性提供了对能够编码该
主题的所有多核苷酸的描述。其中相同氨基酸由替代的或同义的密码子编码的遗传
密码的简并性允许极大数目的核酸被制出,所有这 些核酸编码本文所公开的改进
的转氨酶多肽。因此,如果已识别了具体的氨基酸序列,本领域技术人员能够以不
改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任意
数目的不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选
择的组合制出的多核苷酸的每一种可能的改变,并且所有这些改变将被认为对本文
公开的任何多肽明确地公开,所述本文公开的任何多肽包括在表2中提供的氨基酸
序列。
在一些实施方案中,可选择多核苷酸和/或使之工程化以包括被偏爱性地选择以适
合在其中产生蛋白的宿主细胞的密码子。例如,在细菌中使用的偏爱密码子用于在
细菌中表达基因;在酵母中使用的偏爱密码子用于酵母中的表达;并且在哺乳动物
中使用的偏爱密码子用于哺乳动物细胞中的表达。因为不必替换所有密码子来优化
转氨酶的密码子使用(如,由于天然序列可具有偏爱密码子并且因为偏爱密码子的
使用可能并不是所有氨基酸残基所需的),编码转氨酶多肽的密码子优化的多核苷
酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位
置包含偏爱密码子。
在一些实施方案中,多核苷酸编码包含与参考序列SEQ ID NO:58、72、74、80、
86、96、98、100或102至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更大地相同的氨基酸序列的
转氨酶多肽,其中该多肽能够以与节杆菌属KNK168的天然存在的转氨酶或
SEQ ID NO:2的转氨酶的活性相比改进的活性转化酮底物为胺产物。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与包括对应SEQID NO:4、6、
8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、
44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、
80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168的氨基酸序列的 多肽具有至少约80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更大序列同
一性的氨基酸序列,其中在氨基供体存在时,该多肽在转化酮底物为胺产物方面具
有一种或多种改进的特性。在一些实施方案中,编码的转氨酶多肽具有的活性等于
或大于SEQ ID NO:2多肽的活性。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与参考序列SEQ ID NO:4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、
44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、
80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、
112、114、116、118、120、122、124、126、128、130、132、134、136、138、
140、142、144、146、148、150、152、154、156、158、160、162、164、166或
168至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%或99%相同的氨基酸序列。
在一些实施方案中,多核苷酸编码的转氨酶多肽包括与基于SEQ ID NO:4、6、8、
10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、
46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、
142、144、146、148、150、152、154、156、158、160、162、164、166或168的
参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列,条件是,与
SEQ ID NO:2相比,改进的转氨酶氨基酸序列包括表2中列出的多肽序列任一种
中包含的任一组残基差异。
在一些实施方案中,编码改进的转氨酶多肽的多核苷酸选自SEQ ID NO:3、5、7、
9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、
45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、
81、83、85、87、89、91、93、95、97、 99、101、103、105、107、109、111、
113、115、117、119、121、123、125、127、129、131、133、135、137、139、
141、143、145、147、149、151、153、155、157、159、161、163、165或167。
在一些实施方案中,多核苷酸能够在高度严格条件下与包括SEQ ID NO:3、5、7、
9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、
45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、
81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、
113、115、117、119、121、123、125、127、129、131、133、135、137、139、
141、143、145、147、149、151、153、155、157、159、161、163、165或167的
多核苷酸或其互补物杂交,其中高度严格杂交的多核苷酸编码的转氨酶多肽在氨基
供体存在下,能够以与SEQ ID NO:2多肽相比改进的活性转化式(II)化合物为式(I)
的胺产物。
在一些实施方案中,多核苷酸编码本文所述的多肽,但在核苷酸水平,与编码本文
所述的工程化转氨酶的参考多核苷酸具有约80%或更大序列同一性、约80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%或99%或更大序列同一性。在一些实施方案中,参考多核苷酸选自
SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、
35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、
71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、
105、107、109、111、113、115、117、119、121、123、125、127、129、131、
133、135、137、139、141、143、145、147、149、151、153、155、157、159、
161、163、165或167。
可以用多种方式操作编码改进的转氨酶多肽的分离的多核苷酸以提供该多肽的表达。
在一些实施方案中,编码工程化转氨酶多肽的多核苷酸可作为表达载体提供,其中
存在一个或多个控制序列以调节多核苷酸的表达。取决于表达载体,所分离的多核
苷酸在其插入载体中之前的操作可能是令人期望的或必要的。利用重组DNA方法
修饰多核苷酸和核酸序列的 技术是本领域公知的。在Sambrook等人,2001,
Molecular Cloning:A Laboratory Manual(分子克隆实验室指南),第3版,
Cold Spring Harbor Laboratory Press;以及Current Protocols in Molecular Biology(分
子生物学最新实验方案),Ausubel.F.编,Greene ates,1998,更新至
2006中提供了指导。
在一些实施方案中,除了其他以外,控制序列包括启动子、前导序列、多腺苷酸化
序列、前肽序列、信号肽序列和转录终止子。对于细菌宿主细胞,用于指导本公开
内容的核酸构建体转录的适宜启动子包括从大肠杆菌lac操纵子、大肠杆菌trp操
纵子、噬菌体λ、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草
芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌
(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌
(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌
(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因
(penP)、枯草芽孢杆菌xylA基因和xylB基因、以及原核β-内酰胺酶基因(Villa-
Kamaroff等人,1978, 75:3727-3731)获得的启动子以及
tac启动子(DeBoer等人,1983, 80:21-25)。
对于丝状真菌宿主细胞而言,用于指导本公开内容的核酸构建体转录的适宜启动子
包括从米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天
冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、
黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米黑根毛霉脂肪酶、
米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺
酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见如,WO 96/00787,
通过引用并入本文)的基因获得的启动子以及NA2-tpi启动子(来自黑曲霉中性α-淀
粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和它们突变的、截短
的及杂合的启动子。
在酵母宿主中,有用的启动子可以来自酿酒酵母(Saccharomyces cerevisiae)烯醇化
酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵 母醇脱氢酶/甘油醛-3-磷酸脱氢
酶(ADH2/GAP)以及酿酒酵母3-磷酸甘油酸酯激酶的基因。Romanos等人,1992,
Yeast 8:423-488描述了酵母宿主细胞其他有用的启动子。
控制序列也可以是适宜的转录终止子序列,即由宿主细胞识别的终止转录的序列。
终止子序列被可操作地连接于编码多肽的核酸序列的3′端。在本发明中可以使用在
选择的宿主细胞中有功能的任何终止子。
例如,丝状真菌宿主细胞的示例性转录终止子可以从米曲霉TAKA淀粉酶、黑曲
霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌
胰蛋白酶样蛋白酶的基因中获得。
酵母宿主细胞的示例性终止子可以从酿酒酵母烯醇化酶、酿酒酵母细胞色素
C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因中获得。上述Romanos等人,
1992对酵母宿主细胞其他有用的终止子进行了描述。
控制序列也可以是适宜的前导序列,一种对宿主细胞翻译而言重要的mRNA的非
翻译区。前导序列被可操作地连接于编码多肽的核酸序列的5′端。可以使用在选择
的宿主细胞中有功能的任何前导序列。丝状真菌宿主细胞的示例性前导序列是从米
曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因中获得。酵母宿主细胞适宜
的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵
母α-因子以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因中获
得。
控制序列也可以是聚腺苷酸化序列,即可操作地连接于核酸序列的3′端并且当转录
时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。在本发明中
可以使用在选择的宿主细胞中有功能的任何聚腺苷酸化序列。丝状真菌宿主细胞的
示例性聚腺苷酸化序列可以从米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢
曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶的基
因中获得。Guo和Sherman,1995,Mol Cell Bio 15:5983-5990描述了酵母宿主细
胞的有用的聚腺苷酸化序列。
控制序列也可以是编码与多肽的氨基端连接的氨基酸序列并引导该 编码多肽进入
细胞分泌途径的信号肽编码区。核酸序列的编码序列的5′端可以固有地包含翻译阅
读框中与编码分泌的多肽的编码区区段天然连接的信号肽编码区。可选地,编码序
列的5′端可以包含对编码序列而言为外来的信号肽编码区。在编码序列天然不包含
信号肽编码区时可能需要外来的信号肽编码区。
细菌宿主细胞有效的信号肽编码区是从芽孢杆菌NClB 11837生麦芽糖淀粉酶、嗜
热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰
胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA的
基因中获得的信号肽编码区。Simonen和Palva,1993,Microbiol Rev 57:109-137
描述了其他的信号肽。
丝状真菌宿主细胞有效的信号肽编码区可以是从米曲霉TAKA淀粉酶、黑曲霉中
性淀粉酶、黑曲霉葡萄糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉
(Humicola insolens)纤维素酶以及柔毛腐质酶(Humicola lanuginosa)脂肪酶的基因中
获得的信号肽编码区。
酵母宿主细胞有用的信号肽可以来自酿酒酵母α-因子和酿酒酵母转化酶的基因。
上述Romanos等人,1992对其他有用的信号肽编码区进行了描述。
控制序列也可以是编码位于多肽氨基端的氨基酸序列的前肽编码区。生成的多肽被
称为酶原(proenzyme)或多肽原(或在某些情况下称为酶原(zymogen))。多肽原一般
是无活性的,并且可以通过前肽从多肽原的催化裂解或自身催化裂解转化为成熟的
活性多肽。前肽编码区可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性
蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉
(Myceliophthora thermophila)乳糖酶的基因获得(参见如WO 95/33836,通过引用并
入本文)。
在信号肽和前肽区都存在于多肽的氨基端时,前肽区被定位于紧挨着多肽的氨基端
并且信号肽区被定位于紧挨着前肽区的氨基端。
添加调节序列可能也是令人期望的,所述调节序列允许相对于宿主细 胞的生长调
节多肽的表达。调节系统的实例是响应于化学刺激或物理刺激(包括调节化合物的
存在)而促使基因的表达被打开或关闭的那些调节系统。在原核宿主细胞中,适宜
的调节序列包括1ac、tac以及trp操纵子系统。在酵母宿主细胞中,适宜的调节系
统包括,例如ADH2系统或GAL1系统。在丝状真菌中,适宜的调节序列包括
TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子以及米曲霉葡萄糖淀粉酶启动
子。
调节序列的其他实例是那些允许基因扩增的调节序列。在真核系统中,这些调节序
列包括在甲氨蝶呤的存在下扩增的二氢叶酸还原酶基因和用重金属扩增的金属硫蛋
白基因。在这些情况下,编码本发明的转氨酶多肽的核酸序列将与调节序列可操作
地连接。
因此,在另一个实施方案中,本公开内容也涉及重组表达载体,所述重组表达载体
包含编码工程化转氨酶多肽或其变体的多核苷酸以及一个或更多个表达调节区,诸
如启动子和终止子、复制起点等等,这取决于表达调节区被引入的宿主的类型。可
以将上述多种核酸和控制序列连接在一起产生如下重组表达载体:所述重组表达载
体可以包括一个或更多个便利的限制性位点以允许在这些位点插入或取代编码多肽
的核酸序列。可选地,本公开内容的核酸序列可以通过将该核酸序列或包含该序列
的核酸构建体插入用于表达的适当载体中来表达。在表达载体的创建中,编码序列
位于载体中以使得该编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是能够便利地进行重组DNA步骤并且能够导致多核苷酸序列表
达的任何载体(例如质粒或病毒)。载体的选择将通常取决于载体与该载体要引入的
宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。
表达载体可以是自主复制的载体,即作为染色体外的实体而存在、其复制独立于染
色体复制的载体,例如质粒、染色体外的元件、微型染色体或人工染色体。载体可
以包含用于确保自我复制的任何手段。可选地,载体可以是在引入宿主细胞中时被
整合到基因组并与它所整合的染色体一起复制的载体。此外,可以使用单种载体或
质粒,或者一起包含要引入到 宿主细胞基因组中的总DNA的两种或更多种载体或
质粒,或转座子。
本发明的表达载体优选地包含一种或多种选择性标记,所述选择性标记使得容易选
择转化的细胞。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、
对重金属的耐受性、针对营养缺陷型的原养型等。细菌的选择性标记的实例是来自
枯草芽孢杆菌或地衣芽孢杆菌的da1基因,或是赋予抗生素抗性诸如氨苄西林、卡
那霉素、氯霉素或四环素抗性的标记。酵母宿主细胞的适宜标记是ADE2、HIS3、
LEU2、LYS2、MET3、TRP1和URA3。
在丝状真菌宿主细胞中使用的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟
氨酸氨基甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、
niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、
以及trpC(邻氨基苯甲酸合酶)以及它们的等同物。在曲霉属细胞中使用的实施方案
包括构巢曲霉或米曲霉的amdS基因和pyrG基因,以及吸水链霉菌
(Streptomyces hygroscopicus)的bar基因。
用于表达转氨酶的表达载体可包含允许载体整合到宿主细胞基因组中或允许该载体
在细胞中独立于基因组而自主复制的元件。对于整合到宿主细胞基因组中,载体可
以依赖于编码多肽的核酸序列或载体的任何其他元件通过同源重组或非同源重组将
载体整合到基因组中。
可选地,表达载体可以包含用于指导通过同源重组整合到宿主细胞基因组中的另外
的核酸序列。所述另外的核酸序列使载体能够在染色体中的精确位置被整合到宿主
细胞基因组中。为了提高在精确位置整合的可能性,整合元件应该优选地包含与对
应的靶序列高度同源的数目足够的核酸,诸如100到10,000个碱基对,优选400
到10,000个碱基对,以及最优选800到10,000个碱基对,以增强同源重组的机率。
整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件
可以是非编码核酸序列或编码核酸序列。另一方面,可以通过非同源重组将载体整
合到宿主细胞的基因组中。
对于自主复制,载体还可以包括使该载体能在要考虑的宿主细胞中自 主复制的复
制起点。细菌复制起点的实例是允许在大肠杆菌中复制的P15Aori、或质粒
pBR322、pUC19、pACYC177(该质粒具有P15A ori)或质粒pACYC184的复制起点,
以及允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。
在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4,ARS1
和CEN3的组合,以及ARS4和CEN6的组合。复制起点可以是具有突变的复制起
点,所述突变使其在宿主细胞中以温度敏感的方式起作用(参见,例如Ehrlich,
1978,Proc Natl Acad 75:1433)。
可以将多于一个拷贝的本发明的核酸序列插入宿主细胞中以提高基因产物的生产量。
核酸序列拷贝数的增加可以通过如下方式获得:通过将该序列的至少一个另外拷贝
整合到宿主细胞基因组中,或者通过使该核酸序列包括可扩增的选择性标记基因,
其中可以通过在适当选择剂的存在下培养细胞来选择包含该选择性标记基因的扩增
拷贝和由此包含该核酸序列的另外拷贝的细胞。
在本发明中使用的许多表达载体可商购获得。适宜的商业表达载体包括来自
Sigma-Aldrich Chemicals, MO.的p3xFLAGTMTM表达载体,
它包括用于在哺乳动物宿主细胞中表达的CMV启动子和hGH多腺苷酸化位点以
及用于在大肠杆菌中扩增的pBR322复制起点和氨苄西林抗性标记。其他适宜的表
达载体是可以从Stratagene,LaJolla CA商购获得的pBluescriptII SK(-)和pBK-
CMV,以及源自于pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、
pCEP4(Invitrogen)或pPoly(Lathe等人,1987,Gene 57:193-201)的质粒。
另一方面,本公开内容提供了包含编码本公开内容的改进转氨酶多肽的多核苷酸的
宿主细胞,该多核苷酸与用于在该宿主细胞中表达转氨酶的一个或更多个控制序列
可操作地连接。在由本发明的表达载体所编码的转氨酶多肽的表达中使用的宿主细
胞是本领域公知的并且包括但不限于:细菌细胞,诸如大肠杆菌、乳杆菌属、链霉
菌属和鼠伤寒沙门氏菌(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞
(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登记号201178));昆虫细
胞诸如 果蝇S2细胞和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、
293和Bowes黑色素瘤细胞;以及植物细胞。用于上述宿主细胞的适当培养基和生
长条件是本领域公知的。
可以通过本领域已知的多种方法将用于表达转氨酶的多核苷酸引入细胞中。技术包
括但不限于电穿孔、生物射弹粒子轰击、脂质体介导的转染、氯化钙转染和原生质
体融合。用于将多核苷酸引入细胞中的多种方法将对技术人员是明显的。
示例性宿主细胞是大肠杆菌W3110。通过将编码改进的转氨酶的多核苷酸可操作
地连入质粒pCK110900而产生表达载体,该多核苷酸与在1acI阻抑物的控制下的
1ac启动子可操作地连接。该表达载体也包含P15a复制起点和氯霉素抗性基因。
通过对在大肠杆菌W3110中包含主题多核苷酸的细胞进行氯霉素选择来分离这些
细胞。
改进的转氨酶或编码这种多肽的多核苷酸可利用本领域技术人员常用的方法制备。
如以上指出的,亲本序列SEQ ID NO:2源自于的节杆菌属KNK168转氨酶的天然
存在的氨基酸序列(在本文以SEQ ID NO:2代表)和编码节杆菌属KNK168转氨酶
的相应多核苷酸在美国专利号7,169,592可获得,其通过引用并入本文。在一些
实施方案中,对亲本多核苷酸序列进行密码子优化以增强转氨酶在指定的宿主细胞
中的表达。命名为SEQ ID NO:1的多核苷酸序列是用作大多数实验和工程化转氨
酶的文库构建的起点的亲本序列。
通过使编码天然存在的转氨酶的多核苷酸经历诱变和/或定向进化方法,可以获得
工程化转氨酶。示例性定向进化技术是如在Stemmer,1994,
Proc Natl Acad Sci USA 91:10747-10751;WO 95/22625;WO 97/0078;
WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利
6,537,746(其每一个通过引用并入本文)中所述的诱变和/或DNA改组。
其他可以使用的定向进化方案包括但不限于:交错延伸过程(StEP)、体外重组
(Zhao等人,1998,hnol.16:258-261)、诱变PCR(Caldwell等人,1994,
PCR Methods Appl.3:S136-S140)和盒式诱变(Black 等人,1996,
Proc Natl Acad Sci USA 93:3525-3529)。为了本文的目的可使 用的诱变和定向进
化技术还在以下参考文献中描述:Ling等,1997,“Approaches to DNA mutagenesis:
an overview(DNA诱变方法:概述),”m.254(2):157-78;Dale等,
1996,“Oligonucleotide-
directed random mutagenesis using the phosphorothioate method(利用磷硫酰方法的寡
核苷酸定向随机诱变),”Methods .57:369-74;Smith,1985,
“In vitro mutagenesis(体外诱变),”.19:423-462;Botstein等,1985,
“Strategies and applications of in vitro mutagenesis(体外诱变的策略和应
用),”Science 229:1193-1201;Carter,1986,“Site-directed mutagenesis(定位诱
变),”Biochem.J.237:1-7;Kramer等,1984,“Point Mismatch Repair(点错配修
复),”Cell 38:879-887;Wells等,1985,“Cassette mutagenesis:
an efficient method for generation of multiple mutations at defined sites(盒式诱变:用
于在指定位点产生多个突变的高效方法),”Gene 34:315-323;Minshull等,1999,
“Protein evolution by molecular breeding(通过分子育种的蛋白演
化),”Curr Opin Chem Biol 3:284-290;Christians等,1999,
“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shu
fling(利用DNA家族改组对腺苷激酶AZT磷酸化的定向进化),”Nature Biotech 17:
259-264;Crameri等,1998,
“DNA shuffling of a family of genes from diverse species accelerates directed evolution(
从多种物种的基因家族DNA改组加速定向进化),”Nature 391:288-291;Crameri
等,1997,
“Molecular evolution of an arsenate detoxification pathway by DNA shuffling(通过
DNA改组分子进化砷酸解毒途径),”Nature Biotech 15:436-438;Zhang等,1997,
“Directed evolution of an effective fructosidase from a galactosidase by DNA shuffling a
nd screening(通过DNA改组和筛选从半乳糖苷酶定向进化有效的果糖苷
酶),”Proc Natl Acad Sci USA 94:45-4-4509;Crameri等,1996,
“Improved green fluorescent protein by molecular evolution using DNA shuffling(利用
DNA改组通过分子进化改进的绿色荧光蛋白),’Nature Biotech 14:315-319;和
Stemmer,1994,“Rapid evolution of a protein in vitro by DNA shuffling(通过DNA改
组蛋白的体外快速进化),”Nature 370:389-391。所有出版物通过引用并入本文。
在一些实施方案中,对诱变处理后获得的克隆筛选具有期望的改进酶 特性的转氨
酶。测量来自表达文库的转氨酶酶活性可以使用标准技术进行,诸如分离产物(如,
通过HPLC)和通过测量分离的底物和产物的UV吸光度来检测产物和/或通过利用
串联质谱(如,MS/MS)检测。示例性的测定在以下实施例4描述。每单位时间期望
产物的增加比率指示在固定量的裂解物(或由其制成的冻干粉末)中转氨酶多肽的相
对(酶)活性。在期望的改进酶特性是热稳定性的情况下,可以在使酶制品经历限定
的温度并测量热处理后剩余的酶活性的量之后测量酶活性。然后对包含编码期望的
转氨酶的多核苷酸的克隆进行分离,测序,以识别核苷酸序列的改变(如果有的话),
并将这些克隆用于在宿主细胞中表达酶。
在工程化多肽的序列为已知的情况下,可以根据已知的合成方法通过标准固相方法
制备编码酶的多核苷酸。在一些实施方案中,高达大约100个碱基的片段能够单独
合成,然后连接(例如,通过酶连接或化学连接方法或聚合酶介导的方法)形成任何
期望的连续序列。例如,可以使用例如由Beaucage等人,1981,Tet Lett 22:
1859-69所描述的经典亚磷酰胺方法或由Matthes等人,1984,EMBO J.3:801-05
所描述的方法(例如,像它通常在自动化合成方法中实施的那样)通过化学合成来制
备本发明的多核苷酸和寡核苷酸。根据亚磷酰胺方法,例如在自动化DNA合成器
中合成寡核苷酸,纯化,退火,连接并克隆在适当载体中。此外,基本上任何核酸
都可以从各种商业来源中的任何一种获得,The Great American Gene Company,
Ramona,CA、ExpressGen o,IL、Operon Technologies Inc.,Alameda,
CA以及许多其他来源。
在宿主细胞中表达的工程化转氨酶可以使用任何一种或多种公知的蛋白质纯化技术
从这些细胞中和或培养基中回收,所述公知的蛋白质纯化技术包括但不限于溶菌酶
处理、超声处理、过滤、盐析、超离心和色谱。用于裂解和从细菌诸如大肠杆菌中
高效提取蛋白的适宜溶液是从 MO的Sigma-Aldrich以商品名
CelLytic BTM可商业途径获得的。
用于分离转氨酶多肽的色谱技术包括但不限于反相色谱、高效液相色谱、离子交换
色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件将部分取决于如下因素:诸如
净电荷、疏水性、亲水性、分子量、分子形状等等, 并且将对本领域技术人员是
明显的。在一些实施方案中,工程化转氨酶可表达为与纯化标签或用于结合抗体的
抗体标签如myc表位标签的融合蛋白,纯化标签诸如具有对金属的亲和力的His-
标签。
在一些实施方案中,亲和技术可以用于分离改进的转氨酶。对于亲和色谱纯化,可
以使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生,可以通过用工程化多
肽注射来免疫多种宿主动物,包括但不限于兔、小鼠、大鼠等等。可以将该多肽与
适宜载体(诸如BSA)通过侧链官能基团或与侧链官能基团相连的连接物相连。多种
佐剂可根据宿主物种用于提高免疫应答,包括但不限于弗氏(完全或不完全)佐剂,
矿物凝胶诸如氢氧化铝,表面活性物质诸如溶血卵磷脂,多聚醇,聚阴离子,肽,
油乳剂,匙孔血蓝蛋白,二硝基苯酚,以及可能有用的人佐剂诸如BCG(卡介苗)和
短小棒状杆菌(Corynebacterium parvum)。
6.实施例
本公开内容的多个特征和实施方案在以下代表性实施例中被举例说明,这些代表性
实施例旨在举例说明而不是限制性的。
实施例1:野生型转氨酶基因的获取和表达载体的构建
基于报道的转氨酶的氨基酸序列和美国专利申请公开2(其通过引用并
入本文)实施例1所述的密码子优化算法,为在大肠杆菌中表达而设计转氨酶(TA)
编码基因。基因利用通常包括42个核苷酸的寡核苷酸合成,将基因克隆到表达载
体pCK110700(描绘为美国专利申请公开2的图1,其通过引用并入本
文)或pCK110900(描绘为美国专利申请公开2的图3,其通过引用并入
本文)中处于lac启动子控制下。这一表达载体还包含P15a复制起点和氯霉素抗性
基因。利用标准方法将所得质粒转化到大肠杆菌W3110中。密码子优化的基因和
编码的多肽列在表2中,其序列以SEQ ID NO:1和SEQ ID NO:2提供。
同样地,将编码本公开内容的工程化转氨酶、列在表2的基因(SEQ ID NO:3-168)
克隆到载体pCK110700或pCK110900以在大肠杆菌W3110 中表达。
实施例2:转氨酶粉末的产生-摇瓶方案
将包含编码目标转氨酶的质粒的大肠杆菌的单个微生物菌落接种到含30μg/mL氯
霉素和1%葡萄糖的50mL Luria Bertani肉汤中。细胞在培养箱(incubator)中在30℃
生长过夜(至少16小时),伴随以250rpm摇动。将培养物稀释到1升烧瓶中含
30μg/mL氯霉素和100μM吡多辛的250mL M9YE(1.0g/L氯化铵、0.5g/L氯化钠、
6.0g/L磷酸氢二钠、3.0g/L磷酸二氢钾、2.0g/L Tastone-154酵母提取物、1L/L去离
子水)中,至600nm的光密度(OD600)为0.2,并允许在30℃生长。当培养物的
OD600是0.6至0.8时,通过加入异丙基βD-硫代半乳糖苷(IPTG)至终浓度1mM来
诱导转氨酶基因的表达,然后培养持续过夜(至少16小时)。通过离心(5000rpm、
15min、4℃)收集细胞,丢弃上清液。将细胞沉淀重悬在等体积的冷的(4℃)含
100μM吡哆醛5’-磷酸(PLP)的100mM三乙醇胺(氯化物)缓冲液、pH 7.5中,如上
述通过离心收集。将洗涤的细胞重悬在两体积的冷的含PLP的三乙醇胺(氯化物)缓
冲液中,以12,000psi通过French Press两次并保持在4℃。通过离心(9000rpm、
45min.、4℃)去除细胞碎片。收集澄清的裂解物上清液,储存在-20℃。对冷冻的澄
清裂解物的冷冻干燥提供了粗制转氨酶干粉。可选地,细胞沉淀(洗涤前或洗涤后)
可储存在4℃或80℃。
实施例3:转氨酶的产生-发酵方案
将包含带有目标转氨酶基因的质粒的大肠杆菌的单个微生物菌落接种到含30μg/mL
氯霉素和1%葡萄糖的2mL M9YE肉汤(1.0g/L氯化铵、0.5g/L氯化钠、6.0g/L磷酸
氢二钠、3.0g/L磷酸二氢钾、2.0g/L Tastone-154酵母提取物、1L/L去离子水)中。
细胞在培养箱中在37℃生长过夜(至少12小时),伴随以250rpm摇动。过夜生长后,
将0.5mL的此培养物稀释到1升烧瓶中含30μg/ml氯霉素和1%葡萄糖的
250ml M9YE肉汤中,允许在37℃生长,伴随以250rpm摇动。当培养物的OD600
是0.5至1.0时,从培养箱取出细胞,立即使用或储存在4℃。
小型发酵利用6.0L生长培养基(0.88g/L硫酸铵、0.98g/L柠檬酸钠; 12.5g/L磷酸氢
二钾三水合物、6.25g/L磷酸二氢钾、3.3g/L Tastone-154酵母提取物、0.083g/L柠
檬酸铁铵、和8.3ml/L含2g/L氯化钙二水合物、2.2g/L硫酸锌七水合物、0.5g/L硫
酸锰一水合物、1g/L硫酸亚铜七水合物、0.1g/L钼酸铵四水合物和0.02g/L四硼酸
钠的微量元素溶液)在通气、搅动的15L发酵罐中在30℃进行。在121℃和15PSI
将容器灭菌30分钟,灭菌后加入100μM吡多辛。向发酵罐接种包含编码目标转氨
酶基因的质粒的大肠杆菌W3110的指数晚期培养物(生长在如上述的摇瓶中至初始
OD600为0.5至1.0)。以250-1250rpm搅动发酵罐,以0.6-25L/min向发酵容器供
应空气以保持溶解氧水平为50%饱和或更大。通过加入20%v/v氢氧化铵保持培养
物的pH在7.0。培养物的生长通过加入含500g/L工业葡萄糖右旋糖、12g/L氯化
铵和5.1g/L硫酸镁七水合物的进料溶液来维持。培养物达到OD600为
70+-10后,通过加入异丙基-β-D-硫代半乳糖苷(IPTG)至终浓度1mM来诱导转氨酶
的表达,发酵继续另外的18小时。然后将培养物冷却到4℃,保持在这一温度直
到收获。通过在Sorval RC12BP离心机中在4℃以5000G离心40分钟来收集细胞。
收获的细胞直接用于以下下游回收工艺,或可在4℃储存或在-80℃冷冻直到这样
使用。
在4℃将细胞沉淀以每体积的湿细胞糊重悬在2体积的含100μM吡哆醛5’-磷酸
(PLP)的100mM三乙醇胺(氯化物)缓冲液、pH 7.5中。利用12000psig的压力将悬
液通过配备有两阶段匀浆阀组件的匀浆器来从细胞释放细胞内转氨酶。破裂后立即
将细胞匀浆冷却到-20℃。向裂解物加入11%w/v聚乙烯亚胺pH 7.2溶液至终浓度
为0.5%w/v。向裂解物加入1MNa2SO4溶液至终浓度为
100mM。然后搅拌裂解物30分钟。通过在Sorval RC12BP离心机中在4℃以
5000G离心30分钟来澄清所得的悬液。澄清上清液被倾析,并利用分子量截留为
30kD的纤维素超滤膜浓缩10倍。将最终浓缩物分配到浅容器中,在-20℃冷冻并
冻干为粉末。将转氨酶粉末在-80℃冷冻。
实施例4:用于鉴定能够立体选择性地转化西他列汀酮酰胺底物为西他列
汀的节杆菌属KNK168转氨酶变体的高通量筛选
确定西他列汀酮酰胺底物向西他列汀转化的非手性HPLC方法:西他 列汀
酮酰胺底物(如美国专利号7,326,708中所述地制备)向西他列汀的酶促转化利用配
备有Agilent Eclipse XDB-C8柱(4.6×150mm、5μm)的Agilent 1200HPLC确定,利
用45:55的10mM NH4Ac/MeCN作为洗脱液,流速为1.5ml/min,柱
温度为40℃。保留时间:西他列汀酮酰胺底物:1.4min;西他列汀:1.7min。洗脱
物中的西他列汀酮酰胺底物和产物确定为在210nm或286nm处的峰面积,光程长
为1cm。利用这些条件,西他列汀的检测限是5μg/mL。通常,210nm的入射波长
用于活性类似或等于SEQ ID NO:4的转氨酶的活性测量。
确定西他列汀的立体纯度的手性HPLC方法:西他列汀的立体异构纯度利
用配备有Daicel Chiralpak AD-H柱(4.6×150mm、5μm)的Agilent 1200HPLC确定,
利用60∶40∶0.1∶0.1的EtOH/庚烷/二乙胺/水作为洗脱液,流速为0.8ml/min,柱
温度为35℃。保留时间:西他列汀酮酰胺底物:6.3min;(S)-对映异构体:8.4min;
西他列汀:10.8min。西他列汀酮酰胺底物和产物确定为在210nm或286nm处的峰
面积,光程长为1cm。
检测西他列汀酮酰胺底物向西他列汀的低水平转化的液相色谱-质谱(LC/MS)方
法:西他列汀酮酰胺底物向西他列汀的低水平酶促转化利用LC/MS/MS方法
确定。将5毫升样品上样到Eclipse XDB-C8HPLC柱(4.6×150mm),用0.2%甲酸铵
和甲醇的40∶60流动相以1.0mL/min等度(isocratically)洗脱。在35℃,西他列汀
的保留时间是1.5分钟。质谱法用来在Waters Quattro triple quadruple上检测。Q1
设置为通过408.1AMU的M+H离子,Q3设置为通过235.1AMU的子离子。碰撞
室(Q2)具有的碰撞能量是17.0,氩气流是0.3mL/min。离子化是通过APCI,电晕
放电为5μA,源温度是130℃,探测温度是600℃。去溶剂化的气流是100L/分钟,
锥孔气流设置为50L/分钟。利用这些条件,西他列汀的检测限是71pg/mL。
实施例5:用于鉴定能够立体选择性地转化西他列汀酮酰胺底物为西他列
汀的节杆菌属KNK168转氨酶变体的高通量筛选
利用上述方法诱变如实施例1所述地构建的编码转氨酶的基因,改变的DNA分子
群体用于转化适当的大肠杆菌宿主菌株。选择和加工抗生素 抗性转化体以鉴定表
达具有在适当的氨基供体(即,异丙胺)存在下,将西他列汀酮酰胺底物立体选择性
地转氨基为西他列汀的改进的能力的转氨酶的转化体。细胞选择、生长、诱导转氨
酶变体酶表达和收集细胞沉淀如以下所述。
利用 自动菌落挑取器(Genetix USA,Inc.,Boston,MA)将携带编码转氨酶的基因
的重组大肠杆菌菌落挑取到96孔的浅孔微量滴定板,每孔中包含180μL LB肉汤、
1%葡萄糖和30μg/mL氯霉素(CAM)。细胞在30℃生长过夜,伴随以200rpm摇动。
然后将此培养物的10μL等份转移到包含390μL M9YE肉汤、100μM吡多辛和
30μg/mL CAM的96-深孔板中。在30℃伴随以250rpm摇动培养深孔板2-3小时后,
通过加入IPTG至终浓度1mM来诱导培养细胞中的重组基因表达。然后在30℃伴
随以250rpm摇动培养板18小时。
细胞通过离心(4000RPM,10min,4℃)沉淀,重悬在200μL裂解缓冲液中,通过在
室温摇动2小时而裂解。裂解缓冲液包含100mM三乙醇胺(氯化物)缓冲液、pH 7.5
或8.5、1mg/mL溶菌酶、500μg/mL硫酸多粘菌素B(PMBS)和250μM PLP。用铝/
聚苯乙烯薄片热封带(Velocity 11,Menlo Park,CA,目录号06643-001)密封板后,
在室温剧烈摇动板2小时。细胞碎片通过离心(4000RPM,10min.,4℃)沉淀,直
接检验澄清上清液,或在4℃储存直到使用。
对于在pH 7.5的甲醇或DMSO中筛选早期工程化转氨酶(即,早期“进化子”),将
西他列汀酮酰胺底物(40mg/mL)在甲醇或DMSO中的溶液的10μL等份加入 深孔板
的每个孔,随后利用Biomek NXp自动仪器(Beckman Coulter,Fullerton,CA)加入
90μL 1.1M异丙胺盐酸盐。然后,随后也利用Biomek NXp进行100μL回收的裂解
物上清液的加入,以提供包括2mg/ml西他列汀酮酰胺底物、500mM异丙胺盐酸盐、
50mM三乙醇胺pH 7.5和5%甲醇或DMSO(v/v)的反应。在175℃用铝/聚苯乙烯薄
片热封带(Velocity 11,Menlo Park,CA,目录号06643-001)热密封板2.5秒,然后
在30℃摇动过夜(至少16小时)。通过利用Phoenix液体操纵系统
(Art Robbins Instruments,Sunnyvale,CA)加入1ml乙腈来猝灭反 应。重新密封板,
摇动5min,然后以4000rpm离心10min。将澄清的反应混合物的200等份转移到
新的浅孔聚丙烯板(Costar#3365),如实施例4所述地密封和分析。
对于在pH 8.5的DMSO中筛选晚期工程化转氨酶(即,晚期“进化子”),将西他列
汀酮酰胺底物(400mg/mL)在二甲基亚砜(DMSO)中的溶液的50μL等份加入 深孔板
的每个孔,随后利用Biomek NXp自动仪器(Beckman Coulter,Fullerton,CA)加入
50μL 4M异丙胺盐酸盐。然后,随后也利用Biomek NX进行100μL回收的裂解物
上清液的加入,以提供包括100mg/ml西他列汀酮酰胺底物、1M异丙胺盐酸盐、
50mM三乙醇胺pH 8.5和25%DMSO(v/v)的反应。在175℃用铝/聚苯乙烯薄片热
封带(Velocity 11,Menlo Park,CA,目录号06643-001)热密封板2.5秒,然后在45℃
摇动过夜(至少16小时)。通过利用Phoenix液体操纵系统(Art Robbins Instruments,
Sunnyvale,CA)加入1ml乙腈来猝灭反应。重新密封板,摇动5min,然后以
4000rpm离心10min。将澄清的反应混合物的10μL等份转移到含190μL乙腈的新
的浅孔聚丙烯板(Costar#3365),如实施例4所述地密封和分析。
利用实施例4的检测方法,如实施例1和2中表达的SEQ ID NO:2的转氨酶表现
出对西他列汀酮酰胺底物没有可检测的活性。利用以上公开的方法和方案鉴定能够
转化西他列汀酮酰胺底物为西他列汀的节杆菌属KNK168转氨酶的变体。这些方
法的多次迭代,其中来自一轮的一个或多个改进的分离株用作下一轮诱变和筛选的
起始材料,用来开发或“进化”具有立体选择性地还原西他列汀酮酰胺底物为西他列
汀的改进的能力的节杆菌属KNK168转氨酶变体。
实施例6:在甲醇中西他列汀酮酰胺底物被源自于节杆菌属KNK168转氨
酶的表2中的工程化转氨酶立体选择性地转氨基
源自于节杆菌属KNK168转氨酶、在表2中标为“+”的改进的转氨酶以制备规模在
DMSO中如下评价。向配备有磁性搅拌棒的5mL反应瓶加入500μL转氨酶变体
(20mg/mL)在100mM三乙醇胺-氯化物缓冲液pH7.5中的溶液和250μM吡哆醛5’-
磷酸。随后,向转氨酶溶液加入450μL 1.1 M异丙胺盐酸盐,随后加入50μL西他
列汀酮酰胺底物(40mg/mL)在DMSO中的溶液。在22℃搅拌反应,通过对从反应
混合物定期获取的样品进行HPLC分析来监测反应(分析条件参见实施例4)。表2
提供对应标为“+”的转氨酶变体的SEQ ID NO.、与野生型转氨酶相比的氨基酸残基
差异数目、和各自与具有氨基酸序列SEQ ID NO:4的酶相比针对西他列汀酮酰胺
底物的活性。
在表2中标为“++”、“+++”、“++++”和“+++++”的改进的转氨酶以如下调整的条件
检验:“++”:2g/L西他列汀酮酰胺底物、0.5M异丙胺、22℃、pH 7.5、5%MeOH;
“+++”:5-10g/L西他列汀酮酰胺底物、0.5-1M异丙胺、22-30℃、pH 7.5、5%
MeOH;“++++”:10-40g/L西他列汀酮酰胺底物、1M异丙胺、30-45℃、pH 8.5、
10%MeOH;“+++++”:40-100g/L西他列汀酮酰胺底物、1M异丙胺、45℃、
pH 8.5、10%MeOH-25%DMSO;和“++++++”:40-100g/L酮酰胺底物、1M异丙
胺、45℃、pH8.5、50%DMSO、1000μM PLP。标为“+++”、“++++”、“+++++”、
“++++++”的改进的转氨酶的相对活性分别相对于SEQ ID NO:22、SEQ ID NO:
48、SEQ ID NO:58和SEQ ID NO:104的活性确定。
对于许多工程化转氨酶,西他列汀酮酰胺底物向西他列汀的转化还可利用以适当浓
度的氨基供体诸如D-丙氨酸、3-氨基丁酸或α-甲基苄胺来实现。
实施例7:从2,2,2-三氟-1-苯基乙酮制备(S)-2,2,2-三氟-1-苯基乙胺
(S)-2,2,2-三氟-1-苯基乙胺的制备如下阐明:
2,2,2-三氟-1-苯基乙酮 (S)-2,2,2-三氟-1-苯基乙胺
方法.将1.4g异丙胺盐酸盐加到14mL pH 8.5的0.1M三乙醇胺缓冲液中。
溶解异丙胺盐酸盐后,加入20mg PLP和100mg SEQ ID NO:74的转氨酶,以
400rpm轻柔搅动来溶解。将反应器加热到60℃,用5N NaOH 调整溶液的pH到
pH 8.5。将约400mg 2,2,2-三氟-1-苯基乙酮酮底物溶解在6mL DMSO中,经2
小时逐滴加入溶液。然后以500RPM、60℃搅拌反应器,pH设置在8.5持续24h。
24h后,反应已经达到99%转化为(S)-2,2,2-三氟-1-苯基乙胺产物。在后处理
(workup)期间,反应的温度降低到45℃,逐滴加入2N HCl以降低反应的pH到
pH 2。允许反应搅拌1小时,将沉淀经装有棉毛巾的玻璃烧结漏斗过滤。用
10mL 0.1N HCl洗涤沉淀3次。合并含水滤液,用5N NaOH提高pH到pH 11,随
后用2×100mL IPAC萃取。用25mL盐水洗涤IPAC层,以MgSO4干
燥,过滤,浓缩为(S)-2,2,2-三氟-1-苯基乙胺产物的油。
实施例8:从4-氯-1-(2-氟苯基)丁-1-酮制备(R)-2-(2-氟苯基)吡咯烷(R)-2-(2-
氟苯基)吡咯烷的制备如下阐明:
4-氯-1-(2-氟苯基)丁-1-酮 (R)-2-(2-氟苯基)吡咯烷
方法.向HPLC小瓶加入充入10μL酮和200μL DMSO。向50mLFalcon管加
入3.75g异丙胺-HCl和30mL 0.1M TEA缓冲液。加入约37.5mg PLP,涡旋反应混
合物以混合。向15mL Falcon管加入25mg SEQ ID NO:80的转氨酶。将
5mL PLP/缓冲液的溶液加入含酶的管,涡旋以溶解酶。将1.0mL酶溶液加入含4-
氯-1-(2-氟苯基)丁-1-酮酮底物和DMSO的LC小瓶,将小瓶置于45℃,在恒温混
匀器(thermomixer)上以1000rpm混合。数天后,LCMS分析显示53LCAP转化为产
物,M+1质量为166。共注入期望的(R)-2-(2-氟苯基)吡咯烷产物的可信标准品证实
了该峰的身份。用1.0mL EtOAC萃取反应混合物。浓缩样品,然后用甲醇稀释。
利用ChiralPak AD-H柱作为固定相的SFC检验显示(R)-2-(2-氟苯基)吡咯烷为95%
对映体过量。
实施例9:从3-氧-3-(吡啶-2-基)丙酸乙酯制备(R)-3-氨基-3-(吡啶-2-基)丙酸
乙酯
(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯的制备如下阐明:
3-氧-3-(吡啶-2-基)丙酸乙酯 (R)-3-氨基-3-(吡啶-2-基)丙酸乙酯
方法/材料:反应在带有pH监测器、上方的搅拌、加热罩和热电偶的3L
圆底烧瓶中进行。将约100g3-氧-3-(吡啶-2-基)丙酸乙酯酮酯底物溶解在
800mL DMSO中,这产生绿色的溶液。在含有100g/L异丙胺-HCl的1.2L 0.5M三
乙醇胺缓冲液pH 8.4中准备约4g维生素-B6(“PLP”)。加入后,pH为8.3。通过加
入3mL 20wt%KOH调整pH到pH 8.8。在缓冲液中准备SEQ ID NO:86的转氨酶
多肽(2g),混合直到完全溶解。溶液的pH是8.77,将溶液保持在21.7℃。将在
DMSO母液中准备的酮酯底物一次直接加入批次中。
反应:反应是放热的,从而加热批次温度到38.1℃,而溶液的pH是8.45,
表现为浅绿色浆液。将溶液加热到50℃。在47℃的温度,溶液的pH是8.31,然
后通过加入2mL 20wt%KOH调整pH到8.6。加入底物2小时后,pH为8.07,通
过加入4mL 4M异丙胺溶液调整pH到9.02。加入底物6小时后,pH是8.05,通
过加入4mL 4M异丙胺溶液调整pH到8.9。允许反应孵育过夜。加入底物15小时
后,pH是7.4,加入47.6mL水,增加搅拌(体积减少~25%)。加入约8mL 4M异
丙胺以调整pH到8.85。17.25小时后,pH是8.5,允许反应进行而不进一步调整
pH。在18.33小时,pH是8.27,在RP-HPLC上检验而确定反应完成。
反应后处理:在室温向溶液加入2g Solka 冷却后溶液的pH增加到9.2,因
为缓冲液存在温度依赖性pH变化。随着加入4.5mL浓
H2SO4调整溶液的pH到1.8,熟化1小时。然后将溶液真
空过滤通过带有5μm滤布的过滤瓶和烧结滤器(60mL-40M)。过滤进行1.5小时。
通过与洗液物理混合,用50.6g稀H2SO4(pH 1.6)洗涤滤饼。
过滤进行约20min。用50g稀酸性溶液再次洗涤滤饼,随后经<5min快速过滤。
合并第一次 的洗液和第一次的酸性水溶液,一次地加入67mL庚烷和3.3mL甲苯。
彻底混合溶液,在分液漏斗中分层。第一次的酸性水溶液产生合并的(R)-3-氨基-3-
(吡啶-2-基)丙酸乙酯氨基酸/氨基酯产物的理论产率的约63%的回收率。第一次的
酸性洗液产生约27%的回收率,而第二次的酸性洗液产生约10%的回收率。
向溶液加入约99.4g 20wt%KOH以调整pH到13,在50℃孵育溶液。20min后,
加入另外11.8g 20wt%KOH以调整pH从12.1到13。另外20min后,pH稳定在
12.8,HPLC确定水解完成。观察到固体从溶液沉淀出。在烧结漏斗上过滤碱性溶
液(固体溶解在水中,表现为无机的,因为仅观察到少量产物,固体不溶于MeCN)。
在旋转蒸发器上浓缩碱性溶液,产生(R)-3-氨基-3-(吡啶-2-基)丙酸乙酯的粗制钾盐
溶液,75%产率。
在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有目的均通过引
用以其整体并入本文,其程度如同分别指出将每个单独的出版物、专利、专利申请
或其他文件出于所有目的通过引用并入一样。
尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本
发明的精神和范围。