[摘要] 目的:使变形链球菌重要毒力因子PAc蛋白编码基因pac的遗传工程背景清晰化,以利于克隆构建DNA防龋疫苗。 方法:运用DNASIS计算机分析软件包对pac全基因DNA序列进行酶切图谱,开放阅读框,遗传密码子,编码蛋白等结构参数分析,并就pac基因克隆化方案作出探讨。 结果:pac基因中多个限制性内切酶切点可供制取含重要功能域的目的DNA片段以克隆化;重要密码子及开放阅读框的阐述可帮助准确制定编码产生正确PAc读框的克隆方案。结论:pac基因的遗传工程背景资料分析增强了其克隆化方案的可操作性。
[关键词] pac基因; DNA分析软件包; 克隆工程
自龋病被证实为一种细菌感染性疾病以来,人们一直希望通过免疫学方法达到预防龋病的目的。现代分子克隆工程技术为实现这一目的提供了最先进的手段。本文运用DNA计算机分析软件包对主要致龋菌变形链球菌(S.mutans)重要毒力因子PAc蛋白的结构基因pac全序列进行了限制性内切酶识别位点、开放阅读框、遗传密码子、 编码蛋白等结构参数分析,并结合有关文献对pac基因分子克隆的背景资料进行了研究,旨在使pac基因克隆工程的数据背景清晰化,以利于克隆构建DNA防龋疫苗方案的准确制订。
材料和方法
一、材料
1. c血清型S.mutans MT8148菌株表面蛋白抗原PAc 全核苷酸序列(Okahashi等,1989)。
2. c血清型S.mutans MT8148菌株表面蛋白抗原PAc 全氨基酸代码序列 (美国GenBank, 权限号X14490,1995)。
二、方法
运用DNASIS计算机分析软件包(日本日立软件工程公司开发),对pac基因核苷酸序列及PAc蛋白氨基酸序列进行限制性内切酶识别位点、开放阅读框、遗传密码子、 编码蛋白、特定氨基酸含量等一级结构参数分析。
结 果
一、结构区域分析
pac基因的核苷酸序列由4695 个碱基组成,编码1565个残基的蛋白质。pac基因产物中有两个重复氨基酸序列区域,其中一个在N末端的219~464位残基,富含丙氨酸,但不含脯氨酸及甘氨酸,为A区。A区由三个串联重复片段组成。另一个保守区域是在中央区的867~967位残基,富含脯氨酸,为P区。P区以39个残基为一个片段单位串联重复2.5次。C末端1493~1544位残基有一个富含脯氨酸序列。以上分析结果同Okahashi发表的文献数据[1]。
表1 脯氨酸(proline)及丙氨酸(alanine)在A/P/C末端区和PAc中的含量
A区 | P区 | C末端区 | pac全序列 | |
proline (%) | 33.0 | 28.8 | 6.4 | |
alanine (%) | 33.1 | 12.3 |
二、限制性核酸内切酶识别序列 在分子克隆过程中,目的基因片段通常由限制性核酸内切酶切割DNA分子获得,而具有单一酶切识别位点的内切酶最为常用,此类酶可以准确地切下所需DNA片段并使其被最大限度回收。以下为pac基因中具单一酶切识别位点的限制性内切酶: 表2 pac基因中具有单一酶切识别位点的限制性核酸内切酶 |
内切酶 | 识别序列 | 切割位点(bp) | 所切片段大小(bp) |
BamHⅠ | G!GATCC | 4483 | 4482, 213 |
BglⅠ | GCCNNNN!NGGC | 1130 | 1129, 3566 |
HindⅢ | A!AGCTT | 3933 | 3932, 763 |
SacⅠ | GAGCT!C | 1206 | 1205, 3490 |
SacⅡ | CCGC!GG | 4526 | 4525, 170 |
XbaⅠ | T!CTAGA | 1663 | 1662, 3033 |
通常选择两个单一切点限制性内切酶进行双酶切,以得到目的基因片段。在上述pac基因单一切点内切酶中,有几组酶因所切片段包含了pac基因中的重要结构区域而引起注意: 表3 pac基因双酶切所得目的片段及所含重要结构区域 |
内切酶 | 目的片段大小(bp) | 所含重要区域 |
BglⅠ/ SacⅡ | 3396 | 部分A区 |
部分C末端proline丰富区 | ||
完整P区 | ||
BglⅠ/ BamHⅠ | 3353 | 部分A区 |
完整P区 | ||
SacⅠ/ SacⅡ | 3300 | 部分A区 |
部分C末端proline丰富区 | ||
完整P区 | ||
SacⅠ/ BamHⅠ | 3277 | 部分A区 |
完整P区 | ||
XbaⅠ/ HindⅢ | 2270 | 完整P区 |
XbaⅠ/ SacⅡ | 2863 | 部分C末端proline丰富区 |
完整P区 |