发布网友 发布时间:2022-04-23 21:42
共1个回答
热心网友 时间:2023-10-10 18:19
酿酒酵母是第一个完成基因组测序的真核生物,测序工作于1996年完成 。
酿酒酵母的基因组包含大约1200万碱基对,分成16组染色体,共有6275个基因,其中可能约有5800个真正具有功能。据估计其基因约有23%与人类同源。酵母基因组数据库包含有酵母基因组的详细注释(annotation),是研究真核细胞遗传学和生理学的重要工具。另一个重要的酿酒酵母数据库[1]由慕尼黑蛋白质序列信息中心维护。
在酿酒酵母测序计划开始之前,人们通过传统的遗传学方法已确定了酵母中编码RNA或蛋白质的大约2600个基因。通过对酿酒酵母的完整基因组测序,发现在12068kb的全基因组序列中有5885个编码专一性蛋白质的开放阅读框。这意味着在酵母基因组中平均每隔2kb就存在一个编码蛋白质的基因,即整个基因组有72%的核苷酸顺序由开放阅读框组成。这说明酵母基因比其它高等真核生物基因排列紧密。如在线虫基因组中,平均每隔6kb存在一个编码蛋白质的基因;在人类基因组中,平均每隔30kb或更多的碱基才能发现一个编码蛋白质的基因。酵母基因组的紧密性是因为基因间隔区较短与基因中内含子稀少。酵母基因组的开放阅读框平均长度为1450bp即483个密码子,最长的是位于Ⅻ号染色体上的一个功能未知的开放阅读框(4910个密码子),还有极少数的开放阅读框长度超过1500个密码子。在酵母基因组中,也有编码短蛋白的基因,例如,编码由40个氨基酸组成的细胞质膜蛋白脂质的PMP1基因。此外,酵母基因组中还包含:约140个编码RNA的基因,排列在Ⅻ号染色体的长末端;40个编码SnRNA的基因,散布于16条染色体;属于43个家族的275个tRNA基因也广泛分布于基因组中。表1提供了酵母基因在各染色体上分布的大致情况。 表1酵母染色体简况
染色体编号长度(bp)基因数tRNA基因数
I 23×103894
Ⅱ 807 188 410 13
Ⅲ315×10318210
Ⅳ 153 197479627
V 569 202 27113
Ⅵ 270×10312910
Ⅶ 109 093 657233
Ⅷ561×10326911
Ⅸ 439 8862 2110
X 745 44237924
Ⅺ66 64 483 3116
Ⅻ 1078 1715 3422
ⅫI 924 430 45921
ⅪV 7843 284 1915
XV 109 2283 56020
XⅥ 94 806 148717 序列测定揭示了酵母基因组中大范围的碱基组成变化。多数酵母染色体由不同程度的、大范围的GC丰富DNA序列和GC缺乏DNA序列镶嵌组成。这种GC含量的变化与染色体的结构、基因的密度以及重组频率有关。GC含量高的区域一般位于染色体臂的中部,这些区域的基因密度较高;GC含量低的区域一般靠近端粒和着丝粒,这些区域内基因数目较为贫乏。Simchen等证实,酵母的遗传重组即双链断裂的相对发生率与染色体的GC丰富区相耦合,而且不同染色体的重组频率有所差别,较小的Ⅰ、Ⅲ、Ⅳ和Ⅸ号染色体的重组频率比整个基因组的平均重组频率高。
酵母基因组另一个明显的特征是含有许多DNA重复序列,其中一部分为完全相同的DNA序列,如rDNA与CUP1基因、Ty因子及其衍生的单一LTR序列等。在开放阅读框或者基因的间隔区包含大量的三核苷酸重复,引起了人们的高度重视。因为一部分人类遗传疾病是由三核苷酸重复数目的变化所引起的。还有更多的DNA序列彼此间具有较高的同源性,这些DNA序列被称为遗传丰余(genetic rendancy)。酵母多条染色体末端具有长度超过几十个kb的高度同源区,它们是遗传丰余的主要区域,这些区域至今仍然在发生着频繁的DNA重组过程。遗传丰余的另一种形式是单个基因重复,其中以分散类型最为典型,另外还有一种较为少见的类型是成簇分布的基因家族。成簇同源区(cluster homology region,简称CHR)是酵母基因组测序揭示的一些位于多条染色体的同源大片段,各片段含有相互对应的多个同源基因,它们的排列顺序与转录方向十分保守,同时还可能存在小片段的插入或缺失。这些特征表明,成簇同源区是介于染色体大片段重复与完全分化之间的中间产物,因此是研究基因组进化的良好材料,被称为基因重复的化石。染色体末端重复、单个基因重复与成簇同源区组成了酵母基因组遗传丰余的大致结构。研究表明,遗传丰余中的一组基因往往具有相同或相似的生理功能,因而它们中单个或少数几个基因的突变并不能表现出可以辨别的表型,这对酵母基因的功能研究是很不利的。所以许多酵母遗传学家认为,弄清遗传丰余的真正本质和功能意义,以及发展与此有关的实验方法,是揭示酵母基因组全部基因功能的主要困难和中心问题。