发布网友 发布时间:2022-12-30 05:19
共1个回答
热心网友 时间:2023-10-09 04:27
分享一篇来自PNAS的文章:Transposable elements drive rapid phenotypic
variation in Capsella rubella
Significance:
遗传变异减少的物种快速适应变化环境的机制,被称为“入侵的遗传悖论”,而这一机制尚不清楚。研究发现,与异交种荠菜相比,转座元件(TEs)在C.r荠菜的基因启动子区高度富集,而且C.r中的许多多态TEs与基因表达的变化有关。C.r荠菜开花位点上频繁的TE插入导致了开花时间的变异,而开花时间变异是一个与适应性相关的重要生活史特征。这些结果表明,TE插入驱动快速表型变异,这可能有助于遗传变异有限的物种适应新环境。
Abstract:
具有适应意义性状的快速表型变化对于生物体在不断变化环境中的茁壮成长是至关重要。尽管经历遗传瓶颈的物种,其遗传变异有限,但这种表型变异是如何快速实现的目前尚不清楚。荠菜是十字花科一年生近亲繁殖品种,是研究这一问题的一个很好的材料。它的分布比同类物种更广,尽管极端的遗传瓶颈事件急剧减少了它的遗传变异。研究证明,转座因子(TEs)是遗传变异的一个重要来源,可以解释其表型的高度多样性。TEs与异交种荠菜相比,自交种C.r中的TEs高度富集,并且C.r中4.2%的多态TEs与其相邻基因表达水平的变化相关。此外,我们还发现C.r荠菜的自然种群在开花位点C (FLC)频繁插入TE,是导致12.5%开花时间上自然变异的原因,而开花时间变异是一个与适应性及适应性相关的关键生活史特征。特别是最近在FLC 3’UTR区,TE的插入影响了基因的稳定性,导致其稳态表达水平降低,从而促进了开花。我们的研究结果表明,TE插入可以驱动快速的表型变异,这可能有助于遗传变异有限的物种适应不断变化的环境。
Introction:
具有适应意义性状的快速表型变化为生物体提供了局部适应环境的潜力,这对于生物体的生存和生活范围扩展都至关重要。在全球气候变化的背景下,这变得更加重要。物种在物种形成或被引入一个新的区域后,通常会经历遗传瓶颈,这导致遗传变异的减少,但随后会迅速适应并变得具有入侵性,这被称为“入侵的遗传悖论”。然而,在与适应相关的性状中,介导这些快速多样化表型的潜在机制尚不清楚。
转座因子(TEs)是基因组中变化最大的组成部分,可以复制并整合到新的位置。环境的变化,如气候变化,可以改变TEs的拷贝数及其对基因*的影响,产生具有潜在适应意义的新的遗传变异和表型变异。因此,TEs有潜力迅速创造丰富的遗传多样性,从而成为快速适应环境的媒介。尽管对它们的表型效应进行了广泛的研究,但TEs对快速适应过程的贡献程度在很大程度上尚不清楚。
为了探索TEs能否在遗传变异有限的物种中促进表型快速多样化,我们将重点放在了荠菜(十字花科),这是一种在物种形成过程中经历遗传瓶颈的一年生近亲繁殖物种。C.r种荠菜是入侵遗传悖论的典型例子,其分布比异交种荠菜广范得多。除了向有助于快速传播的自交转变之外,C.r为揭示入侵的遗传悖论提供了一个极好的机会。
在这一研究中,我们推断,如果TEs对快速表型变异和适应性至关重要,那么它们在C.r荠菜基因组中的分布可能反映了这一点。通过群体基因组学分析,我们发现与异交种C.g相比,C.r的TEs在基因启动子和下游区域高度富集。TEs在C.r的自然种群中也是高度多态的,4.2%多态TEs的插入与其相邻基因表达水平的显著变化相关。此外,我们还发现C.r荠菜的自然种群在开花位点C (FLC)频繁插入TE,是导致12.5%开花时间上自然变异的原因,而开花时间变异是一个与适应性及适应性相关的关键生活史特征。特别是最近在FLC 3’UTR区,TE的插入影响了基因的稳定性,导致其稳态表达水平降低,从而促进了开花。总的来说,我们的结果表明TEs在快速表型变异中起着至关重要的作用,这可能有助于植物适应不断变化的环境条件,并解释入侵的遗传悖论。
Results:
Ø TEs在C.r荠菜中高度富集并影响其邻近基因的表达水平**
我们假设,如果TEs是表型变异的关键决定因素之一,它们在自交种荠菜C.r和其异交同源姊妹种C.g之间的分布可能不同。为了检验这一点,我们比较了C.r和C.g中19795个同源基因对中TEs的分布。与C.g的相应区域相比,TEs在C.r的不同基因区域高度富集 (图****1A)。与之前的研究相比,我们用同源区域的分析揭示了这些不同的分布模式,因为这两个物种的基因组具有不同的覆盖度/组装水平。此外,与C.g荠菜(图****1B)相比,TEs在C.r荠菜基因的启动子和下游区域中高度富集,表明TEs可能有助于C.r中基因表达水平的多样化。
为了评估C.r中TEs是否具有多态性,我们比较了28个C.r基因组,包括27个样本 (附录,表S1),以MTE样本为参考。基于全基因组序列的系统发育树表明,这28个C.r是密切相关的(附录,图S1)。我们在这些基因组中鉴定了3808个多态TEs(附录,图S2A)。如前所述,这些多态TEs在基因间区域高度富集(89.84%)(附录,图S2B)。这些样本中多态TEs的数量从1024到1688不等,参考MTE中多态TEs的数量为1731(附录,图S3和表S1)。存在于至少两种样本中的多态TEs被认为是常见的。总的来说,在3808个多态TEs中,2558个(67.17%)存在于至少两个种属中,表明其存在共同的等位基因变异(图****1C)。
为了评估这种变异的功能意义,我们对三个有代表性的C.r荠菜种(MTE,86IT1和879)(附录,表S2)进行转录组测序,基于它们在28个C.r荠菜种中(附录,图S1)系统发育树上的位置。这三份材料中有1309个多态性位点,其中5.45%位于基因区,94.55%位于基因间区。我们发现,在这三个种质的1309个多态位点中,有55个(4.2%)与其相邻基因表达水平的显著变化有关。在这些与基因表达变化相关的TE中,逆转录座子更常见(36.37%,附录,图S4)。利用拟南芥同源基因对受TEs影响的基因进行基因本体富集分析,表明这些基因参与植物侧根形成和防御反应(附录,图S5)。综上所述,这些发现表明多态TEs可以使基因表达多样化,这有可能像在其他植物中一样形成C.r的表型变异。
Ø 开花位点(CrFLC)频繁的TE插入会影响开花时间的自然变异**
异交种荠菜C.g的地理分布比自交种荠菜C.r要窄得多,C.r在环境条件各不相同的南欧和西欧的大部分地区都有分布。而开花时间是适应气候变化和新环境的重要特征。有趣的是,我们发现FLC(C.r荠菜开花时间自然变异的决定因素),在其基因区域有TE插入。为了评估CrFLC基因上TE插入的频率,我们对桑格测序的8份材料中的CrFLC基因区域(从起始密码子上游2 kb到UTR 3’末端)进行了测序,并将它们与之前发表的27个其他CrFLC基因序列进行了比较(附录,表S4)。我们在35份材料中的7份(20%)发现了5种不同的TE插入。我们在两个种属(879和1208)的3’UTR发现了一个TE插入,在五个种属(39.1、690、1204、844和TAAL)的内含子1中发现了另外四个TE插入(图****1D)。插入TE大小在498到1958个碱基之间,且大部分是Helitron型转座子,除了TAAL种中,是一个DNA插入转座子。与参考种MTE和没有TE的种相比,这7个插入TE的种都具有开花早的特征(图****1E和附录,表S4)。除1204种属外,其余6份材料中CrFLC的表达水平均低于参考种MTE(P < 0.05,t测验)。这也反映在CrFLC下游基因FT和SOC1的反向相关表达水平上(图****1F)。此外,开花时间上12.5%的变异可以用C.r荠菜CrFLC上TE插入的等位基因变异来解释(皮尔逊相关系数,r2 = 0.125,P < 0.05)。这些结果表明,在CrFLC基因上TE的插入与C.r的早花特性有关。
Helitron是一种新型的DNA转座子,它具有5'TC和3'CTRR(R代表A或者G)保守边界,在转座时插入在AT碱基之间并且不造成靶位点重复。这些特征与真核生物中发现的其它所有DNA转座子类型都不相同。玉米基因组的结构多样性在一定程度上就是由于Helitron的转座造成的。
Helitrons是目前已知三组真核2类转座因子(TEs)之一,是真核滚环转座元件,通过滚环式复制机制经由单链DNA中间体转座。它们首先在植物(拟南芥和水稻)和线虫中被发现,现在已经在从原生动物到哺乳动物的多种物种中被鉴定出来。Helitrons构成了许多基因组的很大一部分,在这些基因组中,非自主元件的数量经常超过假定的自主伙伴。Helitrons似乎在宿主基因组的进化中起着重要作用。它们经常捕获不同的宿主基因,其中一些可以进化成新的宿主基因,或者成为转座子转座的必要条件
鉴于每个TE插入只存在于FLC位点不同区域的少数C.r荠菜种中,我们得出结论,这些TE插入是最近独立产生的(附录,图S1)。十字花科家族种,在FLC有频繁的TE插入(附录,图S6A)。对来自C.grandiflora和C.orientalis的几份材料和拟南芥的76份材料的分析(附录,表S5)也表明,在879种属中的3’UTR区的TE插入是一个最近的突变,仅出现在两个C.r荠菜种中(附录,图S7)。如果TE插入具有任何适应性意义的潜力,人们可能会期望这些插入能够显示一些地理模式。为了评估这一点,我们比较了这些材料的来源。有趣的是,含有TE插入的物种聚集在这一物种最南端的栖息地——地中海地区 (附录,图S6B和表S4)。该地区拥有地中海气候,其特点是降雨量高,冬季温暖,夏季干热。该地区的植物通常开花早,以避免干燥炎热的夏天。与C.r早期开花相关的高频率TE插入与这一假设一致。为了评估有无TE插入的C.r荠菜种属间是否存在显著的生态位差异,我们进行了生态位建模,发现两组荠菜间存在显著的生态位差异(100个随机排列,单样本t检验,P < 0.001,附录,图S8), 这与C.r荠菜中TEs显示出具有引起适应性意义的表型变异的可能性相一致。
生态位分化(生态位分离、生态位分离、生态位划分的同义词)是指相互竞争的物种以不同的方式利用环境,使其共存的过程。竞争排斥原则指出,如果两个具有相同的生态位(即生态角色)的物种竞争,那么其中一个将不可避免地把另一个推向灭绝。当两个物种区分它们的生态位时,它们的竞争往往不那么激烈,因此更有可能共存。物种可以通过多种方式来区分它们的生态位,比如食用不同的食物,或者利用环境的不同部分。
为了检验3’UTR区和内含子1中的TE插入是否是导致早花变异的原因,进行了遗传图谱构建。首先,分析了一个F2群体(879 × MTE),该群体来源于晚花测序品种MTE和早花品种879之间的杂交,其中早花品种879在3′UTR区含有1个TE插入。开花时间与十字花科植物FLC的表达水平密切相关。我们发现F2群体中,开花时间的分布与CrFLC表达水平的分布一致(图****2 A和2B),其中CrFLC表达水平较低的F2个体属于879基因型(图****2B)。此外,F2群体2周龄幼苗的CrFLC表达水平与3′UTR的TE插入密切相关(皮尔逊相关系数,r2 = 0.462,P < 0.01)。这些发现表明3’UTR区TE的插入可能影响CrFLC在该杂交群体中的表达。
F2群体早花植物池的测序结果在6号染色体上定位到一个863 kb区域(位置2.78-3.64 Mb)(图****2C)。我们进一步使用了来自BC2F2群体的825个个体,并将这一区域缩小到130 kb的区间(附录,表S6)。这个mapping间隔区包含39个开放阅读框,包括CrFLC(图****2D)。桑格测序表明CrFLC启动子中有一个2 bp缺失,内含子中有两个SNP单核苷酸多态性,一个SNP在3’UTR区,其中3’UTR有一个1958bp的Helitron转座子插入,这使得MTE与879有所不同(图****2 D和2E)。其中879种属的CrFLC表达水平是MTE的四分之一(图****1F),这使得它成为观察开花时间变化的主要候选基因。
为了评估CrFLC基因内含子1中的TE插入是否也是引起早花变异的原因,我们构建了844 × MTE的F2群体。使用相似的测序方法,我们基于501个F2个体在6号染色体上鉴定了一个650 kb的区域(附录,图S9 A和S9B)。我们使用另外561个F2个体和附加标记将mapping间隔缩小到210 kb区域,其中包括CrFLC基因座(附录,图S9-C和D以及表S7)。内含子1中TEs的位置与拟南芥中Ler的位置大致相似,其中拟南芥Ler中TE的插入是通过siRNA调节组蛋白修饰,从而来调节开花时间。因此,类似的机制可能会在844中介导早花的开始。
然而,在879中3′UTR区的TE插入是独特的(附录,图S6)。为了证实3’UTR的TE插入是否可调节开花时间,我们用来自MTE和879基因组的CrFLC及一个额外的MTE-CrFLC构建了MTE-Ins重组,其中引入了来自879的Helitron转座子,并比较了他们在拟南芥突变体FRIsf2flc-3中的互补能力(图****3 A)。CrFLC在含有MTE重组的转基因植物中的表达量高于含有879或MTE-Ins重组的转基因植物(图****3B附录,图S10)。与这些发现与CrFLC下游基因CrFT和CrSOC1的表达水平与CrFLC表达水平呈负相关相一致(图****3B),开花时间与CrFLC表达水平相关。具有MTE基因组序列的转基因植物开花较晚,而具有879或具有TE插入的MTE的转基因植物开花较早(均P < 0.001,t测验;图****3C)。综上所述,这些结果表明,C.r荠菜879和MTE株系开花时间的差异是由在CrFLC3′UTR插入TE引起的等位基因变异造成的。
Ø CrFLC中3’UTR区TE的插入导致可变聚腺苷酸化并影响其mRNA的稳定**
转座子TE插入可以通过改变转录和/或调节mRNA稳定性来改变基因表达。为了评估MTE和879之间的CrFLC表达差异是否由转录差异引起,我们通过检测未剪切mRNA丰度来量化转录率。MTE和879之间未剪切的CrFLC新生转录物的丰度相似(图****4A)。与此相一致,在两种材料中,在CrFLC转录起始位点和内含子1的末端检测到低水平的DNA甲基化,这两个区域对FLC的表达*很重要(附录,图S11)。这些发现表明转录差异不能解释观察到的基因表达变化。
TE在3’UTR位点的插入可以产生选择性聚腺苷酸化(APA),进而调节mRNA的稳定性。879中Helitron型转座子的插入引入了一个典型的poly(a)信号(AAUAAA)。3’RACE分析显示在879-CrFLC中存在APA(图****4B)。为了评估APA是否能够完全解释所观察到的表型差异,我们在拟南芥突变体FRIsf2flc-3中转入外源重组的879-CrFLC,其中poly(A)信号发生突变(879-PAS-mut) (SI Appendix,图S12)。与MTE-CrFLC的转基因系相比,这些植物也像879-CrFLC的转基因系一样提早开花,这表明,尽管在3’UTR区TE的插入科导致APA,但其他机制也导致基因表达的降低。
为了评估mRNA的稳定性,我们测量了在有抑制转录的虫草素存在下的亲本系中CrFLC的表达。这些实验表明,879-CrFLCmRNA的降解速度快于MTE-CrFLCmRNA (图****4C)。为了进一步证实3’UTR的作用,我们用来自MTE的CrFLC启动子连接GUS报告基因,且带有MTE或879的3’UTRs,并将这一重组结构转入拟南芥突变体FRIsf2flc-3中(图****4D)。发现,与879相比,MTE 3’UTR导致GUS表达量增加了近三倍。这些结果与拟南芥中的发现一致,表明3’UTR可能影响FLCmRNA的稳定性。
MTE和879在其poly(A)尾之前的AU富集元件(AREs)和GU富集元件(GREs)也不同(图****4B)。这些只存在于879中的元件有可能影响RNA的稳定性。为了评估AREs或GREs是否能介导基因表达的变化,我们比较了在转基因系中特异性突变这些元件后GUS基因的表达水平(图****4D)。虽然第一个ARE的丢失对基因表达有显著影响,但是GRE和第二个ARE的丢失对GUS的表达水平没有影响,表明位于879株系中3’UTR区的第一个ARE对调节这些转基因系中的mRNA的表达至关重要。对含有来自MTE的带有部分3’UTR的GUS转基因系的分析表明,MTE株系中3’UTR的后半区域更为关键,因为MTE株系中 3’UTR区的前半部分(MTEΔ2)的缺失导致GUS的表达水平与MTE相同,但是后半部分(MTEΔ1)的缺失显著降低了GUS的表达水平(图****4D)。这些结果表明,879-CrFLC中AREs的存在和MTE 3′UTR的后半部分的缺失可能通过影响mRNA稳定性而降低CrFLC的表达(图****4D)。
Discussion****:
遗传变异有限的入侵物种通常需要迅速获得表型的多样化,以适应不断变化的环境,并在被称为“入侵的遗传悖论”的过程中获得成功。这个过程是如何发生的是生物学中的一个基本问题。C.r荠菜经历了极端的遗传瓶颈,但分布广泛,因此是解决这一问题的良好模型。由于TEs能在有限的时间内产生丰富的遗传变异,并能影响表型变异,因此被认为是一种快速适应性的因子。例如,在英国灰蛾中,皮层基因内含子1中的TE插入增加了其表达水平,并诱导黑色素化。然而,TEs对快速表型多样化的贡献程度以及它们影响表型的机制尚不清楚。
我们的研究结果表明,TEs在快速表型变异中起着至关重要的作用,并表明它们可能有助于适应不断变化的环境。以前在其他系统中的研究表明,3’UTRs中的TEs可以通过调节拟南芥的甲基化来改变基因表达,并且可以改变水稻的翻译效率。我们已经发现在3’UTR插入一个TE会影响mRNA的稳定性,这一机制也有可能影响基因表达和表型。虽然我们的研究暗示了与潜在适应性意义的相关性,但未来的研究应该探索这种表型多样化是否最终赋予适应性优势,以及TEs是否能够驱动适应性。
十字花科荠属的Capsella rubella是一个新进起源的二倍体物种。在进化过程中,其祖先物种C. grandiflora少数个体的交配系统发生转变,从异交变为自交,形成了C. rubella。然而,尽管C. rubella形成中遗传多样性极大降低,但其分布范围却比其祖先大得多。
Niu, X. M., Xu, Y. C., Li, Z. W., Bian, Y. T., Hou, X. H., Chen, J. F., . . . Guo, Y. L. (2019). Transposable elements drive rapid phenotypic variation in Capsella rubella. Proc Natl Acad Sci U S A. 116 (14) 6908-6913