2021年7月15日,湖南农业大学联合中国农业科学院农业基因组研究所等单位在学术期刊Nature Plant(IF=15.792)在线发表了题为“The Taxus genome provides insights into paclitaxel biosesynthesis”的文章,研究团队组装了染色体级别的高质量南方红豆杉参考基因组,解析了紫杉醇生物合成的遗传基础。南方红豆杉参考基因组的发布加深了对紫杉醇生物合成途径及其遗传基础的理解,为紫杉醇生物合成途径的研究奠定了重要基础。尊龙凯时为本次研究提供了Hi-C辅助组装的建库测序服务。
文章名称:The Taxus genome provides insights into paclitaxel biosesynthesis
发表时间:2021年7月15日
发表杂志:Nature Plant
影响因子:15.792
研究物种:南方红豆杉(Taxus Chinensis Var.Mairei )
样本选择:南方红豆杉单倍型胚乳
测序策略
DNA
PacBio Sequel II平台基因组测序,构建15 kb文库,31X
Illumina HiSeq 2500测序平台,构建Hi-C文库,113X
Illumina HiSeq 2500测序平台,构建DNA小片段文库,69X
RNA
Illumina HiSeq 2500测序平台,构建RNA文库
研究背景
红豆杉科(Taxaceae)是分布广泛的非开花针叶树科,有6个现存属和超过28个种,具有重要的经济价值。红豆杉属(Taxus)是红豆杉科中最大的属,包括南方红豆杉(T.chinensis)、短叶红豆杉(T.brevifolia)、欧洲红豆杉(T.baccata)等常见种,主要分布于亚洲、北美和欧洲。红豆杉是抗癌药物紫杉醇的天然来源,但由于紫杉醇在红豆杉中的丰度较低,植物来源的紫杉醇供不应求,限制了其临床应用。
紫杉醇是一种四环二萜类化合物,可通过复杂的代谢途径进行生物合成。截止目前,紫杉醇的生物合成途径中已鉴定出20多种酶。但该途径中的几个基本步骤,如C1羟基化、C9氧化和氧杂环丁烷的形成,仍有待阐明。
一个完整的红豆杉基因组序列可以为深入了解紫杉醇的生物合成和调控机制提供有价值的生物信息和遗传资源,但红豆杉基因组的大小和复杂性阻碍了其从头开始的基因组组装,限制了对紫杉醇生物合成途径的全面理解。而本文成功地组装了红豆杉基因组,为紫杉醇生物合成途径的研究奠定了重要基础。
研究结果
南方红豆杉基因组的组装和注释
K-mer分析南方红豆杉基因组大小为10 Gb。南方红豆杉基因组的从头组装是通过PacBio长读长序列(318.05 Gb)和Illumina短读长序列组装而成,通过Hi-C辅助组装,将9.86 Gb的测序数据挂载到了南方红豆杉基因组的12条染色体上,覆盖基因组的96.28%(图1),最终获得10.23 Gb的基因组序列,contig N50为2.44 Mb。
图2 组装的12条染色体基因组图谱
在基因组信息的基础上,通过整合转录组数据、同源比对和从头预测基因模型,注释获得42,746个蛋白编码基因。其中,73.02%的基因可以被RNA-seq数据支持(图3)。Busco分析进一步证明1,614个核心基因中有1,052个是完整的,表明南方红豆杉组装的基因组具有相对较高的完整性。
图3染色体基因表达图谱
a表示组装染色体的长度(Mb);b、c、d和e分别表示雄株茎、根、球果和叶皮中组织特异基因的表达;f、g、h和i分别表示雌株茎、根、球果和叶皮中组织特异基因的表达;j和k分别表示高产和低产紫杉醇细胞系。
红豆杉在柏类植物分支中经历了全基因组复制事件
由于全基因组复制(WGD)是导致植物基因组大小扩大的重要进化力量,所以研究人员对南方红豆杉是否经历过WGD事件进行了研究。随着Ks值的增加,Ks值的频率呈现明显的衰减,没有自然分布,表明南方红豆杉基因组中没有最近发生的WGD事件(图4)。研究人员使用MCScanX分析得到8,148个同线基因对,对其进行Ks和4DTv的计算,结果显示,Ks(图4)和4DTv(图5)的两个特征峰分别位于2.1和0.7,表明南方红豆杉中存在古老的WGD事件。
图5 基于4DTv分布的WGD分析
红豆杉基因组扩张与反转录转座子相关
除了WGD对南方红豆杉基因组扩张的作用外,重复序列构成了南方红豆杉基因组的一个重要组成部分。研究发现南方红豆杉基因组中共有7.79 Gb的重复序列,占全基因组的76.09%。在这些重复序列中,长末端重复序列(LTR)反转录转座子所占比例最高,为52.38%。插入时间分析表明,LTR插入是一个连续的过程,大约40%的插入发生在800-2,400万年前(图6C),LTR的连续插入在裸子植物中可能是一种普遍现象。
为了进一步探讨南方红豆杉LTR的进化,分析了几种有代表性的裸子植物和被子植物LTR反转录转座子的系统发育(图6D)。南方红豆杉的Gypsy成分和Copia成分有所扩大,并经历了一个相对独特的进化模式。
图6 南方红豆杉基因组中LTR的插入时间分析和系统发育进化树分析
红豆杉基因家族的进化
图7 南方红豆杉同源蛋白编码基因家族的Venn图和基因家族的进化分析
红豆杉CYP450的进化和基因组组成
由于CYP450参与紫杉醇生物合成中几乎一半的酶反应,所以对南方红豆杉CYP450家族进行了分析。鉴定出总共649个CYP450基因。系统发育分析表明,与其他68个代表种相比,CYP750和CYP725家族在南方红豆杉中有明显的扩张(图8A)。CYP725基因参与紫杉醇的生物合成,可分为 CYP725A和CYP725B亚家族(图8B)。
大多数CYP725A基因(74.68%)位于9号染色体上(图8C,D),表现出明显的不均匀分布,并倾向于组织成不同的基因群,在基因组上总共检测到25个基因群(图8C)。染色体9上的4个基因群(9.1-9.4)的基因表达水平在茉莉酸存在下显著上调(图8E)。9.1和9.2基因群包含所有已知的与紫杉醇生物合成相关的CYP725A亚家族基因和12个未定义的CYP725A基因(图8F)。这两个基因群可能含有南方红豆杉进化过程中产生的大部分紫杉醇合成途径基因。
图8 南方红豆杉CYP450的进化和基因组结构
紫杉烯生物合成基因簇的功能鉴定
PlantiSMASH31分析进一步表明,在9.2基因群中出现了一个与萜类生物合成相关的潜在基因簇。该基因簇包含两个TS基因、两个T5αH基因和两个未知的CYP725A(图9A),其主要负责前两步的催化紫杉醇生物合成。该簇中的基因对茉莉酸处理的响应表现出高度协调的组织表达模式和表达一致性,表明这些基因可能是功能相关的。外源茉莉酸处理导致TS2的转录本水平明显高于TS1(图9E),表明TS2可能通过茉莉酸信号在紫杉醇的生物合成中发挥作用,以响应不同的环境和发育信号。
最后,建立了基因间的共调控网络,该网络可以覆盖所有已知的紫杉醇生物合成基因,表明其全面性和高可信度。利用这个网络鉴定了17个CYP725A基因、3个转移酶和10个TF,它们与已知的紫杉醇生物合成基因密切相关。
图9 紫杉烯生物合成基因簇的功能鉴定
小结
本文报道了南方红豆杉染色体水平的基因组,全长10.23 Gb。南方红豆杉与针叶植物谱系共享一次古老的全基因组复制,并经历了不同的转座子演化。在南方红豆杉基因组中发现了一类独特的细胞色素P450基因CYP725As,作用于紫杉醇的生物合成。另外,还鉴定到了一个紫杉烯生物合成的基因簇,主要是由基因复制形成。本文的研究将有利于加速对紫杉醇生物合成的研究,有助于加快红豆杉生物技术应用和转化进程。
尊龙凯时承担了本次研究的Hi-C辅助组装的建库测序服务,为构建染色体级别超大基因组不断积累物种经验。尊龙凯时将持续为更多客户在超大基因组组装上提供完善的组装策略和方法,助力客户在超大基因组研究上取得新的突破。
作为国内基因组行业的平台型企业,安诺基因拥有多种测序服务平台,配备系列仪器设备,三代PacBio(1台Sequel IIe+7台Sequel II+10台Sequel)为您的科研之路保驾护航;专业的生物信息分析团队,丰富的项目分析经验,让您的数据分析之途无忧。安诺基因已与中国农业大学、中科院遗传与发育所、中国海洋大学、中国农业科学院、福建农林大学等多家科研院所开展了深度合作,助力基因组文章发表于Cell、Nature、Nature Plants、Nature Communications、Molecular Plant、Communications Biology、The Plant Journal等多个国际高水平期刊。
参考文献:
Xiong X, Gou J, Liao Q, et al. The Taxus genome provides insights into paclitaxel biosesynthesis [published online ahead of print, 2021 Jul 15]. Nature Plants. 2021;10.1038/s41477-021-00963-5. doi:10.1038/s41477-021-00963-5.