抽象的
背景
雪茄包装叶是雪茄最重要的原料。研究雪茄烟草的基因组信息有利于遗传育种的角度提高雪茄品质。然而,已经报道了雪茄烟草基因组范围内的参考基因组或全长转录物。特别地,阴离子频道/运输机对其在调节沿海地上生长的雪茄烟草氯化物含量的潜在应用程度很大,这通常会导致相对高的CL-积累,这是不利的。在这里,将PACBIO平台和NGS技术合并以产生用于雪茄包装的雪茄烟草的全长转录组。
结果
从根部,烟草烟草中分离的高质量RNA,对PACBIO平台和NGS进行患者。来自PACBIO,共产生11,652,432个底次(19-GB),平均读取长度为1,608 bp。在与NGS读取结合读取的校正之后,我们最终鉴定了1,695,064个开放阅读框,包括21,486个全长ORF和7,342个基因编码来自55个TF家族的转录因子,以及编码长期非编码RNA的2,230个基因。与阴离子渠道/运输车相关的基因家庭成员,包括成员斯拉克和中电家庭,被确定和特征。
结论
获得,注释和分析雪茄烟草的全长转录组,为雪茄烟草的未来研究提供了有价值的遗传资源。
背景
烟草(烟草L.)属于茄科,是一种广泛种植的重要经济作物[1.]. 根据烘烤方法和农艺性状,我国具有重要经济意义的烟叶可分为四类:烤烟、晒烟、晾烟和白肋烟[2.].作为a kind of sun-cured tobacco, cigar tobacco is cultivated most commonly and traditionally. Cigars are combusted tobacco products consisting of filler, binder and wrapper materials, which are all derived from cigar tobacco [3.]. 世界范围内的优质雪茄烟主要产于古巴、美国、厄瓜多尔、印度尼西亚等国。与世界上最著名的雪茄产地古巴相比[4.]海南省拥有类似的纬度,气候条件和丰富的红粉状壤土。因此,这个位置可能是中国生产高质量原料的雪茄生产。然而,土壤中的氯化物含量高(岛上可能发生)是不利的,并且过量氯化物吸收和悬垂至烟草叶子阻碍雪茄质量。此外,盐胁迫也是对雪茄烟草正常生长的威胁。为了研究雪茄烟草的分子遗传基础及其对育种目的的应力耐受性,重要的是获得其基因的核苷酸序列。根据NCBI数据库,主要烟草品种,K326(烤),TN90(Burley)和Basma Xanthi(Bx,东方)有三种高质量的基因组。5.].到目前为止,尚无关于雪茄烟草基因组序列的报道。
通常称为第二代测序的下一代高通量测序(NGS)已被广泛用于植物转录组分析[6.,7.,8.].尽管这是一种不需要参考基因组就能从植物中获取遗传信息的有效且经济的方法,但其产生的短读长度限制了正确的序列组装和注释。最近,第三代测序(TGS)平台SMRT (single molecular real-time)测序结合PacBio Iso-Seq协议已被用于分析多个植物物种的全长转录组,例如山茶花[9],Medicago Falcate.[10.],大白菜(甘蓝型油菜学报)[11.],番红花[12.),Gossypium精华[13.].
除了硝酸盐(NO3.-)、氯(Cl-)是植物细胞中其他重要的阴离子。氯是许多植物必需的微量营养素-在气孔运动、光合作用、细胞渗透压维持和抗病等一系列细胞生物学过程中起着重要作用[14.,15.,16.].编码植物阴离子通道/转运体的基因有三个家族斯拉克(慢阴离子频道),ALMT(铝活化苹果酸盐转运体)和中电(氯化物频道)家庭[17.].斯拉克基因参与应激信号、生长发育和激素反应拟南芥.SLAH1, 2和3是SLAC家族的成员,据报道可以控制根木质部中的硝酸盐和氯含量[18.,19.].ALMT基因参与植物中的铝耐受性,气孔开口和果酸。在拟南芥AtALMT9是一个由苹果酸激活的液泡氯通道,是气孔打开所必需的[20.,21.].中电基因似乎也在细胞压力电位、气孔运动和营养运输的调节中起着关键作用。在拟南芥中,AtCLCc、AtCLCe和AtCLCg可以转运Cl-与其他阴离子相比[22.,23.,24.].
在本研究中,我们将NGS和PacBio Iso-Seq应用于雪茄烟草,以获得转录组的全球概况。因此,我们还研究了转录因子(transcription factors, TFs)和长链非编码rna (long non-coding RNAs, lncRNAs)。为了确定雪茄烟草中有助于氯离子运输的阴离子通道/转运体,斯拉克和中电基因家族成员的特征。基于RNA-Seq分析鉴定基因的表达水平,并通过qRT-PCR进一步验证转录组测序数据的有效性。作为首次报道的雪茄烟草全长转录组,本研究的发现将为未来雪茄烟草功能基因特别是氯代谢相关基因的研究提供有价值的资源。
结果
雪茄烟全长转录组的构建
从雪茄烟叶的叶、茎和根中等量混合优质rna,生成PacBio Iso-Seq文库。cdna的长度分别为1 ~ 2kb、2 ~ 3kb和> 3 kb。从Pacific Bioscience RS II平台共获得11,652,432个子reads (19 gb),平均reads长度为1,608 bp, N50为2,471 bp (Table .)1.).根据图中所示的生物信息学程序。1.A,去除引物和不需要的组合后,共获得318,203条环状一致序列(circular consensus sequences, CCSs),其读长显著提高,平均长度为2,608 bp。对非嵌合转录本进行抛光,Quiver得到24272条抛光一致序列,平均长度2577 bp, N50为3171 bp;然而,与ccs相比,其读长分布并没有明显的不同。1.B). Illumina NGS产生30.31 Gb的干净读数据。这些NGS reads被用来用LSC软件校正抛光的共识异构体,结果得到24242个校正的转录本(附加文件1.:表S1),平均长度为2,548 BP和3,149bp的N50。然后鉴定出全长ORF,并通过奥菲德斯特软件预测编码的蛋白质序列(https://www.ncbi.nlm.nih.gov/orffinder/).最后,我们完全预测了1,695,064个ORF,平均长度为2,634磅,而只有21,486次被鉴定为全长ORF。如图所示。1.C,全长orf编码的氨基酸长度挤在201-400个氨基酸左右。
经术的功能注释
通过KEGG、Swiss-Prot、TrEMBL、Pfam和GO数据库对24242个校正后的转录本进行了功能注释,共有23104个转录本(占总转录本的95.6%)进行了注释(图1)。2.A) 是的。将同源物种的转录本序列与瑞士Prot数据库中的转录本序列进行比较分析,结果表明,转录本最多的前6个物种为拟南芥(11821个单基因),烟草(1844 unigenes),奥雅萨苜蓿亚普。japonica.(822 unigenes),番茄茄(805个单基因),Nicotiana sylvestris.(534个单基因)和茄属植物tuberosum(531 unigenes)(图。2.B) 是的。为了进一步在线分类这些转录物,进行了术语分析(图。2.C附加文件2.:表S2)。共有18043个转录本被赋予GO术语,可分为三大类(生物过程、细胞成分和分子功能)。在细胞成分(CC)类别中,“细胞部分”(GO:0044464)和“细胞”(GO:0005623)是两个最流行的功能术语(附加文件3.:图S1);在分子功能(MF)类别中,“催化活性”(GO:0003824)和“结合”(GO:0005488)是最具功能的两个术语(附加文件4.:图S2);在生物过程(BP)类别中,“代谢过程”(GO: 0008152)和“细胞过程”(GO: 0009987)是两个功能最强的术语5.:图S3)。KEGG通路的富集为研究基因复杂的生物学功能提供了有价值的分类方法。如图所示。2.D,几种途径,例如“植物激素信号转导”,“植物 - 病原体相互作用”和“苯基丙醇生物合成”是高度富集的(附加文件6.:表S3)。这些结果表明,雪茄烟的次生代谢是活跃的。
转录因子的鉴定
转录因子(Transcription factors,TFs)是通过与特定DNA结合来调节基因表达的蛋白质。总的来说,TFs参与了许多生物过程,如植物生长和胁迫反应[25.].利用TF数据库BLAST对55个不同科的7432个TF进行了注释。确定的前30个家庭如图所示。3..TF家族以bHLH(10.55%)家系最多,其次为MYB(9.87%)、ERF(7.41%)和NAC(7.18%)家系。我们进一步鉴定了根、茎和叶三个不同器官之间的组织特异性TFs。在我们的数据中,大多数TFs在其表达谱的基础上呈现了组织特异性的表达模式(附加文件7.:图S4)。有趣的是,大多数TFs在根中高表达,其中3个bHLH25转座(成绩单16037,transcript_11421和transcript_9016)被发现特异表达。本文所鉴定的大量TFs为进一步研究调控雪茄烟盐胁迫反应或氯离子转运的特定TFs提供了丰富的资源。
识别lncRNAs
构成转录组的另一个重要组成部分,LNCRNA显示在调节某些生物过程中的各种作用[26.]. 在这里,the CPC (Coding Potential Calculator) and Pfam (Protein family) database were used to predict lncRNAs from the PacBioIso-Seq isoforms. And totally 2,230 lncRNAs in cigar tobacco (Additional file8.:表S4,图。4.被确定。lncrna的长度在55 ~ 7697 bp之间,其中大部分(> 80%)的长度≤3000 bp。同时,平均长度为1696 bp,远短于编码亚型(2634 bp)。这些lncrna,特别是未注释的lncrna的功能有待进一步研究。此外,lncRNAs的表达低于mrna(图5)。4.B) 是的。
分析富含组织的转录本
为了分析转录物在不同组织中的表达情况,从3种不同的雪茄烟组织中提取了9个RNA文库,其中包括3个生物复制品。从雪茄烟植株的所有三个器官(叶、茎和根)的质量控制RNA-seq读取被映射到转录本。表达的转录物被定义为平均FPKM(log2)大于2的转录物。我们在叶、茎和根中检测到12017、15060和13859个蛋白质编码转录物,并且10343个转录物在所有取样组织中表达(附加文件)9:表S5),其功能类似于“管家”基因。正如预期的那样,根据GO富集分析,10,343个普遍表达的转录本在基本细胞生物学和代谢过程中富集,包括“有机氮化合物代谢和生物合成过程”、“代谢过程”、“细胞代谢过程”和“初级代谢过程”等GO术语(补充文件)10.:表S6)。另外,普遍存在的类别还包括“细胞内部”,“细胞器”,“核糖核核糖蛋白复合物”和“线粒体部分”的术语。
在这三种组织中都发现了富含组织的转录本。共573,374和383个转录本显示了组织特异性的表达模式(图1)。5.)分别在根、叶和茎中。路径富集显示组织特异性转录物在特定的分子功能中富集,这些功能随组织而变化(附加文件)11.:表S7)。例如,在根组织中富集的转录物与烟酸和烟酰胺代谢有关(见第三行,附加文件中的“root_KEGG”表)11.:表S7),这与根中的尼古丁生物合成一致。通常,转录因子可以通过特异的顺式元件调控基因的表达。我们对这些组织特异表达基因进行了基序富集分析(附加文件)12.:图S5)。在根/叶/茎中发现了几个已知转录因子的有趣基序。例如,motif(ID:C2C2dof tnt。OBP3(也称为OBF结合蛋白3)的OBP3(col-an-m1)编码一个核定位的Dof结构域,富集了根特异性表达的基因。
雪茄烟草中阴离子通道/转运体转录本的特性研究
植物细胞中含有多种无机阴离子,如NO3.-,中心线-所以4.2.−[27.].阴离子频道/运输仪的识别对于了解这些阴离子的监管机制非常重要。在这里,我们试图使用雪茄烟草的全长转录组数据来识别三个主要阴离子运输/频道家族(SLAC,CLC和ALMT)的成员。总共,22中电基因和8斯拉克最终获得了基因,但没有ALMT基因被确定。与其他植物品种比较(表2.),数量中电,斯拉克和ALMT在雪茄烟草中发现的基因是有限的,特别是对于ALMT这可能是由于在缺乏基因组信息的情况下,在序列组装过程中由于低表达缺陷而导致的缺乏检测。
SLAC家族有三名成员,Cigarslac1.,雪茄和雪茄4,通过qRT-PCR成功克隆并鉴定。6.一个)。Cigarslac1.和雪茄4具有组织特异性表达模式;这些基因分别在叶和根中表达。组织表达雪茄排名如下:根 > 树叶 > 茎。以确定这三个雪茄基因参与了盐胁迫反应,测定了盐胁迫下植物根系的表达水平(图。6.B) 是的。Cigarslac1.盐胁迫3 d后,表达量最高,且雪茄4在盐胁迫6 h后,雪茄. 进一步研究Cigarslac1.和雪茄4揭示雪茄对盐胁迫的抗性或适应机制。
对于CLC家族,利用邻接算法将已知的烤烟CLC成员(K326)的蛋白质序列构建在一起,构建了一个系统发育树(图。7.A).所有来自雪茄烟草的clc聚类成两支,这与K326的聚类结果相似[28.]. 根据RNA-seq,大多数cigarCLC公司基因在茎中显示出更高的表达,并且只有两个和六个成员分别在叶子和根中显示出明显更高的表达(图。7.B) 是的。
讨论
包装材料作为雪茄的重要组成部分,直接影响着雪茄的质量。到目前为止,还没有关于雪茄烟基因组序列的报道。近年来,随着第三代测序技术的发展,全长转录组测序技术以其规模、取样深度、转录完整性和成本等优点被广泛应用于无参考基因组序列的物种。
在这项研究中,使用PACBIO ISO-SEQ技术,最流行的第三代测序平台呈现第一综合全长转录组序列。通过使用illumina测序读取校正后,我们产生了24,242个转录物,其平均长度为2,577 bp和3,171bp的N50。基于这些高度准确的转录物,高达95.6%的成绩单在五个功能数据库中注释(Kegg,Swiss-Prot,Trembl,PFAM和Go),这表明这项研究产生了非常大量的雪茄烟草基因。GO注释分析表明,“细胞部分”,“细胞”,“催化活性”,“结合”,“代谢过程”和“细胞过程”构成了大多数子类别。Kegg注释分析表明,“植物激素信号转导”,“植物 - 病原体相互作用”和“苯丙醇生物合成”是具有最大丰富unigenes的前三个途径。GO和KEGG分析表明,雪茄烟草植物的器官正在进行活性细胞代谢,以积累持续增长和发育的必要营养。
长读转录组测序可以为转录和后幕监管分析提供遗传信息(涉及TFS,LNCRNA等的那些)。TFS可以与促进剂或增强子中的顺式调节元素结合,从而调节转录开始。总共有7,432个未编码属于55种不同家族的TFS的未成熟,基于当前的雪茄烟草转录组。其中,BHLH,MYB,ERF和NAC是最代表的TF家庭。此外,大多数TFS显示出组织特异性表达,并且它们的根本特异性表达呈大多数。BHLH家族是最大的植物TFS类别之一,其成员参与调节一系列基本生物过程,如转录活化,黄酮类生物合成和应力反应[29.].事实上,TFs参与植物对盐胁迫的响应已被广泛报道,如MYC2, bHLH转录因子,通过调节脯氨酸的生物合成使拟南芥产生盐不耐[30.]、GmMYB118增加转基因拟南芥对干旱和盐胁迫的耐受性[31, PvERF35促进烟草植株耐盐性[32]NAC在作物耐盐性中起正作用[33,34,35]。,从我们的转基状数据中鉴定的TFS,特别是那些特异性TFS,促进了雪茄烟草中盐胁迫的转录因子的发现。
lncrna在植物中是普遍存在的,参与多种生物调控过程[26.].lncRNAs通常被认为是长度大于200bp但不编码蛋白质的RNA转录本。近年来,一些lncrna已经在植物盐胁迫反应中得到了表征[36,37]. 尽管不同植物对盐敏感的lncRNAs的功能预测已有报道,但lncRNAs能否调控烟草对氯离子的吸收或转运仍需进一步研究。在这里,我们使用三种工具从PacBio-Iso-Seq数据中鉴定了lncRNAs,并在雪茄烟中鉴定了2230个lncRNAs。lncRNAs的平均长度(2115bp)比编码蛋白的mRNAs的平均长度(2634bp)短,这与前人的研究结果一致[38].
对组织特异性基因的研究可以提供组织发育和进化的见解。在这里,我们对雪茄烟三种组织中表达的基因进行了RNA-seq分析。共检测到12981(叶)、14240(茎)和13906(根)蛋白质编码转录本。除了在所有取样组织中表达的11331个“管家”转录本外,554、471和894个转录本分别在叶、茎和根中被鉴定为富集。此外,GO分析表明,叶组织富集基因与代谢过程有关,茎组织富集基因和根组织富集基因都与结合有关。
阴离子通道/转运体对植物的一系列生理功能(如细胞信号转导、植物营养、金属耐受性等)具有重要意义[17.].在过去的几年里,三个基因家族的成员,线性,阿尔姆斯和clc,丰富和提高了对植物阴离子通道/转运体的各类基因编码的认识。慢阴离子(s型)通道在植物阴离子(如氯离子和硝酸盐)的运输中起着关键作用[18.].在拟南芥中,SLAC家族有5个成员:AtSLAC1、AtSLAH1、AtSLAH2、AtSLAH3和AtSLAH4蛋白。其中,有报道称SLAH1、2和3可以控制根木质部的硝酸盐和氯含量[39]. 特别是AtSLAH1该基因在耐盐植物的工程应用中显示出巨大的潜力[19.].之前,我们克隆了SLAH1.基因在K326中的表达发现SLAH1.在盐胁迫下下调,表明其在烟草对盐和氯吸收的响应中起着重要作用(数据未显示)。在本研究中,我们克隆了三个SLAC家族成员:Cigarslac1.,雪茄和雪茄4.qPCR检测了这3个基因在不同组织(根、茎、叶)中的表达及对盐胁迫的响应。据报道ATSLAC1.是调节气孔关闭的关键因子[40]. 在这里,Cigarslac1.在叶子中表达了更高的表达,但它是否可以调节雪茄烟草中的气孔闭合需要更多的实验证实。作为雪茄没有显着的组织表达模式,盐压力后表达几乎没有差异,这是一个问题雪茄可以调节射氯吗-在雪茄烟草中的积累AtSLAH1. 有趣的是雪茄4表现出根特异性表达模式,在盐处理6h后显著诱导表达。因为AtSLAH4目前尚不清楚,我们的数据提供了初步的作用雪茄4在盐胁迫下。对于CLC家族,据报道了很少中电基因通过调节Cl参与植物耐盐功能-液泡膜运输[41,42,43].在以前的研究中,我们在烤烟中识别和分析了CLC系列的成员(K326)[28.),和17NtCLC公司根据Phylogentic分析,成员被特征并分为两种曲折。而且,NtCLC2和NtCLC13型表明在烟草中的氯化物转运或代谢中发挥作用。在这项研究中,26岁cigarCLC公司基于PacBio Iso-Seq数据获得转录本。此外,根据系统发生树,公民可以分为两个分支,类似于NTCLCS..我们还注意到transcript_7126与之密切相关NtCLC13型,这transcript_8468,transcript_9320和transcript_10376与之密切相关NtCLC2.这四个转录本是否在氯代谢中发挥作用还有待进一步研究。
结论
在这项研究中,通过组合PACBIO SMRT测序技术和NGS illumina测序,重建和分析了雪茄烟草的全长转录组。共有24,257种转录物,7,432种转录因子和2,230个LNCRNA被鉴定并分析。此外,鉴定了与阴离子通道/转运蛋白相关的基因系列,包括SLAC和CLC系列,并表征在雪茄烟草中。这些结果可以为未来的雪茄生物学研究提供重要的信息和候选基因,特别是鉴于雪茄烟草没有参考基因组。
方法
植物材料和生长条件
雪茄烟草(烟草中国烟草海南公司海南雪茄研究所捐赠的‘BES-NO-H382’种子,在营养丰富的培养基中播种至发芽。之后,这些植物被种植在塑料盆中,光照时间为16小时,光照时间为28小时oC白天和23日oC晚上。选择三条单根并用于进一步实验。当植物生长到六叶阶段,收获新鲜的叶片,茎和根,在液氮中冷冻,然后储存在-80oC
对于盐胁迫,6叶期植株首先转入1/2浓度的MS溶液。1周后,用300mM NaCl在1/2强度MS溶液中处理7 d。在盐胁迫后1 h、3 h、6 h、12 h、3d和7d从植株上取根。然后用1/2强度的MS溶液冲洗根,拍干,等待RNA提取。
文库制备、SMRT测序和Illumina RNA序列测序
使用超纯植物多聚RNA试剂盒(基因答案)从每个样本中分离总RNA。RNase-free DNase I(基因应答)用于清除任何污染的DNA。使用NanoDrop 2000仪器(Thermo)测定总RNA的纯度和浓度[28.].5微克总RNA(所有三个RNAS池同样混合)用作Clontech智能反应的输入。
蓝琵琶™(使用Sage Science,Beverly,MA)进行大小分级和选择,最后是三个大小范围(1-2 kb、2-3 kb和> 3kb)。对于cDNA文库的构建,使用Pacific Biosciences DNA模板制备试剂盒2.0生成三个SMRT-bell文库。然后,在太平洋生物科学RS II平台上进行SMRT测序。数字1.a列出了整个PACBIO ISO-SEQ数据处理过程的工作流程。
来自根,茎和叶子的RNA样品用于Illumina文库构建和测序。图书馆施工,测序和数据处理的方法与先前描述的方法相同[28.]. 使用Agilent 2200 TapeStation系统(Agilent)检查测序用cDNA文库的质量和大小。这些库在Hiseq上分别在单车道上运行100个循环(成对端)™ 2000(照明公司)。
质量过滤和纠错
简而言之,CCS(https://github.com/pacificbiosciences/ccs.)首先用于为每个测序运行产生循环共有序列(CCS)。除去CCSS的引物和不需要的CCS组合。利马 (https://github.com/pacificbiosciences/barcoding)然后将每个序列定向到5'-3'方向。每个转录本的最终抛光聚类序列是在抛光模式下创建的,并通过LSC进行校正[44,45使用NGS读取默认参数的修正工具。车身(46根据保守的地肠含量,用于探索完整性。
对于NGS读数,Trimmomatic (v0.30) (https://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)去除了适配器序列和rna - seq低质量reads。然后,用Bowtie2将左侧reads映射到PacBio的参考转录本上。转录本的表达水平通过Salmon的FPKM(每千碱基每百万reads中的片段)值进行评估[47].
功能注释
所有转录物的功能注释使用BLAST15进行(版本2.2.26)进行[48]将转录本与SwissProt(一个手动注释的非冗余蛋白数据库)中的转录本进行比较[49],GO(基因本体论)[50],Pfam(保守蛋白质家族或结构域的数据库)[51],trebml(Swissprot的补充数据库)[52]和KEGG(京都基因和基因组百科全书)[53数据库,E-value阈值为10−3. 将功能信息分配给最佳匹配序列。随后通过kobasv2.0搜索GO注释和KEGG路径[54].
lncrnas和ORFs的预测
LncRNAs (long noncoding RNAs)通常被定义为不能编码蛋白质但长度超过200bp的RNA转录本。中国共产党(55]并用Pfam区分编码电位。
为了识别orf,利用ORFfinder软件(http://transdecoder.sf.net).不仅包含完整的orf,而且包含5 ' -和3 ' - utrs(非翻译区域)的转录本被视为全长转录本。用CPC对推测的蛋白序列进行了预测。
富含组织的转录因子分析
基于Roku标准,在每种类型的组织中鉴定了富含组织的转录物(一种特定组织中的表达水平显著高于所有其他组织),截止值为1。通过AME分析组织特异性表达基因的基序富集(https://meme-suite.org/meme/tools/ame).
定量逆转录聚合酶链反应
从雪茄烟草根部分离出总RNA样品,并用如前所述的超级植物植物蛋白质试剂盒(基因答案)从烟烟烟根部和叶片留下QRT-PCR。然后使用转录器第一链CDNA合成试剂盒(ROCHE)逆转旋转第一链cDNA。使用Lighcycler®96实时PCR系统(Roche)来进行QPCR扩增反应。分析所有样品,并将基因表达水平标准化为26秒。本研究中使用的引物根据PACBIO-SEQ同种型序列设计,这些序列在附加文件中列出13.:表S8。qRT-PCR扩增条件为:95℃孵育10s,95℃孵育10s,60℃孵育20s,72℃孵育20s。用熔融曲线法检测引物扩增的特异性,并对PCR产物进行测序验证。
数据可用性
本研究报告的原始序列数据已保存在基因组序列档案中[56国家基因组数据中心[57],中国科学院北京基因组研究所(BIG,中国国家生物信息中心),注册号RCRA003020,可在https://bigd.big.ac.cn/gsa..
数据和材料的可用性
本研究中使用的数据集可在http://bigd.big.ac.cn注册号为CRA003020。
缩写
- 帕比奥:
-
太平洋生物科学
- ngs:
-
新一代测序
- TGS:
-
第三代测序
- SMRT:
-
单分子实时
- CCS技术:
-
圆形的共识序列
- ORF:
-
开放阅读框
- cd:
-
编码序列
- FPKM:
-
每千碱基的转录片段每百万次读取
- 开始:
-
基因本体论
- Kegg:
-
Kyoto基因和基因组的百科全书
- LncRNA:
-
长非编码RNA
- 运输工具:
-
转录因子
- 斯拉克:
-
缓慢的阴离子频道
- CLC:
-
氯化物通道
- 资产负债表:
-
Aluminum-activated苹果酸转运蛋白
参考
- 1。
茄科植物种类在遗传研究中的历史作用。中国生物医学工程学报,2016;
- 2。
关键词:烟草,基因组多样性,高通量重测序,SSR引物植物生理学与生物化学。
- 3.
Koszowski B, Thanner MH, Pickworth WB, Taylor KM, Hull LC, Schroeder MJ。美国大雪茄和小雪茄的尼古丁含量和物理性质。尼古丁Tob Res. 2018;20(3): 393-8。
- 4.
NG LK,Hupe M,Vanier M,Moccia D.通过气相色谱/质谱分析非挥发性有机酸的雪茄烟草的表征:在古巴雪茄的认证中的应用。JAgric Food Chem。2001; 49(3):1132-8。
- 5.
作者简介:Sierro N, Battey JN, Ouadi S, Bakaher N, Bovet L, wilg A等。烟草基因组序列及其与番茄、马铃薯基因组序列的比较。Nat Commun。2014;5:3833。
- 6.
Lo YT, Shaw PC。下一代测序技术在中草药产品鉴定中的应用。Biotechnol放置2019;37(8):107450。
- 7.
Nguyen KL,Grondin A,Courtois B,Gantet P.下一代测序加速作物基因发现。趋势植物SCI。2019; 24(3):263-74。
- 8.
关键词:玉米,全基因组关联,评价,星型观察摩尔。2017;10(3):359 - 74。
- 9.
陈丽,施×,年乙,段S,江乙,王×,等。PacBio-Iso-SEq揭示的中国山茶花色素苷生物合成的选择性剪接调控。G3(贝塞斯达)。2020;10(8):2713–23.
- 10。
崔刚,柴浩,尹浩,杨明,胡刚,郭明,等。转录组全长测序揭示了紫花苜蓿根系耐低温的机制。中国生物医学工程学报,2019;
- 11.
关键词:大白菜(Brassica rapa L. ssp.),花药,转录本,剪切异构体学报)。中国生物医学工程学报,2019;
- 12.
钱旭,孙勇,周刚,袁勇,李娟,黄华,等。单分子实时转录序列分析鉴定了藏红花的开花调控基因。BMC基因组学。2019;20(1):857。
- 13.
冯S,徐M,刘F,崔C,周B.使用PACBIO ISO-SEQ重建全长转录组地图集,介绍了Gossypium Autharale中的替代剪接。BMC植物BIOL。2019; 19(1):365。
- 14.
Franco-Navarro JD,Brumos J,Rosales Ma,Cubero-Font P,Talon M,Colmenero-Flores JM。氯化物调节烟草植物中的叶细胞大小和水关系。J Exp Bot。2016; 67(3):873-91。
- 15.
耐盐机理研究。植物生物学杂志,2008;
- 16.
李B,M测试员,吉利汉姆M。移动中的氯化物。植物科学趋势。2017;22(3):236–48.
- 17.
Barbier Brygoo H,De Angeli A,Filleur S,Frachisse JM,Gambale F,Thomine S等.植物阴离子通道/转运蛋白:从分子基础到调控网络。植物生物学年鉴。2011;62:25–51.
- 18.
Hedrich R,Geiger D. Slac1型阴离子通道的生物学 - 从营养吸收到气孔闭合。新植物。2017; 216(1):46-61。
- 19.
Cubero-Font P,Maierhofer T,Jaslan J,Rosales Ma,Espartero J,Diaz-Rueda P等人。沉默的S型阴离子通道亚基SLAH1栅极SLAH3为氯化物根部到拍摄易位开放。Curr Biol。2016; 26(16):2213-20。
- 20
De Angeli A,Zhang J,Meyer S,Martinoia E.Atalmt9是拟南芥气孔开口所需的雄性活化的真空氯化物通道。NAT Communce。2013; 4:1804。
- 21
Dreyer I, Gomez-Porras JL, rianoo - pachon DM, Hedrich R, Geiger D. Molecular Evolution of Slow and Quick阴离子通道(SLACs and QUACs/ALMTs)。植物科学,2012;
- 22。
LV QD,Tang RJ,Liu H,Gao Xs,Li Yz,郑HQ等。拟南芥氯化物通道基因家族的克隆与分子分析。植物SCI。2009; 176:650-61。
- 23。
Marmagne A,Vinauger Douard M,Monachello D,de longeville AF,Charon C,Allot M等。拟南芥CLC(氯通道)家族的两个成员AtCLCe和AtCLCf分别与类囊体和高尔基体膜有关。J实验机器人。2007;58(12):3385–93.
- 24。
Jossier M,Kroniewicz L,Dalmas F,Le Thiec D,Ephritikhine G,Thomine S等。拟南芥液泡阴离子转运蛋白AtCLCc参与气孔运动的调控,并参与耐盐性。植物J。2010;64(4):563–76.
- 25.
关键词:转录因子,植物,细胞间信号转导,信号转导实验机器人,2014;65(7):1737-49。
- 26.
关键词:植物,非编码rna,生长发育,应激反应Annu Rev Cell Dev Biol. 2019; 35:407-31。
- 27.
Kollist H、Jossier M、Laanemets K、Thomine S。植物细胞中的阴离子通道。费布斯J。2011;278(22):4277–92.
- 28.
张浩,金娟,金玲,李忠,徐刚,王锐,等。烟草氯离子通道基因家族成员的鉴定与分析。基因。2018;676:56 - 64。
- 29.
Murre C. Helix-Loop-Helix蛋白和细胞多样性的出现:30年的发现。基因开发。2019; 33(1-2):6-25。
- 30.
verma d,jalmi sk,bhagat pk,verma n,sinha ak。通过在拟南芥中调节脯氨酸生物合成,MyC2赋予BHLH转录因子MyC2。FEBS J. 2020; 287(12):2560-76。
- 31
杜英特,赵美娟,王聪,高勇,王义新,刘玉华,等。GmMYB118对干旱和盐胁迫响应的鉴定与表征。BMC植物生物学。2018;18(1):320.
- 32
Kavas M,Gökdemirg,Seçginz,Bakhsh A.常见豆ERF转录因子PVERF35的异位表达促进烟草中的盐胁迫耐受性。植物BIOL(斯图特)。2020; 22(6):1102-12。
- 33
李S,王恩,季德,张伟,王勇,于勇,等。盐胁迫下,GmSIN1/GmNCED3s/GmRbohBs前馈环路是调控大豆根系生长的信号放大器。植物细胞。2019;31(9):2107–30.
- 34。
李米,陈R,江Q,太阳X,张H,Hu Z.GMNAC06,NAC结构域转录因子增强了大豆中的盐胁迫耐受性。植物mol biol。2021; 105(3):333-45。
- 35。
洪Y,张H,黄L,李D,宋F。胁迫响应型NAC转录因子基因ONAC022的过度表达提高了水稻的耐旱性和耐盐性。前植物科学。2016;7:4.
- 36。
邓福,张×,王W,袁R,沈福。盐胁迫下陆地棉长非编码rna(lncRNAs)的鉴定。BMC植物生物学。2018;18(1):23.
- 37.
孙X,郑H,李J,刘L,张X,隋N。比较转录组分析揭示了甜高粱对盐胁迫的新的lncRNAs。生物技术前沿。2020;8:331.
- 38.
徐Q,宋Z,朱C,陶C,康L,Liu W等人。LNCRNA与蛋白质编码MRNA在人口表达中的系统比较及其对环境变化的反应。BMC植物BIOL。2017; 17(1):42。
- 39.
拟南芥(Arabidopsis thaliana)慢型阴离子通道SLAC1 (SLAC1)的同源系(homolog)邱静(Qiu J), Henderson SW, Tester M, Roy SJ, Gilliham M. sla1 (SLAC1)调控植物茎部Cl-积累和耐盐性。实验机器人。2016;67(15):4495-505。
- 40.
Hedrich R,Geiger D。SLAC1型阴离子通道的生物学-从养分吸收到气孔关闭。新植物醇。2017;216:46–61.
- 41.
李白,黄佛,蔡斯,攀岩,邵,林·赫姆。来自大豆的Tonoplast-位于大豆的GMNHX1增强了转基因亮黄色(逐)-2细胞的NaCl耐受性。植物细胞环境。2006; 29(6):1122-37。
- 42.
黄天士,李维明,姚秀琴,林慧明。大豆中的GmCLC1蛋白具有氯离子转运体的功能。植物生理学杂志。2013;
- 43
Wei P,王L,刘A,yu B,Lam HM。GMCLC1通过调节大豆中的氯化物积累来赋予增强的耐盐性。前植物SCI。2016; 7:1082。
- 44
Au KF, Underwood JG, Lee L, Wong WH。通过短读对齐提高PacBio长读的准确性。PloS one。2012; 7 (10): e46679。
- 45
LSCplus:一种通过短读对齐提高长读精度的快速解决方案。BMC生物信息学,2016,17(1):451。
- 46。
陈建平,李建平。基因组组装与注释完整性评估。北京:科学出版社。中国生物医学杂志,2019;
- 47。
Patro R,Duggal G,Love Mi,Irizarry Ra,Kingsford C. Salmon提供了快速和偏见的转录表达式的量化。NAT方法。2017; 14(4):417-9。
- 48。
约翰逊M,Zaretskaya I,Raytselis Y,Merezhuk Y,McGinnis S,Madden TL。NCBI BLAST:一个更好的Web界面。核酸RES。2008; 36(Web服务器问题):W5-9。
- 49。
UNIPROT C. UNIPROT:蛋白质信息的集线器。核酸RES。2015; 43(数据库问题):D204-12。
- 50
Ashburner M,Ball Ca,Blake Ja,Botstein D,Butler H,Cherry JM等。基因本体:生物学统一的工具。基因本体组织。NAT Genet。2000; 25(1):25-9。
- 51.
El-Gebali S, Mistry J, Bateman A, Eddy SR, Luciani A, Potter SC等。2019年pam蛋白家族数据库。核酸图谱2019;47(D1): D427-32。
- 52.
O'Donovan C、Martin MJ、Gattiker A、Gasteiger E、Bairoch A、Apweiler R。优质蛋白质知识资源:瑞士PROT和TrEMBL。简要说明。2002;3(3):275–84.
- 53.
Kanehisa M,Goto S。京都基因和基因组百科全书。核酸研究,2000年;28(1):27–30.
- 54.
谢超,毛鑫,黄娟,丁勇,吴军,董胜,等。KOBAS 2.0:一个用于注释和识别丰富路径和疾病的web服务器。核酸研究2011;39(Web服务器版):W316-22。
- 55
孔璐,张勇,叶志强,刘秀琴,赵树青,魏磊,等。CPC:利用序列特征和支持向量机评估转录本的蛋白质编码潜力。核酸研究2007;35(Web服务器版):W345-9。
- 56
王勇,宋飞,朱军,张胜,杨勇,陈涛,等。GSA:基因组序列档案< sup/>。基因组学、蛋白质组学、生物信息学。2017;15(1):14-8。
- 57
国家基因组数据中心。M.国家基因组数据中心2020年数据库资源。核酸研究2020;48(D1): D24-33。
确认
我们感谢Novogene公司(中国北京)为PacBio图书馆构建和测序平台提供的设施和专业知识。我们也感谢AJE公司(https://www.aje.cn/)用于语言编辑。
资金
这项工作得到了烟草基因组编码项目(110202001018(JY-01))和CAST青年精英科学家资助项目(2016QNRC001)的支持。所有资助者在研究设计、数据收集、分析和解释以及手稿撰写方面都没有任何作用。
作者信息
从属关系
贡献
ZH和ZHN构思并设计了实验;JJJ和LZF对数据进行分析;XGY、ZN、CQS和JLF进行了实验;LHK提供了种子;LPP和ZQX参与了材料种植和样品采集;ZH和JJJ撰写稿件;CPJ对手稿的修改有贡献。所有作者阅读并批准最终稿件。
通讯作者
伦理宣言
道德认可和参与同意
不适用。
出版许可
不适用。
相互竞争的利益
作者们宣称他们没有相互竞争的利益。
额外的信息
出版商的注意
斯普林格自然保持中立,就管辖权的要求,在出版的地图和机构的联系。
补充信息
附加文件1:表S1。
基于NGS数据集的校正转录本TPM。
附加文件2:表S2。
为每个成绩单提供术语注释。
附加文件3:图S1。
与注释转录本相关的细胞成分。
附加文件4:图S2。
与注释转录本相关的分子功能。
附加文件5:图S3。
与注释转录物相关的生物学过程。
附加文件6:表S3。
注释转录本的KEGG通路富集。
附加文件7:图S4。
组织特异性转录因子的热图。
附加文件8:表S4。
在雪茄烟中鉴定出lncRNAs。
附加文件9:表S5。
雪茄烟草的内务记录。
附加文件10:表S6。
GO丰富管家转录本。
附加文件11:表S7。
致富集和Kegg富集组织特异性转录物。
附加文件12:图S5。
不同组织中组织特异表达基因的基序富集分析(A。叶子;B根;C:stem)由AME提供。
附加文件13:表S8。
用于基因工程的引物序列斯拉克记录。
权利和权限
开放访问本文是基于知识共享署名4.0国际许可,允许使用、共享、适应、分布和繁殖在任何媒介或格式,只要你给予适当的信贷原始作者(年代)和来源,提供一个链接到创作共用许可证,并指出如果变化。本文中的图像或其他第三方材料包括在文章的创作共用许可中,除非在材料的信用线中另有说明。如果材料没有包含在文章的创作共用许可证中,而您的预期使用不被法律法规允许或超过允许的使用,您将需要直接获得版权持有人的许可。如欲浏览本许可证的副本,请浏览http://creativecommons.org/licenses/by/4.0/.Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本文中提供的数据,除非另有用入数据的信用额度。
关于这篇文章
引用这篇文章
张,H.,金,J.,徐,G。等。无参考基因组的雪茄烟全长转录组的构建及阴离子通道/转运体转录物的鉴定。BMC植物杂志21,299 (2021). https://doi.org/10.1186/s12870-021-03091-6
收到:
认可的:
发表:
关键词
- 雪茄烟
- 完整的转录组
- RNA-Seq
- 阴离子通道/转运蛋白