跳到主要内容

结合遗传和气候因素的野生鹰嘴豆开花时间的非线性回归模型

摘要

背景

需要准确地预测作物开花时间,以达到最大的农业效率。为实现这一目标而开发的几种模型是基于对植物候选的深刻知识,需要对每个庄稼或新品种的大量投资。数学建模可用于更好地利用更浅的数据并以更高的效率从中提取信息。鹰嘴豆品种,鹰嘴豆arietanum,目前正在通过疯狂突出改善C.网藻具有不同开花时间要求的生物多样性。在这些由野生等位基因渗入形成的品种中,花期如何依赖于环境条件还需要更多的了解。

结果

我们为土耳其21种不同地点收集的野生鹰嘴豆开花时间建立了一种新型模型,并在几年不同的几年和季节在4个不同的环境条件下种植。我们提出了一种通用方法,其中通过随机最小化来自数据的模型输出的偏差,自动推断出在气候参数,回归系数和一组预测器中推断出开花时间的分析形式。通过采用语法演化和差分进化的组合完全平行的方法,我们已经确定了一种模型,反映了日间长度,温度,湿度和降水的影响的影响,并且具有测定系数R.2= 0.97。

结论

我们用我们的模型来检验两个重要的假设。我们认为鹰嘴豆的物候可以通过生长地点的地理来源以及当地的环境条件来预测。事实上,从播种到开花期间,起源与生长环境相互作用的位点约占14.7%。其次,由于基因组对特定环境的适应是有蓝图的,基因对开花时间的影响可能受环境因素的制约。基因型与环境的相互作用约占花期总变异的17.2%。我们还鉴定了几个与气候因素变化的不同反应相关的基因组标记。我们的方法是通用的,可以进一步应用于扩展现有的作物模型,特别是当物候信息有限的时候。

背景

鹰嘴豆(中投arietinumL.),是第二种最栽培的谷物作物,在世界50多个国家(ICARDA)种植。最初在土耳其东南部驯化的鹰嘴豆在全球各地的各种环境和气候条件,从南亚和东非到温带北美的北部地区。鹰嘴豆达到其生殖阶段的时间持续时间通常是通过改变温度,降雨模式,日期或通过旋转其他作物使用土地的温度的限制[12].在地中海和温带地区,鹰嘴豆在春天播种,日常长度和温度升高到生殖期间,而在亚热带地区(中市和南部,埃塞俄比亚,昆士兰澳大利亚)在旱季之后种植当季节长度往往更短而温度较冷的季风雨季。在印度北部的温带越多,春季种植的鸡眼的生殖阶段与较低的温度和日间长度恰逢,而在南部和国家的中央部分,它落入终端干旱(干燥季节的末端)[3.4].因此,鹰嘴豆育种的重点是开发生育期不同的品种,以适应不同的纬度和播种制度[3.5- - - - - -7].为实现一致的产量,作物持续时间必须与可用的生长季节密切匹配[8].鹰嘴豆品种和地质响应地中海,中央和印度南部的地中海变得越来越多的温度,因为这些不同的起源已经选择了对鲜明对比的毒性调节剂[3.].这些信息对于作物性能建模是无价的。例如,Vadez等人(2012,2013)[9- - - - - -11考虑了诸如预期降雨量等气候因素来预测鹰嘴豆在不同地理位置上的表现。

几个成功的植物模型,如SSM [1012], DSSAT [13- - - - - -17], APSIM [18等[1920.已为豆类制定。这些模型使用微分方程来描述光合作用,水吸收等等生物物理和生化过程,并占基因型,土壤,天气和经济因素的影响。使用像热单元指数(HUI)等概念评估天气条件的影响[20.]、作物热量单位、度日、生物日[9] -所有这些都在数量上描述了以每天为基础进入下一个物候阶段的速度。DD和BD均与温度、含水量和光周期有关。这种形式主义被应用于开发重要作物的个别模型。例如,DSSAT被用来模拟大豆的生长和产量[21.]和鹰嘴豆[22.在其他几种作物中[23.- - - - - -26.].超过三十年,这些模型已应用于不同国家的研究项目。使用来自各种增长的独立数据成功测试SSM模型[1012]及包括伊朗在内的环境条件[27.]和印度缺水[11].需要大量的操作使DSSAT模型适应新的环境和品种[28.- - - - - -32.,限制了这些模型的使用。由于新品种可以应对新出现的病原体和害虫,以及消费者需求的变化,品种在不断变化,因此对能够适应新品种的灵活模式的需求很高。

在一个基因组技术和方法快速发展的时代,更新的建模方法,可以量身定制基因型特定的效果是至关重要的。下一代测序和高通量基因分型导致数千个分子标记(SSR, SNP, STMS, ESTs, CISP, DArT)的鉴定[33.使构建鹰嘴豆基因图谱成为可能[34.35.并最终分析不同基因座对开花时间等关键性状的影响。Sanger, 454/FLX和Illumina的组合已经被用于生成鹰嘴豆的转录组和基因组集合[34.36.- - - - - -38.].

由于这些测序技术和数据采集的这些进步,基因组 - 范围协会研究(GWAS)已成为了解农业重要性自然变化和特征的遗传学的重要方法。农业重要植物中GWA的最近实例包括高粱中光周期开花时间基因的鉴定[33.],在大麦霜冻耐受性基因(Hordeum Vulgare.l .) [34.];叶架构(35.]玉米中南叶枯肠基因的抵抗力[36.以及水稻的几种农业性状[37.,等等。将GWAS扩展至按环境分析基因型(G×E.)相互作用生物纤维素变量可以用作GWAS表型。加入源和SNPS的站点的生物融色变量与SNP之间的关联可以表明气候适应[39.].虽然GWAS是识别与重要性状相关的基因组区域的一种很好的方法,但典型的GWAS设计需要对复制材料进行控制种植。在许多站点上,这很快就会变得令人望而生畏,而且成本高昂。

作物模型可以补充GWAS由占环境因素的影响[接近16].然而,在基因组时代开发的模型最多地考虑了基因型影响,作为对应于实际基因的一套给定的“遗传系数”[40].因此,这些模型无法模拟逐环的相互作用,从而限制了它们在不同地理位置和基因型中预测品种的候选的效用[9].将遗传和气候数据结合到预测农艺性状的数学模型和工具将通过模拟任何给定的良好特征的环境中任何给定的良好特征的基因型的性能而大大益处育种者[41.42.].

虽然目前的一些作物模型考虑了当地环境条件和其他全球气候变化对本地种植品种的影响,但在这里,我们利用两种野生鹰嘴豆的开花时间建立了一个新的模型(中投reticulatum土地c . echinospermum)在土耳其21种不同的地点收集,并在4个不同的环境条件下生长。我们进一步使用我们的模型来测试两个重要假设。首先,我们提出除了当地的环境因素外,鹰嘴豆学可能被加入地理来源强烈预测。其次,由于基因组对特定环境的适应是有蓝图的,基因对开花时间的影响可能受环境因素的制约。我们通过Chickpea对气候变化情景的统计建模来检查这些假设对原产地和基因型的地理位置的条件。

材料和方法

野生鹰嘴豆资源数据集

数据集包括野生鹰嘴豆(中投reticulatum土地中投echinospermum).在土耳其的五个地区的21个地点收集了加入(见附加文件1:表S1) von Wettberg等[43.].这些野生动物在土耳其(Sanliurfa和Ankara,Ankara,秋季和春季和春季播种)和澳大利亚(Floreat,珀斯,Wa和Mt.Barker,WA附近)。在对比环境中成长,表型数据有关开花的时间是高度多样化的。图2中示出了对整个数据集的开花时间分布。1.开花时间为64 ~ 221天。表型实验和后续分析的细节将在未来的手稿中介绍(Berger, J.:野生鹰嘴豆在不同环境下的表型分析,准备中)。

图1
图1

为整个数据集分发到开花的时间。花的时间范围为64至221天

气候数据从NNDC气候数据下载在线[44.].额外文件中给出了agoclimatic因素的摘要以及测试其与开花时间相关的结果1:表S2和S3分别。

一个伴随着野生鹰嘴豆之一开花时间遗传关联的伴侣论文(中投reticulatumL.)已确定与开花时间(辛格相关的6个暗示多态性位点,在野生鹰嘴豆答:全基因组关联研究,筹备中)。这些SNP被鉴定为最好的单核苷酸多态性在运行TASSEL使用网站/年/季的一个因素来考虑他们的表型效应基因型混合线性模型(MLM),其相关的开花时间(表型)之后。额外的文件1:表S6呈现出与开花时间相关的SNP的参考等位基因的次数存在于植物基因型中。要访问基因型环境相互作用,我们将工厂分组为18组 - 一个用于每个替代(ALT)和参考(REF)等位基因组合(ALT / ALT,REF / ALT和REF / REF) - 每个SNP并构建模型(1)对于每组。

开花时间的回归模型

我们从播种的时间周期模型作为开花的线性组合N.控制功能FNN= 0,…N.−1的农业气候因素。因此,模型采用以下形式(1

$$ Y_ {I} = \ beta_ {0} + \ sum_ {N = 0} ^ {N-1} \ {beta_的n + 1} \ CDOT F_ {N}(\ mathbf {X} _ {I})+ \ varepsilon_ {I} \ qquad I = 0,\点,I-1 $$
(1)

在哪里y一世是否为每个植物建模表型(从播种到开花的时间)一世从一组的尺寸的一世βN系数,N= 0,…N.,以尽量减少数据和模型之间的差异,X一世是农业气候因素的矢量和ε一世是一个标准错误。系数的个数是N.+ 1,因为β0是一个拦截。

与我们的方法控制功能中的先前模型相比FN从气候因子表达中自动以分析形式组成。因此,探讨了表型和因素之间的更广泛的非线性依赖性(参见“控制功能的解析形式“在页面上17).

为了研究原产地对环境的适应,我们将采集地点表示为L.=21个二进制变量,其中L.= 1,......,L.枚举地点:Baristepe1, Baristepe2, Baristepe3, Beslever, Cermik, Cudi, Cudi2, Dereici, Destek, Egil, Gunasan, Kalkan, Karabahce, Kayatepe, Kesentas, Ortanca, Oyali, Sarikaya, Savur1, Sirnak1, Siv-Diyar(参见附加文件第1列)1:表S1)。对于每个工厂有枚举一世= 0,…一世-1其中一个L.变量\ (d_{我}^ {l} \)取值“1”,表示收集网站及其他为“0”。控制功能和位置之间的相互作用是通过在回归函数的附加项,其具有的加权和的形式建模N.·L.控制功能的成对乘积FN和每个二进制站点变量\ (d_{我}^ {l} \)

因此,包含集合站点信息的模型采用如下形式:2).

$ $ y_{我}= \ beta_ {0} + \ sum_ {n = 0} ^ {n} \ beta_ {n + 1} \ cdot f {n} (\ mathbf {X} _{我})+ \ sum_ {n = 0} ^ {n} \ sum_ {l = 1} ^ {l} \ zeta_ {l \ cdot n + n} \ cdot f {n} (\ mathbf {X} _{我})\ cdot d ^ {l} _{我}+ \ varepsilon_{我}$ $
(2)

其中除了在(1)新回归系数ζL.·N.+N定义功能的影响FN气候因素对现场采集植物表型的影响L.这条件ζL.·N.+N≠0点对该位点的植物适应性。因此,这个模型使我们能够对21个采集点中的每个点独立地回归一系列描述表型点的气候变量(如昼长、温度、降水等)。

我们表示K.SNP和j= 3替代(ALT)和参考(REF)等位基因ALT / ALT,ALT / REF和REF / REF分别为0,1和2的组合。然后将GWAS与GWAS纳入我们定义的模型j·K.植物的组,以便同一组的各成员具有在SNP位置中的一个等位基因的相同组合。因此,我们定义了一个矩阵D.行数等于植物的数量一世j·K.列。然后是矩阵的元素D.定义为(3.).因此,回归函数适应的植物的等位基因组合通过改变控制功能的权重的形式。

$$ {\ begin {senugented} d ^ {3k + j} _ {i} = \ left \ {\ begin {array} {ll} 1&\ \ \ text {如果在工厂}〜i \ text {组合对于SNP}〜k〜\ text {是}〜j \\ 0&\ \ \ text {否则} \ end {array} \ revally。\结束{对齐}} $$
(3)

因此,具有遗传信息的模型采用表格(4).

$ ${\{对齐}开始y_{我}= \ beta_ {0} + \ sum_ {n = 0} ^ {n} \ beta_ {n + 1} \ cdot f {n} (\ mathbf {X} _{我})+ \ sum_ {n = 0} ^ {n} \ sum_ {k = 0} ^ {k - 1} \ sum_ j = {0} ^ {j - 1} \ rho_ {(3 k + j) n + n} \ cdot f {n} (\ mathbf {X} _{我})\ cdot d ^ {3 k + j} _{我}+ \ varepsilon_{对齐}}{我}\结束美元美元
(4)

其中除了在(1)新回归系数ρ(3.K.+jN.+N,定义基因型与气候因素相互作用的影响。

控制功能的解析形式

在以前的研究中,已经考虑了表型和气候因素之间不同形式的依赖性[45.- - - - - -50.].例如,“分段”、“beta”、“二次”和“凹形”函数在[10].在迭代回归分析(IRA)中使用二次函数的二次函数的产物(IRA)[51.]每天表征发育速度。单位速度计算为日间长度,水缺损和温度的效果的产物[52.].

我们提出了一种更一般的方法,其中控制函数的分析形式与回归系数和一组预测器自动推断的随机最小化的模型输出的偏离数据。我们使用语法演变(GE)的组合[53.54.],LASSO [55.和差异进化完全平行(DEEP) [56.57.恢复分析形式的方法FN,分别求回归系数和确定气候因子集[58.].1995年通过宠物和价格提出了差分演变[59.作为一种启发式随机优化方法。DEEP由我们开发用于生物信息学领域的应用[56.].它包括最近提出的一些增强功能[57.60].更多详细信息可以在附加文件中找到1:部分S5。

在GE中,通过解码称为“单词”的序列来构建分析功能形式L.整数称为密码子。解码是根据简单的替换规则进行的,该规则建立了密码子之间的对应关系和一个基本的算术运算:“+”“- - -”‘*’'/',或者表达:X(X -常量)1 /(x - cons),在那里X是一个预言者的名字吗常量是一些常量编号(请参阅附加文件1:S2部分)。为了使回归系数的回归系数可靠,我们在这个阶段执行了4倍的交叉验证,以便使用75%的样品进行培训,其余25%用于评估模型的评估。

统计测试

我们使用标准统计技术进行假设检验,在R系统中实现统计计算[61].我们使用了对Pillai测试统计的多种方式分析方差(MANOVA)[62]和ANOVA与Fisher检验统计量来检查意义的关于位置和基因型之间的表型气候因素的影响的差异。用于对基因型和位置之间的表型气候因素的影响的两两比较,我们应用了威尔科克森-Mann-Whitney检验。

Spearman的等级相关用于估计主要收集地点(原产地地理位置)的等位基因频率和气候因子之间的相关性。

软件工具

虽然很少的语法演进(GE)实现是自由的(见)[54.63),它们要么缺乏一组特定的表达式,要么在实验运行中由于解释语言(数据未显示)而表现出较低的性能。因此,我们决定使用Armadillo在c++中实现GE [64],mlpack [65], HDF5 [66], HighFive [67]和Qt [68],因为这些软件包提供了高效的矩阵运算、LASSO方法、数据输入输出和效用函数。代码在GitLab上是开源的[69].

流苏(通过关联,进化和联系的特征分析)[70]是在Java中开发的,与多个操作系统(Windows,Linux和Mac OS)兼容。Tassel可以使用软件的GUI或命令行版本实现几种不同的GWAS模型,如通用线性模型(GLM)和MLM。

结果

我们首先进行了方差分析,以检查在土耳其不同地点收集的材料之间平均开花时间的差异,以证明开花时间是鹰嘴豆的一个适应性状。均数与标准值差异显著F= 2.003和P.= 0.005 < 0.05。

与气候因素和地点之间的相互作用模型

接下来,为了估计土耳其表型点和取样点的气候因素相互作用对开花时间的影响,我们建立了一个模型(2).进行一系列数值实验,因为需要几次运行来获得具有随机优化的可靠解决方案。通过几次试验和错误尝试(数据未示出)建立了控制功能的数量N.=12和“word”的长度L.= 5是用于模型的最佳参数。深人口规模设定为500。

我们得到了几个确定系数>0.85的解和控制函数的不同解析形式(数据未显示)。我们选择模型(5)由于它反映了在表型环境中的日子长度,温度,湿度和沉淀的影响的影响,并且具有测定系数R.2= 0.97。

$$ \ begin {array} {* {20} l} {\ mathtt {ttf}} =&59.49 + 74.95 d ^ {min} _ {x10} + 19.83 / left(t ^ {min} _ {x 5}- 0.03 \右) - 1.98 p ^ {am} _ {x10} \\& - 53.18 \ left(d ^ {mean} _ {x50} + 1 / \ left(u ^ {yen} _ {x10-15}- 23.31 \右)\右) - 13.04 d ^ {mean} _ {x10-15} \\& - (0.05 \ cdot \ mathtt {baristepe1} + 0.12 \ cdot \ mathtt {baristepe3} + 0.29 \ cdot {\ mathtt{beslever}} \\&+ 0.31 \ cdot {\ mathtt {dereiceii}} + 0.45 \ cdot {\ mathtt {kayatepe}} + 0.03 \ cdot {\ mathtt {kesentas}} \\&+ 0.74 \ cdot \ mathtt {siv-diyar} + 0.01 \ cdot {\ mathtt {sarikaya}} + 0.10 \ cdot \ mathtt {sirnak1} \\&+ 0.20 \ cdot {\ mathtt {oyoyi}})\ cdot \ left(d ^ {意思是} _{x50} + 1 /左(u ^ {mean} _ {x10-15} - 23.31 \右)\右)\\&+(0.03 \ cdot \ mathtt {cudi2} + 0.16 \ cdot {\ mathtt {destek+ 0.09 \ cdot {\ mathtt {gunasan}} \\&+ 0.46 \ cdot {\ mathtt {kesentas}} + 0.43 \ cdot {\ mathtt {ocyi}} \\&+ 0.28 \ cdot \ mathtt {sirnak1})\ cdot d ^ {min} _ {x10} \\&+(0.41 \ cdot {\ mathtt {cudi}} + 0.05 \ cdot {\ mathtt {karabahce}} - 0.003 \ cdot {\ mathtt {kesentas}} \\&+ 0.02 \ cdot {\ mathtt {ocyi}} -0.12 \ cdot \ mathtt {sirnak1})\ cdot d ^ {mean} _ {x10-15},\ ent {array} $$
(5)

在哪里\(^{分钟}_ {x10} \)\(d ^ {}均值_ {X50} \)\(^{意味着}_ {x10-15} \)分别表示最小日长播种后10天,平均一天的长度在一个周期的50天,从10〜15天播种后,分别\ (T ^{分钟}_ {x5} \)表示播种后5天内的最低气温,\(u ^ {均值} _ {x10-15} \)为播种后10至15天的平均相对湿度\(P ^ {}均值_ {X10} \)在表示播种后10天的平均降水量。

相对偏差的平方和的分析模型和没有一个词描述的表现型的气候因子之间的交互网站,加入地理原产地网站让我们得出这样的结论:抽样收集site-by-phenotyping环境相互作用占14.7%的变异从播种到开花的时期。

我们发现,barisstepe3、Cudi、Cudi2、desek、Gunasan、Karabahce等采样点的日照长度和湿度相互作用很重要,barisstepe1、Beslever、Dereici、Kayatepe、Kesentas、Oyali、Siv-Diyar、Sarikaya和Sirnak1等采样点的日照长度和湿度相互作用也很重要。barisstepe2、Cermik、Egil、Kalkan、Ortanca和Savur1采集地点与气候因子无交互作用。

基本开花时间模型的位置

分析表型部位的气候因素如何影响在我们建造基本模型的不同地点收集的植物的开花时间(1),用于在每个位置分别采集植物的组。我们目前选择的型号确定的系数最高(R.2)之间的模拟和在附加文件观察到开花的时间对于每个组1:部分S3。这些组开花的时间分布在附加文件中1:图S2。由于该过程的随机性,使用相同的算法参数,使用不同的种子对随机数生成器进行十次运行,以获得一个模型集合。通过随机优化选择各种因素及其组合作为预测因子。

因此,表型环境日长、温度、降水、湿度和它们的成对组合对植物类群开花时间的影响被估计为一个决定系数,在模型集合上平均,只考虑了依赖于所讨论的因素的条件。在附加文件中列出了所有收集地点的每个因素和因素组合的系数值1:图S3-S7。

我们利用模型运行中获得的决定系数值作为因变量,地理位置作为自变量,用多元方差分析(MANOVA)比较了土耳其不同地区的气候因素或因素组合的平均效应。皮莱统计为1.697P.=0.037<0.05证实各因子及其组合对表型的平均影响差异有统计学意义。

此外,我们应用单向ANOVA以单独为每个气候因子或因子组合的不同位置之间的开花时间效果的差异。温度,沉淀及其组合显示出含有测定值的方法的显着差异F= 3.617,P.= 1.806E.-06和F= 2.233,P.= 0.003,F= 2.038,P.分别为= 0.008。

对表型的气候因子效应分析

在此基础上,采用两两比较的方法,分析了气候因子对不同产地植物花期的影响。首先,估计各因素对表型影响的方向和程度,作为回归函数偏导数的有限差分近似(1)。数字2给出了为模型集合和每个位置计算的因素影响估计量的箱形图。

图2
图2.

气候因素对表型的影响分析。作为回归函数偏导数的有限差分近似,为模型集合和每个位置计算的气候因素影响估计量箱形图(1)。每个方框包含两个分位数,从影响变化的25到75%,在估计影响的中值处有一条水平线。空圆圈代表离群值。在垂直轴上高于零标记的盒子表示一个因素对开花时间的积极影响。在这种情况下,增加因子加速开花。其他盒子代表相反的情况。“DL”、“TEMP”、“P”、“U”分别对应日长、温度、降水、湿度相关因子

很明显,日照长度和温度对花期的影响都与地理位置有关。对于在某些地点采集的植物,增加日照长度(如Egil)或温度(如Ortanca)会加快开花速度,而在其他地点对这些因素的响应是相反的(如Kesentas)。令人惊讶的是,降水对所有植物的影响是一致的,降水越多,开花时间越短。这一结果与降雨量和开花时间之间的负相关一致(见附加文件)1:表S3)。与沉淀比较湿度的影响是对于大多数位置相反:随着湿度的上升开花时间增加。因子的组合的影响是比较可以忽略不计。

接下来,我们用Wilcoxon-Mann-Whitney检验比较了因子对位置对表型影响的估计方法。图中显示了位置对间均值的显著差异。3.45,6分别为昼长、温度、降水和湿度。

图3
图3.

日长对开花时间影响的两两比较结果。Mann-Whitney-Wilcoxon检验用于比较不同地点的昼长影响估计值。统计学意义上的平均值差异用红色分级表示,具有统计学意义上不显著比较的单元格留空

图4
图4.

对开花时间的对温度影响成对比较的结果。应用MANN-WHITNEY-WILCOXON测试以比较地点的温度影响估算方法。统计学意义上的平均值差异用红色分级表示,具有统计学意义上不显著比较的单元格留空

图5
图5.

对开花时间的降水影响成对比较的结果。应用MANN-WHITNEY-WILCOXON测试以比较地区的降水量影响估算机。统计学意义上的平均值差异用红色分级表示,具有统计学意义上不显著比较的单元格留空

图6
图6.

湿度对花期影响的两两比较结果。Mann-Whitney-Wilcoxon检验用于比较各地点湿度影响估计值。统计学意义上的平均值差异用红色分级表示,具有统计学意义上不显著比较的单元格留空

开花时间模型与气候因子 - 基因型相互作用

不同的基因型可能与气候因子不同。在这里,我们使用开花时间模型来检查这个假设(4)为气候因子与基因型的交互作用项。我们鉴定了6个与开花时间相关的snp(见附加文件)1:表S5)。在这里,我们将所有植物细分为18个组,每个组在6个多态位点中的一个包含相似的等位基因组合(见开花时间的回归模型章节以了解更多细节)。我们进一步将这些群体称为SNP群体。

使用相同的算法参数来执行十个运行,但是随机数发生器的不同种子。该模型 (6)与判定的最佳系数R.2=0.97进行进一步分析。

$ ${\开始{对齐}{\ mathtt {TTF}} = & -5.71 \ cdot T ^{马克斯}_ {x5-10} - 3.87 \ cdot T ^{马克斯}_ {x15-20}左(1 / - 0.39 \ cdot \ \离开(D ^{分钟}_ {x60} \,, \293.08 \右)+ T ^{马克斯}_ {x10-15} \) \ \ + & 5.42 \ cdot D ^{和}_ {x10-15} / \离开(D ^{分钟}_ {x15-20} \ cdot P ^{意味着}_{×50}+ 1 \)\ \ + & 20.08 \ cdot \ (T ^{意味着}_ {x5-10} + \离开(U ^{意味着}_ {x10-15} - 0.004 \右)/ \离开(T ^{分钟}_ {x5-10} - 210.12 \) \ ) \\ + & ( 0.06 \ cdot \ mathtt {snp5AA} + 0.49 \ cdot \ mathtt {snp3RR}) \ cdot T ^{马克斯}_ {x5-10} \ \ & +0.05 \ cdot \ mathtt {snp3AA} \ cdot T ^{马克斯}_ {x15-20 } \\ - & ( 0.02 \ cdot \ mathtt {snp1RR} + 0.002 \ cdot \ mathtt {snp2AA} + 0.16 \ cdot \ mathtt {snp2RR} \ \ & + 0.09 \ cdot \ mathtt {snp3AA} + 0.50 \ cdot \ mathtt {snp3RR} + 0.007 \ cdot \ mathtt {snp4RR} \ \ & + 0.14 \ cdot \ mathtt {snp5RR} + 0.04 \ cdot \ mathtt {snp6RR}) \ cdot \左(1 / \左(D ^{分钟}_ {x60} - 293.08 \右)+T ^{马克斯}_ {x10-15} \) \ \ + & 0.11 \ cdot \ mathtt {snp4RR} \ cdot D ^{和}_ {x10-15} / \离开(D ^{分钟}_ {x15-20} \ cdot P ^{意味着}_{×50}+ 1 \)\ \ + & 0.54 \ cdot \ mathtt {snp3AA} \ cdot T ^{意味着}_ {x5-10}, \{对齐}}$ $
(6)

在哪里\(^{分钟}_ {x60} \)\(^{分钟}_ {x15-20} \)分别指播后60天以上和播后15 - 20天以上的最小昼长;\(d ^ {sum} _ {x10-15} \)表示每天长度的总长度为10到15;\ (T ^{马克斯}_ {x15-20} \)\ (T ^{马克斯}_ {x10-15} \)\(t ^ {max} _ {x5-10} \)分别指播种后15至20天、10至15天和5至10天期间的最高温度;\ (T ^{意味着}_ {x5-10} \)\ (T ^{分钟}_ {x5-10} \)分别指播种后5至10天内的平均气温和最低气温;\(u ^ {均值} _ {x10-15} \)表示播种后10至15天的间隔的平均湿度\(P ^ {}均值_ {X50} \)表示播种后超过50天的平均降水量。

而单核苷酸多态性仅在鹰嘴豆reticulanum来自15个收集地点的样本,我们能够将模型拟合到整个数据集,给予指标变量适当的值-矩阵的元素D.(见公式3.4).

通过分析带有和不带有气候因子与每个SNP组之间交互项的模型的平方和的相对差异,我们可以得出结论,基因型与环境的交互作用占播种至开花期间变异的17.2%。所有SNPs都与温度和日照长度互作。此外,SNP3与相对湿度相互作用,SNP4与降水相互作用。

分析SNP组对气候因素的响应差异我们建造回归模型(1)。这些组开花的时间分布在附加文件中1:图S8-S13。所选模型在附加文件中呈现1:S4部分。

由于该过程的随机性,使用相同的算法参数,使用不同的种子对随机数生成器进行十次运行,以获得一个模型集合。采用随机优化方法,选择各种农业气候因子及其组合作为预测因子。

我们计算了模型集合的决定系数,其中排除了不包含气候因子预测因子或分析因子组合的项。日长、温度、降水、湿度及其组合的系数值箱线图见附加文件1:所有snp如图S14-S19所示。

作为独立变量的依赖变量和SNP组成员身份应用于依赖变量和SNP组成员的多元途径ANOVA(MANOVA)表明,SNP组对气候因子的平均效应差异是统计学意义的(Pillai Satistical值1.287,P.= 1.333E.-09 <0.05)。

然后我们采用单因素方差分析分别检验各气候因素的影响。日长、湿度和降水与日长组合的系数决定值均值均存在显著差异(F= 2.102,P.= 0.009497,F= 6.642,P.= 5.159E.−12和F= 1.904,P.分别= 0.0218)。

我们分析的下一步是对气候因素对SNP组开花时间的影响进行两两比较。每个因素对表型影响的方向和程度被估计为回归函数对该因素的偏导数的有限差分近似。额外的文件1图S20显示了为模型集合和每个SNP组计算的因子影响估计量的箱形图。

通过Mann-Whitney-Wilcoxon检验比较了SNP组中影响表型的因子的平均估计量。从对Table的分析中可以明显看出1,气候因素五出的分析6个多态性位置对具有不同参考等位基因的基因型的发散作用。作为一个例子,对于SNP1(T→G)天长度对与ALT / ALT和REF / ALT,以及REF / REF和ALT / ALT等位基因组合的植物不同的效果。降水影响植物与ALT / ALT和不同REF / REF组合。在SNP2(A→G)的情况下,我们发现与ALT / ALT和REF / REF与温度或沉淀天长度的组合的基因型之间明显的差异。对于SNP3(C→T)湿度影响具有ALT / ALT和基因型REF / REF不同,一天的长度 - 温度组合施加在ALT / ALT和ALT / REF基因型,以及ALT / REF和REF / REF基因型不同的影响,一天的长度 - 沉淀组合显示上ALT / ALT和REF / ALT基因型不同的效果。对于SNP5(C→A)存在于REF / REF和REF / ALT天长度,以及REF / ALT和ALT / ALT基因型的影响的差异。此外,降水还会影响不同ALT / REF和REF / REF基因型。天长度对ALT / ALT和REF / ALT基因型不同的效果为SNP6(A→G)是明显的。

表1气候因子及其组合对植物基因型的影响差异有统计学意义

为了进一步了解降水与snp等位基因频率的关系,我们对15个群体的等位基因频率进行了相关分析(见附加文件)1:表S4)在推定的GWAS SNP,基因型的主要收集部位下的平均年降水。SNPS 1,4,5和6的等位基因频率具有线性关系,与平均年降水相关。这表明在具有高平均沉淀的区域中发现的群体中固定的等位基因(参见图。7).Spearman的平均温度与SNP的等位基因频率之间的等级相关导致无明显的关系。这表明了2个可能的场景,a)平均年度温度值可能不是指示影响基因型中开花时间的关键时间窗口,b)SNP等位基因不参与温度响应途径的基因(见额外的文件1:图S1)。

图7
图7.

平均年降水量(mean_annual_prec)与15个野生鹰嘴豆群体的6个GWAS SNPs等位基因频率的相关性(完整性显示)。SNPs 1、4、5和6的等位基因频率与年降水量相关。等位基因频率在这些显著snp上均呈线性关系,表明这些等位基因在年平均降水量较高的地区的种群中几乎是固定的

讨论

鹰嘴豆的生命周期很大程度上取决于环境因素。因此,它的物候很可能是由地理起源和当地表型环境强烈预测的,正如从地中海到印度南部的国内鹰嘴豆品种和地方品种所证明的那样[3.].在这里,我们通过Chickpea对原产地和基因型地理位置的环境条件的统计建模来研究鸡眼野生祖细胞的假设。通常是G×E.由于采样地点和环境因素的相互作用,采用最先进的技术,如AMMI和因子回归,或使用生物气候变量作为GWAS表型。在这里,我们实现了一个更普遍的解决方案,其中预测因子(气候因素,收集地点和基因型)和表型(开花时间)之间的依赖关系的分析形式是自动推断的随机优化技术。除了自动化,我们的方法的优势在于它能够快速检查不同的适合数据并选择最优的一个。我们对在土耳其21个不同地点采集的野生鹰嘴豆数据集进行了模型参数化[43.在4种不同的环境中生长。GWAS对数据进行分析,确定了6个负责不受环境条件影响的开花时间变异的多态位点(Singh, A.:野生鹰嘴豆全基因组关联研究,正在准备中)。

我们建立了两种类型的开花时间模型——针对整个数据集和植物组,它们要么来自一个采样点,要么在6个SNP位点中的一个有相似的等位基因组合。

利用整个数据集的模型,我们发现,通过植物地理来源及其基因型的气候因子的相互作用,分别占了开花时间的14.7%和17.2%。与以前的方法相反,测量表型对所有环境因素的组合敏感性,我们的方法使得可以识别对特定环境条件和各个进入,收集网站或SNP组的采样位置的回应。在这种情况下,我们将收集站点作为模型参数描述了地理(纬度,高度等)气候(日长度,温度)和表型上生物相互作用的复合影响。我们发现,21个采样网站中共有15种,特别是在表型部位,日长度和湿度的不同气候因子中相互作用。我们还表明,GWAS中鉴定的六种多态性位点与温度和日间长度相互作用,并且SNP3和SNP4分别与相对湿度和沉淀相互作用。

通过施加面向基团的方法,进一步证实了原产地地理位置对植物候选的影响。我们发现源自不同收集网站的野生鹰嘴豆植物与不同的环境不同。例如,在Baristepe1收集的植物与来自位置Baristepe3,Destek,Egil,Ortanca,Savur1和Sirnak1的植物相比,在Day的长度变化与日间长度变化不同(参见图。3.).

观察基因型收集遗址的气候因子关系,我们假设GWAS SNP的等位基因频率与基因型收集部位的气候因子之间应该存在关联。这是通过对6个SNP组中4个中的每年降量的等位基因频率强烈相关性证实了(图。7).这4个snp中有3个在平均降水量最高的群体内具有固定等位基因(等位基因频率1)。这是有道理的,因为地中海一年生植物对气候适宜的开花时间有很强的选择,这些一年生植物通常开花早,以避免降雨量少的地区的干旱,但开花晚,以最大限度地发挥它们在更长季节、高降雨环境中的繁殖潜力[71].在此背景下,我们感兴趣的是发现SNP等位基因频率与采集地点年平均温度没有相关性。这可能是由于表型温度的强位点和SNP相互作用,在不同位置收集的基因型对温度(和降水)的反应不同。因此,温度升高导致一些地区(如Ortanca, Savur)开花提前,而另一些地区(如Kesentas)开花推迟(见图)。2),这使得它不可能以显示SNP的频率和与标准相关分析温度之间的依赖性。

我们还可以证明,在6个多态性位点中的5个位点上,不同的等位基因组合对基因型的开花时间有不同的影响。例如,SNP1位点不同的等位基因组合对日照长度变化的反应不同(见表)1).这是苏格兰民族党在实践中可能会用到的一个重要特征。

我们相信,我们在这里开发了可以插入到现有的基于过程的模型,如SSM模型,建立一个新一代的作物模型的基于遗传,地理,环境和管理数据,预测的作物方面的性能。在不断增长的基因组信息的时代,这些新机型是必不可少的。建模所选的生物过程的特定子程序可以被修改,以结合这些变量效果,而无需在模型内改变其它工艺。有语法演变及深水这可以在自动的方式来实现,缓解了作物模型的适应性育种世界各地的节目。

结论

分析适应模式是确定在广泛或特定适应的育种中应对GxE相互作用策略的关键。开花时间等适应性性状的物候变化可能受到植物地理来源和当地环境因素的强烈预测。通过对野生鹰嘴豆开花时间对不同环境条件的响应进行统计建模,验证了这一假设。我们的研究结果表明:1)植物的地理来源确实是鹰嘴豆开花时间的良好预测指标;2)与开花时间相关的GWAS位点的等位基因组合具有“环境响应性”,即对气候因素的变化有不同的反应。

我们的方法是通用的,可以进一步应用和扩展到现有的作物模型。

缩写

AMMI:

加性主效应与乘性交互作用

APSIM:

农业生产系统模拟器

双相障碍:

生物的日子

气:

作物热量单位

CISP:

保守的内含子扫描底漆

省:

多样性阵列技术

弟弟:

度的天

深:

差分进化完全平行

DSSAT:

农业技术转移决策支持系统

美国东部时间:

表达序列标签

通用电气:

语法演变

GLM:

一般线性模型

GUI:

图形用户界面

GWAS:

全基因组关联研究

许:

热门单位指数

ICARDA:

干旱地区农业研究中心

艾拉:

迭代回归分析

套索:

最小绝对收缩和选择算子

MANOVA:

多种方式分析方差分析

传销:

混合线性模型

SNP:

单核苷酸多态性

舰导弹:

简单的仿真建模

苏维埃社会主义共和国:

单一序列重复

STMS:

测序标记的微卫星站点

流苏:

特征分析协会,进化和联系

TTF:

开花的时间

参考

  1. 1

    Roberts EH, Hadley P, Summerfield RJ。温度和光周期对鹰嘴豆开花的影响(中投arietinuml)。Ann Bot。1985;55(6):881-92。

    文章谷歌学者

  2. 2

    JB·史密森,JA·汤普森,萨莫菲尔德·RJ。鹰嘴豆(中投arietinumL)右:萨莫菲尔德RJ,罗伯茨RE,编辑。谷物豆类作物。伦敦:柯林斯:1985。p . 312 - 90。

    谷歌学者

  3. 3.

    Berger J,Milroy S,Turner N,Siddique K,Imtiaz M,Malhotra R. Chickpea Evolution已选择不同栖息地对比的酚类机制。Euphytica。2011;180:1-15。

    文章谷歌学者

  4. 4

    Singh P,Virmani SM。模拟鹰嘴豆的生长和产量(中投arietinuml)。现场裁剪。1996年;46:41-59。

    文章谷歌学者

  5. 5

    Upadhyaya HD, Bajaj D, Das S, Saxena MS, Badoni S, Kumar V, Tripathi S, Gowda CLL, Sharma S, Tyagi AK, Parida SK.基因组规模集成方法有助于鹰嘴豆复杂开花时间性状的遗传分析。植物学报。2015;89(4): 403 - 20。https://doi.org/10.1007/s11103-015-0377-z

    中科院文章谷歌学者

  6. 6

    Kumar V,Singh A,Mithra Sva,Krishnamurthy SL,Parida SK,Jain S,Tiwari Kk,Kumar P,Rao Ar,Sharma Sk,Khurana JP,Singh NK,Mohapatra T.稻米盐度耐受性的基因组宽映射(栽培稻).DNA研究》2015年;22(2): 133 - 45。https://doi.org/10.1093/dnares/dsu046

    中科院文章谷歌学者

  7. 7

    引用本文:张志强,张志强,张志强。鹰嘴豆的进化:限制多样性和限制适应的四个瓶颈。植物生物学杂志2003;30:1081 - 1087。

    文章谷歌学者

  8. 8

    埃利斯RH,草坪RJ,RJ萨默,齐答,罗伯茨EH,斋PM,布劳威尔JB,玫瑰Ĵ,Yeates SJ,Sandover S等al.Towards时间的可靠预测到六个一年生作物开花。诉鹰嘴豆(中投arietinum).EXP AGRIC。1994年;30(3):271-82。https://doi.org/10.1017/S0014479700024376

    文章谷歌学者

  9. 9

    王志强,王志强,王志强,等。鹰嘴豆对印度不同纬度作物物候适应性的模拟分析。田间作物Res. 2013;146:1-9。

    文章谷歌学者

  10. 10

    黄志强,王志强,王志强,等。鹰嘴豆生长发育的物候学模型研究。田间作物Res. 2006;99:1-13。

    文章谷歌学者

  11. 11

    陈志强,陈志强,陈志强,等。鹰嘴豆根系相关性状对其末端干旱适应性的影响。田间作物Res. 2012;137:108-15。https://doi.org/10.1016/j.fcr.2012.07.022

    文章谷歌学者

  12. 12

    Soltani A,Robertson M,Mohammad-Nejad Y,Rahemi-Karizaki A.拟模鹰嘴豆增长和发展:叶片生产和衰老。田间作物Res. 2006;99:14-23。

    文章谷歌学者

  13. 13

    Jones J, Antle J, Basso B, Boote KJ, Conant RT, Foster I, Godfray HCJ, Herrero M, Howitt RE, Janssen S, Keating B, munoz - carpenter R, Porter C, Rosenzweig C, Wheeler TR.迈向新一代农业系统数据、模型和知识产品:农业系统科学现状。阿格利司系统。2017;155:269 - 88。

    文章谷歌学者

  14. 14

    Jones J, Antle J, Basso B, J Boote K, T Conant R, Foster I, Charles J Godfray H, Herrero M, E Howitt R, Janssen S, Keating B, Muñoz-Carpena R, Porter C, Rosenzweig C, R. Wheeler T.农业系统建模简史。2016;155:240 - 254。

  15. 15

    Jones J, Hoogenboom G, Porter C, Boote KJ, Batchelor WD, Hunt LA, Wilkens PW, Singh U, Gijsman AJ, Ritchie JT。DSSAT种植系统模型。Eur J Agron. 2003;18:1161。

    文章谷歌学者

  16. 16

    J. Boote K,Jones J,皮克林N.潜在的使用和作物模型的限制。Agron J. 1996;88:704-16。

    文章谷歌学者

  17. 17

    博特·kj,琼斯j,白色jw,assengs,lizaso ji。将机制放入作物生产模型中。植物细胞环境。2013;36(9):1658-1672。

    中科院文章谷歌学者

  18. 18

    基廷B,卡伯里PS,锤G,普罗伯特ME,罗伯逊MJ,Holzworth d,胡特NI,哈格里夫斯Ĵ,Meinke H,赫斯​​曼Z,麦克莱恩G,Verburg K,雪V,角钱Ĵ,Silburn d,王E,布朗小号,布里斯托K,Asseng S,史密斯C.概述APSIM,设计用于养殖系统仿真的模型的。Eur J Agron. 2003;18:267-88。

    文章谷歌学者

  19. 19

    Battisti R, Sentelhas PC, Boote KJ巴西南部气候变化研究中四种大豆作物模拟模型的敏感性和改进要求国际生物气象杂志。2017。https://doi.org/10.1007/s00484-017-1483-1

  20. 20.

    Williams Jr,Jones Ca,Kiniry Jr,Spanel Da。史诗庄稼生长模型。跨rissae。1989;32(2):497-511。

    文章谷歌学者

  21. 21.

    Wilkerson GG,Jones J,Boote KJ,Ingram Kt,Mishoe JW。作物管理型大豆生长。Trans Am Soc Agric Eng。1983;26(1):63-73。

    文章谷歌学者

  22. 22.

    Roorkiwal M,Rathore A,Das RR,Singh Mk,Jain A,Srinivasan S,Gaur P,ChellaPilla B,Tripathi S,Li Y,Hickey JM,Lorenz A,Sutton T,Crossa J,Jannink J-L,Varshney RK。鹰嘴豆产量相关性状的支持基因组预测模型。前植物SCI。2016;7:1666。

    文章谷歌学者

  23. 23.

    Hoovingboom G,White JW,Jones J,Boote KJ。Beangro:具有多功能用户界面的过程导向干酪模型。Agon J. 1994;86(1):186-90。

    谷歌学者

  24. 24.

    Jones J,Keating B,Porter C.模块化模型开发方法。农业系统。2001;70(2):421-43。https://doi.org/10.1016/s0308-521x(01)00054-3

    文章谷歌学者

  25. 25.

    Wajid A,Rahman MHU,Ahmad A,Khaliq T,Mahmood N,Rasul F,Bashir Mu,AWAIS M,Hussain J,Hoogeoom G.模拟氮气和有前途的品种对扁豆产量的互动影响(镜片玉米粉),采用cropgro -豆类模型。国际农业生物学杂志。2013;15(6): 1331 - 6。

    谷歌学者

  26. 26.

    Ilkaee MN,Paknejad楼Golzardi楼Tookalloo MR,哈比比d,Tohidloo G,Pazoki A,Agayari楼Rezaee男,梨ZF。对一些使用cropgro豌豆模型下不同播期鹰嘴豆品种重要性状的仿真。诠释J BIOSCI。2014;4(12):84-92。

    谷歌学者

  27. 27.

    陈志强,陈志强。鹰嘴豆生长发育及产量的一个简单模型。农田作物Res. 2011;124:252-60。

    文章谷歌学者

  28. 28.

    lal m,singh kk,srinivasan g,rathore ls,naidu d,tripathi cn。印度Madhya Pradesh在Madhya Pradesh的生长和产量应对气候变化和变化。Meteorol农业。1999;93:53-70。

    文章谷歌学者

  29. 29.

    郑宇,金勇,徐波,徐敏。基于多模式集成气候变化情景的韩国大豆潜在产量变化和不确定性评估。农业技术。2017;6(2): 1000158。

    谷歌学者

  30. 30.

    Mohammed A, Tana T, Singh P, Molla A, Seid A中投arietinum在气候变化条件下的埃塞俄比亚东北部。农业水资源管理。2017;194:68 - 77。

    文章谷歌学者

  31. 31.

    帕蒂尔DD,帕特尔HR。古吉拉特邦中部农气区鹰嘴豆CROPGRO (DSSAT 4.6)模型的定标与验证国际农业科学学报2017;9:4342-4。

    谷歌学者

  32. 32.

    在埃塞俄比亚半干旱的中央裂谷中,气候变化对Adaa Woreda(东绍瓦区)鹰嘴豆生产的影响建模。J Pet Environ Biotechnol. 2016;7:288。

    谷歌学者

  33. 33.

    Bhosale Su,Stich B,Rattunde HFW,Weltzien E,Haussmann Bi,Hash CT,Ramu P,Cuevas He,Paterson Ah,Melchinger Ae,Parzies HK。中非高粱光周期开花时间基因的关联分析[高粱二色的(L) moench]。BMC Plant Biol. 2012;12(1): 32。https://doi.org/10.1186/1471-2229-12-32

    中科院文章谷歌学者

  34. 34.

    Visioni A,Tondelli A,Francia的E,Pswarayi A,Malosetti男,罗素Ĵ,托马斯W,沃R,Pecchioni N,Romagosa I,在大麦霜冻耐受Comadran J.全基因组关联映射(Hordeum Vulgare.l)。BMC基因组学。2013;14(1):424。https://doi.org/10.1186/1471-2164-14-424

    中科院文章谷歌学者

  35. 35.

    田F,Bradbury P,Brown P,Hung H,Sun Q,Flint-Garcia S,Rocheford T,McMullen M,Holland J,Buckler E. Gearome-Wide Consign of Consign-Gear-Indiaigual ofcience在玉米嵌套关联映射群中的叶架构研究。NAT Genet。2011;43(2):159-62。https://doi.org/10.1038/ng.746

    中科院文章谷歌学者

  36. 36.

    Kump酒店KL,布拉德伯里PJ,Wisser RJ,圆盾ES,卑AR,Oropeza-罗萨斯MA,Zwonitzer JC,Kresovich S,McMullen的MD,洁具d,巴林特-Kurti PJ,荷兰JB。在玉米嵌套关联作图群体小斑病数量抗性的全基因组关联分析。NAT Genet。2011;43(2):163-8。https://doi.org/10.1038/ng.747

    中科院文章谷歌学者

  37. 37.

    杨文,郭z,黄c,段l,陈g,姜n,方文,冯h,谢w,x x,王g,罗q,张q,刘q,xiong l.结合高吞吐量表型和基因组的协会研究,揭示水稻的自然遗传变异。NAT Communce。2014;5:5087。https://doi.org/10.1038/ncomms6087

    中科院文章谷歌学者

  38. 38.

    Suwarno WB,皮克斯利KV,帕拉西奥斯 - 罗哈斯N,Kaeppler SM,巴布R.全基因组关联分析,揭示了玉米类胡萝卜素生物强化新的目标。理论应用遗传学。2015;128(5):851-64。https://doi.org/10.1007/s00122-015-2475-3

    中科院文章谷歌学者

  39. 39.

    Lasky JR, Upadhyaya HD, Ramu P, Deshpande S, Hash CT, Bonnette J, Juenger TE, Hyma K, Acharya C, Mitchell SE, Buckler ES, Brenton Z, Kresovich S, Morris GP。高粱地方品种的基因组-环境关联预测适应性状。Sci放置2015;1(6)。https://doi.org/10.1126/sciadv.1400218http://Advises.sciencemag.org/content/1/6/e1400218.full.pdf.

  40. 40

    黄C, Correll MJ, Gezan SA, Zhang L, Bhakta MS, Vallejos CE, Boote KJ, Clavijo-Michelangeli JA, Jones J. Next generation crop models: A modular approach to model early vegetative and reproductive development of common bean (菜豆L).农业系统。2017;155:225-39。https://doi.org/10.1016/j.agsy.2016.10.010

    中科院文章谷歌学者

  41. 41.

    满足全球粮食需求:通过遗传、环境和管理相互作用实现潜力。阿格龙j . 2015;107:1215-26。

    文章谷歌学者

  42. 42.

    塔迪厄楼荸荠R.解剖和在植物抗逆造型。CurrOp植物BIOL。2010;13:206-12。

    文章谷歌学者

  43. 43.

    冯Wettberg EJ, Chang PL,英航şdemir F, Carrasquila-Garcia N, Korbu磅,Moenga SM, Bedada G, Greenlon, Moriuchi KS,辛格V, Cordeiro MA Noujdina NV, Dinegde KN,国王便SGA, Getahun T,万斯L,伯格曼E,林赛D,乳房,Warschefsky EJ, Dacosta-Calheiros E,品牌E, Yilmaz MA Cakmak,玫瑰J, Migneault, Krieg CP, Saylak年代,Temel H, Friesen ML,赛勒E, Z,雷纳托Ozcelik带领H, Kholova J, C,白肢野牛P, Yildirim M, Sharma H, Vadez V, Tesfaye K, Woldemedhin房颤,焦油国安B, Aydogan, Bukun B, Penmetsa房车,伯杰J, Kahraman, Nuzhdin SV,库克博士生态学和基因组学的一个重要的作物野生相对是农业创新的前奏。Nat Commun。2018;9:649。

    文章谷歌学者

  44. 44.

    NNDC来说。气候数据在线。https://www7.ncdc.noaa.gov/CDO/cdoselect.cmd?datasetabbv=GSOD.访问2017年12月30日。

  45. 45.

    Hammer GL,Vaderlip RL,Gibson G,Wade LJ,Henengell RG,较年轻的Dr,Warren J,Dale AB。谷物高粱基因型 - 环境相互作用。II,温度和光周期对组来的影响。农作物科学。1989;29:376-84。

    文章谷歌学者

  46. 46.

    堀江T.作物个体发育和发展:Boote KJ,贝内特JM,辛克莱TR,保尔森GM,编辑。生理学和作物产量的测定。麦迪逊,USA:ASA,综援及SSSA:1994页。153-180。

    谷歌学者

  47. 47.

    荜EL,Boote KJ,琼斯Ĵ,格林SS。两个物候模型的比较预测开花和大豆的到期日。农作物科学。1996年;36:1606年至1614年。

    文章谷歌学者

  48. 48.

    尹X,Kropff MJ,Horie T,Nakagawa H,Centeno Hgs,朱D,Goudriaan J.一种用于水稻开花的光热反应模型。一世。模型描述和参数化。现场作物RES。1997年;51:189-200。

    文章谷歌学者

  49. 49.

    Robertson MJ, Carberry PS, Huth NI, Turpin JE, Probert ME, Poulton PL, Bell M, Wright GC, Yeates SJ, Brinsmead RB。apsim模拟不同豆科植物的生长发育。澳洲农业研究2002;53:429-46。

    文章谷歌学者

  50. 50.

    Robertson MJ,Watkinson Ar,Kirkegaard Ja,Holland JF,Potter Td,Burton W,Walton GH,Moot DJ,Wratten N,Farre I,Asseng S.环境和基因型控制在油菜和印度芥末开花的时间。澳洲农业研究2002;53:793-809。

    文章谷歌学者

  51. 51.

    主要DJ,约翰逊博士,坦纳·杰沃,安德森·克。大长度与温度对大豆发育的影响。农作物科学。1975年;15:174-9。

    文章谷歌学者

  52. 52.

    大豆:根据温度、日照和水分有效性建模的大豆阶段。阿格龙j . 1985;77:500-5。

    文章谷歌学者

  53. 53.

    O 'Neill M, Ryan C.语法演变。EE Trans Evol compput . 2001;5(4): 349 - 58。https://doi.org/10.1109/4235.942529

    文章谷歌学者

  54. 54.

    诺里安。F . de Silva A . Leong P. gramEvol: r.j Stat software art . 2016;71(1): 1-26。https://doi.org/10.18637/jss.v071.i01.

    谷歌学者

  55. 55.

    通过LASSO的回归收缩和选择。J R Stat Soc Ser B. 1996;58(1): 267 - 88。

    谷歌学者

  56. 56.

    陈志强,陈志强。基因调控网络的深度差分进化完全并行方法。J Supercomput。2011;57:172-8。https://doi.org/10.1007/s11227-010-0390-6

    文章谷歌学者

  57. 57.

    一种基于差分进化完全并行方法的参数优化软件。PeerJ compput Sci. 2016;2:74。https://doi.org/10.7717/peerj-cs.74

    文章谷歌学者

  58. 58.

    科兹洛夫K,诺维科娃LY,Seferova IV,Samsonova MG。对气候因素的大豆依赖发展的数学模型。Biofizika。2018;63:175-6。

    谷歌学者

  59. 59.

    Storn R,价格K.差分演变 - 在连续空间上全球优化的简单高效启发式。技术报告技术报告TR-95-012,ICSI。1995年。

  60. 60

    在差分进化Zaharie D.参数调整,通过控制人口的多样性:Petcu d,编辑。Proc。对符号和数值算法科学计算第4 InternationalWorkshop。蒂米什瓦拉,罗马尼亚:Analele Universitatii蒂米什瓦拉:2002页。385-97。

    谷歌学者

  61. 61

    R核心团队。R:统计计算的语言和环境。奥地利维也纳:统计计算R基金会;2018.统计计算基础。https://www.R-project.org/

    谷歌学者

  62. 62

    皮拉伊;。回归收缩和选择通过套索。Ann Math Stat. 1955;26:117-21。

    文章谷歌学者

  63. 63

    Peter Harrington。基因编程C ++代码。https://github.com/pbharrin/genetic-填充.访问2017年12月30日。

  64. 64

    Sanderson C,Curtin R. Armadillo:用于线性代数的基于模板的C ++库。j开源软。2016;1:26。

    文章谷歌学者

  65. 65

    Curtin Rr,Cline Jr,Slagle NP,3月WB,Ram P,Mehta Na,Grey Ag。MLPACK:可扩展的C ++机器学习库。J Mach Learn Res。2013;14:801-5。

    谷歌学者

  66. 66

    HDF组。层次数据格式,版本5。http://www.hdfgroup.org/hdf5/.访问2017年12月30日。

  67. 67

    蓝脑计划。Highfive酒店 - 仅标头C ++ HDF5接口。https://github.com/pbharrin/genetic-填充

  68. 68

    Qt公司。Qt库。https://www.qt.io/.访问2017年12月30日。

  69. 69

    科兹洛夫NLREG。https://gitlab.com/mackoel/nlreg..访问2017年12月30日。

  70. 70

    张志,kon DE, Casstevens TM, Ramdoss Y, Buckler ES。TASSEL:用于不同样本中复杂性状关联制图的软件。生物信息学。2007;23日(19):2633 - 5。https://doi.org/10.1093/bioinformatics/btm308

    中科院文章谷歌学者

  71. 71

    张志强,张志强,张志强,等。地中海豆科植物的繁殖策略:植物物候、种子大小和活力的权衡。植物学报2017;8:548。

    文章谷歌学者

下载参考

致谢

我们感谢Lyubov Novikova、Svetlana Surkova、Alena sokkolkova和Peter Chang的有益讨论。这项工作是利用彼得大帝圣彼得堡理工大学超级计算机中心的计算资源完成的(http://www.scc.spbstu.ru).

资金

数据收集和制备,GWAS,以及在群(等位基因频率的Spearman相关分析图。7和附加文件1图S1)得到了美国国际开发署与d.r.c.、E.J.B.v.W.、S.V.N.、a.f.w.、a.k.、V.V.和R.V.P.的合作协议的支持,并得到了南加州大学多恩西夫化学生物学培训项目的支持。所有其他分析都得到了RScF #16-16-00007的支持。本文的发表得到了RScF #16-16-00007的支持。

数据和材料的可用性

在当前研究期间使用和/或分析的数据集和程序从相应的作者可根据要求提供。

关于这个补充

本文已作为一部分发布BMC Plant Biology Volume 19 Supplement 2, 2018: Selected articles from BGRSSB-2018:植物生物学(第2部分).该补充的全部内容可在网上找到//www.cinefiend.com/articles/supplements/volume-19- supplement-2

作者信息

从属关系

作者

贡献

Sergey Nuzhdin(SN),Maria Samsonova(MS),Eric Bishop-Von Wettberg(EW)和Konstantin Kozlov(KK)构思和设计了这项研究。Jens Berger(JB),Douglas Cook(DC),Abdulkadir Aydogan(AA)和Abdullah Kahraman(AK)准备了DataSet。EW对野生种族进行了采样,并准备了Geo数据。Anupam Singh(AS)对群体的等位基因频率进行了GWAS分析和Spearman的相关性分析。KK,SN和MS配制了模型。KK进行了计算。KK,SN和MS分析了结果。AS,KK,SN,EW和MS编写了文本。所有作者阅读并认可的终稿。

相应的作者

对应到玛丽亚Samsonova

伦理宣言

伦理批准和同意参与

不适用。

同意出版物

不适用。

相互竞争的利益

两位作者宣称他们没有相互竞争的利益。

出版商的注意事项

施普林格《自然》杂志对已出版的地图和机构附属机构的管辖权要求保持中立。

额外的文件

额外的文件1

附加文件1包含有关基于SNP基团的信息,这些组的气候数据,关于语法演化方法的详细信息。(PDF 634 KB)

权利和权限

开放访问本文遵循知识共享署名4.0国际许可协议(http://creativecommons.org/licenses/by/4.0/)如果您向原始作者和源给出适当的信用,则允许在任何介质中进行不受限制的使用,分发和再现,提供指向Creative Commons许可证的链接,并指示是否进行了更改。Creative Commons公共领域奉献豁免(http://creativecommons.org/publicdomain/zero/1.0/)适用于本条提供的数据,除非另有说明。

再版和权限

关于这篇文章

通过CrossMark验证货币和真实性

引用这篇文章

Kozlov,K.,K.,Singh,A.,Berger,J.et al。野生鹰嘴豆术中的非线性回归模型结合了遗传和气候因素。BMC植物BIOL.19日,94(2019)。https://doi.org/10.1186/s12870-019-1685.2

下载引用

关键词

  • 野生鹰嘴豆
  • 模型
  • 气候因素
  • GWAS