基于相对熵原理的生物进化系统树构建

基于相对熵原理的生物进化系统树构建

一、基于相对熵原理构建生物进化系统树(论文文献综述)

红艳[1](2020)在《基于物种特征的系统发生网络构建算法研究》文中研究说明系统发生是通过追溯物种形成过程,分析物种之间的进化关系。最初,物种进化关系由系统发生树表示。然而经过深入研究发现,物种进化过程中常常出现网状事件(如杂交、重组和水平基因转移),导致部分物种拥有多个父辈群体。这时树形结构无法描述它们之间的进化关系。系统发生网络既可以表示网状进化关系,又可以表示多个系统树之间的冲突进化信息。而且系统发生树可以看作是系统发生网络的一种特殊形式。因此系统发生网络的构建对生物进化研究具有重要的现实意义。本文研究了基于物种特征的系统发生网络构建算法。主要内容:⑴深入研究了系统发生树这一特殊网络的构建算法。本文提出了基于距离矩阵构建系统发生树的ENJ算法,它是邻接法的一种改进。邻接法是目前有效构建系统发生树算法之一,它运算速度快,准确率高,且适用于大数据集。但是它会出现结果进化树不唯一现象。ENJ算法可以有效合并三个邻接节点,解决了邻接法产生多个结果树的问题。对比实验中,相比INJ算法,ENJ算法构建的系统发生树与原始树的差异更小,能更好的表示原始树的信息。⑵深入研究了一般系统发生网络的构建算法。本文提出了基于有根系统树构建系统发生网络的Frin算法,它是Cass算法的一种有效改进。Cass算法接受任意的多个系统树作为输入,是目前有效构建系统发生网络算法。但是它受输入数据顺序影响大,运算速度慢。Frin算法基于物种频率和不相容度选择去除物种,削弱了输入数据顺序的影响,加快了系统发生网络的构建。并且实验证明,相比Cass、Lnetwork和BIMLR算法,Frin算法明显削弱了输入数据顺序的影响;Frin算法构建的网络更简单,多余簇的数量更少;Frin算法为禾本科植物有效地构建了系统发生网络。

闫肖婷[2](2019)在《基于主路径的主题演化与关键节点分析》文中进行了进一步梳理信息化时代,各国综合国力的竞争焦点聚集在科技的竞争。科技演化路径体现科技的发展脉络,凝聚着领域发展的重要信息。研究者有效解读科技演化路径隐含的主题及演化趋势,识别科技发展中的关键节点,可以深层次分析领域中的重大热点科技,为国家科研发展规划、企业研发战略提供决策依据和未来发展方向。因此,对科技演化路径的深入挖掘分析已经成为科技发展中必不可少的一环。引文网络隐藏着技术发展的内在规律。主路径分析方法是基于节点的连通性出发,从构建的引文网络中获得高遍历权重的边组成领域发展的主路径,用以描述科技发展走向,揭示领域内的潜在发展规律。然而,对于从网络中提取且用以表达领域发展的科技演化路径,研究者很难快速、准确识别不同领域科技演化路径上的节点所表达的科技内容以及判别领域发展中的关键技术,而对科技演化路径的解读是了解领域发展的关键。为此,本研究构建主题含量指标用于标示科技演进路径的主题及演化,并构建了基于主路径的链路计数方法和采用相对熵方法识别引文网络中的关键节点。本文首先从主路径角度出发,构建一种凸显主路径上的核心主题及演化方法。该方法是基于引文网络主路径映射专利分类号或主题词的链接计数,通过专利的分类号或主题词替代文本主题在主路径上演化并计算节点的主题含量,以主题含量的变化凸显主路径上的核心主题及其发展历程。为了验证所构建方法的合理性,本文采用OLED领域和DNA领域的数据进行实证分析。研究结果表明,本文构建的衡量主题演化指标适用于专利和文本的主题演化,并通过主题演化图清晰揭示主题演化过程。其次,本研究结合SPLC算法构建一种链路计数方法对主路径上节点的重要性进行了排序,引入生物学领域判别生物序列差异大小的方法识别引文网络中的重大转变节点。为了高效解读领域中隐藏的关键技术,发现领域中的重大转变及潜在的重大机遇,本研究先通过比较被引频次和主路径方法得到的节点的重要性排序结果,从内容上验证了从主路径角度分析节点重要性的方法的优越性。其次,引入相对熵识别引文网络的重大转变,更是丰富了关键节点的分析体系,为研究人员深入了解关键节点隐含的信息,掌握主路径上的技术发展提供一定的理论和实践价值。但如何增加文本的测量维度,细化文献之间的差异性,为更准确判别领域中的重大转变,未来还需进一步深入研究。最后,本文对研究的成果和主要结论做了总结,并讨论了研究中存在的局限以及对未来研究方向的展望。

任和月[3](2018)在《基于叶绿体基因组研究影响买麻藤类植物系统树重建的因素》文中指出叶绿体基因组较小、拷贝数高、结构保守,包含了植物光合作用和质体半自主性遗传的重要基因。叶绿体基因和基因组为分子进化研究提供了重要信息,且常用于植物分子系统学研究。买麻藤类(Gnetophytes)是具有被子植物特征的裸子植物,对研究种子植物的起源与演化具重要价值,但其系统发育位置至今仍无定论。本研究从叶绿体基因组全序列提取共有叶绿体基因的编码序列构建数据矩阵,先是运用极大似然法(Maximum Likelihood,ML)、最大简约法(Maximum Parsimony,MP)、贝叶斯法(Bayesian Inference,BI)以及邻接法(Neighbor Joining,NJ)基于每个基因分别重建系统发育树,对比、分析了不同基因和不同构树方法对买麻藤类系统树重建产生的影响;然后又选取不同分子性状(碱基替换、碱基插入/缺失以及密码子第一、二和第三位碱基)构建系统树,研究了这些性状对系统树重建带来的效应。获得以下结果:(1)对选取出的57个共有叶绿体基因用上述四种不同的构树方法构建基因树,得到的基因树拓扑结构存在差异。利用ML法,有28个基因的构树结果显示买麻藤类与广义柏类互为姐妹群,25个基因支持买麻藤类与松科植物互为姐妹群,而4个基因支持买麻藤类与松柏类互为姐妹群。基于MP法,有32个基因支持买麻藤类与广义柏类互为姐妹群,19个基因支持买麻藤类与松科植物互为姐妹群,而有6个基因支持买麻藤类与松柏类互为姐妹群。应用BI法,有26个基因的推测结果显示买麻藤类与广义柏类互为姐妹群,22个基因支持买麻藤类与松科植物互为姐妹群,而有9个基因支持买麻藤类与松柏类互为姐妹群。最后,借助NJ法,有34个基因支持买麻藤类与广义柏类互为姐妹群,15个基因支持买麻藤类与松科植物互为姐妹群,而有8个基因显示买麻藤类与松柏类互为姐妹群。(2)分别以不同的叶绿体基因序列构树,相应的结果显示重建出的买麻藤类系统位置会发生改变。其中,psaC、psbH、atpA、atpF、rbcL、petA、petG、rpl22、rpl36、rps2、rps3、rps4、rps19、rpoA、rpoB、rpoC1、infA、cemA、ycf2这19个基因的构树结果不受构树方法的影响,均显示买麻藤类与广义柏类互为姐妹群。psaB、psbF、psbN、ycf3、ycf4、rpl14、rps8这7个基因的构树结果也不受构树方法的影响,但显示买麻藤类与松科植物互为姐妹群。而psbE和petB的构树结果均显示买麻藤类与整个松柏类植物互为姐妹群。买麻藤类与广义柏类互为姐妹群的拓扑结构,得到了更多基因的支持。(3)对于受到最多基因支持的拓扑结构(即买麻藤类与广义柏类互为姐妹群),同时再兼顾系统树结果不受构树方法的影响这一因素,筛选出相应的基因。将它们的序列分别串联为联合数据集,然后运用极大似然法、最大简约法、贝叶斯法和邻接法分别对其进行分析。另外,再基于该联合数据集,分别构建由碱基替换、插入/缺失以及提取自密码子三个位置上的碱基组成的数据矩阵,再利用四种构树方法予以分析。结果显示,在极大似然法、最大简约法和贝叶斯法重建的系统树中,买麻藤类的系统位置几乎不受所用分子性状的影响,但分支的自展支持率却有所降低。与之相对,在用邻接法对密码子三个不同位置的碱基数据进行分析时,由密码子第一位和第二位碱基重建的买麻藤类的系统位置表现为与整个松柏类互为姐妹群,而由密码子第三位碱基重建的系统树显示,买麻藤类与广义柏类互为姐妹群。

李玲[4](2014)在《基于线粒体基因组构建生物系统进化树》文中研究表明基因是遗传信息的载体,描述了变化万千的生命形态。随着人类基因组计划的顺利完成和信息技术的飞速发展,越来越多的生物完全基因组序列可供人们来研究,这为我们从基因的角度来解读生物的奥秘提供了便利。但是要读懂这部仅由四个字母组成的生命“天书”,传统的实验观察手段就显得力不从心了,只能借助数学原理和计算机数据处理方法来高效、精确的进行生物序列分析。本文基于传统的序列特征参数——组分向量,提出了描述序列特征的新参数——组合多联体,分别用信息熵和离散增量作为距离函数对26种胎盘类哺乳动物和64种脊椎动物构建了系统进化树。全文共分四个部分:第一部分介绍了利用线粒体基因组构建生物进化树的研究现状和意义、信息熵的应用和发展历程及本文的主要工作。第二部分是本文的理论和方法。基于传统的序列特征参数——组分向量,本文提出了新的生物序列特征参数——组合多联体,并通过碱基关联分析,说明了组合多联体的意义;本文使用R软件,基于新对称相对熵和离散增量这两种距离函数,通过距离矩阵法构建生物系统进化树。第三部分,通过距离矩阵法对26种胎盘类哺乳动物和64种脊椎动物线粒体DNA数据进行分析,构建了生物的系统进化树。计算中,选用了三种特征参数来描述序列,分别是:6联体、组合6联体、6联体和组合6联体。在用新对称相对熵作为距离函数时,分别基于三种特征参数构造距离矩阵,并通过R软件对两组数据构建了生物系统进化树。结果显示,以组合6联体,特别是组合间距为57的组合6联体为序列特征参数时,得到的系统进化树要比以6联体为序列特征参数时分类更清晰、准确;在用离散增量作为距离函数时,分别通过三种特征参数构建了生物系统进化树,同样验证了组合多联体在进化树构建中的有效性。另外,通过两组结果的对比,发现用新对称相对熵作为距离函数,比相对熵和离散增量作为距离函数,构建的进化树更为合理、更接近物种的生物学分类。

李国宝[5](2014)在《聚类算法在生物分子进化领域的应用及改进》文中认为生物进化树构建是分子生物学的一个重要研究方向,主要通过对生物分子例如蛋白质、DNA的分析比较,得出这些生物分子的同源性远近关系,进而利用这种同源性远近关系来构建生物进化的顺序树—即生物进化树。生物进化树研究历史久远,对于分子生物学的发展起到过巨大的作用。生物进化树让人类直观的认识了生物最具可能性的先后进化顺序,能够较好的从直观性上解释达尔文的生物进化论。由于划分的角度不同,生物进化树的构建方法有着各种分类。本文从是否基于进化距离将进化树构建方法分为两大类,即基于距离矩阵的构建方法和不基于距离矩阵的构建方法。基于距离的构建算法通常能够很快的得到进化树,并且得到的生物进化树经过验证也比较可靠,因此,本文主要研究基于距离矩阵的进化树构建方法。传统的基于距离矩阵的进化树构建算法有NJ、UPGMA等,其中UPGMA方法假设进化树中所有物种的进化速率相同,而真实情况是物种的进化速率是有差异的,所以该方法并不能令人信服。NJ方法在构建进化树时不仅考虑生物的进化速率差异,还保证每个分组的生物进化距离之和最小,因此是一种比较常用的生物进化树构建方法。本文对邻接法的一些特点进行了改进,使得适应范围变得更加广泛。对原有邻接建树法主要做了三点改进:(1)对原有的Jukes-Cantor距离估计公式进行了改进,引入了打分矩阵对序列比对结果进行打分,不仅考虑信息位点上的核苷酸变异,还对非信息位点的碱基变异进行打分,充分利用了DNA序列的遗传信息。并且由DNA序列之间的两两比对变为序列之间的多重比对,这样可以利用更多的序列进化的隐藏信息,进一步减少构建错误进化树拓扑结构的可能性;(2)对于距离不满足可加性的距离矩阵,引入方差和协方差来帮助判断待合并的两个分类单元。经过改进的新的距离估计方法可以在距离信息部分丢失的情况下提高结果的准确性,这就提高了距离估计方法的健壮性,使得距离估计方法可以用于外界噪声较大的情形,因为新的距离估计方法能够具有一定的抗干扰能力;(3)对于贪心算法每次迭代都需要求距离最小的一对分类单元这一局部最优方法进行了改进,通过引入“领域”对使得每次迭代产生的次优解得以保存,这就为后面构建的进化树满足全局最优提供了可能。实验也表明,改进贪心特性后的算法可以最大可能的得到全局最优进化树,而且在时间复杂度方面也降低很多。本文还提出一种新的基于层次聚类的生物进化树距离矩阵构建方法和一种基于Kmeans聚类的生物进化树距离矩阵构建方法。实验证实,这两种进化树构建方法得到的生物进化树是可信的,花费的时间也接近其他基于距离的进化树构建方法。基于层次聚类的距离矩阵法首先通过序列比对计算生物之间的进化距离,然后运用层次聚类算法对生物样本进行分类,最终的分类结果转化为二叉树形式。基于Kmeans聚类的进化树距离矩阵构造法先计算样本之间的距离,然后运用Kmeans方法对样本进行分类,在划分后的每一个类别中利用哈夫曼方法对该类别构建进化树,最后将每个类别构建好的进化树合并成一颗二叉树,该树即为所寻找的生物进化树。此外,本文将两步聚类方法运用到Bayes建树方法中,对数据序列进行预处理后再进行进一步的进化树构建,通过与其他可靠的建树方法比较后证实了本方法的有效性。由于生物的真实进化历史只能通过研究生物化石等手段获知,很多生物的进化顺序只能根据生物学家的各种实验近似得出,因此对于进化树的评价标准也不是唯一的。一般来说,如果与运用其他被普遍认可的进化树构建方法得到的进化树拓扑结构基本一致,就可以认为某种进化树构建方法是有效的。

郭子湖[6](2013)在《核苷酸替换模型中若干问题的研究》文中指出自达尔文时代起,构建系统进化树(即把各物种之间的进化关系用树的形式表现出来)就一直是生物研究的一个重要课题。20世纪80年代以来,相关学者主要通过现代生物信息学手段来进行进化树的重建。在新的构树方法中,第一步就是要选取合适的核苷酸替换模型或者氨基酸替换模型。因此,核苷酸替换模型的选择,直接决定了所构建的进化树是否合理。本文在此前提下对核苷酸替换模型的一些性质进行了研究。本文的主要内容包括以下方面:1.第一章概括了系统进化树构建过程中常用的几种核苷酸替换模型以及这些模型所包含的距离测度;简单介绍了生物学家对核苷酸替换模型和各种距离的研究进展。总结了这些模型和距离测度所存在的问题和局限。2.第二章研究了较复杂的核苷酸替换模型,即等输入模型和Tamura模型下DNA序列中四种核苷酸频率和序列熵随世代变化的规律,为了解生物进化奠定理论基础。本章在Shannon信息熵的理论基础上,利用Lagrange乘数法进行了理论证明,并用Mathematica软件模拟了Tamura模型下DNA序列中四种核苷酸组成的变化规律和序列熵的变化过程。DNA序列发生突变过程中,各核苷酸频率随世代变化趋于平衡,且序列熵趋于最大值。这证明核苷酸突变具有保熵性质,这也验证了前人关于生物是朝多样性增大的方向发展进化的结论。3.第三章首先简单介绍了转换颠换动力学模型,并在此基础上提出了两个新的核苷酸替换模型。对于第一个模型,我们给出了该模型下四种核苷酸频率随时间变化的函数关系,并证明在此模型下核苷酸频率并不是单调的趋于平衡频率的,而是存在震荡现象。因此,我们推测,该模型更能反映真实的进化规律,从而能更好的对数据进行拟合。另外,我们给出了该模型下三种距离即p距离,距离和选择进化距离的估计。对于第二个模型,我们是在转换颠换动力学的启发下提出该模型。该模型将转换频率频率分为了两部分,我们用谱分解的方法给出了该模型下动力学方程的解,但是在对距离进行估计时,我们发现需要求解的方程组十分复杂,因而很难直接求出其解析解。4.第四章提出了一种求解无限制模型的新的思路。无限制模型是对现有模型的一个统一,无限制模型自提出以来,就受到相关学者的高度关注。但是由于无限制模型的自由参数过多,其求解问题一直是一个难点,所以对该模型的研究进展不大。我们将该模型分七种情况讨论其解并用计算机辅助的方法进行求解。5.第五章是对前面章节的总结。在这一章中,我们简单总结了核苷酸替换模型和进化距离研究中仍然存在的问题以及今后的研究方向。

解小莉[7](2012)在《生物序列的分析方法及其进化模型研究》文中研究表明自从达尔文时代起,重建地球上所有生命的进化历史,并用系统树的形式来描述这部历史,已经成为许多生物学家的一个梦想。随着分子生物学及生物技术的迅猛发展,生物科学的数据资源急剧膨胀,人们开始利用生物序列数据推断生物进化历史,建立了分子系统学。生物序列及其进化模型是分子系统学的重要组成部分。传统的生物序列分析方法是比对分析方法,20多年前,非比对分析方法作为比对分析方法的补充和发展而出现,并且成为计算分子生物学的一个研究热点。本文以生物序列为研究对象,提出了一些新的分析方法,研究了生物序列进化过程的模型,为进化距离的改进提出了一些新的结果。本文的主要工作包括以下几个方面:1.提出了新的氨基酸序列的两种图形表示方法。一种方法是按照疏水性把氨基酸分为三类,对分类后的氨基酸序列进行分析,文中定义了三条曲线(IA曲线,EA曲线和IE曲线),这三条曲线不仅能可视化新的序列,而且可以比较三类氨基酸的分布情况。首次引入条件概率作为序列的数字特征,以挖掘隐藏在序列中的相关性信息,并在此基础上分析了序列的相似性。第二种图形表示方法是直接利用氨基酸的疏水值,定义了氨基酸序列的疏水性曲线,根据传统的图形量化方法分析序列的相似性。以ND6(NADHdehydrogenase subunit6)蛋白质序列为生物数据,阐明并比较了两种分析方法,结果表明两种方法是合理可行的。2.提出了蛋白质序列的选择进化距离公式。蛋白质序列的进化距离因氨基酸替代模型的不同而不同,针对这一问题,本文在选择的思想下,建立了氨基酸序列的进化模型,得到了新的进化距离(选择进化距离)公式,给出了进化距离中参数的确定方法。通过17个物种的细胞色素b的氨基酸序列说明了选择进化距离的计算方法,并根据自展法比较了不同进化距离得到的物种进化树。结果表明,利用选择进化距离构建的进化树与其他几种进化距离得到的进化树的拓扑结构一致,而且选择进化距离的计算避免了氨基酸替代模型的选择问题。3.提出了量化DNA序列碱基分布的指标。在DNA序列的4个单碱基和16个双碱基的距离分布模型的基础上,定义了4个单碱基和16个双碱基的平均距离指标和相对距离熵指标,以衡量DNA序列中所有单(双)碱基的分布情况。平均距离指标描述了相邻两个相同单(双)碱基之间其他碱基的数目,相对距离熵指标描述了每个单(双)碱基的距离分布的均匀性程度。在此基础上,分析了17个物种的线粒体基因组序列的单(双)碱基的分布情况,在线粒体基因组序列中,相邻两个碱基G的平均距离和相对距离熵比其它碱基的平均距离和相对距离熵大;双碱基CG的平均距离比其他双碱基的平均距离大。4.建立了核苷酸替代的转换-颠换进化动力学模型。在核苷酸替代动力学模型及研究结果的基础上,分析了不同核苷酸替代模型下核苷酸序列的相同对、转换对和颠换对频率随时间的变化规律,说明了转换颠换比和各种进化距离的特征,建立了核苷酸序列的转换-颠换进化模型,给出了模型中各个参数的确定方法及其生物学意义。和传统的核苷酸替代动力学模型相比,该模型优点在于更加简单,由核苷酸替代阵或核苷酸替代路径图可以直接得到,而且这个模型很容易给出DNA序列的进化距离。

蒋田田[8](2012)在《基于本体信息论的生命演化规律》文中研究说明千百年来,生命的起源、生命的本质、生命的新陈代谢、情感和意识的起源、生物的多样性、进化的法则等问题一直是困扰人类心智的问题。在这特殊的生物学领域里,过去的人们基于还原论的逻辑尝试用物理、化学领域中拆分的方法对生命进行还原,把生命拆分成多个部分进行研究,取得了不菲的成就,然而这种方式破坏了生命的有机性和活性,难以破解生命的奥秘。本文尝试突破还原论的逻辑,彻底改变传统还原认识论的世界观。本文认为,世界万象是不断演化和寻找稳定模式的信息实在及信息过程,是在无边界网络中涌现出的公共的、有机的、有功能的、多层次的、学习的、进化的模式。本文导出了由信息实在及信息过程创生世界万象的动力学方程,描述了“在无限网络中信息实在不断抓取数据通过无偏差的相互参照形成稳定模式从而证明模式存在”这一真实世界形成和演化的过程,显然,这一过程满足最大广义信息熵原理(或最大流原理)。生命系统作为整个同构和全息的世界图景中的部分和环节,也是一个通过最大化地收集广义信息熵使自身生成演化的广义生命体,本文由此揭示了生命系统的实质,得到了控制生命系统生成演化的动力学方程,构建起阐述生命系统的理论框架。在理论阐述基础上,通过生命系统的量化方法,我们重构蛋白质分子分形维数的动力学过程,揭示了蛋白质分形的内涵和演化过程,这对除蛋白质模式之外的其他的生命系统的模式的演化内涵的揭示也有指导意义。另外,本文还发展出一套具体的算法,借助Matlab平台提供的自组织特征映射人工神经网络对复杂系统的动力学演化方程进行求解,即利用抓取的组元重构复杂系统自我涌现的稳定模式,建立了新世界观和理论框架下对复杂系统的数值模拟方法。基于这一思路,本文以微生物生态系统和太湖虾为例,对其整体结构模式的演化进行了模拟分析可对诸如生命此类的复杂系统结构演化进行预测,可在一定程度上了解其发展趋势。最后我们对生命的其他相关问题诸如宇宙、物质、意识的起源问题都分别进行了探讨,希望能让人们在对生命等问题的认识上有些更深刻的感知和体会。

梁丽萍[9](2011)在《DNA序列选择进化距离及其在系统发育分析中的应用》文中指出在研究各种物种的进化历史中,利用蛋白质或DNA序列进行系统发育分析已成为生物信息学的一个重要研究领域。系统发育分析的主要研究方法为:选取一组同源的蛋白质或DNA序列,通过各种方法计算出各个序列间的进化距离,进而构建出能反映物种间进化关系的进化树。20世纪80年代以来,进化树的构建方法大多数是基于合理的蛋白质或DNA序列之间距离的定义以及在距离之下作出一定的假设来提出的。本文针对DNA序列间的进化距离做一些探究和改进。在DNA序列的系统发育分析中,要计算出各DNA序列间的进化距离之前,必须进行DNA序列比对,因此本文就序列比对的相关概念和研究方法做了简单的介绍。系统发育分析最终是构建进化树,而构建进化树的方法主要有距离法、最大简约法和最大似然法三种,因此本文对这三种方法也做了简单介绍。在DNA序列中,核苷酸替代是基因进化的原动力,因此核苷酸替代数的估计是研究基因进化的基础,是测定DNA序列间进化距离的数学统计方法。但由于核苷酸替代模型有很多,如Jukes-Cantor模型、Kimura模型、Equal-input模型、Tamura模型、Tamura-Nei模型等。每个模型下又分别包含p距离、替代率为常数的距离d和替代率服从Г分布的Г距离dG。因此在构建进化树时,需要对这三种距离进行选择。本文在简单介绍各种核苷酸替代模型以及每个模型下的p距离、d距离和Г距离的同时,通过DNA序列的同源率,建立了DNA序列进化的动力学方程,进而得到了一种新的物种间进化距离dy (选择进化距离)。该距离包含了p距离、d距离和Г距离。进一步根据动力学方程的特点,将模型转化为一元线性回归问题,用最小二乘法求得选择模型中的动力学参数b和各核苷酸位点每年的平均替代速率r。最后,本文以16个物种的线粒体基因序列为例,来说明选择进化距离并通过构建不同进化距离下的基因进化树来对各进化距离进行比较。结果表明:选择进化距离dy是一种有效的构建进化距离的方法。

曹家树[10](2010)在《基于生物适应进化原理论证生物进化的动力》文中研究指明文章从现有主流生物进化理论存在的问题入手,以生物适应进化原理为认识基础,讨论生物进化的动力,以求对生物进化机制有一个新的认识。在薛定谔"生命赖负熵生存"观点的指导下,提出了"负熵流"包括能量流、物质流和信息流,以及负熵流是生命生存和发育的动力的观点。作者在原有生物适应进化原理基础上,修改完善并提出了"DNA、RNA和蛋白质在环境作用下的生物适应进化调控系统"理论,并根据系统发育是个体发育的"积分"的观点,推论得出生物与环境的负熵差引起的负熵流也是生命进化的动力,对生物进化机制作出了新的理解。基于这样的生物进化机制的认识,提出了"进化是一个子系统在其上一等级系统中,将自身全部或部分信息遗传给下一代子系统,并在其适应上一等级系统过程中,产生一些新质,终止一些旧质,从而在其上一等级系统中得以延续的变化过程"的概念,并探讨了一些与进化有关的其他争议问题。

二、基于相对熵原理构建生物进化系统树(论文开题报告)

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

三、基于相对熵原理构建生物进化系统树(论文提纲范文)

(1)基于物种特征的系统发生网络构建算法研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 研究背景与意义
    1.2 国内外研究现状
        1.2.1 系统发生树构建算法
        1.2.2 系统发生网络构建算法
    1.3 内容与结构
    1.4 本章小结
第二章 背景知识介绍
    2.1 簇
        2.1.1 基本概念
        2.1.2 ST集
    2.2 系统发生树
        2.2.1 基本概念
        2.2.2 系统发生树的距离计算
    2.3 系统发生网络
        2.3.1 基本概念
        2.3.2 系统发生网络的距离计算
        2.3.3 簇集与系统发生网络的关系
    2.4 本章小结
第三章 邻接法及Cass算法
    3.1 邻接法及其改进算法
        3.1.1 邻接法
        3.1.2 INJ算法
        3.1.3 邻接法的特点
    3.2 Cass算法及其改进算法
        3.2.1 Cass算法
        3.2.2 Lnetwork算法
        3.2.3 Cass算法的缺点
    3.3 本章小结
第四章 基于距离矩阵构建系统发生树算法
    4.1 ENJ算法
    4.2 算法比较与分析
    4.3 实验设计与讨论
        4.3.1 数据来源
        4.3.2对比实验
    4.4 本章小结
第五章 基于有跟系统树构建系统发生网络算法
    5.1 Frin算法
    5.2 比较与分析
        5.2.1 算法比较
        5.2.2 算法分析
    5.3 实验设计与讨论
        5.3.1 数据来源
        5.3.2输入数据顺序影响实验
        5.3.3网络复杂度对比实验
        5.3.4 禾本科植物上的应用
    5.4 本章小结
第六章 总结与展望
    6.1 总结部分
    6.2 展望部分
参考文献
攻读硕士学位期间发表的学术论文
致谢

(2)基于主路径的主题演化与关键节点分析(论文提纲范文)

摘要
Abstract
1 绪论
    1.1 研究背景和研究意义
        1.1.1 研究背景
        1.1.2 研究意义
    1.2 国内外研究现状综述
        1.2.1 主路径主题演化研究现状
        1.2.2 关键节点分析研究现状
    1.3 研究内容
    1.4 研究方法和创新点
        1.4.1 研究方法
        1.4.2 创新点
2 研究相关理论与方法
    2.1 引文网络
        2.1.1 引文网络相关概念
        2.1.2 主路径分析方法
    2.2 引文网络中节点重要性研究
3 基于主路径的主题演化分析
    3.1 主题演化链路方法构建
    3.2 研究对象和数据来源
        3.2.1 有机发光二极管(OLED)领域
        3.2.2 脱氧核糖核酸(DNA)领域
    3.3 主题演化的结果分析
        3.3.1 基于类别的主题演化结果分析
        3.3.2 基于文本分析的主题演化
    3.4 本章小结
4 基于主路径的节点重要性排序及重大转变识别
    4.1 主路径上的节点重要性分析
        4.1.1 概述
        4.1.2 节点重要性排序的链路方法
        4.1.3 研究对象和数据来源
        4.1.4 节点重要性的结果分析
    4.2 主路径上的重大转变节点识别
        4.2.1 概述
        4.2.2 重大转变节点识别方法
        4.2.3 研究对象和数据来源
        4.2.4 重大转变节点的结果分析
    4.3 本章小结
5 总结与展望
    5.1 总结
    5.2 展望
参考文献
攻读学位期间录用和发表的学术成果
致谢

(3)基于叶绿体基因组研究影响买麻藤类植物系统树重建的因素(论文提纲范文)

摘要
abstract
1 前言
    1.1 叶绿体基因组研究概况
        1.1.1 叶绿体基因组的基本结构
        1.1.2 叶绿体基因组的基因组成
        1.1.3 叶绿体基因组的进化
        1.1.4 叶绿体基因组的系统发育研究
    1.2 松柏类植物叶绿体基因组概述
    1.3 买麻藤类植物的研究进展
    1.4 基因树和基因树冲突
    1.5 系统发育关系的构建
        1.5.1 极大似然法
        1.5.2 最大简约法
        1.5.3 贝叶斯法
        1.5.4 邻接法
    1.6 本研究的意义
2 材料与方法
    2.1 叶绿体基因组全序列的获得及分析
        2.1.1 植物类群的选择和叶绿体基因组的获取
        2.1.2 叶绿体基因组的特征分析
    2.2 系统发育分析
        2.2.1 构建基因树与基因的选取
        2.2.2 基于不同分子性状重建系统树
3 结果与分析
    3.1 44种裸子植物叶绿体基因组特征分析
    3.2 四种方法构建的基因树的基因分类
    3.3 利用多基因联合数据集重建系统发育树
        3.3.1 ML法重建的买麻藤类系统发育树
        3.3.2 MP法重建的买麻藤类系统发育树
        3.3.3 BI法重建的买麻藤类系统发育树
        3.3.4 NJ法重建的买麻藤类系统发育树
4 讨论
    4.1 分析由不同构树方法筛选出的叶绿体基因
    4.2 建树方法和分子性状的选取对系统发育重建的影响
5 结论与展望
致谢
参考文献
附录

(4)基于线粒体基因组构建生物系统进化树(论文提纲范文)

摘要
Abstract
第一章 绪论
    1.1 研究现状和意义
    1.2 本文的主要工作
第二章 理论和方法
    2.1 序列分析方法简述
    2.2 新对称相对熵
        2.2.1 相对熵
        2.2.2 对称相对熵
        2.2.3 新对称相对熵
    2.3 离散增量
        2.3.1 离散量
        2.3.2 离散增量
    2.4 组合 K 联体
        2.4.1 组合 K 联体
        2.4.2 碱基关联和组合间距
    2.5 系统进化树
        2.5.1 系统进化树的概念
        2.5.2 系统进化树的构建方法
第三章 系统进化树的构建
    3.1 数据及数据库
        3.1.1 数据库简介
        3.1.2 26 种胎盘类哺乳动物线粒体基因数据库
        3.1.3 64 种脊椎动物线粒体基因数据库
    3.2 以新对称相对熵(NSRE)为距离函数的进化树的构建
        3.2.1 以序列 6-mer 分布的 NSRE 构建生物系统进化树
        3.2.2 以序列组合 6-mer 分布的 NSRE 构建生物系统进化树
        3.2.3 以序列组合 6-mer 和 6-mer 分布的 NSRE 构建生物系统进化树
    3.3 以离散增量(ID)为距离函数的进化树的构建
    3.4 结果分析
第四章 总结与展望
参考文献
附录
致谢
在读期间取得的研究成果

(5)聚类算法在生物分子进化领域的应用及改进(论文提纲范文)

致谢
摘要
Abstract
第1章 绪论
    1.1 课题研究的目的与意义
    1.2 国内外研究现状
        1.2.1 距离度量标准
        1.2.2 聚类算法
        1.2.3 进化树构建算法
    1.3 本文的主要研究工作
    1.4 文章结构
第2章 进化树构建方法
    2.1 引言
    2.2 基本概念介绍
    2.3 基于距离的进化树构建算法
        2.3.1 距离估计方法
        2.3.1.1 Jukes-Cantor 方法
        2.3.1.2 Kimura 方法
        2.3.1.3 Tajima 和 Nei 方法
        2.3.1.4 Tamura 方法
        2.3.2 距离建树法
        2.3.2.1 UPGMA
        2.3.2.2 最小二乘法
        2.3.2.3 最小进化法
        2.3.2.4 邻接法
    2.4 基于特征的进化树构建方法
        2.4.1 最大简约法
        2.4.1.1 最小变异数的估计
        2.4.1.2 最大简约树的搜索策略
        2.4.2 最大似然法
        2.4.2.1 似然值的估计
        2.4.2.2 最大似然树的搜索策略
    2.5 进化树构建方法的比较
    2.6 本章小结
第3章 距离建树方法的改进
    3.1 引言
    3.2 距离估计方法
        3.2.1 距离估计方法分析
        3.2.2 传统距离估计方法的改进
    3.3 进化树构建算法的改进
        3.3.1 进化树构建算法分析
        3.3.2 进化树构建距离估计方法的改进
        3.3.3 邻接法建树中贪心方法的改进
        3.3.3.1 贪心算法分析
        3.3.3.2 贪心算法的改进
    3.4 改进算法完整介绍
    3.5 序列实验及进化树评价
        3.5.1 序列构建进化树实验一
        3.5.2 序列构建进化树实验二
    3.6 本章总结
第4章 运用聚类和分类方法构建进化树
    4.1 引言
    4.2 结合 kmeans 聚类构建进化树
        4.2.1 研究思路
        4.2.2 序列比对计算 DNA 序列之间进化距离
        4.2.3 用聚类方法对 DNA 进化距离分类
        4.2.4 用 hoffman 算法生成进化树
        4.2.5 评价进化树
    4.3 基于层次聚类构建进化树
        4.3.1 研究思路
        4.3.2 序列比对计算生物进化距离
        4.3.3 层次聚类生成生物进化树
        4.3.4 对层次聚类生物进化树的评价
    4.4 两步聚类结合 bayes 方法构建进化树
        4.4.1 两步聚类方法对序列进行分类
        4.4.1.1 预聚类
        4.4.1.2 正式聚类
        4.4.1.3 聚类结果验证
        4.4.2 使用 Bayes 方法构建进化树
        4.4.3 对生成进化树的检验
    4.5 本章总结
第5章 总结与展望
    5.1 总结
    5.2 展望
攻读学位期间发表的学术论文以及参加的科研项目
参考文献

(6)核苷酸替换模型中若干问题的研究(论文提纲范文)

摘要
ABSTRACT
第一章 文献综述
    1.1 研究背景
    1.2 DNA 进化距离研究概况
        1.2.1 p 距离
        1.2.2 核苷酸替代数学模型和 d 距离
        1.2.3 距离
        1.2.4 选择进化距离
        1.2.5 不同距离测度的比较
第二章 核苷酸替换模型熵性质的研究
    2.1 引言
    2.2 DNA 序列的熵
    2.3 有限长 DNA 序列点突变的熵性质
        2.3.1 等输入模型下有限长 DNA 序列点突变的熵性质
        2.3.2 Tamura 模型下有限长 DNA 序列点突变的熵性质
    2.4 有限长 DNA 序列点突变熵性质的计算机模拟
    2.5 结论
第三章 转换颠换动力学模型及其应用
    3.1 转换颠换动力学模型介绍
    3.2 NM1 模型
    3.3 NM2 模型
    3.4 结论
第四章 无限制模型求解的探索
    4.1 方法介绍
    4.2 结论
第五章 结论
    5.1 结论
    5.2 讨论与展望
参考文献
附录
致谢
个人简介

(7)生物序列的分析方法及其进化模型研究(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 分子系统学与分子进化
    1.2 系统树及其构建
    1.3 序列分析方法
        1.3.1 比对分析方法
        1.3.2 非比对分析方法
    1.4 本文的主要工作
第二章 基于氨基酸疏水性的蛋白质序列分析方法及应用
    2.1 引言
    2.2 基于氨基酸特征序列的氨基酸序列分析
        2.2.1 蛋白质特征序列
        2.2.2 蛋白质氨基酸序列的图形表示
        2.2.3 氨基酸序列的数字特征
        2.2.4 相似性分析
        2.2.5 应用举例
    2.3 基于疏水性的氨基酸序列图形表示及相似性分析
        2.3.1 氨基酸序列的图形表示
        2.3.2 氨基酸序列的数字特征和相似性分析
        2.3.3 应用举例
    2.4 讨论
第三章 选择模型进化距离的提出及应用
    3.1 引言
    3.2 氨基酸序列的不同进化距离
        3.2.1 P 距离
        3.2.2 泊松校正距离
        3.2.3 Γ距离
    3.3 选择进化距离
        3.3.1 氨基酸进化模型及选择进化距离
        3.3.2 选择进化距离的性质
        3.3.3 参数估计及检验
    3.4 应用举例
        3.4.1 选择进化距离的估计及进化树的构建
        3.4.2 不同进化距离的比较分析
    3.5 讨论
第四章 基于 DNA 单、双碱基距离分布的 DNA 序列的非比对分析方法及应用
    4.1 引言
    4.2 DNA 序列单个碱基的距离分布及数字特征
    4.3 DNA 序列的双碱基的距离分布及数字特征
    4.4 线粒体基因组序列中的应用
        4.4.1 线粒体基因组序列的单碱基分析
        4.4.2 线粒体基因组的双碱基分析
    4.5 讨论
第五章 核苷酸序列的转换-颠换进化动力学模型及其分析
    5.1 引言
    5.2 核苷酸替代进化模型
    5.3 核苷酸替代模型下的 O 、 P 和 Q 及 p 距离的理论表达式
    5.4 核苷酸替代进化模型下的 DNA 进化距离分析
    5.5 不同核苷酸替代进化模型的研究结果
    5.6 模型(1)~(5)的 P Q进化模型及其分析
        5.6.1 模型(1)~(5)的 P Q进化模型
        5.6.2 模型(1)~(4)中核苷酸替代速率与 P 、 Q 替代速率间的关系
        5.6.3 Tamura-Nei 模型中核苷酸替代速率与其P_1 , P_2 ,Q 替代速率间的关系
    5.7 讨论
第六章 结论
参考文献
致谢
作者简介

(8)基于本体信息论的生命演化规律(论文提纲范文)

摘要
ABSTRACT
第一章 绪论
    1.1 神创论
    1.2 活力论
    1.3 机械论生命观
        1.3.1 古典机械论生命观
        1.3.2 近现代机械论生命观
        1.3.3 基因生命观
    1.4 整体有机论生命观
    1.5 进化论中生命认识的进展
        1.5.1 进化理论的认识
        1.5.2 进化的概念及模型
    1.6 现存的问题及本文的思路
第二章 生命演化的新理论模型的建立
    2.1 信息论意义下世界新图景(模式)
    2.2 生命系统是世界模式之一
    2.3 生命是涌现模式的信息过程
    2.4 信息论科学框架下生命系统演化模型
        2.4.1 生物信息熵
        2.4.2 生命系统演化法则—最大流原理(MFP)
        2.4.3 生命系统的势函数
        2.4.4 生命系统的演化的动力学方程
    2.5 生命系统中的ξ场及信息力的本质
    2.6 本章总结
第三章 生命系统进化新理论的量化过程
    3.1 基于新的生命实在的生命系统进化的实质
    3.2 生物进化模型的量化分析
    3.3 蛋白质分形维数和ξ的重构过程
    3.4 新进化理论与达尔文进化论的比较
    3.5 本章结语
第四章 系统生物学的新模型及其具体运用
    4.1 系统生物学新模型及其模拟方法
    4.2 应用案例1:微生物生态系统案例的模拟
    4.3 应用案例2:太湖秀丽白虾不同生长阶段的消化酶活性的研究
    4.4 案例运用的意义
    4.5 结语
第五章 生命相关问题的探索
    5.1 时空观的变革
        5.1.1 近代科学时空观的回顾
        5.1.2 近现代科学时空观困境的实质
        5.1.3 基于MFP 框架的新时空的变革及特点
        5.1.4 新时空的本质
        5.1.5 新时空与文明史的变革
        5.1.6 时空的全息性、普遍性、非独立性、灵活性和多样性
    5.2 宇宙演化新图景及新时空观下的科学范式的转变
    5.3 宇宙、物质、意识的起源问题
        5.3.1 宇宙的起源
        5.3.2 物质、意识的起源
    5.4 整个科学的统一
    5.5 新时空的启示
    5.6 本章结语
第六章 理论的学术意义及应用方法
    6.1 理论的学术意义讨论
    6.2 在描述世界万象方面的具体应用
    6.3 应用的一般方法
    6.4 本章结语
第七章 结论与展望
    7.1 本文的主要结论
    7.2 展望:螺旋的宇宙
参考文献
发表论文和参加科研情况说明
致谢

(9)DNA序列选择进化距离及其在系统发育分析中的应用(论文提纲范文)

摘要
ABSTRACT
第一章 文献综述
    1.1 研究背景
    1.2 序列比对算法
    1.3 DNA 序列进化距离研究概况
        1.3.1 p 距离
        1.3.2 核苷酸替代的数学模型及进化距离d
        1.3.2.1 Jukes-Cantor 模型及其进化距离
        1.3.2.2 Kimura 双参数模型及其进化距离
        1.3.2.3 Equal-input 模型及其进化距离
        1.3.2.4 Tamura 模型及其进化距离
        1.3.2.5 Tamura-Nei 模型及其进化距离
        1.3.3 Γ距离
        1.3.4 基于非序列比对的进化距离
    1.4 系统进化树
第二章 DNA 序列选择进化距离及其应用
    2.1 选择模型的主要思想
    2.2 选择模型在不同核苷酸替代模型下的应用
        2.2.1 Jukes-Cantor 模型的选择进化距离dJ-C (y)
        2.2.2 Kimura 双参数模型的选择进化距离dK (y)
        2.2.3 Equal-input 模型的选择进化距离dE (y)
        2.2.4 Tamura 模型的选择进化距离dT (y)
        2.2.5 Tamura-Nei 模型的选择进化距离dT -N(y)
    2.3 动力学参数b 的性质
    2.4 b 的估计与应用举例
        2.4.1 b 的估计
        2.4.2 应用举例
        2.4.3 各种进化距离的比较
第三章 结论与讨论
    3.1 结论
    3.2 讨论
参考文献
附录
致谢
作者简介

(10)基于生物适应进化原理论证生物进化的动力(论文提纲范文)

1 对主流生物进化学说的理解
2 负熵流与生命的生存与发育
3 负熵流是生物进化的动力

四、基于相对熵原理构建生物进化系统树(论文参考文献)

  • [1]基于物种特征的系统发生网络构建算法研究[D]. 红艳. 内蒙古大学, 2020(01)
  • [2]基于主路径的主题演化与关键节点分析[D]. 闫肖婷. 华中师范大学, 2019(01)
  • [3]基于叶绿体基因组研究影响买麻藤类植物系统树重建的因素[D]. 任和月. 华南农业大学, 2018(08)
  • [4]基于线粒体基因组构建生物系统进化树[D]. 李玲. 内蒙古工业大学, 2014(04)
  • [5]聚类算法在生物分子进化领域的应用及改进[D]. 李国宝. 南京林业大学, 2014(04)
  • [6]核苷酸替换模型中若干问题的研究[D]. 郭子湖. 西北农林科技大学, 2013(02)
  • [7]生物序列的分析方法及其进化模型研究[D]. 解小莉. 西北农林科技大学, 2012(11)
  • [8]基于本体信息论的生命演化规律[D]. 蒋田田. 天津大学, 2012(08)
  • [9]DNA序列选择进化距离及其在系统发育分析中的应用[D]. 梁丽萍. 西北农林科技大学, 2011(04)
  • [10]基于生物适应进化原理论证生物进化的动力[J]. 曹家树. 遗传, 2010(08)

标签:;  ;  ;  ;  ;  

基于相对熵原理的生物进化系统树构建
下载Doc文档

猜你喜欢