第二代高通量测序数据的差异基因表达分析研究文献综述

 2022-07-15 05:07

  1. 研究背景及意义

自人类诞生之日起,从人类开始有了系统的思维意识起,人类对于生命奥秘的探索就从未停止过。20世纪是一个科学技术飞速发展的世纪,物理化学的发展使我们可以更加清楚地认识世界的物质组成,从分子、原子、质子、电子、夸克从外向内更加深刻地了解微观世界;可望而不可即的浩瀚星空曾激起多少人无穷的想象,而航空航天技术的发展让我们得以探索地球以外的世界;信息技术的发展深刻改变人们的工作、生活方式,促使人们的思想观念发生变化,促进科技进步,加速产业的变革,信息技术的广泛应用促进了人们的工作效率和生活质量的提高,让人们得以足不出户尽知天下事,人不离家照样能办事。生物科学在20世纪同样得到了发展,细胞学、遗传学、分子生物学等学科的发展使我们已经从组织、器官、细胞、生物大分子等各个层次认识了生命的物质基础。生物与其它物质有着本质的区别,生命并非是简单的物质堆积,生物体的生长发育是生命信息控制之下的复杂而有序的过程。目前,我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。既然牵涉的信息的组织、传递和表达,我们未尝不可用信息科学的方法和技术来分析和认识生命信息呢?[1]

在自然科学还没有发展的古代,人们对生物的五光十色、绚丽多彩迷惑不解,他们往往把生命和无生命看成是截然不同、没有联系的两个领域,认为生命不服从无生命物质的运动规律。不少人还将各种生命现象归结为一种非物质的力,即“活力”的作用。这些无根据的臆测,随着生物学的发展而逐渐被抛弃,在现代生物学中已经没有立足之地了。20世纪特别是40年代,生物学吸收了数学、物理学和化学等的成就,逐渐发展成一门精确的、定量的、深入到分子层次的科学,人们已经认识到生命是物质的一种运动形态。传统的生物学是一门实验科学,生物学研究依赖于实验数据的处理和分析。生物学也是一门发现科学,通过实验发现新的现象、新的生物学规律,经过分析和归纳总结,提炼出新的生物学知识。在这个过程中,需要对实验数据进行处理和理论分析,在此基础上解释实验现象,认识实验现象发展的本质,探索固有的生物学规律,进而了解和掌握生命的物质基础和生命的本质。随着生物科学和技术的迅速发展,生物数据积累速度不断加快,因此也就对生物数据的科学分析方法和使用分析工具提出了更新、更高的要求。

生物信息学是在生命科学的研究中,以计算机为工具对生物信息进行储存、检索和分析的科学。它是当今生命科学和自然科学的重大前沿领域之一,同时也将是21世纪自然科学的核心领域之一。其研究重点主要体现在基因组学和蛋白质组学两方面,具体说就是从核酸和蛋白质序列出发,分析序列的结构功能的生物信息[2]

DNA是物质遗传的基础,通过复制把遗传信息由亲代传递给子代。DNA长链以右旋方式相互缠绕成螺旋结构,双链上的碱基通过氢键相互吸引。脱氧核苷酸是DNA的基本结构和功能单位,决定生物多样性的就是脱氧核苷酸中的四种碱基:腺嘌呤(adenine,缩写为A)、胸腺嘧啶(thymine,缩写为T)、胞嘧啶(cytosine,简写为C)和鸟嘌呤(guanine,序偶写为G)。碱基之间通过互补性配对相连,嘌呤和嘧啶之间会形成氢键,在通常情况下,A只与T相连,C只与G相连,从而形成互补的碱基对,而遗传信息通过碱基排列顺序的方式贮藏在DNA分子中[3]。带有遗传信息的DNA片段被称为基因,包含着合成各种功能蛋白质和酶的编码信息,因此,基因与DNA是完全不同的两个概念。而其他的DNA序列,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。组成简单生命最少要265到350个基因。

在细胞的生命活动中,把基因中的遗传信息经过转录和翻译,指导合成具有生物活性的蛋白质分子的传递过程称为基因表达。基因表达的作用是通过基因中的编码信息来控制蛋白质的合成。转录使遗传信息从DNA流向RNA。在真核生物中,基因有外显子和内含子交替排列构成,其中外显子是具有编码功能的遗传信息,能够在合成过程中被翻译成蛋白质,而内含子对蛋白质合成是没有意义的。因此,在转录之后,基因中的外显子和内含子在一条原始转录物RNA分子中,被称为mRNA前体(pre-RNA),又称核内异质RNA。因此mRNA分子既有外显子序列又有内含子序列,另外还包括编码区前面及后面非翻译序列。由于内含子不含有编码功能,这些内含子必须除去而把外显子序列连接起来,才能产生成熟的有功能的mRNA分子,这个过程被称为RNA剪接。在真核生物中,选择性剪接是普遍存在的。选择性剪接(也叫可变剪接)是指从一个mRNA前体中通过不同的剪接方式(选择不同的剪接位组合)产生不同的mRNA剪接异构体的过程。若选择性剪接产生的mRNA编码框不同,则(1)可在同一细胞中产生多种蛋白质。(2)在不同细胞中通过不同的剪接方式,表现出组织特异性。(3)在不同发育时期或不同条件下采取不同剪接方式,表达不同的蛋白质。这也揭示了为何在人类基因组中,大约有20000~25000个可编码蛋白质的基因,却能产生超过90000种蛋白质。

研究表明,非正常的选择性剪接事件会导致基因的调控关系遭到破坏或打断,使得mRNA表达异常,从而导致各种遗传疾病和肿瘤,比如人类强直性肌营养不良,视网膜色素变性和帕金氏综合征等疾病,因此研究剪接异构体成了迫在眉睫的需求。生物学家希望进一步探索基因与蛋白质之间的调控关系,研究蛋白质的产生到底是由哪个剪接异构体来决定的,使得科学家对疾病有更加本质的了解,从而帮助医生对疾病进行早期预防、诊断和治疗。

  1. 国内外研究概况

目前用于筛选差异基因的常用方法有如下几种:DD-PCR、GENE-FISHING、GENE CHIP、高通量测序等,简单介绍如下:

DDRT-PCR技术即mRNA差异显示聚合酶链式反应技术,此技术是以PCR技术和聚丙烯凝胶电泳技术为基础,结合银染或放射性自显影等显色技术,能快速有效地鉴定并克隆两个或多个平行材料之间的差异表达基因。DDRT-PCR技术的基本过程如下:

(1)提取两组平行材料中的总RNA或mRNA

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。