疾病相关LncRNA发现研究-信息分析文献综述

 2022-12-02 08:12

一、选题依据

长链非编码RNA(Long non-coding RNA, lncRNA)是一类本身不编码蛋白、转录本长度超过200nt的长链非编码RNA分子。近年来的研究表明,lncRNA会广泛参与到染色体沉默、基因组印记、染色质修饰、转录激活、转录干扰、核内运输等多种重要的调控过程,涉及表观遗传学调控、转录调控、转录后调控等多种层次。此外,随着深度核糖体测序(Ribo-Seq)技术的发展,越来越多的研究发现部分lncRNA也具有编码多肽的能力,这类多肽通常不到100个氨基酸,被称为微肽(Micropeptide)。部分微肽被证明与肌肉功能、胚胎发育以及癌症等生理与病理过程相关。LncRNA是目前细胞生物学领域的热点方向,十分具有潜力。

生物信息学分析作为基础科研的必要组成部分,承担了从复杂数据中分析归纳重点信息,发掘数据的相关性以及预测机制和功能的重要责任。因此,从生物学信息分析角度对lncRNA序列的预测、序列特征挖掘及其在疾病发展过程中的作用进行发现研究是至关重要的。本课题通过分析样品基因的测序结果,对数据进行生物信息学分析,包括GO分析、KEGG分析、Pathway分析等,并作差异基因火山图、PPI网络分析图等,以期发现全新的lncRNA并进行功能验证,为后续的深入研究提供思路和基础。

二、研究方法

1、测序数据预处理:对测序数据质量评估,预处理及均一化处理。

2、差异表达lncRNA及mRNA的筛选:应用倍数法、多重假设检验等手段,对两条件或多条件下的表达差异的lncRNA和mRNA分别进行计算和筛选,并绘制基因差异火山图和聚类图。

表达模式聚类分析:针对结果进行样本及差异表达lncRNA和mRNA的聚类,寻找属于同一表达趋势的基因。

GO、KEGG和pathway显著性富集分析:对差异基因应用数据库进行功能富集分析,挖掘具有统计学意义的差异表达基因的功能类别和细胞通路。

LncRNA编码能力预测:对进行研究的lncRNA进行蛋白编码能力预测,通过数据库查找其是否具有smORF和编码能力。

LncRNA功能预测:根据lncRNA是否编码微肽的结果,采用不同方法。若lncRNA直接行使功能,则筛选出表达显著相关的lncRNA-mRNA关系对,利用成熟的mRNA的功能来推导lncRNA的功能。若翻译出的微肽行使功能,则对微肽进行进一步研究。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。