自组织竞争网络在患者癌症发病预测中的应用文献综述

 2022-07-15 08:07

自组织竞争神经网络在患者癌症发病中的应用文献 综述

前言:

在过去的几十年里, 癌症研究正日趋成熟。基因表达谱数据的利用是癌症预测研究的热点之一。基因表达谱的数据分析在很大程度上促进了癌症的诊断和治疗, 准确确诊和预测癌症是目前医生最重要、最紧迫的任务之一。

随着高通量测序技术的快速发展, 从基因组到表型, 基因组各个层次的多分子水平数据, 特别是基因表达谱数据越来越丰富。对于日渐增多的大型生物信息数据, 机器学习方法也因此获得青睐与应用。随着近年来计算机辅助技术的飞速发展, 机器学习方法在癌症诊断中的应用越来越重要。

正文:

在生物信息学领域,癌症的分类预测已成为一个重要课题,它能克服形态学诊断和影像学诊断存在的诸多缺陷,对癌症患者实现早期精确诊断具有重大的研究价值。

在过去的十余年间,越来越多的学者以及科学家开始采用肿瘤细胞的基因表达谱数据进行模式识别,并多取得了较好的成果。Furey[[1]]提出了利用支持向量机(Support vector machine)来对肿瘤组织样本进行分类验证,结果表明, 此方法对组织和细胞类型的分类是有效的。Listgarten[[2]]使用了乳腺癌数据集, 使用决策树、朴素贝叶斯、SVMs等模型,结果发现SVMs的效果为最佳。侯艳[[3]]等人在研究基于随机森林(RF)回归估计因果关系是,将此方法用于卵巢癌基因表达谱数据,并对分析结果进行验证,发现该方法明显优于贝叶斯网络方法。梁炉方[[4]]将支持向量机、随机森林和多元统计的向后剔除法结合起来对结肠癌基因表达数据进行分析,并得到了较好的准确率。Chen[[5]]对四家医院的癌症患者数据进行了跨实验室验证,其分析了多个数据集在肺癌诊断中的预后应用,构建了多种不同的ANN结构,结果表明该方法可以有效预测癌症患者的生存分类,总体准确率达到了83.0%。

随着近几年深度学习的发展,很多科学家也正在尝试构建更加复杂的网络结构进行实验,这些网络模型具有更高的学习性能以及调节能力,但是其有一个缺点,就是加大了模型的复杂程度,学习过程中需要一层层不断向前传播和反向调节,尤其是当数据维度较大时,模型参数体积将几何式地增长,拖慢了运行速度,并且训练结果不佳。

上述这些诊断方法大多是监督学习方法。但是在生物信息学中, 获取标签数据是昂贵的, 现有的数据常常是不充分的。TCGA数据库已经是世界上最大的数据库之一, 很多疾病仍然缺乏标记数据。例如, MESO只有86个样本, KICH也仅有89个样本。而非监督学习非常适合标签稀疏的场景。[[6]]

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。