开题报告内容:(包括拟研究或解决的问题、采用的研究手段及文献综述,不少于2000字)
1.选题的目的和意义:
如今,信息化程度已不同以往。每天都会产生数万以PB计量的数据,大数据的出现是必然的趋势,医药行业也不例外。然而,医药行业依然存在许多等待解决的问题:如“看病难,买药贵”、医疗资源分布不合理、以药养医等。今天,医药学信息呈爆炸式增长,大数据在医药领域的应用显得尤为重要。这些信息大部分来源于电子病历记录、医学图像、临床诊疗记录等。在这些分散在各地、结构多样的众多数据中,如何挖掘出有价值的数据进行分析并且加以利用成为了一个重要的命题。只有充分利用隐藏其中的珍贵信息及数据间的相关性,才能够实现临床科研水平、医药研发、疾病诊疗、公共卫生健康管理等各方面水平的提高。研究大数据在医药领域的应用,是为了从疾病预防、疾病诊治、疾病检测各个方面改善患者的就医体验和减轻医护人员的工作负担,缓解医疗资源有限的难题。同时,大数据技术的出现也使得医疗软件设计人员更好的挖掘数据,提高数据的利用率,减少数据存储不安全的现象。通过挖掘潜在的医学信息发现特定患者与特定疾病的相关性,找出治疗靶点,研究出适合患者的最好治疗药物和方法,最终实现“精准医疗”。真正激发出医药行业巨大的潜力,挖掘出其丰厚的经济效益和深远的社会效益。
2.国内外研究现状
国内的研究现状:
自我国原卫生部出台《全国卫生信息化发展规划纲要》以来,“医疗大数据”俨然成为了医疗信息化的重要方向。有越来越多的实践探索朝这个目标前进。中南大学已与移动公司合作,负责开展“移动医疗”相关应用的原型系统设计开发。除此以外,理论探索也在持续进行。高汉松等结合云计算提出一种基于Hadoop的医疗云数据挖掘平台架构,详细阐述其基础层、平台层、功能层以及业务层等各层功能。
我国的医疗信息化还处在初始发展阶段,更多的工作都是围绕着电子病历系统、临床应用系统展开。然而,我国医药服务单位还没有建立起具备一定影响力的大数据环境。其中一大阻力就是来源于数据的收集。患者在多处就医的情况下,不仅会使数据的采集变得冗余复杂,更会使数据失去了准确度,数据的前后不一致给之后的数据分析工作带来了极大的困难。其次,数据过于分散,有些医院和生产商出于利益等各种原因不便将数据共享,这些都使得数据收集的工作不能顺利的进行。目前只有一小部分企业单位开展了医药类客户关系数据库的研究,数据库规模较小,很难产生规模效应。
国外的研究现状:
大数据与医药的结合也是国外许多国家关心的重点,围绕着这个中心展开了许多的研究工作,得到了一些初步的成果。谷歌公司开发了“谷歌流感趋势”系统来预测流行病,该系统成功的预测了甲型H1N1流感在美国境内的传播。Predilytics公司运用大数据、机器学习技术来分析医保领域透明、公正和业务驱动的结果,相对于传统的统计/回归模型,其提供的异常预测模型的分析深度要高出1-3倍,与此同时,理论探索的工作也在积极进行。Lin C等提出一种迅速处理、存储、探索、分析大型医疗数据的综合方法。Don S等描述医疗网络物理系统(MCPS)大数据处理框架的初始工作,该框架结合了卫生保健系统以及网络方面的动态配置和完全弹性决策功能。
由于目前的大数据研究目前处于起始阶段,还有许多难题等待克服。
