数据挖掘在医学上的应用

时间:2024-01-20 点赞:45135 浏览:87015 作者原创标记本站原创

本文是一篇数据库论文范文,数据库类有关毕业论文格式,关于数据挖掘在医学上的应用相关开题报告范文。适合数据库及生物医学及数据方面的的大学硕士和本科毕业论文以及数据库相关开题报告范文和职称论文写作参考文献资料下载。

【摘 要】医学数据挖掘是一门涉及面广、技术难度大的新兴交叉学科.本文在阐述医学数据特点的基础上,初步探讨了医学数据挖掘的一般过程,并讨论了其在医学方方面面中的应用.最后,文章简要介绍了医学数据挖掘现状及未来前景.


【关 键 词】医学数据挖掘,挖掘特点,挖掘过程,应用现状

1.引言

在临床研究中,随着近年来大型医院信息管理系统的发展,有关病人和疾病的电子格式的数据日益增多,通过临床日常工作和各项检查数据进行的数据采掘研究也逐年增加.有人应用数据采掘技术在心电图中寻找并且定位心肌梗塞的关键指征,还有人应用大型的数据采掘软件(如DMSS软件,DataMiningSurveillanceSystem)对ICU病房的微生物学数据进行分析,发现感染和抗药性模式上的变化,还有人对医院感染和卫生检测数据进行数据采掘研究.由于基因组学的革命产生了大量的电子格式的生物信息学信息.人们将信息学的研究方法引进生物学的研究中,产生了新的学科-生物信息学(Bioinformatics).数据采掘也成为在大量的生物信息学术举重发现知识的重要工具.通过WWW可以进入公共数据库(如GenBank、EMBL)获取公开的测序数据,这些数据中蕴含着大量的未知的信息,对它们进行数据采掘会得出丰硕的成果.如Zweiger等提出可以对基因组数据中的基因表达微列阵进行挖掘以发现新的知识.有人还开发出领域服务器直接从BLAST检索中测定蛋白质的同源性.Whisstock等通过在基因组序列中采掘确认与已知的蛋白质家族的远距离同源蛋白.Grelle等尝试在基因和蛋白质中寻找其选择性表达.因此,掌握医学数据挖掘的能力越来越成为开展基础医学和临床医学等医学课题的先决条件.

2.医学数据的特点

挖掘医学数据库跟挖掘其它类型的数据库相比,具有其自身的独特性.医学数据首先是以治愈患者为目的而搜集的,其次才是用于医学研究的资源.医学数据具有如下特点.

2.1医学数据的隐私性

医学数据不可避免地涉及到患者的一些隐私信息,当这些隐私信息使患者在日常生活中遭遇到不可预料的侵扰时,就产生了隐私性问题.隐私性不同于安全性和机密性,当未被授权的个人或机构设法取得这些隐私信息时,就产生了安全性问题,当拥有隐私信息的研究人员与未经授权的个人或机构共享这些患者信息时,就暴露出了机密性问题.医学数据挖掘者有义务和职责在保护患者隐私的基础上进行科学研究,并且确保这些医学数据的安全性和机密性.

2.2医学数据的多样性

由于医学数据是从医学影像、实验数据以及医生与病人的交流中获得的,所以原始的医学数据具有多种形式.医学数据包括影像(如SPECT)、信号(如ECG)、纯数据(如体征参数化验结果)、文字(如病人的身份记录、症状描述、检测和诊断结果的文字表述)等.医学数据的多样性是它区别于其它领域数据的最显著特征.

2.3医学数据的不完整性

医学数据的搜集和处理过程经常相互脱节,搜集是以治愈患者为直接目的,而处理是以寻找某种疾病的一般规律为目的,因此搜集的信息可能无法涵盖研究需要的所有信息.此外,人为因素也可能导致据记录的偏差和残缺,许多医学数据的表达、记录本身也具有不确定和模糊性.病例和病案的有限性使医学数据库不可能对任何一种疾病信息都能全面地反映.

2.4医学数据的冗余性

医学数据库是一个庞大的数据资源,每天都会有大量的记录存储到数据库中,其中可能会包含重复的、无关紧要的、甚至是相互矛盾的记录.例如,对同一疾病,病人所表现的症状、化验结果和治疗措施都可能相同.此外,医学数据还具有时间性特征,医学检测的信号如ECG、影像SPECT都是时间函数,具有较强的时效性.

3.数据挖掘的过程

数据挖掘的过程一般由三个主要的阶段构成:数据准备、开采操作、结果表达和解释,对知识的发现可以描述为这三个阶段的反复过程.

3.1准备数据

这个阶段又可进一步分成三个子步骤:数据集成、数据选择、数据预处理.数据集成将多文件和多数据库运行环境中的数据进行组合,解决语义模糊性,处理数据中的遗漏和清洗无效数据等.数据选择的目的是辨别出需要分析的数据集合,缩小处理范围,提高数据挖掘的质量.预处理是为了克服目前数据挖掘工具的局限性.

3.2数据挖掘

这个阶段进行实际性分析工作,包括的要点是:先决定如何产生假设,是让数据挖掘系统为用户产生假设,还是用户自己对数据库中可能包含的知识提出假设,前一种称为发现型的数据挖掘,后一种称为验证型的数据挖掘.再选择合适的工具进行发掘知识的操作,最后进行证实.

3.3结果表述和解释

根据用户的需求对提取的信息进行分析,挑选出有效信息,并且通过决策支持工具进行移交.因此,这一步骤的任务不仅是把结果表达出来(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过此,这一步骤的任务不仅是把结果表达出(例如采用信息可视化方法),还要对信息进行过滤处理,如果不能令用户满意,需要重复以上数据挖掘的过程.

4.数据挖掘的应用

在基础医学领域,数据采掘研究在药学和病理学的研究和开发中有广阔的应用前景,并取得了较为突出的成果.如利用趋势分析筛选药物,将某种药物在一定时期内的反应收集起来加以分析.在大型化学数据库中自动寻找药效基团,利用神经网络技术对世界卫生组织的药物副作用数据库的二百万条报告进行数据采掘,发现药物间相互作用.

在病理学研究中,有人提出采用数据发掘技术对显微标本中获得的大量数据(如计数、大小、形状特点、生理学评估、质地等分析数据)进行分析,总结出其中的关键性指标,还可以对大分子及其化合物的电子显微镜三维致密重建图形进行数据采掘分析.在基因学研究中,通过WWW可以进入公共数据库(如GenBank、EMBL)获取公开的测序数据,这些数据中蕴含着大量的未知的信息,对它们进行数据采掘会得出丰硕的成果.如Zweiger等提出可以对基因组数据中的基因表达微列阵进行挖掘以发现新的知识.有人还开发出领域服务器直接从BLAST检索中测定蛋白质的同源性.Whisstock等通过在基因组序列中采掘确认与已知的蛋白质家族的远距离同源蛋白.Grelle等尝试在基因和蛋白质中寻找其选择性表达.

5.数据挖掘的现状

生物医学数据库是一个复杂数据库,包括电子病历、医学影像、病理参数、化验结果等.目前数据挖掘技术主要应用于以结构化数据为主的关系数据库、事务数据库和数据仓库,对复杂类型数据的挖掘尚在起步阶段.造成这种局面的可能原因有:挖掘结果的可理解性欠佳,挖掘结果数量过大,难以处置:挖掘方法在实际应用中与用户的交互作用不理想等.数据挖掘在经过多年的发展之后已经形成相对成的技术体系,特别是在数据挖掘设计、数据抽取以及联机分析处理技术等方面都取得了令人满意的进展,为数据挖掘的应用奠定了技术基础.随着数据挖掘技术的广泛应用和各种挖掘算法的不断改进完善,结合生物医学信息自身的特殊性和复杂性,处理好挖掘过程中的关键技术,使数据挖掘技术在处理生物医学资料中的功能日益强大.数据挖掘技术在生物医学研究、医疗卫生管理与决策中的应用范围也会越来越广,并带来可观的经济和社会效益.

综上所述,可以预见数据采掘技术在医学领域中具有广阔的应用前景,随着大型数据库和网络技术的普及应用,必将有大量的电子格式的数据在国内的各行各业、尤其是医疗部门中出现,信息专业的研究与开发人员应当抓住机遇,做好技术上的准备,迎接挑战.

相关论文

临床医学中数据挖掘技术的运用

此文是一篇临床医学论文范文,临床医学有关论文范文,与临床医学中数据挖掘技术的运用相关毕业论文参考文献格式。适合不知如何写临床医学及数。

数据挖掘其在医学方面的应用

本文是一篇数据库论文范文,数据库相关毕业论文范文,关于数据挖掘其在医学方面的应用相关毕业论文范文。适合数据库及统计学及计算机方面的的。

基于数据挖掘的会计管理与

本论文为会计管理有关本科毕业论文会计学,关于基于数据挖掘的会计管理与相关毕业论文开题报告范文,可用于会计管理论文写作研究的大学硕士。

用户关系管理中数据挖掘技术的应用

本论文为关于数据库毕业论文格式范文,关于用户关系管理中数据挖掘技术的应用相关毕业论文,可用于数据库论文写作研究的大学硕士与本科毕业。

基于Web的数据挖掘其应用

本论文是一篇关于电子商务相关大专电子商务毕业论文,关于基于Web的数据挖掘其应用相关大学毕业论文范文。免费优秀的关于电子商务及网络教育。