医院数据仓库系统是数据仓库技术在医学领域的具体实现,其用户主要是医院的医生、护士和管理人员,是对临床数据的开发与利用。医院数据仓库系统的建立对于医院管理、临床治疗和医学研究等相关领域都有着巨大的推动力。
在线联机分析
在线联机分析(OLAP)应用是在数据仓库技术的基础之上利用数据分析技术对数据进行不同维度的切片处理分析,可得到医院经营情况、收益、投资和汇报等医院绩效评估依据。利用业界标准的具有商业应用价值的统计算法对跨越整个医院的数据进行统计分析,形成对医院现状的统计特征,从而使高层管理者能够从更宏观的角度把握医院的经营状况。如现有资源使用情况统计分析、现有服务情况统计分析、供应商/合作伙伴给医院带来的利润统计分析以及医护人员的作业情况比较等。从功能上讲,经营分析应用涵盖病人账户情况分析、业务发展分析、收益情况分析、市场竞争分析、服务质量分析、营销管理分析、大客户分析、新业务与现有业务分析、合作服务方分析等方面的主题。
OALP应用的主要效益体现在:①通过汇集医院内外的数据,以及合理运用智能分析工具,使医院决策层、管理层能更方便、更及时地获取关键的管理和业务信息;②利用信息挖掘商业价值,辅助决策层对企业的全面监控;③通过对内外部数据的分析和利用,为战略制订、业务拓展、自主定价和运营体系的改善提供决策支持。
目前数据仓库在医学领域的应用主要集中在以下几个方面:
1. 疾病辅助诊断 采用数据仓库和数据挖掘技术对病人资料数据库中大量历史数据进行处理,挖掘出有价值的诊断关联规则,这样根据病人的年龄、性别、辅助检查结果和生理生化指标等就可以作出诊断结论,从而排除了人为因素的干扰,具有较强的客观性。
2. 疾病辅助治疗 建立医学专病的临床治疗方案数据仓库,将各种治疗方案所有病例的检查指标、诊断和治疗过程以及疗效进行存储与分析,在积累到一定病例后,就有可能对治疗方案的各种影响因素进行评估,有利于改进治疗方案。
3. 药品管理 将各种药品的数据进行整理,对其成分、用法、主治和副作用等信息进行处理,建立统一的药品管理数据仓库,对于各种药物的利用和研究都有很大的意义。
4. 药品开发 在新药的研究开发中,采用数据仓库和数据挖掘技术,在关键环节先导化合物的发掘方面寻找同药效学相关的有效化学物质基础,确定药效基团,指导新药的研究与开发,从而缩短新药的研究开发周期。降低研发费用。
数据挖掘与数据分析
随着信息技术的高速发展,各个领域所积累的数据呈指数级增长,数据的丰富带来了对强有力的数据分析工具的需求。如何从信息的汪洋大海中自动并高效地提取所需的有用知识,提高信息利用率,成为迫切需要解决的问题。如何将底层的数据转变成一种知识就需新的方法来处理这些海量的数据。于是人们结合统计学、数据库和机器学习等技术,提出数据挖掘技术来解决这一难题。
数据仓库和数据挖掘都是决策支持技术,但两者的辅助决策方式不同。数据仓库是在数据库的基础上发展起来的,它将传统数据库中大量的、详细的和不同格式的数据按照决策需求进行集成和重新组织,从而可以为不同需求的用户提供统一的数据源。数据挖掘是通过知识的关联,挖掘现有数据中隐含的信息,给用户提供更为深入和丰富的信息,可以让用户在决策分析中使用。
数据挖掘于1989年第11届国际联合人工智能学术会议上首次提出,其又称知识抽取(information extraction)、信息发现(information discovery)、知识发现(knowledge discovery)、智能数据分析(intelli-gent data analysis)、信息收获(information harvesting)等。在人工智能领域习惯称之为知识发现(knowledge discovery in database,KDD)。
1. 数据挖掘的定义 数据挖掘就是从大量的、不完全的、有噪声的、模糊的和随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的并且最终可理解的信息和知识的过程。这个定义包括几层含义:①数据源必须是真实的、大量的和含噪声的;②发现的是用户感兴趣的知识;③发现的知识要可接受、可理解和可运用;④发现的知识支持特定的被发现的问题。它涉及多学科的集成,包括数据库技术、统计、机器学习、高性能算法和模式识别等诸多内容。
2. 数据挖掘的功能 数据挖掘的功能主要由两部分组成:描述型(descriptive)和预测型(predic-tive)。描述型的任务是指描述数据库中数据的某些特性。预测型的任务是指从现有数据中进行总结并且推断后续数据的变化状况。主要有以下功能:
(1)分类(classification):就是通过分析样本客户数据库中的数据,为每个类别作出准确的描述或建立分析模型或挖掘出分类规则,然后用这个分类规则对其他客户的记录进行分类。在使用上,既可以用此模型分析已有的数据,也可以用它来预测未来的数据。
(2)预测(prediction):利用历史数据建立模型,再运用最新的数据作为输入值,获得未来变化的趋势或评价给定样本可能具有的属性值或值的范围。如根据已有的蛋白质结构知识对新发现或合成的蛋白质预测其规律等。
(3)聚类(clustering):即“物以类聚”。它是分类的逆向方法。聚类把没有分类的记录在不知道应分成几类的情况下,按照数据内在的差异性大小合理地划分成几类,并确定每个记录所属类别。
(4)关联(association):是从大量的数据中发现项集之间的有趣的联系、相关关系或因果结构,以及项集的频繁模式。
(5)时间序列(sequential):又称趋势分析,它是从相当长时间的发展中发现规律和趋势。和关联分析相似,但侧重点在于分析数据间的前后因果关系。
(6)偏差分析(deviation):又称比较分析,它是对偏差和极端特例的描述,由于揭示事物偏离常规的异常现象,如标准类外的特例,数据聚类外的离群值等。
数据分析常用技术可分为统计分析、决策分析和数据挖掘三大类,在数据挖掘技术日益发展的同时,许多数据挖掘的软件工具也逐渐问世,主要分为通用的和针对特定领域的数据挖掘工具两大类。
(1)通用数据挖掘工具:不区分具体数据的含义,处理常见的数据类型。如SPSS公司的Clemen-tine、SAS软件包,IBM公司Almaden研究中心开发的QUEST系统、SCI公司的MineSet系统、加拿大SimonFraser大学开发的DBMiner系统、开源的WEKA(Waikato Environment for Knowledge Analysis),以及Google新近发布的Google Correlate 等。
(2)针对特定领域的数据挖掘工具:在设计算法时充分考虑到数据和需求的特殊性。如澳大利亚的Track公司开发的医院管理信息挖掘工具SpeedMiner,通过对医院特定的数据进行汇总和分析,给医院管理层提供决策帮助。
3. 医院数据分析 考虑到临床数据挖掘应用对建立历史性主题数据仓库的要求,目前各医院的智慧医疗大多还停留在数据分析层面。结合医院目前的HIS、PACS和LIS等业务系统,以这些业务系统的数据库为数据源,建立面向全院数据中心的数据仓库,实现医院一体化以及医疗信息的集成和共享交换。在数据仓库的基础上利用数据分析技术,建立一个面向全院的智能管理平台,为医院的科学管理和科学决策提供了有价值的信息资源,真正实现医院全方位智能化管理。
建立基于全院数据中心的数据仓库并进行数据分析,从基础业务数据中通过预定的和切合院方实际需要的主题进行数据抽取、数据清洗和数据整合等处理,立足于综合性医院的需求,针对HIS系统中医院内部各个科室等职能部门所产生的庞大数据,通过BI所提供的各种强大的分析功能进行多角度、多层次的分析,为医院的科学管理和科学决策提供有价值的信息资源,以便作出正确的决策。同时利用BI所提供的图形化界面实现对医院实时数据的监控。
目前多数医院实现的数据分析功能有:
(1)数据监控功能:包括门诊人次的实时监控、手术室使用情况实时监控、病床实时使用情况监控、住院病人数量实时监控、出入院人数实时监控、科室护患比实时监控、医保定额监控等。
(2)医院管理仪表盘显示:主要针对病案首页主要指标,在一个界面上直观地看到整个医院住院的基本情况。如采用列表显示全院、各科室年、月门诊量、日均门诊量以及同比增长率;采用饼图显示全院门诊量分布;采用曲线图显示全院、各科室年月门诊量走势。还要进行单病种相关性分析、病人医疗费用分析和临床与科室业务收入分析;列表显示出出入院病人疾病分类及疗效、疗程、费用报表、医院部分病种住院医疗费用分析、不同病人来源平均住院日分析表、医保数据分析和院感查询等。
4. 数据挖掘技术在医学中的应用 在二十余年的发展时间里,数据挖掘技术在商业、金融业、工业和医学中都有成功的应用例子。目前,医学的发展已经由经验医学、实验医学转向目前以证据为基础的循证医学,医学数据产生量大,具在客观性和实验性等特点,数据挖掘技术在此医学领域中的应用更具有重要的实用价值和经济价值。目前数据挖掘技术在医学中的应用主要在以下几方面:
(1)疾病的辅助诊断:疾病诊断通常与分类相关,而分类是数据挖掘的重要功能之一, 因此疾病辅助诊断一直是数据挖掘的重要应用领域。数据挖掘技术利用积累起来的大量历史数据,根据病人的年龄、性别、检查结果、生理生化和影像等指标作出诊断结论,挖掘出有价值和有普遍性的诊断规则,从而排除了人为因素的干扰,有的几乎接近专家的预测精度。
(2)疾病预警、预测和预后分析:对疾病及早采取防范或治疗措施,将有利于提高医治效果,利用数据挖掘技术可从大量数据中发现各种检查结果与病情、医疗结果之间的相关性,及早提醒医务人员可能出现的情况,从而作出相应的治疗调整。
(3)疾病治疗方案的选择:对于某些疾病,治疗方案的优选问题的复杂性已远非医生的经验或直觉所能解决的,所以数据挖掘技术正在逐步被应用于治疗方案优选领域。
(4)药物开发中的应用:采用数据挖掘技术建立的药物开发系统可以用来寻找同药效学相关的有效化学物质基础,指导新药的研究与开发,从而缩短研制周期和降低研发费用。
(5)生物信息学中的应用:目前DNA分析的研究成果已经导致了对许多疾病和残疾的基因成因的发现,以及对疾病的诊断、预防和治疗的新药物、新方法的发现。然而,人类的基因约有10万个,一个基因通常又由成百个核苷按一定的次序组织而成,核苷又按不同的次序各序列可以形成不同的基因,其组合不计其数,对海量的DNA数据数据挖掘技术成为其分析的强有力工具。
(6)医院信息系统中的应用:数据挖掘技术结合HIS可以对医院的业务收入预测,为医院的发展提供辅助决策;对医生开的处方分析,可以发现不同种类药品的使用规律;对门诊电子病例分析,可以挖掘出各种疾病在不同时期的发病率的高低等有价值的信息等。
5. 知识库和模型库 知识是人类对客观世界的认识,知识是先由底层数据经过分类、归纳、综合等综合处理而得到的上层信息。知识库,又称智能数据库或人工智能数据库,是用于知识管理的一种特殊的数据库。知识库中的知识源于领域专家,它是求解问题所需领域知识的集合,包括理论知识、事实数据,由专家经验得到的启发式知识,如某领域内有关的定义、定理和运算法则以及常识性知识等。建立知识库,必定要对原有的信息和知识做一次大规模的收集和整理,按照一定的方法进行分类保存,并提供相应的检索手段。这样,信息和知识便从原来的混乱状态变得有序化,有利于信息和知识的检索。
模型(model)是以某种形式对一个系统本质属性的描述,以刻画系统的功能、行为及规律。模型库是在计算机中按一定组织结构形式存贮和表示的多个模型的集合,用于存贮决策模型,其功能是使决策者能构造、修改和应用库内各种模型以支持决策。模型库将众多模型按一定结构形式组织起来,通过模型库管理系统对各个模型进行管理和使用。它具有共享性和动态性。共享性是指它具有一些可支持不同层次决策活动的基本模型,可被不同的决策活动共享。动态性是指它所具有的基本单元可在不同的决策活动中,用不同的方式组合成不同的模型。
模型库是决策支持系统的核心部分,是决策支持系统区别于一般管理信息系统的最重要的标志。它之所以能够对决策的制订提供有效的支持,主要原因是在于决策支持系统具有能为决策者提供推理、分析和比较选择问题的模型库。因此,模型库及其管理系统在决策支持系统中占有十分重要的地位。
模型是通过模型库管理系统对其进行维护和管理。模型库管理系统为生成和管理模型提供一个用户界面友好的软件环境,主要功能是对模型的建立、维护、调用、查询运行、检验和评价进行集中的控制。其模型有两类:①标准模型:按照某些常用的程序设计语言编程,并存在库中;②用户应用建模语言和模型库管理系统的建模功能而建立的模型:模型库管理系统一般由模型库、数据库(模型数据表、模型字典库)和系统管理3部分组成。
医护人员在医疗活动中的差错已经成为了国内外社会普遍关注的问题。1999年美国国立医学研究院(instiute of medicine,IOM)发表名为“To err is Human”(人是会犯错误的)的报告,报告表明:第一,医疗错误的数量惊人,医疗差错致死已经处于十大死因的第五位;第二,大部分的医疗错误是可以通过计算机系统避免的。因此,通过建立决策支持系统的手段来控制医疗差错及提高医疗质量也是更加迫切的任务。
相关链接
- DRG/DIP付费下的医院管理策略【2024-12-17】
- “人工智能+医院管理”:SPD在医疗机构精益管理中的实践【2024-12-11】
- 智慧医院管理系统的发展趋势是医院发展的关键【2024-12-09】
- 第十二届健康界医院管理大会在海南盛大召开【2024-12-03】
- 医院管理者必读 | 执行力三板斧【2024-12-03】