随着医院数字化程度增加,信息系统数据的质量问题也就日益凸现出来。数据质量问题轻则影响医疗事务的一般处理,影响统计分析,重则影响医院决策,造成医患纠纷,影响病人诊断治疗,甚至可能危及病人的生命。 数字化条件下医疗数据的产生、传输、存储、处理和应用方式都与传统方式不同。传统的数据质量管理方式无法满足数字化医院对数据质量监控和管理的要求,对数字医疗产生的数据质量监控和管理带来很大困难。近年来,国内多家医院对信息系统数据质量监控和管理作了许多有益探讨和尝试,对改善数据质量起到积极作用。但由于缺乏相应规范和标准,医院信息系统数据质量监控和管理的研究和应用受到很大制约。随着卫生部《医院信息系统基本功能规范》、《中国医院基本数据集标准1.0版,BDSS 1.0》征求意见版(以下简称“BDSS 1.0”)等有关医院信息标准和规范的公布,有条件探讨建立医院信息系统数据质量监控指标。 数据质量监控指标 数据质量监控指标由数据项目和质量属性两个部分组成,或表示为:医院信息系统数据元(data element)+质量属性(quality attribute)。 数据项目是指医院信息系统(HIS)中需要进行数据质量监控和管理的数据项目。HIS中并非所有的数据项目都涉及质量问题,需要进行选择。 质量属性是对指每个数据项目的质量描述,包括数据的合法值域以及数据的完整性、一致性、关联性、有效性和唯一性等内容。 * 合法值域 表述数据的类型、长度和取值区间、正常值,以及遵从的标准等。 * 完整性 表述数据表示是否完整,有无缺失、漏项等。 * 一致性 表述同一数据的同一属性在数据系统或数据集内是否一致。 * 关联性 表述数据系统或数据集内数据间是否存在逻辑、数值、应用等方面的关联。 * 有效性 表述数据是否满足应用系统定义的条件。 * 唯一性 表述数据在数据系统或数据集内是否存在重复记录。 HIS数据质量监控指标的总和称为HIS数据质量监控指标集。以不同的HIS子系统,将数据质量监控指标集划分为若干子集,一个子集对应一种信息子系统。按照《医院信息系统基本功能规范》,则可划分为:护士站子集、病区医生站子集、门诊医生站子集、患者ADT管理子集、病案管理子集等等。这样的划分主要是考虑到操作性和应用性。 数据质量基本监控指标的特征 具有较显著质量意义 对HIS应用系统数据质量监控和管理除了针对数据本身的质量外,还能通过对系统数据的质量监管达到保证系统应用质量的目的。 进行质量评价 也就是可质控性,收录的监控指标要能够进行计算分析或逻辑分析。 监控指标的产生拟参考BDSS 1.0,考虑到BDSS 1.0只是收录基本数据项目,还要在对应的HIS应用子系统数据项目内提取常用的与质量相关的指标。数据项目的提取采用自下而上方式,从现有HIS应用子系统的流程和数据模型以及数据库结构中,按照数据质量监控和管理的目标,筛选、收集有关数据项目,并与BDSS 1.0的项目合并整理为数据质量监控指标集,或称为数据质量基本监控指标集。 表1是BDSS 1.0的子域目录,BDSS 1.0子域的划分并没有完全对应HIS应用子系统,例如“患者ADT及挂号和转诊”子域就涉及病人管理、住院管理和住院管理等若干个HIS应用子系统,所以一个BDSS 1.0子域的项目可能会被多个监控指标集的子集引用。 表1 中国医院信息基本数据集(BDSS,1.0)子域划分目录 数据质量监控指标的质量属性 质量属性包括数据的正常值范围以及其它有关质量的描述。BDSS 1.0的部分项目给出了正常值域,可以直接作为本监控指标正常值范围,对于其它监控指标则要赋予正常值域。数据的正常值域是进行数据质量监控的重要指标,否则就只能进行“空”、“非空”等简单判断。除了正常值范围外,还要对其它质量属性进行描述。表2 列举若干数据质量监控指标的质量属性。 表2 数据质量监控指标的质量属性举例 数据质量属性的设置可以参考国家、行业的有关标准和规范,也可以是行业认可的默认值、经验值,或者根据专家投票认可。部分指标具有质量意义,但其质量属性难以确定或难以分析处理,例如自由描述的长字符型数据,不宜列入本指标集。 (来源:《中国数字医学》杂志2007年第11期,作者:李小华,时任广州军区广州总医院信息中心主任,彭传薇 刘晓辉 刘琛玺,广州军区广州总医院)