龙源期刊网 http://www.qikan.com.cn
疾病专用生活质量量表的评价方法
作者:王玉日 孙宏伟 李慧慧 来源:《中国医药科学》2013年第07期
[摘要] 改革开放以来,生活质量受到和社会越来越多的关注,生活质量量表也随着其关注度的增加不断涌现出来。患者作为一个特殊群体,其生活质量的测量工具也有其特异性,因此,对疾病专用生活质量量表的评价有不同于一般评价方法的一面。本文综合了改革开放以来疾病专用生活质量量表的评价方法,并找出一些不足之处,以便为以后生活质量量表的评价提供必要的方法和线索。
[关键词] 生活质量;信度;效度
[中图分类号] R173.32 [文献标识码] B [文章编号] 2095-0616(2013)07-179-03
随着社会、医学的发展、人民生活水平的提高,单纯的躯体健康已经不足以全面表述一个人的健康状况。20世纪70年代,医学领域开始使用一种比较全面的、能够描述人健康的概念:“生活质量”。世界卫生组织(WHO,1993)生活质量研究中心的专家们在总结20多个国家生活质量概念的基础上提出了生活质量的定义:“生活质量是不同的文化和价值体系中的个体,对与他们的生活目标、期望标准,以及所关心事情的有关生活状态的体验和满意程度”,它包括3层含义:(1)它是一个的概念,包括身体机能、心理功能和社会功能等;(2)它是主观的评价指标(主观体验),应由被测者自己评价;(3)它是有文化依赖性的,必须建立在一定的文化价值体系下。
患者是一个特殊群体,他们在躯体、心理上承受了更大的压力,这一群体的生活质量与健康人相比较差,而每一种疾病症状不同,患者所承受的痛苦固然不同,那么用同一种量表测其生活质量必然存在一定的误差。学者、专家们根据每种疾病发病机制、影响因素、临床表现和患者易出现的心理问题等编制了针对各种疾病的专用量表。评价量表好坏的两个重要标准是信度和效度,另外反应度和灵敏度也是较常用的评价指标。只有信度和效度良好的量表才可以在临床上使用。以下是对疾病专用量表评价方法的总结、概述。 1 资料的收集 1.1 调查对象
被视为患有某种疾病的人群,一般是从相关医院选择住院患者或者门诊患者。由于对生活质量的评价主观性较强,在施测时一般要求患者本人填写,因此,患者要符合以下几点要求:(1)符合疾病的诊断标准,确定患有某种疾病;(2)有一定的语言表达能力;(3)有一定的文化水平,能够完成问卷。有的慢性病要求测量前一段时间之内有发作,例如对成年癫痫患者生活质量量表--31的信效度检验时,要求患者6个月之内有发作[1]。
龙源期刊网 http://www.qikan.com.cn
1.2 资料的收集
一般采用简单随机抽样,让患者完成2~3份量表(1份为原量表,另外1或2份用于做校标的量表),并间隔一段时间后用原量表进行重测。由于门诊和部分住院患者流动性较大,有些重测是采用邮寄的方式将量表寄回。 2 评价方法 2.1 信度检验
信度(reliability)是衡量一个量表质量高低的重要指标之一,它指的是测量结果的稳定性程度。换句话说,若能用同一测量工具反复测量某人的同一种心理特质,则其多次测量的结果间的一致性程度就叫信度,有时也叫测量的可靠性。
计算信度的方法有很多,其中重测信度、内部一致性信度和分半信度是最常用的三种信度评价方法,复本信度和评分者信度由于其实施的困难性而很少有研究者使用。
2.1.1 重测信度 重复性检验是目前应用较广泛的评价量表信度的方法之一。重测信度指的是用同一个量表对同一组被试施测两次所得结果的一致性程度。其大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数。重测信度可以考察量表是否具有跨时间的一致性。理想状态下,生活质量不变的患者在多次测量生活质量时,应该做出非常接近的选择,或可重复的选择。
在重复测量中,间隔时间是影响评估结果的重要因素,间隔时间太短的话,重复记忆可能导致信度偏高;而间隔时间太长,则被试的生活质量可能变化,导致评估结果的不准确。因此,两次施测的间隔时间既不能太长,也不能太短。另外,不同的群体间隔时间也是不同的,例如:评价吸毒者生存质量量表时,万崇华等[2]采用的间隔时间为24 h;在研制MOS-SF-36中文版时,李鲁等[3]采用的是2周;Asher等[4]在研究先天脊柱侧突的健康相关生活质量量表时间隔时间定为4周;武阳丰等[5]在中国一般人群生活质量量表的测评中则采用的24~72 h的间隔时间。在对癌症患者生命质量测定量表体系共性模块的研制过程中,重测信度是采用入院后1~2 d的测定结果与刚入院相比较[6]。在测量重测信度时,对普通人群一般要求近期健康和社会状态均无变化,而对不定期发作的疾病一般要求患者近2~4周无发作或处于稳定期和缓解期,以避免因疾病发作引起的量表分数发生较大变化。重测信度主要是计算各条目、各维度之间的皮尔逊相关系数,也有研究者通过中位数分析法进行计算。
2.1.2 同质性信度 同质性信度(homogeneity reliability)也叫内部一致性系数,是指测验内部所有题目间的一致性程度。这里,题目间的一致性含有两层意思,其一是指所有题目测的都是同一种心理特质,其二是指所有题目得分之间都具有较高的正相关。一句话,同质性信度就是一个测验所测内容或特质的相同程度。
龙源期刊网 http://www.qikan.com.cn
同质性信度有3种计算方法:Cronbach's α系数、θ系数和Ω系数。目前普遍使用的是Cronbach's α系数。
α=[K/(K-1)][1-(ΣSi2)/Sx2]
其中,K是题目数,Si2表示所有被试在第i题上的分数变异,Sx2表示测验总分的变异。α值大,必有测量信度高;但α值小时,却不能断定测量信度不高。在实际工作中,一般认为如果α值>0.7就可判定为该测量有良好的信度。
疾病专用生活质量量表一般都包括3个以上的维度,如生理维度、心理维度、社会功能维度等。对量表的内部一致性信度都是通过计算总量表及各维度的Cronbach's α系数,考察量表条目间的一致性程度。以往研究计算的Cronbach's α系数都在0.4以上,有部分维度信度值较低,没有达到信度标准。
2.1.3 分半信度 分半信度(split-half reliability)指的是将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。它可以和等值性系数一样解释,即可以把对等的两半测验看成是在最短时距内施测的两个平行测验。疾病专用生活质量量表通常将总量表及各个维度或子量表按奇数项和偶数项分成对等的两半后,计算两个半量表的相关系数。 rxx=2[1-(Sa2+Sb2)/Sx2]
Sa2和Sb2分别表示所有被试在两半测验上得分的变异数,Sx2表示全体被试在整个测验上的总得分的变异数。 2.2 效度检验
效度(validity)是指一个测验或量表实际能测出其所要测的心理特质的程度。由于测量效度是就测量结果达到测量目的的程度而言的,所以测量效度的估计在很大程度上取决于人们对测量目的的解释。目前,比较常见的解释角度主要有3种:一是用测量的内容来说明目的;二是用心理学上的某种理论结构来说明目的;三是用工作实效来说明目的。以往量表通常对其内容效度、结构效度和效标关联效度进行检验。
2.2.1 内容效度 内容效度(content validity)是指一个测验实际测到的内容与所要测量的内容之间的吻合程度。估计一个测验的内容效度就是去确定测验在多大程度上代表了所要测量的行为领域。内容效度在很大程度上依赖于量表是否按照预先严格定义的方法进行,包括纳入从事该领域的专家、查阅发表的资料和文献、与患者进行交流等。其次,内容效度可以用每个条目得分与其所属领域得分的相关性来评价,相关性越大表明内容效度越好。
近年来,部分学者开始用内容效度指数来评价一份量表的内容是否符合当初预想的内容[7]。内容效度指数分为两种,一种是条目水平的内容效度指数(I-CVI),一种是量表水平的内容效度指数(S-CVI)。测量方法是让数位专家对条目与所在维度的相关性进行评价,一般
龙源期刊网 http://www.qikan.com.cn
是四级评分:1代表不相关,2代表弱相关,3代表较强相关,4代表非常相关。I-CVI=评价为3或4的专家数/专家总数。一般认为I-CVI要不小于0.78才算合格。S-CVI又可以分为全体一致S-CVI(S-CVI/UA)和平均S-CVI(S-CVI/Ave)两种。S-CVI/UA=专家评为3或4的条目数/条目总数×100%;S-CVI/Ave=所有条目得分之和/条目总数×100%。Davis[8]认为S-CVI/UA高于0.8时内容效度才良好,而S-CVI/Ave则应该达到0.90[9]。
2.2.2 结构效度 结构效度(construct validity)是指一个测验实际测到的理论结构和特质的程度,或者说它是指测验分数能够说明心理学理论的某种结构或特质的程度。对疾病专用量表结构效度进行检验通常采用的是因子分析法和相关分析法。因子分析包括探索性因子分析和验证性因子分析:探索性因子分析主要用于量表的结构不是很清晰时,而验证性因子分析则用于对已知量表的分析。一般在量表的制定过程中(对初始量表进行预测验时)用探索性因子分析,而在量表形成后对其进行检验时用验证性因子分析。因子分析时,重点从两个方面来评价量表的结构效度:(1)公因子应与设计时假设的生活质量几个领域相一致,且公因子累积方差贡献率至少达到40%;(2)每个条目得分都应在其中一个公因子上有较高的负荷值(spearman相关系数>0.4),而对其他公因子的负荷值较低。由于探索性因子分析和验证性因子分析各有所长说短,有些学者也建议在对生活质量量表进行结构效度验证时两种方法结合起来使用,这样可以避免因验证性因子分析因子间可能存在潜在联系带来的局限。
相关分析法是通过计算量表各条目、各维度与总分的相关来检验。各条目分与总分相关系数要在0.3~0.8之间会产生良好的信度和效度,各条目与所在维度的相关密切程度要高于其他维度,量表会具有良好的结构效度。除了上述两种方法,有的学者还将测定量表与已知的相关量表进行相关分析来确定其结构效度[10]。
2.2.3 效标关联效度 效标关联效度是指量表与真实值的一致性程度。但是生活质量的测量是根据患者的主观经验进行的,因此,没有这样的金标准。研究者通常采用与其他常用量表得分的相关程度来说明新量表的效标关联效度。不同的生活质量量表选择的标准量表也不同,为使效度比较更为严谨,有些学者选择两个标准量表(一般其中一个为普适量表,另一个为针对该疾病的特异性量表)作为校标。计算新编量表总分和标准量表总分的相关系数以及新编量表各维度与标准量表各维度的相关系数。一般认为相关系数在0.4~0.8之间认为两种具有良好的相关性。
2.2.4 区分效度 区分效度也可称为反应度,是指被调查者若有所变化,调查结果应对此变化作出反应,或者说量表理应能够反映出不同患病程度患者生活质量的区别。常用的测评方法有两种:一种方法是对患者治疗前后两次施测,将得分进行配对t检验,若量表具有很好的区分效度,t检验结果应该有显著差异。有的学者选取正常组和患病组两组患者测评结果进行单因素方差分析,如果量表能够区分不同人群则其方差差异应该具有统计学意义。另一种方法是根据患者是否具有并发症以及并发症的严重程度或者患者的疾病严重程度将患者分组,考察不同程度病情的患者是否能被量表区分出来。 3 结论
龙源期刊网 http://www.qikan.com.cn
一个合格的量表必须经过严格的信效度检验才能应用于临床。目前我国在临床上广泛应用的疾病专用生活质量量表都经过了信效度检验,但是我国仍有很多临床上使用的生活质量量表推广性还不是很高,笔者总结在信效度检验方面可能存在的问题有:(1)各类量表测评时样本量不一,万崇华等[2]认为,生活质量是主观性的多终点资料,变异大,样本量应该在100例以上,但在临床上分析治疗前后的差异,样本量可以小一些。部分量表测评时样本量仅有几十份,代表性不够强。(2)在对重测信度进行检验时忽略了病情稳定程度以及严重程度对生活质量的影响,若患者病情不稳定,两次施测之间有发病经历必然影响生活质量评分。(3)几乎所有的生活质量量表的信度评价都用到了克朗(Cronbach)α系数,但是已有不少学者指出α系数的缺陷,它只是信度估计值的下限,不能准确得估计量表的信度,而建议使用基于因子分析的Ω系数。(4)在检验内容效度时忽略了表面效度,没有关注到量表中各条目是否都容易被患者理解。而且内容效度的计算缺乏统计学数据支持,目前内容效度指标的应用开始受到重视。(5)一份好的生活质量量表必须既能够区分出不同疾病严重程度的患者,也能够区分出患者和正常人,但是很多学者在测评量表时没有注重这两方面,因此效度测评缺乏全面性。
疾病专用生活质量量表能够较全面的考察患者的生活状况,不仅能发现生理上的痛苦,还能发现潜在的因疾病产生的心理及社会功能问题,从而更全面的了解患者的情况,不同的患者采用针对性较强的治疗方案。因此,在疾病专用生活质量量表使用前必须确定其可用性、可推广性,及对其进行严格的信效度检验。目前很多量表在使用前进行的检验不够全面,一些新的较严谨的检验方法没有很好的加以利用。 [参考文献]
[1] 刘雪琴,任晓琳,周谷兰,等.成年癫病患者生活质量-31量表的信度和效度[J].中华神经医学杂志,2003,3(2):106-109.
[2] 方积乾.生活质量测定方法及应用[M].北京:北京医科大学出版社,2000:144-154. [3] LI L,Wang HM,ShenY.Chinese SF-36 Health Survey:translation,cultural adaptation,validation,and normalisation[J].J Epidemiol Community Health,2003,57(4):259-263. [4] Asher M,Min Lai SD,Manna B.The reliability and concurrent validity of the seoliosis research society-22 Patient questionnaire of idiopathic scoliosis[J].Spine,2003,28(l):63-69. [5] 武阳丰,谢高强,李莹.国人生活质量普适量表的编制与评价[J].中华流行病学杂志,2005,26(10):751-756.
[6] 万崇华,孟琼,杨铮,等.癌症患者生命质量测定量表体系共性模块的研制(二):信度与效度分析[J].癌症,2007,26(3):225-229.
龙源期刊网 http://www.qikan.com.cn
[7] 史静静,莫显昆,孙振球.量表编制中内容效度指数的应用[J].中南大学学报,2012,37(2):152-155.
[8] Davis LL.Instrument review:Getting the most from your panel of experts[J].Appl Nurs Res,1992,5(4):194-197.
[9] Waltz CF,Strickland OL,Lenz ER.Measurement in nursing and health research[M].3rd ed.New York:Springer,2005:157.
[10] 李洁,周涵辉,肖勃.精神症病人生活质量量表信度、效度测试报告[J].中国心理卫生杂志,2003,l7(11):778-780. (收稿日期:2013-04-01)