一、误差的概念
误差:研究所获得的实际测定值与真实值之间的差别。
误差=︱实测值-真实值 ︳
按照误差的来源、性质和可否控制,分为系统误差和随机误差。
(一)随机误差(random error)
概念:由于偶然的、无法预测的不确定因素有变动所引起的。
抽样误差:抽样所得结果与总体参数的差异。
特点:
1.主要由个体的变异性引起的。
2.随机误差的大小和方向都不是固定的。
3.抽样误差在随机抽样的研究中普遍存在,不可能完全避免。
4.随机误差的分布是有规律的,呈正态分布。根据统计学原理可以进行估计。通过增加实验次数或样本量可以减少随机误差。
抽样误差的估计:
(二)系统误差(systematic error)
是由某些不能准确定量,但恒定因素造成的,使调查结果偏离总体真值的误差。
原因:如实验方法不当、仪器不准、试剂未经校正、调查员凭主观意向询问、对调查内容理解错误、操作人员技术不熟练、未执行标准操作规程、医生诊断标准不一致等 。
特点:有固定的大小、方向;在重复调查(测量)时,可以重复出现;系统误差是可以消除的。
二、偏倚的概念和分类
指在医学研究各个环节(研究设计、计划执行、资料统计分析)中存在的系统误差以及结果解释、推论中的片面性,使得研究结果与真实值出现倾向性的差异,从而导致错误的结论。
按偏倚的性质分类:选择偏倚、信息偏倚、混杂偏倚。
按偏倚的方向分类:1. 正偏倚和负偏倚 假如某一特征的真实值为θ,而测量值为θ’。当θ<θ’,为正偏倚;当θ>θ’,为负偏倚。
三、选择偏倚
指在对样本进行研究时,入选的研究对象与总体之间的某些特征具有较大的差别,导致样本不能代表总体,因而使样本的研究结果与总体真实值之间有差别。主要产生于研究的设计阶段和资料收集阶段(失访)。
(一)入院率偏倚
以医院病人为研究对象时,由于入院率的不同而造成的偏差。
(二)现患病例-新发病例偏倚(Neyman bias)
病例对照或现况研究中的的病例为现患典型病例,不包括死亡、病程短、轻型等病例。因此,存活旧病例的信息可能只与存活有关,未必与疾病发病有关,从而高估了暴露因素的作用;或病例因疾病改变了生活习惯,从而过低估了暴露因素的作用。
(三)检出偏倚(detection bias)
指由于某暴露因素的存在,引起某种症状或体征的出现,使一部分病例容易被检出。如以这部分病例组成病例组,那么,病例组中该暴露因素存在的频率高于对照组。从而发现该暴露因素与该疾病有关联。如雌激素与子宫内膜癌的关系研究。
(四)易感性偏倚(susceptibility bias)
在职业流行病学研究中又称为健康工人效应(healthy worker effect)。
(五)无应答偏倚(non-response bias)
部分研究对象由于各种原因如不合作拒绝参加、失访等没有获得研究结果。无应答大于15%以上,可使得研究结果与真实值有差异,而产生选择偏倚。
选择性偏倚的控制:
1.采用科学的研究设计。
2.掌握研究对象的入选与排除标准。
3.随机化。
4.提高应答率,减少失访。
四、信息偏倚
又称观察性偏倚(observation bias),在从研究对象收取所需信息时产生的偏倚。其表现是使研究对象的某种特征被错误分类(misclassification)。各种类型的流行病学研究均可发生信息偏倚,可来自于研究对象、研究者本身,也可来自于测量仪器、设备、方法等。
(一)回忆偏倚(recalling bias)
在调查过去的暴露状况时,由于研究对象记忆失真或不完整在准确性和完整性上的差异所致的系统误差。如孕妇接受X线照射:医院记录与回忆符合率为73%。流产史:前10年发生的,完整回忆率为82%;20年以前则为73%。Klemetti 等人在研究环境因素与死产或新生儿畸形关系时发现,当询问产妇过去是否暴露于某种药物时,分娩死婴或畸形儿的母亲有30%与定群研究或者与过去的病历记录不一致,而正常婴儿母亲只有22%。
避免回忆偏倚的方法:设计适当的问题以帮助准确回忆,提高问题的准确性以降低回忆偏倚;建立一个完全不同的对照组,这个对照组不受不完整回忆的影响。
(二)暴露怀疑偏倚(exposure suspicion bias)
研究者事先了解研究对象的患病或结局,对研究对象以不同方法去调查。常出现在病例对照研究中。
(三)诊断怀疑偏倚(diagnosis suspicion bias)
由于研究者和被研究者事先了解被研究者的暴露或分组情况,怀疑被研究者已经患病,或希望出现研究的阳性结果,因而在诊断或分析时做出带倾向性的判断。如对暴露组、或试验组的检查细致程度大于对照组。该偏倚常见于队列和实验研究。
(四)测量偏倚(detection bias)
实验过程中由于实验的仪器和试剂质量及操作人员的操作误差造成的偏倚称为测量偏倚。
(五)报告偏倚(reporting bias)
研究对象的有意做假所造成,即有意的夸大或缩小某些信息而导致的偏倚,亦称说谎偏倚。
(六)错误分类偏倚(misclassification bias)
由于疾病的诊断标准不明确,没有统一的诊断标准及诊断方法不完善,或未使用统一的诊断方法,结果是错误地将病例判断为非病例而归类于对照组,或是将非病例判断为病例而归类于病例组,出现错误的分类,影响结果的真实性,由此产生的偏倚为错误分类偏倚。常见于病例对照研究、队列研究和临床防治试验等有对照的研究中。分为有差异错误分类和无差异错误分类。
信息偏倚的控制:
1.对于敏感问题的调查,可采用随机应答技术等方法,提高应答率和真实性。
2.使用统一的标准收集资料。
3.采用盲法收集资料。
4.使用客观的研究指标。
五、混杂偏倚(confounding bias)
(一)混杂因素与混杂偏倚
混杂因素:要分析某个危险因素与所研究疾病之间的联系时,如果存在其它因素,这些因素本身为所研究疾病的病因或危险因素,同时又与所要研究的危险因素有联系,则这些因素称为混杂因素。常见混杂因素有:人口统计学因素,如年龄、性别、种族、职业、经济收入、文化水平等指标。
混杂偏倚:当混杂因素在比较组间分布不同,可能使所研究的因素与疾病的关系发生曲解。
混杂因素特点:
1.是所研究疾病的独立危险因子。
2.与研究因素(暴露因素)有关。
3.不是研究因素与研究疾病因果链上的中间变量。
(二)混杂偏倚的识别
1.首先结合专业知识判断是否可能存在混杂因素。
2.然后用分层分析进行定量判别。
(三)混杂偏倚的控制
一)在研究的设计阶段:
1.限制(restriction):设计时限制研究对象的入选条件。例研究OC与MI关系时,如认为年龄为混杂因素,可只选某一年龄组妇女为研究对象。
2.匹配(matching):在实验和非实验研究中均可应用。
3.随机化(randomization)分组:使潜在的混杂因素在各组分配均匀。常用于实验研究。
二)在资料分析阶段:
1.标准化方法。
2.分层分析。
3.多元回归模型分析。