快彩吉林快三走势图_流行病学研究的有效性和精确性

研究的真实性研究的真实性 研究的真实性研究的真实性((accuracy) accuracy)可通过衡量研究中是否存 可通过衡量研究中是否存 在误差及误差的影响程度来反映,理论上要求在 在误差及误差的影响程度来反映,理论上要求在 有限的资源条件下达到最小误差。快彩吉林快三走势图 有限的资源条件下达到最小误差。 研究的有效性和精确性反映了研究的真实性,而研究的有效性和精确性反映了研究的真实性,而 研究的设计方案、实施策略、资料分析手段和结 研究的设计方案、实施策略、资料分析手段和结 果报告形式等过程都有可能产生不同类型的误差, 果报告形式等过程都有可能产生不同类型的误差, 从而在不同程度上影响研究的有效性和精确性。 从而在不同程度上影响研究的有效性和精确性。 误差 误差 误差误差((error) error)是指研究的测得值和真实值之间的偏离, 是指研究的测得值和真实值之间的偏离, 包括随机误差和系统误差两类。 包括随机误差和系统误差两类。 随机误差(随机误差(random error random error))是由抽样而产生的误差, 是由抽样而产生的误差, 可影响研究的精确性,一般可通过统计学方法予 可影响研究的精确性,一般可通过统计学方法予 以估计或评价。 以估计或评价。快彩吉林快三走势图 系统误差(系统误差(systematic error systematic error), ),又称偏倚( 又称偏倚(bias bias), 发生在研究的设计、实施、分析、推断等各阶段,发生在研究的设计、实施、分析、推断等各阶段, 可影响研究的有效性。 可影响研究的有效性。快彩吉林快三走势图 第一节 第一节 研究的有效性 研究的有效性 有效性的分类 有效性的分类 外部有效性外部有效性((external external validity) validity)考虑的是从研究中得 考虑的是从研究中得 出的联系可否被外推至不同时间 出的联系可否被外推至不同时间、、地区的不同人 地区的不同人 内部有效性内部有效性((internal validity) internal validity)强调研究结果是否正 强调研究结果是否正 确地反映了所研究因素与疾病的真实联系,影响 确地反映了所研究因素与疾病的真实联系,影响 研究内部有效性的主要因素是系统误差 研究内部有效性的主要因素是系统误差((systematic systematic error), error),即偏倚 即偏倚((bias) bias)。。快彩吉林快三走势图 偏倚的定义 偏倚的定义 偏倚指的是研究设计、实施、分析和推断偏倚指的是研究设计、实施、分析和推断 过程中存在的各种对暴露因素与疾病关系 过程中存在的各种对暴露因素与疾病关系 的错误估计,它系统地歪曲了暴露因素与 的错误估计,它系统地歪曲了暴露因素与 疾病间的真实联系。 疾病间的真实联系。 偏倚是一种系统误差,它与随机误差不同,偏倚是一种系统误差,它与随机误差不同, 即使样本增加至无穷大,系统误差仍维持 即使样本增加至无穷大,系统误差仍维持 原样(图 原样(图10 10--11)。 图图1010--11 偏倚 偏倚的方向 的方向 偏倚是有方向的。快彩吉林快三走势图偏倚是有方向的。 当研究结果因偏倚而被夸大时,称为当研究结果因偏倚而被夸大时,称为正偏倚; 正偏倚; 而而当研究结果因偏倚而被当研究结果因偏倚而被缩小时,称为负偏倚。 缩小时,称为负偏倚。 相对于危险因素,正偏倚时,相对于危险因素,正偏倚时,RR RR 偏偏 >>RR RR 真真 ;负偏倚 ;负偏倚 时,RRRR 偏偏 <>RR RR 真真 偏倚的种类偏倚的种类 选择偏倚选择偏倚 信息偏倚信息偏倚 混杂偏倚混杂偏倚 选择偏倚的定义 选择偏倚的定义 选择偏倚是由被选入到研究中的研究对象与没有选择偏倚是由被选入到研究中的研究对象与没有 被选入者在暴露或疾病有关的特征上的差异所造 被选入者在暴露或疾病有关的特征上的差异所造 成的系统误差 成的系统误差。快彩吉林快三走势图。 快彩吉林快三走势图_流行病学研究中快彩吉林快三走势图_流行病学研究中,,当按一定的条件识别研究对象 当按一定的条件识别研究对象 时时,,从所纳入的研究对象 从所纳入的研究对象中获得的有关因素与疾 中获得的有关因素与疾 病的联系系统地偏离了源人群中该因素与疾病之 病的联系系统地偏离了源人群中该因素与疾病之 间的真实联系 间的真实联系,,即认为有选择偏倚 即认为有选择偏倚((selection selection bias) bias) 存在 存在。。 选择偏倚的种类 选择偏倚的种类 检出偏倚或检出症候偏倚检出偏倚或检出症候偏倚 诊断偏倚诊断偏倚 入院率偏倚入院率偏倚 纳入纳入//排除偏倚 排除偏倚 奈曼偏倚奈曼偏倚 志愿者偏倚志愿者偏倚 ••健康工人效应 健康工人效应 ••失访偏倚 失访偏倚 ••无应答偏倚 无应答偏倚 ••时序模糊 时序模糊 ••特发性偏倚 特发性偏倚 检出偏倚或 检出偏倚或检出症候偏倚 检出症候偏倚 ((detection bias/detection signal bias) detection bias/detection signal bias) 有检出症候者:若暴露于所研究因素可以产生某有检出症候者:若暴露于所研究因素可以产生某 种临床症候,则具有该因素暴露史的病例相对于 种临床症候,则具有该因素暴露史的病例相对于 无暴露史的病例可能更早就诊,有更大的可能被 无暴露史的病例可能更早就诊,有更大的可能被 选择性地纳入样本。快彩吉林快三走势图 选择性地纳入样本。 当病例对照研究中的病例主要为有检出症候者,当病例对照研究中的病例主要为有检出症候者, 而对照来自产生所有病例(有检出症候和无检出 而对照来自产生所有病例(有检出症候和无检出 症候病例)的人群时,则通常可以夸大暴露的危 症候病例)的人群时,则通常可以夸大暴露的危 险性,产生偏倚,这种偏倚被称为检出偏倚或检 险性,产生偏倚,这种偏倚被称为检出偏倚或检 出症候偏倚。 出症候偏倚。 诊断偏倚 诊断偏倚((diagnostic bias) diagnostic bias) 当临床医生或疾病报告系统对暴露者和非当临床医生或疾病报告系统对暴露者和非 暴露者采用不同的诊断标准时,由此造成 暴露者采用不同的诊断标准时,由此造成 的诊断上的偏倚称为诊断偏倚。 的诊断上的偏倚称为诊断偏倚。 入院率偏倚 入院率偏倚 入院率偏倚又称伯克森偏倚入院率偏倚又称伯克森偏倚((Berkson Berkson’’s bias) bias),,是指利用医院就诊或住院病人作为病例对 是指利用医院就诊或住院病人作为病例对 照研究对象时,由于病例和对照入院率不 照研究对象时,由于病例和对照入院率不 同而导致的偏倚。 同而导致的偏倚。 纳入 纳入//排除偏倚 排除偏倚((inclusion/exclusion bias) inclusion/exclusion bias) 病例对照研究中由于系统性地纳入或排除病例对照研究中由于系统性地纳入或排除 患有已知与暴露有关疾病的对象所致的偏 患有已知与暴露有关疾病的对象所致的偏 倚称为纳入或排除偏倚。 倚称为纳入或排除偏倚。 奈曼偏倚 奈曼偏倚((Neyman bias) Neyman bias) 又称现患又称现患-- 新发病例偏倚 新发病例偏倚((prevalence prevalence--incidence bias) incidence bias)。。 病例对照研究往往 病例对照研究往往纳入现患病例或存活病例,即 纳入现患病例或存活病例,即 同时纳入新、旧病例而不包括死亡病例和那些病 同时纳入新、旧病例而不包括死亡病例和那些病 程短的病例。由此而产生的偏倚称为奈曼偏倚。 程短的病例。由此而产生的偏倚称为奈曼偏倚。 因为: 因为: 现患病例与新病例的暴露状况、病情、病型、现患病例与新病例的暴露状况、病情、病型、 病程和预后等都不尽相同。 病程和预后等都不尽相同。 现患病例可能是现患病例可能是““生物学上的强者 生物学上的强者””。。 现患病例往往对自身所患疾病有所了解,有时现患病例往往对自身所患疾病有所了解,有时 会主动更改其对危险因素的暴露,导致了对危险 会主动更改其对危险因素的暴露,导致了对危险 因素与疾病关系的低估。 因素与疾病关系的低估。 志愿者偏倚 志愿者偏倚((volunteer bias) volunteer bias) 当研究的暴露组或治疗组对象为志愿者时,在暴当研究的暴露组或治疗组对象为志愿者时,在暴 露的志愿者和非暴露的对照(主要为非志愿者) 露的志愿者和非暴露的对照(主要为非志愿者) 间的比较可能受到志愿者偏倚的影响。因为: 间的比较可能受到志愿者偏倚的影响。因为: 除了暴露状态不同外,在与疾病发生相关的其除了暴露状态不同外,在与疾病发生相关的其 他很多方面也可能不同,如志愿者具有更强的自 他很多方面也可能不同,如志愿者具有更强的自 我保健意识等。 我保健意识等。 志愿者由于对疾病及其危险因素的了解较多,志愿者由于对疾病及其危险因素的了解较多, 在回忆暴露情况时可能会过分强调其暴露程度; 在回忆暴露情况时可能会过分强调其暴露程度; 或因未患所研究疾病而对回忆暴露史不感兴趣。 或因未患所研究疾病而对回忆暴露史不感兴趣。 健康工人效应 健康工人效应((health worker effect health worker effect)) 在职业快彩吉林快三走势图_流行病学研究中,常常碰到的一个问题是在职业快彩吉林快三走势图_流行病学研究中,常常碰到的一个问题是 健康工人效应。 健康工人效应。 通常,受雇佣的工人比失业者健康;有些行业还通常,受雇佣的工人比失业者健康;有些行业还 对雇员的健康有专门的要求。因此,由于健康工 对雇员的健康有专门的要求。因此,由于健康工 人效应,可能反而会得出暴露组疾病危险性低于 人效应,可能反而会得出暴露组疾病危险性低于 非暴露组的结果,而其实是因为这些健康工人比 非暴露组的结果,而其实是因为这些健康工人比 一般工人或失业者健康,且对暴露因素的易感性 一般工人或失业者健康,且对暴露因素的易感性 可能低于一般工人或失业者。 可能低于一般工人或失业者。 失访偏倚 失访偏倚((loss loss--to follow follow--upbias) up bias) 研究对象在随访过程中发生影响疾病危险研究对象在随访过程中发生影响疾病危险 性评价的失访时,如因健康原因、死亡、 性评价的失访时,如因健康原因、死亡、 不合作、迁出等失访,则可发生失访偏倚。 不合作、迁出等失访,则可发生失访偏倚。 失访偏倚对研究结果的影响取决于失访的失访偏倚对研究结果的影响取决于失访的 程度、失访者在所比较组的分布和失访原 程度、失访者在所比较组的分布和失访原 因与所研究结果的关联程度等。 因与所研究结果的关联程度等。 无应答偏倚 无应答偏倚((non non--response bias) response bias) 无应答偏倚主要发生于现况调查,表现为调查对无应答偏倚主要发生于现况调查,表现为调查对 象不合作或不参与。 象不合作或不参与。 这些无应答对象通常不能代表所研究人群,且无这些无应答对象通常不能代表所研究人群,且无 法判断其暴露或疾病状况,因此当无应答率较高 法判断其暴露或疾病状况,因此当无应答率较高 时,如大于 时,如大于15% 15%,由于选择偏倚的存在,从应答人 ,由于选择偏倚的存在,从应答人 群中得出的有关研究因素与疾病的联系不能反映 群中得出的有关研究因素与疾病的联系不能反映 两者间的真实联系。 两者间的真实联系。 时序模糊 时序模糊((temporal ambiguity) temporal ambiguity) 流行病学病因学研究通常假设个体对危险因素的流行病学病因学研究通常假设个体对危险因素的 暴露先于疾病发生。 暴露先于疾病发生。 但有些研究难以辨别暴露和疾病的时序。如横断但有些研究难以辨别暴露和疾病的时序。如横断 面研究反映的是疾病的患病率,危险因素与疾病 面研究反映的是疾病的患病率,危险因素与疾病 往往同时存在,此时,很难区分观察到的因素和 往往同时存在,此时,很难区分观察到的因素和 疾病的联系是由于暴露导致发病还是发病导致暴 疾病的联系是由于暴露导致发病还是发病导致暴 露,产生时序模糊。 露,产生时序模糊。 特发性偏倚 特发性偏倚((protopathic protopathic--type bias) type bias) 流行病学病因学研究可能因纳入一些在疾病临床流行病学病因学研究可能因纳入一些在疾病临床 前期发生行为改变的对象而发生偏倚,当这种暴 前期发生行为改变的对象而发生偏倚,当这种暴 露状态的改变涉及到某种药物或治疗措施时,称 露状态的改变涉及到某种药物或治疗措施时,称 为特发性偏倚。 为特发性偏倚。 如对象因出现了与临床前期有关的症状或体征后如对象因出现了与临床前期有关的症状或体征后 自觉地减少或去除了某种暴露,当这些对象被纳 自觉地减少或去除了某种暴露,当这些对象被纳 入病例对照研究的对照组时,可能 入病例对照研究的对照组时,可能夸大 夸大危险因素 危险因素 与疾病的联系,而当这些对象因其早期症状或体 与疾病的联系,而当这些对象因其早期症状或体 征而被纳入病例组时,又有可能因其行为改变而 征而被纳入病例组时,又有可能因其行为改变而 只反映了其终止某种暴露后的效果而不是原有的 只反映了其终止某种暴露后的效果而不是原有的 长期暴露的效果。 长期暴露的效果。 选择偏倚的控制 选择偏倚的控制 研究设计阶段研究设计阶段 建立和利用健康监测系统信息,尽可能使用发病率资料。建立和利用健康监测系统信息,尽可能使用发病率资料。 采用严格科学的研究设计。采用严格科学的研究设计。 明确对象纳入标准、统一疾病诊断和监测程序。明确对象纳入标准、统一疾病诊断和监测程序。 资料收集阶段资料收集阶段 加强随访、提高应答率。加强随访、提高应答率。 在资料收集阶段尽可能多地收集有关暴露史的各种信息在资料收集阶段尽可能多地收集有关暴露史的各种信息 确保疾病的诊断不是依据暴露史而得出。确保疾病的诊断不是依据暴露史而得出。 数据分析阶段数据分析阶段 信息偏倚的定义 信息偏倚的定义 信息偏倚信息偏倚((information bias) information bias)又称观察偏倚 又称观察偏倚 ((observational bias) observational bias),,指在研究的实施阶段从 指在研究的实施阶段从 研究对象获取研究所需信息时所产生的系 研究对象获取研究所需信息时所产生的系 统误差。 统误差。 信息偏倚可发生于各种类型的流行病学研信息偏倚可发生于各种类型的流行病学研 究,可来自研究对象,也可来自研究者本 究,可来自研究对象,也可来自研究者本 身,或来自用于测量的仪器、设备和方法。 身,或来自用于测量的仪器、设备和方法。 信息偏倚的种类 信息偏倚的种类 错分偏倚错分偏倚 均数回归趋势均数回归趋势 生态学偏倚等生态学偏倚等 错分偏倚 错分偏倚((misclassification bias) misclassification bias) 由于研究中的测量误差如资料收集不准确或不完由于研究中的测量误差如资料收集不准确或不完 整等造成对研究对象的暴露程度或疾病结果的错 整等造成对研究对象的暴露程度或疾病结果的错 误归类,影响了结果估计的有效性,此类偏倚统 误归类,影响了结果估计的有效性,此类偏倚统 称为错误分类偏倚或错分偏倚。 称为错误分类偏倚或错分偏倚。 错分偏倚由发生在不同类型研究中的系统误差所错分偏倚由发生在不同类型研究中的系统误差所 致,包括回忆偏倚、报告偏倚、诊断怀疑偏倚、 致,包括回忆偏倚、报告偏倚、诊断怀疑偏倚、 暴露怀疑偏倚和测量偏倚等。 暴露怀疑偏倚和测量偏倚等。 回忆偏倚 回忆偏倚((recall bias) recall bias) 回忆偏倚多见于病例对照研究和回顾性队列研究。回忆偏倚多见于病例对照研究和回顾性队列研究。 由于所调查的因素发生于过去,回忆的准确性和由于所调查的因素发生于过去,回忆的准确性和 完整性受回忆间期长短、所回忆因素对研究对象 完整性受回忆间期长短、所回忆因素对研究对象 的意义和该因素的发生频率的影响,造成对研究 的意义和该因素的发生频率的影响,造成对研究 结果的有偏估计。 结果的有偏估计。 而且既往经历对病例和非病例的意义往往迥然不而且既往经历对病例和非病例的意义往往迥然不 同,病例组对既往暴露情况的记忆深度和详细程 同,病例组对既往暴露情况的记忆深度和详细程 度通常较对照组为甚,由此造成了回忆偏倚在各 度通常较对照组为甚,由此造成了回忆偏倚在各 比较组中分布不同。 比较组中分布不同。 报告偏倚 报告偏倚((reporting bias) reporting bias) 与回忆偏倚不同,报告偏倚是因为对象有与回忆偏倚不同,报告偏倚是因为对象有 意夸大或隐瞒某些信息导致了对疾病或暴 意夸大或隐瞒某些信息导致了对疾病或暴 露程度的错误分类。 露程度的错误分类。 诊断怀疑偏倚和暴露怀疑偏倚 诊断怀疑偏倚和暴露怀疑偏倚((diagnostic diagnostic suspicion bias exposuresuspicion bias) suspicion bias exposuresuspicion bias) 由于研究者或被研究者的主观倾向、愿望或偏见由于研究者或被研究者的主观倾向、愿望或偏见 所导致的对暴露因素和 所导致的对暴露因素和//或疾病结果的错误判断, 或疾病结果的错误判断, 从而歪曲了暴露同疾病间的真实联系,分别称为 从而歪曲了暴露同疾病间的真实联系,分别称为 诊断怀疑偏倚或暴露怀疑偏倚。 诊断怀疑偏倚或暴露怀疑偏倚。 在队列研究或实验中,如果研究者事先已认为暴在队列研究或实验中,如果研究者事先已认为暴 露于研究因素可能与疾病的发生有关,则可能对 露于研究因素可能与疾病的发生有关,则可能对 暴露或干预组进行非常严格细致的检查,而对非 暴露或干预组进行非常严格细致的检查,而对非 暴露组则不然,造成对研究结果判断的偏倚,此 暴露组则不然,造成对研究结果判断的偏倚,此 类偏倚称为诊断怀疑偏倚。 类偏倚称为诊断怀疑偏倚。 测量偏倚 测量偏倚((measuring bias) measuring bias) 由于研究中所使用的仪器、设备、试剂、由于研究中所使用的仪器、设备、试剂、 方法和条件的不精良、不标准、不统一或 方法和条件的不精良、不标准、不统一或 研究指标设定不合理、数据记录不完整造 研究指标设定不合理、数据记录不完整造 成的研究结果系统地偏离其真值的现象称 成的研究结果系统地偏离其真值的现象称 为测量偏倚。 为测量偏倚。 测量偏倚可发生在各种快彩吉林快三走势图_流行病学研究的设测量偏倚可发生在各种快彩吉林快三走势图_流行病学研究的设 计、实施和资料处理过程中。 计、实施和资料处理过程中。 均数回归趋势 均数回归趋势((regression mean)regression 以连续变量表示的某些测量值,由于随机误差的以连续变量表示的某些测量值,由于随机误差的 存在,在初次测量时可能表现为极端值,即远远 存在,在初次测量时可能表现为极端值,即远远 地高于或低于人群中的其他对象的相应值,但在 地高于或低于人群中的其他对象的相应值,但在 以后的多次重复测量中,该对象的上述测量值会 以后的多次重复测量中,该对象的上述测量值会 出现向这一变量的人群均数靠拢的倾向,称为均 出现向这一变量的人群均数靠拢的倾向,称为均 数回归趋势。 数回归趋势。 均数回归趋势所呈现的变化可能会被当作真实的均数回归趋势所呈现的变化可能会被当作真实的 变化而错误地归因于某种干预措施的效果。 变化而错误地归因于某种干预措施的效果。 生态学偏倚 生态学偏倚((ecologic bias) ecologic bias) 生态学研究中个体水平的生物学信息由于生态学研究中个体水平的生物学信息由于 被结合于群体(组群)水平的暴露与疾病 被结合于群体(组群)水平的暴露与疾病 结果的推断中而丧失。由于每个组群内部 结果的推断中而丧失。由于每个组群内部 的暴露状态并不一致,因此,由组群间暴 的暴露状态并不一致,因此,由组群间暴 露水平与疾病发生的差异得出的生态学联 露水平与疾病发生的差异得出的生态学联 系可能与相应的个体暴露水平与疾病发生 系可能与相应的个体暴露水平与疾病发生 的关系迥然不同,从而导致生态学谬误。 的关系迥然不同,从而导致生态学谬误。 信息偏倚的控制 信息偏倚的控制 错分偏倚的控制错分偏倚的控制 均数回归趋向的控制均数回归趋向的控制 生态学偏倚的控制生态学偏倚的控制 错分偏倚的控制措施 错分偏倚的控制措施 首先,在研究设计中对暴露因素必须有严首先,在研究设计中对暴露因素必须有严 格、客观的定义,并力求指标定量化。 格、客观的定义,并力求指标定量化。 其次,在资料收集阶段,应尽量选用客观其次,在资料收集阶段,应尽量选用客观 定量指标,可选用回忆指征帮助对象回忆, 定量指标,可选用回忆指征帮助对象回忆, 也可利用实物或照片来准确获取信息。 也可利用实物或照片来准确获取信息。 ((22)错分偏倚的校正: )错分偏倚的校正: 错分偏倚在所比较组内的分布可以相同,错分偏倚在所比较组内的分布可以相同, 也可以不同,可用错分的灵敏度和特异度 也可以不同,可用错分的灵敏度和特异度 来表示。 来表示。 在病例对照研究中,错分的灵敏度指正确在病例对照研究中,错分的灵敏度指正确 查出有暴露史者占实际有暴露史人数的比 查出有暴露史者占实际有暴露史人数的比 例;特异度指正确查出无暴露史者占实际 例;特异度指正确查出无暴露史者占实际 无暴露史人数的比例。 无暴露史人数的比例。 当各比较组发生错分的灵敏度和特异度分别相同当各比较组发生错分的灵敏度和特异度分别相同 时,产生的错分偏倚称为均衡性错分 时,产生的错分偏倚称为均衡性错分((non non-- differential misclassification) differential misclassification),,又称无差异错分或 又称无差异错分或 非特异性错分。 非特异性错分。 当各比较组发生错分的灵敏度和特异度各不相同当各比较组发生错分的灵敏度和特异度各不相同 时,称为非均衡性错分 时,称为非均衡性错分((differential differential misclassification) misclassification),,又称差异错分或特异性错分。 又称差异错分或特异性错分。 均数回归趋向的控制 均数回归趋向的控制 在实验研究中,可以通过设立对照组、尤其是随在实验研究中,可以通过设立对照组、尤其是随 机化分组的对照组来控制均数回归趋向的影响。 机化分组的对照组来控制均数回归趋向的影响。 另外一个有效的方法是不论在基线时还是随访过另外一个有效的方法是不论在基线时还是随访过 程中,采用一组重复测量值的均数来代替对象的 程中,采用一组重复测量值的均数来代替对象的 相应指标测量值。重复测量的次数越多,所获值 相应指标测量值。重复测量的次数越多,所获值 越稳定,受均数回归趋向的影响越小,当然也需 越稳定,受均数回归趋向的影响越小,当然也需 考虑测量的成本效益。 考虑测量的成本效益。 在分析过程中也可通过各种统计分析方法来估计在分析过程中也可通过各种统计分析方法来估计 均数回归趋向的程度。 均数回归趋向的程度。 生态学偏倚 生态学偏倚 很难避免出现生态学偏倚。但其意义在于很难避免出现生态学偏倚。但其意义在于 为进一步的分析性快彩吉林快三走势图_流行病学研究提供线索, 为进一步的分析性快彩吉林快三走势图_流行病学研究提供线索, 因此,只要充分注意到生态学研究的局限 因此,只要充分注意到生态学研究的局限 性,并运用适当的统计学方法来估计生态 性,并运用适当的统计学方法来估计生态 学偏倚的影响程度,必要时开展纵向的生 学偏倚的影响程度,必要时开展纵向的生 态学趋势研究,生态学研究结果还是可以 态学趋势研究,生态学研究结果还是可以 获得合理的应用。 获得合理的应用。 混杂偏倚 混杂偏倚((confounding) confounding) 快彩吉林快三走势图_流行病学研究中,由于一个或多个外来因 快彩吉林快三走势图_流行病学研究中,由于一个或多个外来因 素(又称第三因子)的存在,掩盖或夸大 素(又称第三因子)的存在,掩盖或夸大 了研究因素与疾病(或事件)的联系,从 了研究因素与疾病(或事件)的联系,从 而部分或全部地歪曲了两者之间的真实联 而部分或全部地歪曲了两者之间的真实联 系,称为混杂偏倚或混杂 系,称为混杂偏倚或混杂,,引起混杂偏倚的 引起混杂偏倚的 外来因素称为混杂因素 外来因素称为混杂因素((confounder) confounder)。。 混杂因素的特点: 混杂因素的特点: ((11))混杂 混杂因素 因素必须与所研究疾病的发生有关 必须与所研究疾病的发生有关,, 是该疾病的危险因素之一 是该疾病的危险因素之一。。 ((22))混杂 混杂因素 因素必须与所研究因素有关 必须与所研究因素有关。。 ((33)混杂因素必须不是研究因素与疾病病因 )混杂因素必须不是研究因素与疾病病因 链上的中间环节或中间步骤。 链上的中间环节或中间步骤。 中年人少量饮酒与心肌梗塞危险性 中年人少量饮酒与心肌梗塞危险性 混杂因素示例混杂因素示例 少量饮酒 不饮酒 心肌梗塞发病(例) 140 100 随访人年(人年) 30,000 30,000 发病率(1/千) 4.67 3.33 RR=1.40 不同性别中年人少量饮酒与心肌梗塞危险性 不同性别中年人少量饮酒与心肌梗塞危险性 混杂因素示例混杂因素示例 男性 女性 少量饮酒 不饮酒 少量饮 不饮酒心肌梗塞发 12060 20 40 (人年)20,000 10,000 10,000 20,000 发病率(1/千) 6.00 6.00 2.00 2.00 RR=1.0 RR=1.0 图图10 10--22 混杂偏倚的判断和测量 混杂偏倚的判断和测量 判断和测量某一可疑混杂因素的混杂作用,判断和测量某一可疑混杂因素的混杂作用, 可以通过比较含有该因素时研究因素与疾 可以通过比较含有该因素时研究因素与疾 病的效应估计值, 病的效应估计值,如如RR RR或或OR OR,,与排除该因 与排除该因 素后的效应估计值来实现。 素后的效应估计值来实现。 混杂偏倚的判断和测量 混杂偏倚的判断和测量 当当cRR=cRR=aRR aRR((ff))或或cOR= cOR=aOR aOR((ff))时时,,则则ff无混杂 无混杂 作用 作用。。 当当cRRcRRaRR aRR((ff))或或cOR cORaO aOR( R(ff))时,且分层后 时,且分层后 层和无ff层的分层层的分层RRi RRi或或ORi ORi相同,则 相同,则ff有混 杂作用。杂作用。 混杂偏倚的控制 混杂偏倚的控制 限制限制((restriction) restriction) 匹配匹配((matching) matching) 随机化随机化((randomization) randomization) 盲法((blindness)blindness) 统计处理统计处理 限制 限制((restriction) restriction) 一个提高可比性的方法是在选择研究对象一个提高可比性的方法是在选择研究对象 时,限制在具有一定特征的对象中进行观 时,限制在具有一定特征的对象中进行观 察,以排除其他因素的干扰。 察,以排除其他因素的干扰。 但用这种方法来控制偏倚所获得的结论常但用这种方法来控制偏倚所获得的结论常 有很大局限性,影响研究对象的代表性, 有很大局限性,影响研究对象的代表性, 使研究结果外推至一般人群时受限。 使研究结果外推至一般人群时受限。 匹配 匹配((matching) matching) 匹配是指在为研究对象设立对照时,使病匹配是指在为研究对象设立对照时,使病 例和其对照在一个或多个潜在混杂因素上 例和其对照在一个或多个潜在混杂因素上 相同或相近,从而消除混杂因素对研究结 相同或相近,从而消除混杂因素对研究结 果的影响。 果的影响。 匹配 匹配((matching) matching) 匹配的目的是为了控制混杂、提高研究的匹配的目的是为了控制混杂、提高研究的 统计学效率。 统计学效率。 病例对照研究、队列研究和实验研究均可病例对照研究、队列研究和实验研究均可 采用匹配。尤其是队列研究,使用匹配可 采用匹配。尤其是队列研究,使用匹配可 达到直接控制混杂的效果,但病例对照研 达到直接控制混杂的效果,但病例对照研 究中仍需进行分层分析来较好地控制混杂。 究中仍需进行分层分析来较好地控制混杂。 随机化 随机化((randomization) randomization) 随机化是指以随机化原则将研究对象以同随机化是指以随机化原则将研究对象以同 等的机率被分配在各处理组中,从而使潜 等的机率被分配在各处理组中,从而使潜 在的混杂因素在各组间分布均衡。 在的混杂因素在各组间分布均衡。 随机化多用于实验研究,尤其是临床试验。随机化多用于实验研究,尤其是临床试验。 盲法((blindness)blindness) 盲法是消除测量性偏倚的有效方法,在考盲法是消除测量性偏倚的有效方法,在考 核疗效时要实行双盲,考核疗效者和受试 核疗效时要实行双盲,考核疗效者和受试 者都不知真实所给予的治疗内容,而且在 者都不知真实所给予的治疗内容,而且在 实验室各种检查的报告者也不知道谁是观 实验室各种检查的报告者也不知道谁是观 察组,谁是对照组。 察组,谁是对照组。 统计处理: 统计处理: 常用的估计和控制混杂偏倚的统计处理方法有: 常用的估计和控制混杂偏倚的统计处理方法有: 分层分析分层分析 标准化标准化 多因素分析多因素分析 分层 分层((stratification stratification)) 分层是指将研究所获资料按混杂因素分成数层分层是指将研究所获资料按混杂因素分成数层 (亚组)进行分析。 (亚组)进行分析。 分层是最常用的检出和控制偏倚的方法之一。分层是最常用的检出和控制偏倚的方法之一。 可以通过可以通过Mantel Mantel--Haenszel Haenszel分层分析法进行分析。 分层分析法进行分析。 但如果欲控制的混杂因素较多,则分层分析对样 但如果欲控制的混杂因素较多,则分层分析对样 本量的要求较大,此时,可以应用多因素分析方 本量的要求较大,此时,可以应用多因素分析方 法如LogisticLogistic回归分析等来估计和控制混杂。 回归分析等来估计和控制混杂。 标准化 标准化((standardization standardization)) 当比较两个率时,如果两组对象内部构成当比较两个率时,如果两组对象内部构成 存在的差别足以影响结论,可用率的标准 存在的差别足以影响结论,可用率的标准 化加以校正,亦即使可能影响结果的因素 化加以校正,亦即使可能影响结果的因素 受到同等的加权,使这两个率可比、无偏 受到同等的加权,使这两个率可比、无偏 倚,这种方法称为标准化。 倚,这种方法称为标准化。 第二节 第二节 研究的精确性 研究的精确性 点估计 点估计 点估计只是单一的一个数值,它不能反映所估计点估计只是单一的一个数值,它不能反映所估计 的因素与疾病关系的统计学变异,或称随机误差, 的因素与疾病关系的统计学变异,或称随机误差, 也不能反映参数估计的不稳定性。 也不能反映参数估计的不稳定性。 对于一项设计严密、样本很大的研究而言,其随对于一项设计严密、样本很大的研究而言,其随 机误差可能较小,但对于样本较小的研究,对结 机误差可能较小,但对于样本较小的研究,对结 果参数的点估计可能具有较大的随机误差。 果参数的点估计可能具有较大的随机误差。 区间估计 区间估计 可信限的应用可以反映参数估计中随机误可信限的应用可以反映参数估计中随机误 差的程度。 差的程度。 常用常用95% 95%或或90% 90%作为可信限水平。 作为可信限水平。 第一类错误和第二类错误 第一类错误和第二类错误 αα水平在统计学水平在统计学上称为第 上称为第II类错误 类错误((α) 性错误,即无效假设原本是正确的,但被性错误,即无效假设原本是正确的,但被 拒绝接受,误判为有差别。 拒绝接受,误判为有差别。 在假设检验中的另一类错误,即假阴性错在假设检验中的另一类错误,即假阴性错 误,统计学上称为第 误,统计学上称为第II II类错误 类错误((β) β),,就是无效 就是无效 假设原本上不正确的,当却被 假设原本上不正确的,当却被接受,误判 接受,误判 为无差别。 为无差别。 快彩吉林快三走势图_流行病学研究中的第 快彩吉林快三走势图_流行病学研究中的第II和第 和第II II类错误 类错误 样本 人群 有差别 无差别 有差别 精确性精确性((precision) precision) 精确性指的是在估计人群某个参数时不发精确性指的是在估计人群某个参数时不发 生随机误差的能力。 生随机误差的能力。 精确性和把握度:把握度反映了当差别确精确性和把握度:把握度反映了当差别确 实存在时正确地拒绝无效假设的能力;而 实存在时正确地拒绝无效假设的能力;而 精确性反映了不受随机误差影响正确地估 精确性反映了不受随机误差影响正确地估 计参数的能力。 计参数的能力。 精确性估计 精确性估计 统计学效率统计学效率 样本大小样本大小 统计学效率 统计学效率 研究的统计学效率研究的统计学效率((statistical efficiency) statistical efficiency)可以 可以 用于估计研究的精确性。 用于估计研究的精确性。 统计学效率是指单位样本所提供的统计信统计学效率是指单位样本所提供的统计信 息量,可以用所研究参数的可信限范围来 息量,可以用所研究参数的可信限范围来 衡量。 衡量。 样本大小 样本大小 一般而言,样本越大,结果的估计越精确。一般而言,样本越大,结果的估计越精确。 但是,盲目地追求大样本可能会影响研究 但是,盲目地追求大样本可能会影响研究 的可行性,增加研究成本,且增加用于收 的可行性,增加研究成本,且增加用于收 集资料的投入与额外获得的精确性之间并 集资料的投入与额外获得的精确性之间并 不能达到成本效益合理。 不能达到成本效益合理。 样本大小与参数估计精确性示例 样本大小与参数估计精确性示例 暴露 研究一 研究二 研究三 状态 暴露15 10 25 15 50 65 15 100 115 非暴露 1015 5055 100105 合计 20 20 40 20 100 120 20 200 220 3.003.00 3.00 95%CI 0.79~11.4 1.01~8.88 1.05~8.57 精确性的提高 精确性的提高 增大样本量增大样本量 选择合适的研究对象选择合适的研究对象 选择恰当的结果估计方法选择恰当的结果估计方法 样本大小 样本大小 增大样本可以增加研究的精确性,但资源增大样本可以增加研究的精确性,但资源 的有限性和对成本效益的考虑往往限制了 的有限性和对成本效益的考虑往往限制了 样本大小。 样本大小。 此时,可以通过使用合适的选择对象和估此时,可以通过使用合适的选择对象和估 计结果的方法来获得较理想的精确性。 计结果的方法来获得较理想的精确性。 对象选择 对象选择 限制对象纳入条件限制对象纳入条件 均衡所比较组对象人数均衡所比较组对象人数 结果的估计 结果的估计 选择不同的结果估计方法,可改善研究的选择不同的结果估计方法,可改善研究的 精确性。 精确性。 应最大限度地利用每个变量所包含的信息应最大限度地利用每个变量所包含的信息。。 采用统计学效率较高的分析方法。采用统计学效率较高的分析方法。

研究的真实性(accuracy)可通过衡量研究中是否存在误差及误差的影响程度来反映,理论上要求在有限的资源条件下达到最小误差. 研究的有效性和精确性反映了研究的真实性,而研究的设计方案,实施策略,资料分析手段和结果报告形式等过程都有可能...

文档格式:
.ppt
文档页数:
68页
文档大小:
312.5K
文档热度:
文档分类:
高等教育 --  大学课件
文档标签:
精确 随机误差 bias 精确性 统计学 生态学 检出 流行病学 病例 症候