队列研究
description
Transcript of 队列研究
第 7 版 流行病学 人 民 卫 生 出 版 社
第四章
第 7 版 流行病学 人 民 卫 生 出 版 社
病因和危险因素研究是流行病学研究的重要任务,病因研究的逻辑顺序应该是先有病因存在,然后有疾病发生,即先因后果。
那么,怎样的研究满足先因后果的逻辑顺序,能更有效地证实因果关系呢?
队列研究。
第 7 版 流行病学 人 民 卫 生 出 版 社
队列研究( cohort study)是分析流行病学研究中两大重要方法之一。
它通过直接观察暴露于某因素不同状况人群的结局来探讨该因素与所观察结局的关系。
第 7 版 流行病学 人 民 卫 生 出 版 社
千淘万漉虽辛苦
吹尽狂沙始到金
唐朝诗人刘禹锡的《浪淘沙九首》
第 7 版 流行病学 人 民 卫 生 出 版 社
第一节 概 述
第二节 研究设计与实施
第三节 资料的整理与分析
第四节 常见偏倚及其控制
第五节 优点与局限性
第 7 版 流行病学 人 民 卫 生 出 版 社
概 念
基本原理
研究目的
研究类型
第一节 概 述
第 7 版 流行病学 人 民 卫 生 出 版 社
概 念
暴露 (exposure)
指研究对象接触过某种待研究的物质或具有某种研究的特征或行为。是本研究需要探讨的因素。
队列 (cohort)
有共同经历或有共同暴露特征的一组人群(如出生队列和暴露队列)。根据其变化分为固定队列和动态队列。
第 7 版 流行病学 人 民 卫 生 出 版 社
固定队列 fixed cohort
研究开始研究开始 研究结束研究结束
出现结局
未出现结局
第 7 版 流行病学 人 民 卫 生 出 版 社
动态队列 dynamic cohort
研究开始研究开始 研究结束研究结束
出现结局
失访
第 7 版 流行病学 人 民 卫 生 出 版 社
危险因素( risk factor )
泛指能引起某特定不良结局( outcome ),或使其发生的概率增加的因子,包括个人行为、生活方式、环境和遗传等多方面的因素。危险因素的反面称为保护因素( protective factor ),两者可统称为决定因素( determinant factor )。
第 7 版 流行病学 人 民 卫 生 出 版 社
根据研究对象是否暴露于某研究因素或其不同水平将研究对象分成暴露组( E )与非暴露组( Ē )
随访一定时间,比较两组之间所研究结局 (outcome) 发生率的差异,以分析暴露因素与研究结局之间的关系
基本原理
第 7 版 流行病学 人 民 卫 生 出 版 社
N目标人群 代表性样本
Y
E
Ē
时间顺序
暴露结局
Y
N
第 7 版 流行病学 人 民 卫 生 出 版 社
主要特点
观察法
设立对照
由因到果,符合时间顺序
能确证暴露和结局之间的因果关系
第 7 版 流行病学 人 民 卫 生 出 版 社
研究目的
检验病因假设
评价预防效果
研究疾病的自然史
新药的上市后监测
第 7 版 流行病学 人 民 卫 生 出 版 社
研究类型
前瞻性队列研究 (prospective cohort study)
历史性队列研究 (historical cohort study )
双向性队列研究 (ambispective cohort study)
第 7 版 流行病学 人 民 卫 生 出 版 社
时间顺序
过去 现在 将来
历史性队列
双向性队列
前瞻性队列
回顾性收集已有的历史资料回顾性收集已有的历史资料
继续前瞻性收集资料继续前瞻性收集资料
前瞻性收集资料
第 7 版 流行病学 人 民 卫 生 出 版 社
time
Exposure Study startsDisease
occurrence
Diseaseoccurrence
time
Study starts
Exposure
time
Diseaseoccurrence
Study starts 历史性队列
双向性队列
前瞻性队列
Exposure
第 7 版 流行病学 人 民 卫 生 出 版 社
前瞻性队列研究 ( prospective cohort study)
研究队列的确定是现在 (concurrent)
根据研究对象现在的暴露分组需要随访 (follow up)
结局在将来某时刻出现
第 7 版 流行病学 人 民 卫 生 出 版 社
优 点
时间顺序增强了病因推断的可信度直接获得暴露与结局资料,结果可信能获得发病率
缺 点所需样本量大,花费大,时间长影响可行性
第 7 版 流行病学 人 民 卫 生 出 版 社
前瞻性队列研究应用条件
有明确的检验假设 所研究疾病的发生率较高 , 一般不低于 5‰
明确规定暴露因素和结局变量 有可靠的测量手段 足够的观察人群和暴露情况 能完成随访的人群 足够的人、财、物力
第 7 版 流行病学 人 民 卫 生 出 版 社
历史性队列研究 historical cohort study
根据研究开始时研究者掌握的有关研究对象在过去某时点的暴露情况的历史材料做出的
不需要随访,研究开始时结局已出现
第 7 版 流行病学 人 民 卫 生 出 版 社
优 点
短期内完成资料的收集和分析 时间顺序仍是由因到果省时、省力、出结果快
缺 点资料积累时未受到研究者的控制,内容上未必 符合要求需要足够完整可靠的过去某段时间有关研究对象的暴露和结局的历史记录或档案材料
第 7 版 流行病学 人 民 卫 生 出 版 社
双向性队列研究 ambispective cohort study
研究队列的确定是过去根据研究对象过去某时刻的暴露情况分组需要随访部分结局可能已出现
第 7 版 流行病学 人 民 卫 生 出 版 社
优点:是将前瞻性队列研究与历史性队列研究结合起来的一种设计模式,因此兼有上述二类的优点 。
应用:当基本具备进行历史性队列研究的条件下,如果从暴露到现在的观察时间还不能满足研究的要求(人时不够,未满足效应期),还需继续前瞻性观察一段时间时,则选用双向性队列研究。
第 7 版 流行病学 人 民 卫 生 出 版 社
确定研究因素 确定研究结局 确定研究现场与研究人群 确定样本量 资料的收集与随访 质量控制
(以一项乙肝病毒( HBV )感染与原发性肝细胞癌( PHCC )的队列研究为例,以下简称实例)
第二节 研究设计与实施
第 7 版 流行病学 人 民 卫 生 出 版 社
确定研究因素
主要暴露因素:在描述性研究和病例对照 研究的基础上确定。
可能影响结局的因素:混杂因素及人口学特征等。
实例中确定的研究因素是乙肝病毒感染,以 HBsAg阳性作为乙肝病毒感染指标。
第 7 版 流行病学 人 民 卫 生 出 版 社
因素的测量: 需测量暴露的水平,暴露的时间,及暴露的方式。暴露的测量应采用敏感、精确、简单和可靠的方法。
性质:定性 (quality) ,定量 (quantity)
方法:访谈,实验室检查,查阅记录
第 7 版 流行病学 人 民 卫 生 出 版 社
结局是研究队列中预期结果事件,是队列研的自然终点( natural end )。研究结局的确定应全面、具体、客观。可包括:
发病、死亡、健康状况和生命质量
终极结果(发病)或中间结局(血清变化)
正面(生命延长)和负面(发病)
定性或定量
可多个或多方面(实例的结局是 PHCC死亡 )
确定研究结局
第 7 版 流行病学 人 民 卫 生 出 版 社
一次研究可有多个结局
吸烟吸烟吸烟
慢性支气管炎
冠心病
肺癌肺癌
结局的测量 采用国际或国内通用的标准
第 7 版 流行病学 人 民 卫 生 出 版 社
有足够符合条件的研究对象领导重视、群众支持医疗条件较好,交通较便利发病率较高有代表性实例的研究现场是江苏省海门市
确定研究现场与研究人群研究现场
第 7 版 流行病学 人 民 卫 生 出 版 社
从目标人群中抽出的具有代表性的人
未患所研究疾病
分为暴露组和对照组
研究人群
第 7 版 流行病学 人 民 卫 生 出 版 社
暴露人群选择
职业人群 特殊暴露人群 一般人群 有组织的人群团体
第 7 版 流行病学 人 民 卫 生 出 版 社
对照人群的选择
内对照 (internal control) : 一群研究对象内部 外对照 (external control) : 一群研究对象外部 总人口对照 (total population control) : 整个地区 现成的发病或死亡统计资料 多重对照 (multiple controls) :两种或以上的对照 形式 实例是从一般人群中选择研究对象,采用内对照
第 7 版 流行病学 人 民 卫 生 出 版 社
计算样本量时需考虑的问题
抽样方法 暴露组与对照组的比例 失访率
确定样本量
第 7 版 流行病学 人 民 卫 生 出 版 社
影响样本量的因素
对照人群中所研究疾病的发病率 p0
暴露组与对照组人群发病率之差 p1-p0
第一类 错误 α值
把握度 (power) 1-β
第 7 版 流行病学 人 民 卫 生 出 版 社
p : : 两个发病率的平均值两个发病率的平均值pp11 ::暴露组预期发病率暴露组预期发病率pp00 ::对照组预期发病率对照组预期发病率
样本量的计算:查表公式计算(条件 暴露组和对照组样本含量相等暴露组和对照组样本含量相等))
201
2
11002
pp
qpqpzpqzn
第 7 版 流行病学 人 民 卫 生 出 版 社
已知 p0=0.003 , RR=2.5 , α=0.05 , β=0.1
计算样本量 根据上述条件 zα=1.96 , zβ=1.282 , q0=0.997
p1=p0×RR=0.0075 , q1=0.9925
代入公式得 n=5420
即 HBsAg阳性组与阴性组各需 5420 人
实例
第 7 版 流行病学 人 民 卫 生 出 版 社
基线资料
随 访
资料收集方法
资料的收集与随访
第 7 版 流行病学 人 民 卫 生 出 版 社
基线 (baseline) 资料暴露的资料个体的其他信息实例对研究对象的基线资料的收集包括:血清 HBsAg,同时还收集了肝炎史、 PHCC
家族史、职业、吸烟、饮茶、饮酒、水源类型、主食类型等其他可疑危险因素及年龄、性别等人口学特征资料。
第 7 版 流行病学 人 民 卫 生 出 版 社
随访 (follow up)
随访对象、内容和方法 随访间隔 随访者 观察终点(研究对象出现了预期的结果) 观察终止时间(整个研究工作截止的时间)实例是从 1993年起到 2003年止每年随访一次,观察终点是 PHCC死亡
第 7 版 流行病学 人 民 卫 生 出 版 社
查阅纪录
调查询问
健康或疾病检查
环境监测等
资料收集方式
第 7 版 流行病学 人 民 卫 生 出 版 社
调查员的选择
调查员培训
制定调查员手册
监督
质量控制
第 7 版 流行病学 人 民 卫 生 出 版 社
基本整理模式
人时的计算
率的计算
效应的估计
第三节 资料的整理与分析
第 7 版 流行病学 人 民 卫 生 出 版 社
基本整理模式
病例 非病例 合计暴露组 a ( 1079 ) b ( 13259 ) a+b=n1
非暴露组 c ( 387 ) d ( 75511 ) c+d=n0
合计 a+c=m1 b+d=m0 a+b+c+d=t
非暴露组发病率 =c/n0=75.25‰
暴露组发病率 =a/n1=5.10‰
表 4-1 队列研究资料归纳整理表(累积发病率资料)
第 7 版 流行病学 人 民 卫 生 出 版 社
暴露组 非暴露组 合计病例数 A1 ( 1079) A0 ( 387) M
人年数 T1
( 139238.27)T
0 ( 780562.0
1 )
T
暴露组发病率 = A1 / T1=774.93
非暴露组发病率 = A0 / T 0=49.58
表 4-2 队列研究资料归纳整理表(人时资料)
第 7 版 流行病学 人 民 卫 生 出 版 社
人时的计算
精确法:逐人逐天计算
近似法:按年平均人口数计算
寿命表法:当年内进入或退出队列的
个人均作 1/2
人年计算
第 7 版 流行病学 人 民 卫 生 出 版 社
率的计算
常用指标 累积发病率
发病密度
标化死亡比
标化比例死亡比
第 7 版 流行病学 人 民 卫 生 出 版 社
变化范围 0~1
适用条件 样本大 人口稳定 整齐的资料 报告时必须注明时间长短
累积发病率 (cumulative incidence)
CI=观察期内发病(或死亡)人数
观察开始时的人口数
第 7 版 流行病学 人 民 卫 生 出 版 社
发病密度 (incidence density)
变化范围 0~∞
适用条件 观察时间长 人口不稳定 存在失访 资料不很整齐
ID =观察期内发病(或死亡)人数
观察人时
第 7 版 流行病学 人 民 卫 生 出 版 社
标化死亡比 (standardized mortality ratio , SMR)
变化范围 0~∞
适用条件 结局事件的发生率低 样本小,不宜直接计算率时
的预期死亡数以标准人口死亡率计算数研究人群中的观察死亡
SMR
第 7 版 流行病学 人 民 卫 生 出 版 社
全人口某病的死亡(发病)率 × 观察人口数
预期死亡(发病)数的计算:
第 7 版 流行病学 人 民 卫 生 出 版 社
SMR=1
研究人群某病死亡(发病)危险 = 标准人群 SMR>1
研究人群某病死亡(发病)危险 > 标准人 群,是标准人群的 SMR倍 SMR<1
研究人群某病死亡(发病)危险 < 标准人群
SMR 的意义 被研究人群死于(发生)某病的危险性是标准人群的多少倍
第 7 版 流行病学 人 民 卫 生 出 版 社
标化比例死亡比 ( standardized proportional mortality ratio, SPMR )
预期死亡数实际死亡数
SPMR
变化范围 0~∞
适用条件 不能得到历年人口资料 仅有死亡人数、原因、日期和年龄
第 7 版 流行病学 人 民 卫 生 出 版 社
预期死亡数计算
全人口中某病因死亡数全部死亡数
×某单位实际全部死亡数
第 7 版 流行病学 人 民 卫 生 出 版 社
显著性检验
u检验:当样本量较大, p 和 1-p都不太 小时 直接概率法二项分布检验泊松( Poisson )分布检验2检验计分检验( score test )
第 7 版 流行病学 人 民 卫 生 出 版 社
效应的估计
相对危险度 归因危险度 归因危险度百分比 人群归因危险度 人群归因危险度百分比 剂量 - 反应关系
第 7 版 流行病学 人 民 卫 生 出 版 社
相对危险度( relative risk, RR )
0
1
0 nc
na
I
IRR e
意义 E 发病或死亡的危险是 Ē 的多少倍 RR值 ,暴露的效,应 暴露与结局关联强度
暴露组率
非暴露组率
通常包括了危险度比( risk ratio )或率比 (rate ratio, RR) 。 即暴露组的危险度(累积发病率)或发病密度与对照组的危险度或发病密度之比。
第 7 版 流行病学 人 民 卫 生 出 版 社
意义 乙肝病毒感染者发生 PHCC的危险是非乙肝病毒感染者的 14.75倍
发病密度 0.4959‰ 15.63
实例 乙肝病毒感染与 PHCC关系的队列研究结果
累积发病率7.749 ‰
75.25‰
暴露组5.10‰
非暴露组14.75
RR
第 7 版 流行病学 人 民 卫 生 出 版 社
RR 与关联强度
很强10~< 0.1
强3.0~9.90.1~0.3
中1.5~2.90.4~0.6
弱1.2~1.40.7~0.8
无1.0~1.10.9~1.0
关联强度RR
第 7 版 流行病学 人 民 卫 生 出 版 社
RR 的 95%CI
RR 95%CI
反自然对数即为 RR 95%CI,实例算出的危险度比(RR) 的 95% 可信区间是: 13.12 ~ 16.60
Woolf 法
dcba
RRVar 1111 ln
RRVarRRln 96.1 ln
ln
第 7 版 流行病学 人 民 卫 生 出 版 社
归因危险度 (attributable risk, AR )
意义E 与 Ē 人群比较,所增加的疾病发生数量AR值 暴露因素消除后所减少的疾病数量
ca或
1000
× RRIIIRRAR
010 nnIIAR
e
即暴露组发病率(危险度)与对照组发病率(危险度)相差的绝对值
第 7 版 流行病学 人 民 卫 生 出 版 社
意义RR 吸烟对肺癌的病因学意义较大AR 戒烟对心血管疾病的预防作用较大 即公共卫生意义较大
RR 与 AR 的区别
心血管疾病肺癌疾病
1.7
10.7
RR
126.43170.32296.75
45.434.6950.12
AR非吸烟者吸烟者
( 1/10万人年)
第 7 版 流行病学 人 民 卫 生 出 版 社
归因危险度百分比 AR%(病因分值 EF )
RR
或
%100%0 ×
eI
IIeAR
%1001
% ×
RRAR
指暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比。
意义:暴露人群中的发病或死亡归因于暴露的部分占全部发病或死亡的百分比
第 7 版 流行病学 人 民 卫 生 出 版 社
人群归因危险度 (population attributable risk, PAR)
暴露人群与一般人群比较,所增加的疾病发生率的大小
PAR值 暴露因素消除后所减少的疾病数量
PAR= It - I0
It:总人群率Io:非暴露组率
指总人群发病率中归因于暴露的部分
意义
第 7 版 流行病学 人 民 卫 生 出 版 社
人群归因危险度百分比 PAR %
PAR占总人群全部发病(或死亡)的百分比
%100% 0
t
t
I
IIPAR
%100
11
1%
RRP
RRPPAR
e
e
或
Pe:总人群的暴露比例
意义
第 7 版 流行病学 人 民 卫 生 出 版 社
实例
已知 Ie=75.25 ‰ , 5.10‰ ,全人群的 PHCC死亡率 It=16.25‰ ,则:
AR=70.15 ‰, AR%=93.2%
PAR= 11.15‰, PAR%= 68.6%
从计算结果可知,虽然 HBV导致 PHCC 的 AR%
达 93.2% ,但因人群中只有部分人感染了 HBV ,故其 PAR%仅为 68.6% 。
第 7 版 流行病学 人 民 卫 生 出 版 社
分析方法
列出不同暴露水平下的发病率以最低暴露水平组为对照,计算各暴露水平的RR 和危险度差 (RD)
必要时,应对率的变化作率的趋势性检验
剂量 - 反应关系
第 7 版 流行病学 人 民 卫 生 出 版 社
结果
血清胆固醇水平 患冠心病的 RR
说明存在剂量效应关系
表 4-3 40 ~ 59岁男子按基线血清胆固醇分组的冠心病 6 年发生情况
血清胆固醇 (mg/dl) 人数 病例数 危险度 平均年发病率 RR AR
<210 454 16 0.0352 0.0059 1.00 0.0000
210 ~ 455 29 0.0637 0.0106 1.81 0.0285
>245 424 51 0.1203 0.0200 3.39 0.0851
合计 1333 96 0.0720 0.0120
第 7 版 流行病学 人 民 卫 生 出 版 社
选择偏倚
失访偏倚 信息偏倚(本章略)
混杂偏倚(本章略)
第四节 常见偏倚及其控制
第 7 版 流行病学 人 民 卫 生 出 版 社
选择偏倚( selection bias )
研究人群在一些重要因素方面与
一般人群或待研究的总体人群存在差异,
而导致研究结果的偏倚。
第 7 版 流行病学 人 民 卫 生 出 版 社
产生原因 选择对象的方法不当
最初选定参加研究的对象中有人拒绝参加
历史性队列研究中部分档案丢失或记录不全 志愿者队列 研究开始时未能发现早期病人等
控 制 预防为主,抽样方法正确,严格按规定标准选择对象,提高研究对象的应答率和依从性
第 7 版 流行病学 人 民 卫 生 出 版 社
失访偏倚( lost to follow-up )
研究对象因迁移、外出、死于非
终点疾病或拒绝继续参加观察而退出队
列所引起的偏倚。
本质上属于选择性偏倚
第 7 版 流行病学 人 民 卫 生 出 版 社
控 制设计 选择便于随访的人群 在计算的研究样本的基础上扩大 10%实施 加强对随访员的管理 制定随访计划和监测措施整理资料 对失访对象进行补查 比较失访者和急需观察者的基本特征差异, 以评估失访可能造成的影响
第 7 版 流行病学 人 民 卫 生 出 版 社
优点 直接获得暴露组和非暴露组的发病率或死亡率 直接估计危险度 符合时间顺序,验证病因的能力较强 获得一种暴露与多种结局的关系 收集的资料完整可靠,不存在回忆偏倚 可研究疾病的自然史
第五节 优点与局限性
第 7 版 流行病学 人 民 卫 生 出 版 社
局限性
不适于发病率很低的疾病的病因研究 易发生失访偏倚 耗时,耗人力、物力、财力 设计要求严密,资料的收集和分析难度较大 随访过程中,已知变量的变化或未知变量的 引入增加分析难度