第十三章 医学统计学方法的基本概念和基本步骤

53
第第第第 第第 第第第第第第第第第第第第第第

description

第十三章 医学统计学方法的基本概念和基本步骤. 医学统计学的学习要求:. 理解基本的统计原理 正确选择、运用统计分析方法 培养基本的统计思维能力. 不要求: 公式的推导和记忆、 复杂的手工计算. 2. 教材:预防医学 施榕主编 内容: 第十三章 医学统计学方法的基本概念和基本步骤 第十四章 数值变量的统计描述 第十五章 数值变量的统计推断 第十六章 分类变量的统计描述 第十七章 分类资料的统计推断 第十八章 秩和检验 第十九章 直线相关与回归分析 第二十一章 统计表和统计图. 本节主要内容. 第一节 统计学的几个基本概念 - PowerPoint PPT Presentation

Transcript of 第十三章 医学统计学方法的基本概念和基本步骤

Page 1: 第十三章 医学统计学方法的基本概念和基本步骤

第十三章 医学统计学方法的基本概念和基本步骤

Page 2: 第十三章 医学统计学方法的基本概念和基本步骤

2

医学统计学的学习要求:

理解基本的统计原理正确选择、运用统计分析方法培养基本的统计思维能力

不要求: 公式的推导和记忆、 复杂的手工计算

Page 3: 第十三章 医学统计学方法的基本概念和基本步骤

教材:预防医学 施榕主编内容:第十三章 医学统计学方法的基本概念和基本步骤第十四章 数值变量的统计描述第十五章 数值变量的统计推断第十六章 分类变量的统计描述第十七章 分类资料的统计推断 第十八章 秩和检验第十九章 直线相关与回归分析第二十一章 统计表和统计图

Page 4: 第十三章 医学统计学方法的基本概念和基本步骤

本节主要内容

第一节 统计学的几个基本概念

第二节 医学统计工作的基本步骤

Page 5: 第十三章 医学统计学方法的基本概念和基本步骤

一、什么是医学统计学?

例 1 :比较两种疗法对活动期十二指肠球部溃疡。一组:口服呋喃硝铵,有效率 90% ;另一组:口服西咪替丁,有效率 85%问:能否立即下结论,呋喃硝铵疗效高于西咪替丁?

Page 6: 第十三章 医学统计学方法的基本概念和基本步骤

医学统计学:应用概率论和数理统计的基本原理和方法,研究医学领域中数据的收集、整理和分析的一门应用性学科。 是指导人们如何对科研问题进行严密的设计、获取可靠的数据、正确的归纳、分析与推理判断的科学,帮助揭示疾病或现象的发生、发展规律,为预防疾病、促进健康提供客观依据。

Page 7: 第十三章 医学统计学方法的基本概念和基本步骤

二、为什么要学统计学?

1. 采用统计学方法,发现不确定现象背后隐藏的规律。

变异( variation):是社会和医学中的普遍现象。 变异使得实验或观察的结果具有不确定性,如每个人

的身高、体重、血压等各有不同。

Page 8: 第十三章 医学统计学方法的基本概念和基本步骤

2. 用统计学思维方式考虑有关医学研究中的问题 “阳性”结果是否是虚假联系? 某感冒药治疗 1 周后,治愈率为 90% ,能否说该感冒药十分

有效? “阴性”结果是否是样本含量不足?

有人曾对发表在 Lancet, N Engl J Med , JAMA 等著名医学杂志上的 71 篇阴性结果的论文作过分析,发现其中有 62篇( 93% )可能是由于样本含量不足造成的假阴性。

Page 9: 第十三章 医学统计学方法的基本概念和基本步骤

3. 保证你的研究论文能通过统计学审查 据国外 60~ 80 年代对不同医学杂志发表论文的调查结果显示,有统计错误的论文所占比例高达 72% ,最低也有 20% 。

国内 1984 年对《中华医学杂志》、《中华内科杂志》、《中华外科杂志》、《中华妇产科杂志》、《中华儿科杂志》 595 篇论文的调查结果,相对数误用为 11.2% ,抽样方法误用 15.9% ,统计图表误用 11.7% 。

某研究者 1996 年对 4586 篇论文统计(中华医学会系列杂志仅占 6.9% ),数据分析方法误用达 55.7% 。

Page 10: 第十三章 医学统计学方法的基本概念和基本步骤

JAMA,新英格兰医学杂志( NEJM)、英国医学杂志、中华医学会杂志对来稿都有统计学要求或统计学指导。

国际生物医学杂志编辑协会在其《生物医学期刊投稿的统一要求》中也包含了统计学要求。

Uniform Requirements for Manuscripts

Submitted to Biomedical Journals

http:// www.acponline.org

Page 11: 第十三章 医学统计学方法的基本概念和基本步骤

第一节 统计学的几个基本概念

Page 12: 第十三章 医学统计学方法的基本概念和基本步骤

一、 总体和样本

总体 : 是指根据研究目的确定的性质相同的观察单位的全体。

更确切地说,是同质的所有观察单位某项观察值(变量值)的集合。

population and sample 观察单位( observation unit ): 统计研究中的最基本单位,可以是一个人、一个家庭、一个地区、一个样品。

Page 13: 第十三章 医学统计学方法的基本概念和基本步骤

同质:是指除了实验因素外,影响被研究指标的非实验因素相同。即研究对象的性质相同。

变异:是指在同质的基础上,被观察个体之间观察指标的差异。

同质和变异homogeneity and variation

Page 14: 第十三章 医学统计学方法的基本概念和基本步骤

例 1 调查 2007年上海市 7 岁男童的身高和体重 同质: 2007年、上海市、 7 岁男童 变异:身高和体重各不相同

例 2 研究某降压药的疗效 同质:高血压患者、用某药治疗 变异:疗效各不相同

同质和变异

Page 15: 第十三章 医学统计学方法的基本概念和基本步骤

总体和样本

研究目的

总 体 该地 2002年全部正常成人的白细胞数

观察单位 每个正常成人

变 量 值 每人测得的白细胞数

研究某地 2002年正常成人白细胞数

同质基础:同一地区、同一年份、同为正常人、

有限

总体

Page 16: 第十三章 医学统计学方法的基本概念和基本步骤

例如:研究用珍菊降压片高血压患者治疗后的疗效

同质基础:同为高血压患者、同用珍菊降压片治疗

总体:包括设想用该药治疗的所有高血压患者的治疗效果

这个结果没有时间和空间的限制,观察单位数无限

无限总体

无限总体

Page 17: 第十三章 医学统计学方法的基本概念和基本步骤

有限总体:总体中所包含的个体数目是可以掌握的,有空间、时间的限制。

无限总体:没有具体的空间、时间的限制,所包含的个体数目是未知的。(设想的、或抽象的)

有限总体和无限总体

Page 18: 第十三章 医学统计学方法的基本概念和基本步骤

调查某地 2002 年正常成人的白细胞数 —— 总体

从某地 2002 年正常成人随机抽取 150 人,分别测其白细胞数,组成样本。—— 样本

总体总体 样本抽取部分观察单位

统计量统计量参 数参 数 推断inference

Page 19: 第十三章 医学统计学方法的基本概念和基本步骤

样本 : 是从总体中随机抽取的具有代表性的一部分观察单位其某

项指标的实测值的集合。

抽样( sampling ):从总体中抽取部分个体的过程。

样本含量( sample size ) :样本包含的观察单位的数称为样

本含量、样本大小或样本例数

如何正确地由样本反映总体呢?

抽样时必须遵循随机化原则

Page 20: 第十三章 医学统计学方法的基本概念和基本步骤

随机性: 总体中每个个体都有相同的机会被抽取到样本

随机不等于随意

随机抽样的实现:随机数字表

Page 21: 第十三章 医学统计学方法的基本概念和基本步骤

参数和统计量parameter and statistic

参数:根据总体个体值计算出来

的描述总体特征的总体特征的的指标。

希腊字母表示:如总体均数

μ 、总体标准差 σ 、总体率 π等。

是固定的常数 但一般未知。

普查

统计量: 根据样本个体值计算出来

的描述样本特征的指标 拉丁字母表示:如样本均数、

样本率 p 等。 在参数附近随机波动。

抽样调查

x

Page 22: 第十三章 医学统计学方法的基本概念和基本步骤

由于抽样所引起的样本统计量与总体参数之间的差异称为抽样误差。

产生的原因: 1. 个体之间存在变异 2.抽样时只能抽取总体中的一部分作为样本 不可避免 但有一定的分布规律,可估计;并在一定范围内控制抽样误差

二、抽样误差( random sampling error ):

Page 23: 第十三章 医学统计学方法的基本概念和基本步骤

三、变量及其分类

实验或调查研究中的观察指标称为随机变量 (random

variable) ;

变量的观测值称为变量值 (variable value) 或观察值( observed value )

由变量值构成资料( data )

Page 24: 第十三章 医学统计学方法的基本概念和基本步骤

根据变量值是否定量可分为数值变量( numerical variable):计量资料

分类变量( categorical variable):•无序分类变量( unordered categorical variable )计数资料

•有序分类变量( ordinal categorical variable )

等级资料

Page 25: 第十三章 医学统计学方法的基本概念和基本步骤

25

1. 计量资料( measurement data): 定义:用定量方法对观察单位准确测量后所得的资料。

变量值是定量的,表现为数值大小 ,多有度量衡单位。特点: 有度量衡单位 多为连续性资料 例如:身高( cm )、体重( kg )

血压( mmHg )、脉搏(次 / 分) 红细胞计数( 1012/L )

Page 26: 第十三章 医学统计学方法的基本概念和基本步骤

26

2. 计数资料( enumeration data )定义:用定性的方法得到的资料。 按观察单位某种性质或特征分组后,再分别清点各组观察单位的个数。

变量表现为互不相容的类别或属性特点:没有度量衡单位 多为间断性资料 例如:肤色(黑、白)——二项分类 血型( ABO ——) 多项分类 职业(工农兵 ——) 多项分类 性别(男女) ——二项分类

Page 27: 第十三章 医学统计学方法的基本概念和基本步骤

3. 等级资料 (ranked data) 定义:将观察单位按某种属性的不同程度分成等级后分组计数所得的资料。

是介于计量资料和计数资料之间的一种资料特点:其变量值具有半定量性质 表现为等级大小或属性程度例如: ①癌症分期:早、中、晚。 ②药物疗效:治愈、好转、无效、死亡。 ③尿蛋白: ,,,++,+++ 及以上

Page 28: 第十三章 医学统计学方法的基本概念和基本步骤

实例数据 1

Page 29: 第十三章 医学统计学方法的基本概念和基本步骤

实例数据 2

Page 30: 第十三章 医学统计学方法的基本概念和基本步骤

4. 三类资料间关系

例:一组 2040岁成年人的血压

以 12kPa为界分为正常与异常两组,统计每组例数

<8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压

计量资料等

级资

料 计数资料

Page 31: 第十三章 医学统计学方法的基本概念和基本步骤
Page 32: 第十三章 医学统计学方法的基本概念和基本步骤

确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:

肯定发生某种结果的叫必然事件; 肯定不发生某种结果的叫不可能事件。随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。

随机事件:在一定条件下某一现象可能发生也可能不发生的事件。 随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的或者可以估计的。

四、概率 (probability )

Page 33: 第十三章 医学统计学方法的基本概念和基本步骤

概率 ( probability ) :是反映某一随机事件发生的可能性大小的一个量度,记为 P,取值

[0 , 1] 。 必然事件: P= 1 不可能事件: P= 0 随机事件: 0<P<1 P<0.05或 P<0.01的随机事件称为小概率事件

统计学上认为 1 次抽样中不大可能发生。

CertainCertain

ImpossibleImpossible

0.50.5

00

11

Page 34: 第十三章 医学统计学方法的基本概念和基本步骤

频率( frequency ) :指样本的实际发生率。设在相同条件下,独立重复进行 n 次试验,随机事件 A

出现 f 次,则事件 A出现的频率为 f /n 。

例如投掷硬币,历史上有人对此做过实验得到如下结果:实验者 抛掷次数 正面次数 %频率( )

德摩尔根 2048 1061 0. 5181Buff on 4040 2048 0. 5069

K. pearson 12000 6019 0. 5016K. pearson 24000 12012 0. 5005

频 率 ( frequency )

Page 35: 第十三章 医学统计学方法的基本概念和基本步骤

频率与概率间的关系样本频率总是围绕概率上下波动样本含量 n越大,波动幅度越小,频率越接近

概率。频率常用于估计概率:当 n→∝时, f /n→ P(A) 。

Page 36: 第十三章 医学统计学方法的基本概念和基本步骤

第二节 医学统计学的基本步骤

1. 设 计:包括观察性研究设计和实验性 研究设计

2. 收集资料:取得准确可靠的原始资料

3. 整理资料:对资料进行清理、改错,数量化

4. 分析资料:统计描述、统计推断

Page 37: 第十三章 医学统计学方法的基本概念和基本步骤

定义:是在保证科学性、可重复性和高效性的前提下,为验证研究假说而制定周密的医学研究计划。

在广泛的查阅文献、全面了解现状、广泛征询意见的基础上,对将要进行的研究工作所作的全面的设想。

1 、设计( design )

Page 38: 第十三章 医学统计学方法的基本概念和基本步骤

1 、设计( design )的分类: 调查设计( survey design):对研究对象不施加任何干预,通常建立随机抽样( random sampling)方案。

搜集资料在整个研究设计中占主要地位 .

实验设计( experiment design ):对研究对象施加干预,如动物实验研究、临床试验,通常建立随机分组( random allocation)方案。

Page 39: 第十三章 医学统计学方法的基本概念和基本步骤

2 、设计( design )的内容(1) 明确研究目的和研究假说。(2)确定研究对象与观察单位、样本含量和抽样方法。(3)是否施加干预,如何施加干预?如何设置对照?(4)设置观察指标。(5) 需搜集哪些原始资料,用什么方法 ?(6)如何对取得资料作进一步的整理和汇总,计算统计指标。(7)如何控制误差。(8)预期会得到什么结果。(9)研究进度和经费的安排等。

Page 40: 第十三章 医学统计学方法的基本概念和基本步骤

Fisher 在他的著作中多次强调,统计学家与科学研究者的合作应该在实验设计阶段,而不是在需要数据处理的时候。

“试验完成后再找统计学家,无异于请统计学家为试验进行“尸体解剖”。 统计学家或许只能告诉你试验失败的原因。”

Page 41: 第十三章 医学统计学方法的基本概念和基本步骤

2 、收集资料( data collection )收集资料:根据研究目的收集准确、完整的原始资料。

资料的来源:1 、统计报表:疫情报表、医院工作报表等;

2 、登记和报告卡(单):传染病和职业病发病报告卡,肿瘤发病及死亡报告卡,出生及死亡报告单等;

3 、日常医疗卫生工作记录:如门诊病例、住院病例、健康检查记录、卫生监测记录等

4 、专题调查或实验研究:开展医学科研的主要资料来源

前三种都有局限性。

Page 42: 第十三章 医学统计学方法的基本概念和基本步骤

资料收集计划 ①选择搜集资料的地点、人员和时间; ②搜集资料人员的培训方案; ③预调查或预实验方案拟定; ④资料的记录方式; ⑤调查表的拟订和印刷; ⑥调查或实验仪器、试剂的准备; ⑦调查资料的抽样复核比例和方法; ⑧搜集资料所需经费的准备等。

Page 43: 第十三章 医学统计学方法的基本概念和基本步骤

目的是对搜集到的原始资料其系统化和条理化,便于进一步计算统计指标和深入分析。

资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。

3 、整理资料( data sorting )

Page 44: 第十三章 医学统计学方法的基本概念和基本步骤

资料整理的过程

1 、对原始数据进行核对和检查。2 、设计分组。( 1 )质量分组:按属性或类别归类分组;( 2 )数量分组 : 按数值大小分组。3 、按分组要求设计整理表,汇总资料。

Page 45: 第十三章 医学统计学方法的基本概念和基本步骤

可借助于计算机软件( EpiData, Study -Builder, Excel)来完成。 1、编码,将数据输入计算机 2、纠错改错、补漏等

Page 46: 第十三章 医学统计学方法的基本概念和基本步骤

运用统计学的基本原理和方法,根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计分析方法,进行一系列的统计描述和统计推断,揭示事物内部的规律。

可借助于计算机(常用软件:SPSS 、 SAS 、 STATA)完成。

4 、分析资料( data analysis )

Page 47: 第十三章 医学统计学方法的基本概念和基本步骤

4 、分析资料( data analysis )

统计描述( descriptive statistics ) 是指用统计指标和适宜的统计图、统计表等

方法,描述统计资料的分布规律及其数量特征。统计推断( inferential statistics ) 是通过随机样本信息推断总体特征的过程。 参数估计( parameter estimation)

假设检验( hypothesis test)

Page 48: 第十三章 医学统计学方法的基本概念和基本步骤

第二十二章 常用统计分析软件简介( 284页)

一、 SPSS ( PASW )软件:二、 SAS软件 : 统计专业用户三、 STATA软件:分析能力强,速度极快! 图形精美四、 EPI INFO :流行病学调查得数据管理软件。

Page 49: 第十三章 医学统计学方法的基本概念和基本步骤

SPSS软件美国斯坦福大学研制,目前已被 IBM兼并。最新版本 19.0.

特点:界面友好、使用方便、功能齐全。

Page 50: 第十三章 医学统计学方法的基本概念和基本步骤
Page 51: 第十三章 医学统计学方法的基本概念和基本步骤
Page 52: 第十三章 医学统计学方法的基本概念和基本步骤
Page 53: 第十三章 医学统计学方法的基本概念和基本步骤

SPSS软件