第一讲 教育测评的统计基础

37
第 第第第第第 第第第

description

第一讲 教育测评的统计基础. 一、什么是统计学? (一)含义 1. 研究随机现象的规律 2. 研究样本与总体的关系. (二)内容. 1. 描述统计 研究对数据的初步整理和分析。 2. 推断统计 研究如何通过样本的信息,估计总体的信息和对总体的信息进行推断,这些估计和推断是在一定的概率基础上进行的。 3. 实验设计. (三)基本概念. 1. 总体与样本 2. 随机现象 3. 概率 4. 抽样 5. 统计量与参数. (四)方法与功用. 1. 方法:不完全归纳法 2. 功用: ( 1 )研究和处理随机事件; ( 2 )量化研究. - PowerPoint PPT Presentation

Transcript of 第一讲 教育测评的统计基础

Page 1: 第一讲 教育测评的统计基础

第一讲 教育测评的统计基础

Page 2: 第一讲 教育测评的统计基础

•一、什么是统计学?

•(一)含义•1. 研究随机现象的规律•2. 研究样本与总体的关系

Page 3: 第一讲 教育测评的统计基础

(二)内容• 1. 描述统计• 研究对数据的初步整理和分析。• 2. 推断统计• 研究如何通过样本的信息,估计总体的

信息和对总体的信息进行推断,这些估计和推断是在一定的概率基础上进行的。

• 3. 实验设计

Page 4: 第一讲 教育测评的统计基础

(三)基本概念• 1. 总体与样本• 2. 随机现象• 3. 概率• 4. 抽样• 5. 统计量与参数

Page 5: 第一讲 教育测评的统计基础

(四)方法与功用• 1. 方法:不完全归纳法• 2. 功用:• ( 1 )研究和处理随机事件;• ( 2 )量化研究

Page 6: 第一讲 教育测评的统计基础

二、 数据的描述统计分析

• (一)集中量数• 表示数据集中趋势或典型水平的量数。

常用的有算术平均数、中数、众数等。• 算术平均数( Mean)= 所有数据之和 /

数据的总频数 =∑X/N ,用 X 表示。• 平均数的优、缺点:简明易懂、适合代

数运算;但易受极端值影响。

Page 7: 第一讲 教育测评的统计基础

(二)差异量数• 表示数据差异程度或分散程度、离散

程度的量数。常用有方差、标准差、平均差等。

• 最常用的是:方差与标准差 (std.deviation)

• 方差等于离差平方的算术平均数。可用S2 、 σ2 表示。标准差等于方差的平方根,可用 S 、 σ 表示。

Page 8: 第一讲 教育测评的统计基础

• ∑ ( X - X ) 2

• S2=————————• N• ( X1- X ) 2+ ( X2- X ) 2 +… ( Xn- X )

2

• = ——————————————• N

Page 9: 第一讲 教育测评的统计基础

(三)标准分数• 1. 定义:标准分数等于离差除以标准差

之商。用 Z 表示。• Z= ( X - X ) /S• 标准分数是不带单位的相对位置量数,

它表示其原始分数在团体中的相对位置。• 2.T 分数 =Z×10+50• 3.CEEB 分数 =Z×100+500

Page 10: 第一讲 教育测评的统计基础

(四)相关量数• 1 、相关的含义• 两个随机变量之间不精确、不稳定的变化关系

称为相关关系。它与函数关系的区别就在于两个变量值不是一一对应得那样精确、稳定。

• 从变化方向来看,有:• ( 1 )正相关• ( 2 )负相关• ( 3 )零相关

Page 11: 第一讲 教育测评的统计基础

• 从密切程度来看,有:• 1 、强相关或高度相关• 2 、中度相关• 3 、弱相关或低度相关

Page 12: 第一讲 教育测评的统计基础

2 、相关系数• 用来描述两个变量之间变化方向及密切程

度的数字特征量称为相关系数。用 r 表示。• 相关系数的取值范围, [-1 , 1] 。• 相关系数的值,仅仅是一个比值。不能加

减乘除。• 相关系数只能描述两个变量之间的变化方

向及密切程度,并不能揭示二者之间的内在本质联系。

• 相关关系也并不一定是因果关系。

Page 13: 第一讲 教育测评的统计基础

3 、积差相关

• ( 1 )积差相关的概念• 当两个变量都是正态连续变量,而且

两者之间呈线性关系,表示这两个变量之间的相关称为积差相关。

Page 14: 第一讲 教育测评的统计基础

• ( 2 )积差相关的使用条件• ① 两个变量都是由测量获得的连续性

数据。• ② 两个变量的总体都呈正态分布。• ③ 必须是成对的数据,而且每对数据

之间是相互独立的。• ④ 两个变量之间呈线性关系。可由相

关散布图的形状来决定。• ⑤ 要排除共变因素的影响。• ⑥ 样本容量 n ≥ 30 ,计算出的积差

相关系数才具有有效意义。

Page 15: 第一讲 教育测评的统计基础

( 3 )积差相关系数的定义公式及计算

• • ∑ ( X—X )( Y—Y)• r = ——————————• N σx σy

• XY — X Y• = ———————————— • σx σy

Page 16: 第一讲 教育测评的统计基础

三、 推断统计的理论基础• (一)概率的含义及运算• 1 、后验概率•           m •   频率 W(A)=— •           n •   随机事件A在N次试验中出现M次,随着试

验次数N的无限增大,随机事件A的频率稳定于一个常数P,这个常数P就是随机事件A出现概率的近似值。可表示为:

M•   P(A)≈───•          N•

Page 17: 第一讲 教育测评的统计基础

2 、先验概率• 先验概率是通过古典概率模型加以定义的,故又称为古典概率。

•   古典概率模型要求满足两个条件:•   (1)试验的所有结果是有限的;•   (2)每一种可能结果出现的可能性(概

率)相等。•  若所有可能结果的总数为N,随机事件A包括M个可能结果,则事件A的概率为:

•         M•   P(A)=———•         N

Page 18: 第一讲 教育测评的统计基础

3 、概率的加法和乘法• (1)概率的加法• 在一次试验中不可能同时发生的事件称

为互不相容事件。 • 两个互不相容事件和的概率,等于这

两个事件概率之和。•  P(A+B)=P(A)+P

(B)

Page 19: 第一讲 教育测评的统计基础

(2)概率的乘法• 独立事件:A事件出现的概率不影响B事件出现的概率。

• 两个独立事件积的概率,等于这两个事件概率的乘积。

•  P(AB)=P(A)P(B)

Page 20: 第一讲 教育测评的统计基础

(二)正态分布• 正态分布的特点• 1、曲线在Z=0处为最高点。• 2、曲线以Z=0处为中心,双侧对称。• 3、曲线从最高点向左右缓慢下降,并无限伸延,但永不与基线相交。

• 4、标准正态分布上的平均数为0,标准差为1。

• 5、曲线从最高点向左右伸延时,在正负1个标准差之内,既向下又向内弯。从正负1个标准差开始,既向下又向外弯,即拐点位于正负1个标准差处。

Page 21: 第一讲 教育测评的统计基础

四、推断统计的基本原理 • (一) 什么是小概率事件?• 发生的概率非常小的随机事件。通常我们选择概率小于 5%或 1%的随机事件为小概率事件。

• (二)推断统计的基本假设• 小概率事件在一次抽样中不可能发生。• (三)推断统计的基本方法• 概率意义上的反证法。

Page 22: 第一讲 教育测评的统计基础

(四)举例说明• 某小学历届毕业生汉语拼音测验平均

分数为 66 分,标准差为 12 分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取 36份试卷,算得平均分为 70 分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?

Page 23: 第一讲 教育测评的统计基础

五、研究问题与推断统计方法• (一)小学生学习经验调查问卷• 1. 个人变量• 学生性别;家庭状况等。• 属于类别和等级变量• 2. 数学焦虑• 27题, a1~a27;包括压力惧怕、情绪担忧、考试焦虑、课堂焦虑四个因素层面,

• 属于连续变量

Page 24: 第一讲 教育测评的统计基础

3. 数学态度•共有 30 个题目, b1~b30 ;包括学习信心、有用性、成功态度、探究动机四个层面。

•属于连续变量。•4. 数学投入动机•共 14 个题目, c1~c14 ;包括工作投入、自我投入动机两个因素层面。

•属于连续变量

Page 25: 第一讲 教育测评的统计基础

5. 数学成绩•自编数学成绩测验,共 45题(满分为

45 分)•属于连续变量

Page 26: 第一讲 教育测评的统计基础

(二)研究问题与统计方法• 研究问题 1 :小学生的数学焦虑、数学态度、数学投入动机与数学成绩的现状如何?

• 以平均数和标准差最为适宜。

Page 27: 第一讲 教育测评的统计基础

研究问题 2• 学生的数学焦虑、数学态度、数学动机、数

学成绩间是否有显著的相关存在?• 计算积差相关• 计算积差相关的基本假定:• 1. 受试样本人数最好在 30人以上• 2. 变量间均为连续变量• 3. 变量总体均呈正态分布• 4. 二者相关形态为直线相关,而非曲线相关。

Page 28: 第一讲 教育测评的统计基础

研究问题 3• 不同性别的学生,其数学焦虑、数学态

度、数学投入动机与数学成绩是否有显著差异?

•自变量为学生性别,属于类别变量• 因变量有 4 个,均属于连续变量•采用独立样本 t-test ,分开检验• 为何是独立样本?

Page 29: 第一讲 教育测评的统计基础

研究问题 4• 不同家庭状况的学生,其数学成绩、数

学焦虑是否有显著差异?•自变量为类别变量,但有 4 个水平• 因变量为连续变量•采用独立样本单因子变异数分析( on

e-way ANOVA)

Page 30: 第一讲 教育测评的统计基础

研究问题 5• 学生性别、数学焦虑、数学态度、数学投入动机是否可有效预测学生的数学成绩?其预测力如何?

•自变量为学生性别、数学焦虑等四个。• 因变量为数学成绩•采用多元回归分析法•注意性别是类别变量,须转化为虚拟变

量,即 0 、 1 变量。

Page 31: 第一讲 教育测评的统计基础

回归方程式• 多元回归分析之原始化回归方程式为:• Y=B0+B1X1+B2X2+B3X3+……+ BKXK

• 其中 B0 为截距, BK 为原始回归系数。• 标准化回归方程式为:• ZY=Β1ZX1+Β2ZX2+B3ZX3+……+BKZXK

• 其中 BK 为标准化回归系数。

Page 32: 第一讲 教育测评的统计基础

研究问题 6• 学生性别与家庭状况变量在数学成绩上

是否有显著的交互作用?•自变量有 2 个:学生性别、家庭状况,

均属于类别变量• 因变量有一个,即数学成绩,为连续变

量•采用独立样本二因子变异数分析( tw

o-way ANOVA)

Page 33: 第一讲 教育测评的统计基础

研究问题 7

• 不同年级的学生在数学态度四个层面上是否有显著差异?

• 自变量为年级,属于间断变量(有 3 个水平)。

• 因变量数学态度包括四个层面,实际上有四个因变量。

• 采用独立样本单因子多变量变异数分析(multiple analysis of variance,MANOVA)

Page 34: 第一讲 教育测评的统计基础

研究问题 8• 学生性别、家庭状况在数学成绩、数学焦虑、数学态度方面是否有显著的交互作用?

•自变量有 2 个,一为二分变量、一为四分变量,均属于间断变量。

• 因变量有 3 个,均属连续变量。•采用独立样本二因子多变量变异数分析

法。

Page 35: 第一讲 教育测评的统计基础

研究问题 9•模式图是否得到支持?•采用路径分析•径路系数即回归方程式中的标准化回归

系数•采用多元回归分析法的“强迫输入法”

( enter )

Page 36: 第一讲 教育测评的统计基础

路径分析图

数学焦虑

投入动机

数学态度数学成绩

Page 37: 第一讲 教育测评的统计基础

进行 3 个复回归分析• 第一个复回归:效标变量为数学成绩,预测变量为数学焦虑、数学态度、数学投入动机。

• 第二个复回归:效标变量为数学态度,预测变量为数学焦虑、数学投入动机。

• 第三个复回归:效标变量为数学投入动机,预测变量为数学焦虑。