第一讲 教育测评的统计基础
-
Upload
chase-woodward -
Category
Documents
-
view
87 -
download
5
description
Transcript of 第一讲 教育测评的统计基础
第一讲 教育测评的统计基础
•
•一、什么是统计学?
•(一)含义•1. 研究随机现象的规律•2. 研究样本与总体的关系
(二)内容• 1. 描述统计• 研究对数据的初步整理和分析。• 2. 推断统计• 研究如何通过样本的信息,估计总体的
信息和对总体的信息进行推断,这些估计和推断是在一定的概率基础上进行的。
• 3. 实验设计
(三)基本概念• 1. 总体与样本• 2. 随机现象• 3. 概率• 4. 抽样• 5. 统计量与参数
(四)方法与功用• 1. 方法:不完全归纳法• 2. 功用:• ( 1 )研究和处理随机事件;• ( 2 )量化研究
二、 数据的描述统计分析
• (一)集中量数• 表示数据集中趋势或典型水平的量数。
常用的有算术平均数、中数、众数等。• 算术平均数( Mean)= 所有数据之和 /
数据的总频数 =∑X/N ,用 X 表示。• 平均数的优、缺点:简明易懂、适合代
数运算;但易受极端值影响。
(二)差异量数• 表示数据差异程度或分散程度、离散
程度的量数。常用有方差、标准差、平均差等。
• 最常用的是:方差与标准差 (std.deviation)
• 方差等于离差平方的算术平均数。可用S2 、 σ2 表示。标准差等于方差的平方根,可用 S 、 σ 表示。
• ∑ ( X - X ) 2
• S2=————————• N• ( X1- X ) 2+ ( X2- X ) 2 +… ( Xn- X )
2
• = ——————————————• N
(三)标准分数• 1. 定义:标准分数等于离差除以标准差
之商。用 Z 表示。• Z= ( X - X ) /S• 标准分数是不带单位的相对位置量数,
它表示其原始分数在团体中的相对位置。• 2.T 分数 =Z×10+50• 3.CEEB 分数 =Z×100+500
(四)相关量数• 1 、相关的含义• 两个随机变量之间不精确、不稳定的变化关系
称为相关关系。它与函数关系的区别就在于两个变量值不是一一对应得那样精确、稳定。
• 从变化方向来看,有:• ( 1 )正相关• ( 2 )负相关• ( 3 )零相关
• 从密切程度来看,有:• 1 、强相关或高度相关• 2 、中度相关• 3 、弱相关或低度相关
2 、相关系数• 用来描述两个变量之间变化方向及密切程
度的数字特征量称为相关系数。用 r 表示。• 相关系数的取值范围, [-1 , 1] 。• 相关系数的值,仅仅是一个比值。不能加
减乘除。• 相关系数只能描述两个变量之间的变化方
向及密切程度,并不能揭示二者之间的内在本质联系。
• 相关关系也并不一定是因果关系。
3 、积差相关
• ( 1 )积差相关的概念• 当两个变量都是正态连续变量,而且
两者之间呈线性关系,表示这两个变量之间的相关称为积差相关。
• ( 2 )积差相关的使用条件• ① 两个变量都是由测量获得的连续性
数据。• ② 两个变量的总体都呈正态分布。• ③ 必须是成对的数据,而且每对数据
之间是相互独立的。• ④ 两个变量之间呈线性关系。可由相
关散布图的形状来决定。• ⑤ 要排除共变因素的影响。• ⑥ 样本容量 n ≥ 30 ,计算出的积差
相关系数才具有有效意义。
( 3 )积差相关系数的定义公式及计算
• • ∑ ( X—X )( Y—Y)• r = ——————————• N σx σy
• XY — X Y• = ———————————— • σx σy
三、 推断统计的理论基础• (一)概率的含义及运算• 1 、后验概率• m • 频率 W(A)=— • n • 随机事件A在N次试验中出现M次,随着试
验次数N的无限增大,随机事件A的频率稳定于一个常数P,这个常数P就是随机事件A出现概率的近似值。可表示为:
M• P(A)≈───• N•
2 、先验概率• 先验概率是通过古典概率模型加以定义的,故又称为古典概率。
• 古典概率模型要求满足两个条件:• (1)试验的所有结果是有限的;• (2)每一种可能结果出现的可能性(概
率)相等。• 若所有可能结果的总数为N,随机事件A包括M个可能结果,则事件A的概率为:
• M• P(A)=———• N
3 、概率的加法和乘法• (1)概率的加法• 在一次试验中不可能同时发生的事件称
为互不相容事件。 • 两个互不相容事件和的概率,等于这
两个事件概率之和。• P(A+B)=P(A)+P
(B)
(2)概率的乘法• 独立事件:A事件出现的概率不影响B事件出现的概率。
• 两个独立事件积的概率,等于这两个事件概率的乘积。
• P(AB)=P(A)P(B)
(二)正态分布• 正态分布的特点• 1、曲线在Z=0处为最高点。• 2、曲线以Z=0处为中心,双侧对称。• 3、曲线从最高点向左右缓慢下降,并无限伸延,但永不与基线相交。
• 4、标准正态分布上的平均数为0,标准差为1。
• 5、曲线从最高点向左右伸延时,在正负1个标准差之内,既向下又向内弯。从正负1个标准差开始,既向下又向外弯,即拐点位于正负1个标准差处。
四、推断统计的基本原理 • (一) 什么是小概率事件?• 发生的概率非常小的随机事件。通常我们选择概率小于 5%或 1%的随机事件为小概率事件。
• (二)推断统计的基本假设• 小概率事件在一次抽样中不可能发生。• (三)推断统计的基本方法• 概率意义上的反证法。
(四)举例说明• 某小学历届毕业生汉语拼音测验平均
分数为 66 分,标准差为 12 分。现以同样的试题测验应届毕业生(假定应届与历届毕业生条件基本相同),并从中随机抽取 36份试卷,算得平均分为 70 分,问该校应届与历届毕业生汉语拼音测验成绩是否一样?
五、研究问题与推断统计方法• (一)小学生学习经验调查问卷• 1. 个人变量• 学生性别;家庭状况等。• 属于类别和等级变量• 2. 数学焦虑• 27题, a1~a27;包括压力惧怕、情绪担忧、考试焦虑、课堂焦虑四个因素层面,
• 属于连续变量
3. 数学态度•共有 30 个题目, b1~b30 ;包括学习信心、有用性、成功态度、探究动机四个层面。
•属于连续变量。•4. 数学投入动机•共 14 个题目, c1~c14 ;包括工作投入、自我投入动机两个因素层面。
•属于连续变量
5. 数学成绩•自编数学成绩测验,共 45题(满分为
45 分)•属于连续变量
(二)研究问题与统计方法• 研究问题 1 :小学生的数学焦虑、数学态度、数学投入动机与数学成绩的现状如何?
• 以平均数和标准差最为适宜。
研究问题 2• 学生的数学焦虑、数学态度、数学动机、数
学成绩间是否有显著的相关存在?• 计算积差相关• 计算积差相关的基本假定:• 1. 受试样本人数最好在 30人以上• 2. 变量间均为连续变量• 3. 变量总体均呈正态分布• 4. 二者相关形态为直线相关,而非曲线相关。
研究问题 3• 不同性别的学生,其数学焦虑、数学态
度、数学投入动机与数学成绩是否有显著差异?
•自变量为学生性别,属于类别变量• 因变量有 4 个,均属于连续变量•采用独立样本 t-test ,分开检验• 为何是独立样本?
研究问题 4• 不同家庭状况的学生,其数学成绩、数
学焦虑是否有显著差异?•自变量为类别变量,但有 4 个水平• 因变量为连续变量•采用独立样本单因子变异数分析( on
e-way ANOVA)
研究问题 5• 学生性别、数学焦虑、数学态度、数学投入动机是否可有效预测学生的数学成绩?其预测力如何?
•自变量为学生性别、数学焦虑等四个。• 因变量为数学成绩•采用多元回归分析法•注意性别是类别变量,须转化为虚拟变
量,即 0 、 1 变量。
回归方程式• 多元回归分析之原始化回归方程式为:• Y=B0+B1X1+B2X2+B3X3+……+ BKXK
• 其中 B0 为截距, BK 为原始回归系数。• 标准化回归方程式为:• ZY=Β1ZX1+Β2ZX2+B3ZX3+……+BKZXK
• 其中 BK 为标准化回归系数。
研究问题 6• 学生性别与家庭状况变量在数学成绩上
是否有显著的交互作用?•自变量有 2 个:学生性别、家庭状况,
均属于类别变量• 因变量有一个,即数学成绩,为连续变
量•采用独立样本二因子变异数分析( tw
o-way ANOVA)
研究问题 7
• 不同年级的学生在数学态度四个层面上是否有显著差异?
• 自变量为年级,属于间断变量(有 3 个水平)。
• 因变量数学态度包括四个层面,实际上有四个因变量。
• 采用独立样本单因子多变量变异数分析(multiple analysis of variance,MANOVA)
研究问题 8• 学生性别、家庭状况在数学成绩、数学焦虑、数学态度方面是否有显著的交互作用?
•自变量有 2 个,一为二分变量、一为四分变量,均属于间断变量。
• 因变量有 3 个,均属连续变量。•采用独立样本二因子多变量变异数分析
法。
研究问题 9•模式图是否得到支持?•采用路径分析•径路系数即回归方程式中的标准化回归
系数•采用多元回归分析法的“强迫输入法”
( enter )
路径分析图
数学焦虑
投入动机
数学态度数学成绩
进行 3 个复回归分析• 第一个复回归:效标变量为数学成绩,预测变量为数学焦虑、数学态度、数学投入动机。
• 第二个复回归:效标变量为数学态度,预测变量为数学焦虑、数学投入动机。
• 第三个复回归:效标变量为数学投入动机,预测变量为数学焦虑。