第一讲教育测评的统计基础

第一讲教育测评的统计基础

•

•一、什么是统计学？

•（一）含义•1. 研究随机现象的规律•2. 研究样本与总体的关系

（二）内容• 1. 描述统计• 研究对数据的初步整理和分析。• 2. 推断统计• 研究如何通过样本的信息，估计总体的

信息和对总体的信息进行推断，这些估计和推断是在一定的概率基础上进行的。

• 3. 实验设计

（三）基本概念• 1. 总体与样本• 2. 随机现象• 3. 概率• 4. 抽样• 5. 统计量与参数

（四）方法与功用• 1. 方法：不完全归纳法• 2. 功用：• （ 1 ）研究和处理随机事件；• （ 2 ）量化研究

二、数据的描述统计分析

• （一）集中量数• 表示数据集中趋势或典型水平的量数。

常用的有算术平均数、中数、众数等。• 算术平均数（ Mean)= 所有数据之和 /

数据的总频数 =∑X/N ，用 X 表示。• 平均数的优、缺点：简明易懂、适合代

数运算；但易受极端值影响。

（二）差异量数• 表示数据差异程度或分散程度、离散

程度的量数。常用有方差、标准差、平均差等。

• 最常用的是：方差与标准差 (std.deviation)

• 方差等于离差平方的算术平均数。可用S2 、 σ2 表示。标准差等于方差的平方根，可用 S 、 σ 表示。

• ∑ （ X - X ） 2

• S2=————————• N• （ X1- X ） 2+ （ X2- X ） 2 +… （ Xn- X ）

2

• = ——————————————• N

（三）标准分数• 1. 定义：标准分数等于离差除以标准差

之商。用 Z 表示。• Z= （ X - X ） /S• 标准分数是不带单位的相对位置量数，

它表示其原始分数在团体中的相对位置。• 2.T 分数 =Z×10+50• 3.CEEB 分数 =Z×100+500

（四）相关量数• 1 、相关的含义• 两个随机变量之间不精确、不稳定的变化关系

称为相关关系。它与函数关系的区别就在于两个变量值不是一一对应得那样精确、稳定。

• 从变化方向来看，有：• （ 1 ）正相关• （ 2 ）负相关• （ 3 ）零相关

• 从密切程度来看，有：• 1 、强相关或高度相关• 2 、中度相关• 3 、弱相关或低度相关

2 、相关系数• 用来描述两个变量之间变化方向及密切程

度的数字特征量称为相关系数。用 r 表示。• 相关系数的取值范围， [-1 ， 1] 。• 相关系数的值，仅仅是一个比值。不能加

减乘除。• 相关系数只能描述两个变量之间的变化方

向及密切程度，并不能揭示二者之间的内在本质联系。

• 相关关系也并不一定是因果关系。

3 、积差相关

• （ 1 ）积差相关的概念• 当两个变量都是正态连续变量，而且

两者之间呈线性关系，表示这两个变量之间的相关称为积差相关。

• （ 2 ）积差相关的使用条件• ① 两个变量都是由测量获得的连续性

数据。• ② 两个变量的总体都呈正态分布。• ③ 必须是成对的数据，而且每对数据

之间是相互独立的。• ④ 两个变量之间呈线性关系。可由相

关散布图的形状来决定。• ⑤ 要排除共变因素的影响。• ⑥ 样本容量 n ≥ 30 ，计算出的积差

相关系数才具有有效意义。

（ 3 ）积差相关系数的定义公式及计算

• • ∑ （ X—X ）（ Y—Y）• r = ——————————• N σx σy

• XY — X Y• = ———————————— • σx σy

三、推断统计的理论基础• （一）概率的含义及运算• 1 、后验概率• 　　　　　　　　　　ｍ　• 　　频率　Ｗ（Ａ）＝—　• 　　　　　　　　　　ｎ　• 　　随机事件Ａ在Ｎ次试验中出现Ｍ次，随着试

验次数Ｎ的无限增大，随机事件Ａ的频率稳定于一个常数Ｐ，这个常数Ｐ就是随机事件Ａ出现概率的近似值。可表示为：

Ｍ• 　　Ｐ（Ａ）≈───• 　　　　　　　　 N•

2 、先验概率• 先验概率是通过古典概率模型加以定义的，故又称为古典概率。

• 　　古典概率模型要求满足两个条件：• 　　（１）试验的所有结果是有限的；• 　　（２）每一种可能结果出现的可能性（概

率）相等。• 　若所有可能结果的总数为Ｎ，随机事件Ａ包括Ｍ个可能结果，则事件Ａ的概率为：

• 　　　　　　　　Ｍ• 　　Ｐ（Ａ）＝———• 　　　　　　　　Ｎ

3 、概率的加法和乘法• （１）概率的加法• 在一次试验中不可能同时发生的事件称

为互不相容事件。　•　两个互不相容事件和的概率，等于这

两个事件概率之和。•　　Ｐ（Ａ＋Ｂ）＝Ｐ（Ａ）＋Ｐ

（Ｂ）

（２）概率的乘法•　独立事件：Ａ事件出现的概率不影响Ｂ事件出现的概率。

•　两个独立事件积的概率，等于这两个事件概率的乘积。

•　　Ｐ（ＡＢ）＝Ｐ（Ａ）Ｐ（Ｂ）

（二）正态分布• 正态分布的特点• １、曲线在Ｚ＝０处为最高点。• ２、曲线以Ｚ＝０处为中心，双侧对称。• ３、曲线从最高点向左右缓慢下降，并无限伸延，但永不与基线相交。

• ４、标准正态分布上的平均数为０，标准差为１。

• ５、曲线从最高点向左右伸延时，在正负１个标准差之内，既向下又向内弯。从正负１个标准差开始，既向下又向外弯，即拐点位于正负１个标准差处。

四、推断统计的基本原理 • （一）什么是小概率事件？• 发生的概率非常小的随机事件。通常我们选择概率小于 5%或 1%的随机事件为小概率事件。

• （二）推断统计的基本假设• 小概率事件在一次抽样中不可能发生。• （三）推断统计的基本方法• 概率意义上的反证法。

（四）举例说明• 某小学历届毕业生汉语拼音测验平均

分数为 66 分，标准差为 12 分。现以同样的试题测验应届毕业生（假定应届与历届毕业生条件基本相同），并从中随机抽取 36份试卷，算得平均分为 70 分，问该校应届与历届毕业生汉语拼音测验成绩是否一样？

五、研究问题与推断统计方法• （一）小学生学习经验调查问卷• 1. 个人变量• 学生性别；家庭状况等。• 属于类别和等级变量• 2. 数学焦虑• 27题， a1~a27；包括压力惧怕、情绪担忧、考试焦虑、课堂焦虑四个因素层面，

• 属于连续变量

3. 数学态度•共有 30 个题目， b1~b30 ；包括学习信心、有用性、成功态度、探究动机四个层面。

•属于连续变量。•4. 数学投入动机•共 14 个题目， c1~c14 ；包括工作投入、自我投入动机两个因素层面。

•属于连续变量

5. 数学成绩•自编数学成绩测验，共 45题（满分为

45 分）•属于连续变量

（二）研究问题与统计方法• 研究问题 1 ：小学生的数学焦虑、数学态度、数学投入动机与数学成绩的现状如何？

• 以平均数和标准差最为适宜。

研究问题 2• 学生的数学焦虑、数学态度、数学动机、数

学成绩间是否有显著的相关存在？• 计算积差相关• 计算积差相关的基本假定：• 1. 受试样本人数最好在 30人以上• 2. 变量间均为连续变量• 3. 变量总体均呈正态分布• 4. 二者相关形态为直线相关，而非曲线相关。

研究问题 3• 不同性别的学生，其数学焦虑、数学态

度、数学投入动机与数学成绩是否有显著差异？

•自变量为学生性别，属于类别变量• 因变量有 4 个，均属于连续变量•采用独立样本 t-test ，分开检验• 为何是独立样本？

研究问题 4• 不同家庭状况的学生，其数学成绩、数

学焦虑是否有显著差异？•自变量为类别变量，但有 4 个水平• 因变量为连续变量•采用独立样本单因子变异数分析（ on

e-way ANOVA）

研究问题 5• 学生性别、数学焦虑、数学态度、数学投入动机是否可有效预测学生的数学成绩？其预测力如何？

•自变量为学生性别、数学焦虑等四个。• 因变量为数学成绩•采用多元回归分析法•注意性别是类别变量，须转化为虚拟变

量，即 0 、 1 变量。

回归方程式• 多元回归分析之原始化回归方程式为：• Y=B0+B1X1+B2X2+B3X3+……+ BKXK

• 其中 B0 为截距， BK 为原始回归系数。• 标准化回归方程式为：• ZY=Β1ZX1+Β2ZX2+B3ZX3+……+BKZXK

• 其中 BK 为标准化回归系数。

研究问题 6• 学生性别与家庭状况变量在数学成绩上

是否有显著的交互作用？•自变量有 2 个：学生性别、家庭状况，

均属于类别变量• 因变量有一个，即数学成绩，为连续变

量•采用独立样本二因子变异数分析（ tw

o-way ANOVA）

研究问题 7

• 不同年级的学生在数学态度四个层面上是否有显著差异？

• 自变量为年级，属于间断变量（有 3 个水平）。

• 因变量数学态度包括四个层面，实际上有四个因变量。

• 采用独立样本单因子多变量变异数分析（multiple analysis of variance,MANOVA)

研究问题 8• 学生性别、家庭状况在数学成绩、数学焦虑、数学态度方面是否有显著的交互作用？

•自变量有 2 个，一为二分变量、一为四分变量，均属于间断变量。

• 因变量有 3 个，均属连续变量。•采用独立样本二因子多变量变异数分析

法。

研究问题 9•模式图是否得到支持？•采用路径分析•径路系数即回归方程式中的标准化回归

系数•采用多元回归分析法的“强迫输入法”

（ enter ）

路径分析图

数学焦虑

投入动机

数学态度数学成绩

进行 3 个复回归分析• 第一个复回归：效标变量为数学成绩，预测变量为数学焦虑、数学态度、数学投入动机。

• 第二个复回归：效标变量为数学态度，预测变量为数学焦虑、数学投入动机。

• 第三个复回归：效标变量为数学投入动机，预测变量为数学焦虑。

第一讲教育测评的统计基础

Documents

Transcript of 第一讲教育测评的统计基础

第一讲 教育测评的统计基础

Documents

Transcript of 第一讲 教育测评的统计基础

第一讲教育测评的统计基础

Transcript of 第一讲教育测评的统计基础