第二章 统计数据的搜集与整理

48
第第第 第第第第第第第第第 计计计计计计 计计计计计计 计计计计 计计 统统

description

第二章 统计数据的搜集与整理. 统计数据的搜集 统计数据的整理 统计表与统计图. 第一节 统计数据的搜集. 一、统计数据搜集的意义 统计数据搜集,即统计调查,就是把客观现象作为一个整体,按照预定的要求,采用科学的方法,对反映这个整体的各个有关标志的数值,有计划、系统、科学地进行登记,取得真实可靠的原始资料。 统计调查,在统计工作的整个过程中,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料搜集的基础上建立起来的。只有搞好统计调查,才能保证统计工作达到对于客观事物规律性的认识,并从而预测未来。. 返回. 范围. 时间. 组织方式. 搜集方法. - PowerPoint PPT Presentation

Transcript of 第二章 统计数据的搜集与整理

Page 1: 第二章  统计数据的搜集与整理

第二章 统计数据的搜集与整理

统计数据的搜集

统计数据的整理

统计表与统计图

Page 2: 第二章  统计数据的搜集与整理

第一节 统计数据的搜集

一、统计数据搜集的意义统计数据搜集,即统计调查,就是把客观现象作为一个整体,

按照预定的要求,采用科学的方法,对反映这个整体的各个有关标志的数值,有计划、系统、科学地进行登记,取得真实可靠的原始资料。

统计调查,在统计工作的整个过程中,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料搜集的基础上建立起来的。只有搞好统计调查,才能保证统计工作达到对于客观事物规律性的认识,并从而预测未来。

返回

Page 3: 第二章  统计数据的搜集与整理

二、统计数据搜集的方法

统计调查的种类

统计调查

范围 时间 组织方式 搜集方法

非全面调

查全面调

查 经常性调

查 一次性调

查 统计报

表 专门调

查 直接观察

法 采访

法 报告

Page 4: 第二章  统计数据的搜集与整理

(二)统计报表1. 统计报表的特点和优点 可以在调查进行前把报表布置到基层填报单位,以便它们根据报

表的要求,及时建立健全各种原始记录,使统计报表的资料来源建立在可靠的基础上,做到资料准确、报送及时。

各级领导部门可以通过统计报表,经常了解经济和社会发展变化的情况。

便于完整地积累资料,用来进行历史对比,较有系统地分析研究经济和社会发展变化的规律性。

Page 5: 第二章  统计数据的搜集与整理

统计报表的种类

统计报表

全面统计报表非全面统计报表

日报旬报月报季报

半年报年报等 基层报表综合报表

调查范围

报送周期

填报单位

内容和实施范围

国家统计报表部门统计报表地方统计报表

Page 6: 第二章  统计数据的搜集与整理

2 、统计报表制度

统计报表制度

1 2

3

45

6

报表指标体系的确定

报表表式的设计

报表实施范围

报表的报送程序和报送

日期 填表说明

统计目录

报送程序包括填报单位填报报表的份数、方式和受表单位,还要规定报表报送的日期。

每张报表都要把指标内容按统一规定格式安排。同时要明确规定表名、表号、报告期别、报送单位、报送日期、报送方式、单位负责人和填表人签署等

所有报表的指标体系应注意与会计核算、业务核算的指标体系衔接,相互为用,避免重复

具体说明填表的方法、指标解释、指标计算方法及有关注意事项。指标解释是一项重要内容,它具体解释指标的概念、计算范围、计算方法以及其他有关问题

大体可分为两类:一类是分组用的目录,另一类是具体项目的目录

明确规定每种报表的填报单位及汇总时的综合范围

Page 7: 第二章  统计数据的搜集与整理

(三)专门调查普查

什么是普查

普查是为了某一目的而专门组织的一次性的全面调查,一 般用来搜集总体在某个时点上的精确资料。例如,人口普查、工业普查、农业普查等。普查也可以用来搜集总体在一段时期内发展过程的总量。如基本建设项目普查、出生人口总数、死亡人口总数等普查。

组织形式 组织原则

普查基本上有两种形式:一种是组织专门的 普查机构,配备一定数量的普查人员,对被调查者直接进行调查登记。 另一种是 利用企业单位的原始记录和核算资料,颁发一定的调查表格, 由这些企业单位根据调查要求自行填报。

必须规定普查的标准时点 统一规定调查期限 统一规定调查项目 同一种普查,尽可能按一定周期进行

Page 8: 第二章  统计数据的搜集与整理

重点调查重点调查是一种非全面调查。它是在调查对象中, 不是就

全部单位,而只是 选择其中的一部分重点单位所进行的调查。所谓重点单位;是指在总体中举足轻重的那些单位。这些单位虽可能数目不多,但就调查的标志值来说,它们在总体中却占有很大的比重,能够反映出总体的基本情况。

组织重点调查的重要问题是确定重点单位:•重点单位选多选少,要根据调查任务确定;•选中的单位,管理应比较健全,统计 力量应比较充实,

统计基础应比较巩固,这样才能准确、及时地取得资料。

Page 9: 第二章  统计数据的搜集与整理

典型调查 典型调查是一种非全面调查,它是根据调查的目的与要求,

在对被调查对象进行全面分析的基础上,有意识地 选择若干有典型意义的或有代表性的单位进行的调查。典型调查的作用:可以用于研究新生事物; 可以补充全面调查资料的 不足;

在一定条件下,可以利用典型调查资料,结合基本统计数字,估计总体指标数值。

Page 10: 第二章  统计数据的搜集与整理

抽样调查抽样调查是一种非全面调查,它是从研究现象的 总体中随

机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种调查方法。

抽样调查是现代推断统计的核心,与其他非全面调查比较有三个显著特征: 按随机原则从总体中抽取样本单位,排除个人主

观意图的影响; 以样本指标为依据推断总体或检验总体的某种假

设; 抽样调查的误差可以事先计算并加以控制。

Page 11: 第二章  统计数据的搜集与整理

三、统计调查方案

统计调查方案的主要内

调查的任务和目的

调查对象和调查单位

调查表 调查时间 调查工作的组织实施

根据党的方针政策和当前的政治经济任务, 抓住实际上最为重要的迫切问题,从统计工作的整体出发,立足于整个国民经济综合 平衡的需要、制定和检查计划的需要、,从调查对象的实际出发,把需要与可能结合起来。

调查对象,就是需要调查的那些客观现象的总体,它是由性质上相同的许多调查单位所组成的。调查单位,就是所要调查的客观现象的个体所组成的整体,也就是在调查对象中所要调查的具体单位。

调查表,就是根据调查目的所确定的具体调查项目。调查表的内容一般由表头、表体和表脚三部分组成。表头:用来表明调查的名称以及填写调查单位(填报单位)的名 称、性质、隶属关系等;表体 :统计调查所要说明的客观现象的项目以及这些项目的具体表现 ;表脚:包括调查者(填报人)的签名和调查日期等。

调查时间指调查资料所属的时间。如果所要调查的是时期现象,就要明确规定资料所反映的是调查对象从何年何月何日起到何年何月何日止的资料。如果所要调查的是时点现象,就要明确规定统一的标准调查时点。

调查工作的组织领导机构和调查人员的组织;调查的方式和方法;调查前的准备工作,包括宣传教育、干部培训、文件印刷等;调查资料的报送 办法;调查经费的预算和开支办法;提供或者公布调查成果的时间。

返回

Page 12: 第二章  统计数据的搜集与整理

第二节 统计数据的整理

一、统计数据整理意义与基本步骤 统计整理是统计调查的继续,统计分析的前提。统计

整理,是指根据统计研究的目的,将统计调查所得的原始资料(也称初级资料)进行科学的分类和 汇总,或对已经加工的综合资料(也称次级资料)进行 再加工,为统计分析准备系统化的、条理化的综合资料的工作过程。作为一个相对独立的统计工作阶段来说,统计整理主要指对原始资料的整理。

Page 13: 第二章  统计数据的搜集与整理

统计整理的基本步骤: 设计和编制统计资料的汇总方案 对原始资料进行审核 用一定的组织形式和方法,对原始资料进行分组、汇总和

计算 对整理好的资料再一次进行 审核,改正在汇总过程中所发生的各种差错

编制统计表,以 简明扼要地表达社会经济现象在数 量方面的有关联系

Page 14: 第二章  统计数据的搜集与整理

二、统计数据的分组(一)统计分组的概念统计分组就是根据统计研究的需要,将统计总体按照一定

的标志区分为若干个组成部分的一种统计方法。(二)统计分组的作用

可以将复杂的社会经济现象按照统计认识的要求 区分为各个性质不同的组成部分

能在特殊意义上观察总体中所有个体单位在各组中的分布状态的分布特征,认识总体各组成部分的量

将各种性 质上有关的分组资料联系起来进地统计分析,还可观察不同社会经济现象 总体之间数量上的依存关系

Page 15: 第二章  统计数据的搜集与整理

(三)统计分组的方法统计分组的关键在于分组标志的选择和各组界限的划分。分组标志的选择 正确选择分组标志,一般应遵循以下原则:

• 根据统计研究的目的选择分组标志• 选择能反映所研究现象本质的分组标志

Page 16: 第二章  统计数据的搜集与整理

(四)统计分组的种类 分组标志多少

简单分组 复合分组

标志属性不同

品质标志分组 数量标志分组

Page 17: 第二章  统计数据的搜集与整理

按年龄分20岁以下2030岁3040岁4050岁5060岁60岁以上

按文化程度分组大专中专高中初中小学文盲

按性别分组男性女性

按工龄分组5 年及以下610 年1120 年

21 年及以上

简单分组,是指用一个分组标志对总体进行的分组。例如,为了了解企业职工总体的基本情况,可选择年龄、性别、文化程度、工龄、工种等标志分别进行分组,即属于简单分组。 返回

Page 18: 第二章  统计数据的搜集与整理

复合分组,是指用两个或两个以上的标志对总体进行层叠式分组。所谓层叠式分组是指在按前一个分组标志分组的基础上,再按后一个分组标志分组。例如,为了研究我国高等院校在校学生基本情况,可以同时选择学科、层次、性别等三个标志进行复合分组。

文科

研究生

本科生

专科 生

男生

女生男生

女生男生

女生

理工科

研究生

本科生

专科 生

男生

女生男生

女生男生

女生

返回

Page 19: 第二章  统计数据的搜集与整理

按数量标志分组时,根据每组数量标志值的具体表现, 又分为单项式分组和组距式分组两种。

单项式分组,就是总体按数量标志分组后,每一个具体数值表示一个组。例如,对某地区居民进行调查时,将居民户按家庭人口数分组,每组标志值为1 , 2 , 3 , 4 , 5 , 6 , 7 人。

组距式分组,是将总体按数量标志分组后,每组用两个标志值组成的区间来表示。例如,将某企业职工按工资水平分组,可分为 150元以下, 150 ~ 160元, 160 ~ 170元, 170 ~ 180元, 180 ~ 190元, 190 ~ 200元, 200元以上几组。

Page 20: 第二章  统计数据的搜集与整理

三、次数分 配(一)次数分布的 概念和分类在统计分组的基础上,将总体中的所有单位按组归类整理,

形成总体中各单位在各组间的分布,叫做次数分布,分布在各组的个体单位数叫次数, 又称频数。各组次数与 总次数 之比称比率,又称频率。

根据分组标志特征的不同,分布数列可以分为属性分布数列与变量分布数列两种。

按品质标志分组形成的分布数列称为属性分布数列,简称品质数列。(见表 2.1 )

Page 21: 第二章  统计数据的搜集与整理

表 2-3 我国某年工业企业按轻重工业分组资料

按轻工工业分组 企业数(万个) 占总数的比重(%)

轻工业 366.1 70.6

重工业 152.4 29.4

合计 518.5 100.0

Page 22: 第二章  统计数据的搜集与整理

按数量标志分组形成的分布数列称为变量分布数列、简称变量数列。例如,某电业局发电厂按拥有发电机组的套数分组,可编成如下变量数列:

表 2.4

拥有发电机组(套) 发电厂数(个) 比率(%)1 35 28.0

2 48 38.4

3 26 20.8

4 12 9.6

5 4 3.2

合计 125 100.0

Page 23: 第二章  统计数据的搜集与整理

(二)变量数列的编制按数量标志分组的分布数列即为变量数列。变量数列又可

分为单项变量数列和组距变量数列两种。

单项变量数列:单项式分组形成的分布数列。单项变量数列简称单项数列,又称分组数列。如表2-5所示

组距变量数列:组距式分组所形成的分布数列。组距变量数列简称组距数列。如表2-6所示

Page 24: 第二章  统计数据的搜集与整理

表 2-5 某车间工人生产某种零件分布情况

生产零件个数(个)

工人数(人)

每组工人占全部工人比重 %

12 7 6.86

13 12 11.76

14 48 47.06

15 18 17.65

16 14 13.73

17 2 2.94

合计 102 100.00返回

返回

Page 25: 第二章  统计数据的搜集与整理

表 2-6 某企业职工按月工资分组资料

按工资水平分组(元) 工人人数(人)150160 4

160170 20

170180 36

180190 30

190200 15

200210 5

合计 110

Page 26: 第二章  统计数据的搜集与整理

在组距数列中,需要明确以下几个概念: 组限:组距数列中,各组的界限称为组限。组限又分为上限和下限。下限是每组最小的标志值,上限是每组最大的标志值。如上表中标志值 150—160元一组, 150元和 160元是组限, 150元为下限, 160元为上限。

组距数列中,如果各组的组限都齐全, 称为闭口组;若组限不齐全,即 最小组缺下限或最大组缺上限,或最小组的下限、最大组的上限都缺,称为开口组。缺下限或缺上限称半开口组,下限、上限都缺称全开口组。

Page 27: 第二章  统计数据的搜集与整理

组距:每组下限与上限之间的距离叫组距。每组组距等于上限与下限之差,即组距 = 上限-下限。上表中标志值150~160元组的组距=160元- 150 元 =10元。

组距又有两种表现 形式:一种是各组组 距都相等,称为等距。这样的组距数列称为等距数列。如表 2-6 即为等距数列。一种是各组组 距不完全相等, 称为异距。这样的组距数列称为异距数列,也称不等距数列。

Page 28: 第二章  统计数据的搜集与整理

组中值:每组下限与上限之间的中点数值叫组中值。组中值等于下限与上限和的一半。

2

上限下限即组中值

如上表 2-6 ,标志值 150160元组

(元)组中值 1552

160150

开口组的组中值如何计算?

Page 29: 第二章  统计数据的搜集与整理

2

邻组组距该组上限缺下限组组中值

若将表 2-6 第一组改为“ 160元以下”,则

元该组组中值 1552

10160

2

邻组组距该组下限缺上限组组中值

若将表 2-6最末组改为“ 200元以上”,则

元该组组中值 2052

10200

Page 30: 第二章  统计数据的搜集与整理

下面举例说明变量数列的编制方法

现举例说明编制等距数列的步骤与原则。设有 50 名工人某月份完成生产定额的原始资料如下 (单位:% ) :

95 91 114 110 118 133 121 146 117 125

108 105 110 107 137 120 145 125 136 127

121 118 103 115 115 141 117 123 118 129

136 101 98 113 113 114 119 126 120 93

122 108 101 105 125 116 122 132 128 127

Page 31: 第二章  统计数据的搜集与整理

第一步,在全部标志值中, 找出最小值与最大值,计算全距。以上资料中,最小值为 91 ,最大值为 145 ,则:

全距 = 最大值-最小值 =145 - 91=54

第二步,确定组距和组数。对于同一资料,在全距一定的情况下,组数与组距成反比例关系,即

组距全距组数

Page 32: 第二章  统计数据的搜集与整理

第三步,确定各组组限。确定组限时,一般是从最低组的下限开始或从最高组的上限开始。最低组的下限不要刚好等于原始资料中的最小值,而应略小于这个最小值;同样,最高组的上限应略高于原始资料中的最大值。特殊情况下,确定组限也可以从中间某组开始。如本例中,不可将未完成生产定额的工人与刚好及超额完成生产定额的工人分为一组,因此,应把 100( % ) 作为其中两相邻邦组的界限。

Page 33: 第二章  统计数据的搜集与整理

在实际统计工作中,组限的表示方法常用的有 如下两种形式:

第一种 第二种 …… ……

80 ~ 89 80 ~ 90

90 ~ 99 90 ~ 100

100 ~ 109 100 ~ 110

…… ……

Page 34: 第二章  统计数据的搜集与整理

第一种形式称为名义组限,适用于离散变量分组的数列。如企业按“职工人数”分组。人数只能取整数,相邻两组的上限与下限之间不会有别的数值存在,在汇总各组单位数量时,不至出现麻烦。如果用这种形式表示连续变量分组的数列时,则每组的上、下限所表示的是实际值精确至最近整数的数值。例如,有某总体单位的标志值为89.5 ,就把该数值四舍五入为 90 而属于 90-99 这一组。这就是说, 90-99 这一组实际上包括了 89.5-99.499之间的所有标志值,依次类 推。

Page 35: 第二章  统计数据的搜集与整理

第二种形式称为实际组限,既适用于离散变量分组的数列也适用于连续变量分组的数列。每个组内所包括的标志值皆是以下限为起点、以上限为极限(但不包括上限,特殊情况例外),这就是所谓有“上限不在内”的原则。例如,有某总体单位的标志值为 90 ,则该单位属于 90100 这一组而不属于 8089.99之间的所有标志值。本例中若采用第二种组 限的表示方法,可列表如表 2—7 所示。

Page 36: 第二章  统计数据的搜集与整理

表 2-7

按生产定额完成情况分组 % 工人数 /人90100 4

100110 10

110120 15

120130 13

130140 5

140150 3

合计 50

第四步,汇总各组标志值出现的次数, 绘制变量数列表。返回返回

Page 37: 第二章  统计数据的搜集与整理

一、统计表(一)统计表的作用

第三节 统计表与统计 图

统计表能 够系统组织和合理安排大量的统计资料,使资料表现得 紧凑、清晰、醒目。统计表是表现统计资料的最重形式。

统计表能反映 总体特征及各部分之间的关系,便于进行对比和计算各种分析指标。

统计表是积累和保 存统计资料的主要手段。

Page 38: 第二章  统计数据的搜集与整理

(二)统计表的 结构

统计表

形式

内容

总标题 横行标题 纵栏标题 数字资料

主词

宾词

统计表的名 称,用以概括统计表中全部统计资料的内容,一般放在表的上 端中央

又称横标目,它表明统计表 横行项目的名称,一般置于表的 左边

又称纵标目,它表明 纵栏指标名称,一般置于表的右上方

一般在各横行标题与纵栏标题的交叉处,是说明总体(各组)数量特征的指标。

统计表所要说明的对象,即统计总体各个组成部分的名称,一般是指表的标行标题部分 。

用来说明主词的各种统计指标,一般指表的 纵栏标题和数字资料部分 。下面看

个例子吧

Page 39: 第二章  统计数据的搜集与整理

某地工工业部门的分组

按经济类 型和企业规模分组 企业数全民所有制企业 252

其中:大型企业 15

中型企业 23

小型企业 214

集体所有制企业 960

其中:大型企业 2

中型企业 8

小型企业 950

Page 40: 第二章  统计数据的搜集与整理

(三)统计表的种类用途不同调查表:调查项目以表格的 形式表示出来。 整理表( 又称汇总表) :对调查资料直接整理的 结果。 分析表:表述统计分析资料的统计表。 对总体是否进行分组及分组情况不同 简单表:对总体未经任 何分组,在主词栏中只是总体单位或

时间的排列,具有一览表的性 质。 简单分组表:对总体只按一个标志进行分组的统计表。复合分组表:对总体进行复合分组后形式的的统计表。

Page 41: 第二章  统计数据的搜集与整理

性质不同时间数列表:主词栏中是按时间单位的顺序排列的统计表,

如表 2—9 所示。 表 2-9 我国历年国内生产总值资料

年份 国内生产总值 / 亿元1978 3624

1980 4518

1985 8964

1990 18548

1998 79396

Page 42: 第二章  统计数据的搜集与整理

空间数列表:反映在同一时间不同空间范围内(如不同单位、不同地区、不同部门等)的资料的统计表, 如表 2—10 所示。

表 2-10 我国 1998 年国内生产总值资料

产业 国内生产总值 / 亿元

第一产业 14600

第二产业 38692

第三产业 26104

合计 79396

Page 43: 第二章  统计数据的搜集与整理

二、统计图

0 90 100 110 120 130 140 150 (完成%)

15

10

5

人数

直方图

横轴表示各组组限

纵轴表示次数(一般标在左方)和比率(一般标在右方)

Page 44: 第二章  统计数据的搜集与整理

折线

0 90 100 110 120 130 140 150 (完成%)

15

10

5

·

·

·

·

·

·

人数

Page 45: 第二章  统计数据的搜集与整理

曲线图

·

·

·

··

0 90 100 110 120 130 140 150

15

10

人数

Page 46: 第二章  统计数据的搜集与整理

(二)次数分布的 主要类型 主要有下列三种类 型:钟形分布、 U 形分布、 J形分

钟形分布

正态分布 右偏分布 左偏分布

Page 47: 第二章  统计数据的搜集与整理

U 形分布

Page 48: 第二章  统计数据的搜集与整理

J形分布

正 J形分布

反 J形分布