stats · Web...

26
2020 年年 6 年年年年 《》、

Transcript of stats · Web...

2020年第6期《调研世界》封面、目录和文章选登

调研世界

THE WORLD OF SURVEY AND RESEARCH

目 录

热点聚焦

基于混合数据的群组评价方法及其应用 陈 骥 姚 婷(3)

调研报告

中国城镇就业质量指数研究 人口和就业统计司课题组(10)

基于BP神经网络的油菜籽遥感识别研究 余新华 王 宏(16)

统计分析

全球化国家科技创新能力综合评价指数统计模型

——基于互联网科技统计视阈 程 豪(25)

中国社会公共资源的网络化城乡共享水平测度研究 李盛竹 赵志营(32)

休闲与生活满意度研究 韦佳佳 王琪延(38)

专题研究

日常生活感受对农业转移人口市民化意愿的影响

——基于全国范围内3721份调研数据 罗 峰 顾楚丹(43)

中国农业转移人口的城市落户意愿

——以城市落户能力为分析框架 邢朝国(49)

区块链技术行业运营模式及产业发展研究 王 洋 于 君(55)

共享经济统计问题探析 张 蒙(61)

THE WORLD OF SURVEY AND RESEARCH

CONTENT

Hot Spot

Group Evaluation Method Based on Mixed Data and Its Application Chen Ji Yao Ting(3)

Research Report

Research on Employment Quality Index of Urban Areas in China

Research Group of Department of Population and Employment Statistics(10)

Research on Remote Sensing Recognition of Rapeseed Based on BP Neural Network

Yu Xinhua Wang Hong(16)

Statistical Analysis

Statistical Model of Global National Science and Technology Innovation Capability Comprehensive

Evaluation Index——From the Perspective of Internet Science and Technology Statistics

Cheng Hao(25)

Research on the Measurement of Networked Urban and Rural Sharing Level of Chinese Social Public

Resources Li Shengzhu Zhao Zhiying(32)

Research on the Relationship between Leisure and Life Satisfaction Wei Jiajia Wang Qiyan(38)

Special Research

The Influence of Daily Life Eexperience on the Citizenization Willingness of Agricultural Migrant Population

——Based on 3721 Survey Data Luo Feng Gu Chudan(43)

Willingness of Transferring Urban Household Registration of Agricultural Migrant Population in China

——Analysis Based on the Framework of City Settlement Ability Xing Chaoguo(49)

Research on the Commerce Operation Model and Industry Development of Blockchain Technology

Wang Yang Yu Jun(55)

Analysis on the Statistics of Sharing Economy Zhang Meng(61)

基于混合数据的群组评价方法及其应用*[footnoteRef:1] [1: *基金项目:国家社科基金重大项目“基于大数据的跨境电子商务统计监测、评估与监管体系研究”(项目编号:16ZDA053);国家社科基金一般项目“群组评价的杠杆效应及其评价机制设计”(项目编号:16BTJ026);全国统计科学研究项目“基于分层结构的综合评价问题研究”(项目编号:2015LZ039)。]

陈 骥 姚 婷

内容摘要:针对复杂综合评价问题中的混合数据,在描述混合数据处理过程的基础上,讨论了混合数据的转换方法、数据意义的统一,并结合群组评价技术进行了应用。首先,采用数据转换的思路,将混合数据中的区间变量、语义变量转换为传统的点值数据。其次,基于数据修正的视角,考虑评价个体所持的评价尺度波动性差异,以数据意义一致性为目标,通过对评价个体权重的分配,分离评价尺度波动情形下的数据可比度并进行数据修正,从而实现数据意义的统一。最后,在归纳总结方法步骤的基础上,进行了案例应用,验证了方法的可用性。

关键词:混合数据;群组评价;数据转换;可比性

中图分类号:C812 文献标识码:A 文章编号:1004-7794(2020)06-0003-07

DOI: 10.13778/j.cnki.11-3705/c.2020.06.001

一、引言

由于数据采集方式的非全面性、主观指标的模糊性、统计测量的非精确性以及现象发生的随机性等问题,在面向复杂问题评价时,利用传统的点值数据来描述现象的数量差异,并不能完全满足综合评价与决策的应用需要,且与统计研究的数据环境也难以完全匹配(苏为华等,2006)[1]。基于此,诸多学者在扩展数据类型的视角下,将模糊数、区间数、语义变量、直觉模糊数、犹豫数等引入综合评价并开展相应的研究(陈骥等,2018)[2]。同时,为了更好地描述指标、开展评价与决策,在考虑“适配性”的基础上,部分学者采用了数据混合化的研究思路,即在指标体系中,采用了若干种不同的数据类型进行表示。潘亚虹等(2019)在将评价信息分为定性和定量两类的前提下,将精确数、随机变量与概率语义术语集的混合数据进行融合[3];徐选华等(2015)则在多阶段决策问题中,采用了区间值、语义等级与实数值的混合数据[4];关欣等(2016)根据多源测量的数据来源渠道,构建了由实数、区间数和序数组成的混合型数据集合[5];丛东升等(2018)构建了具有随机性、区间性、模糊性等混合不确定性信息的产品方案评价体系[6]。结合前景理论,张晓等(2012)、糜万俊等(2017)、罗承昆等(2019)以及龚承柱等(2014)提出了直觉模糊数、区间值和实数等数据类型的混合数据并用于风险识别问题[7-10]。

在混合数据的情形下,无法对类型各异的评价数据进行直接的综合。为解决此问题,大部分文献采用了“由异到同”的数据转换思路,即将不同的数据类型统一为某一种类型(如点值或区间值等)。其中,陈骥等(2012)提出了区间值变量服从正态分布情形下的点值化转换方法[11];唐卫东等(2011)提出了精确值、区间数、三角模糊数之间相互转化方法[12];赵萌等(2013)根据区间数和直觉模糊数的表达特点,提出了一种区间数与直觉模糊数之间的转化方法[13];李伟伟等(2014)提出了混合信息的随机化转化方法[14]。虽然此类数据转换方法,在一定程度上能够实现数据形式上的统一,但由于数据属性与数据尺度存在较大差异(例如,五等级的语义变量与百分制的点值变量在关键点上的表征是否统一,区间值变量与点值变量的数量差异是否相同等问题),在实际应用中仍需关注混合数据在内涵上的统一。显然,若将内涵不同、数量意义具有差异的数据强行进行综合,其结果必定是评价结论的偏离。笔者认为,在混合数据情形下,如何实现数据的可综合、可对比,是混合数据转换是否有效的关键。

而现有文献对上述问题,并未进行系统的研究与讨论。基于此,本文将主要围绕混合数据的转换与统一这两个关键内容开展讨论;同时,为了便于说明混合数据的处理方法,将结合群组评价的应用场景进行相关阐述。实际上,在群组评价中,由于评价个体或决策者对于评价单元在数量差异判断方面,存在着较大的模糊性、非精确性,因此,混合数据更易于反映评价个体的心理量化过程。

本文的后续部分安排如下:第二部分为问题描述,主要介绍混合数据的形式及其处理过程;第三部分是混合数据的转换方法,分别介绍了区间值变量、语义变量的点值化处理;第四部分针对数据意义的非统一性,讨论了基于个体评价尺度波动的个体权重分配方法,并利用其结果进行数据修正,从而实现数据意义的统一;第五部分归纳了本文所述方法的基本步骤;第六部分则为应用案例。

二、问题描述

群组评价被广泛应用于具有定性定量相结合的复杂社会经济管理问题。其可被简单地描述为:包含n位评价个体的群组E,根据由p个指标构成的指标体系I,对m个评价单元进行评价;通过将个体评价意见综合为群组评价结论,从而开展相应的统计分析与决策。评价个体ei(1≤i≤n)对评价单元oj(1≤j≤m)在评价指标Ik(1≤k≤p)上的量化数据可表示为xk ij。

在混合数据的情形下,指标体系I中各指标的数据形式并不完全相同。考虑到常用的描述不确定性、模糊性问题的方式,在本文中,主要讨论区间值变量、语义变量以及实数形式的点值变量这3类。

(一)数据形式的描述

点值变量通常表示为xi=c,其中,c的具体取值类型有多种,大致可分为评价值(用于反映规模或水平差异,如商品使用天数、出现故障的次数)、评价序(反映优先次序或等级差异,如质量等级主观评级)和评价类(反映类别归属与类间差异,如售后服务是否满意)。区间值可表示为,其中,为其下限,为上限,用于描述被调查者的不确定性问题,例如预期购买的次数、实际交易的商品数量等。语义变量可表示为,其中,s表示语义值,为集合S={s0,s1,···,sg}的一个取值,α表示语义变量距离指标中心值的距离。例如,可以把变量的取值集合S表示为“很好” “好” “很不好”等形容词来 描述。

(二)混合数据处理的过程

混合数据处理过程包含两个内容:数据形式的转换和数据意义的统一。前者包括数据类型的统一(即将各评价指标统一为某一类取值形式)和指标取值区间的统一。而后者则包括指标的离散度、关键点意义等方面的内容。

1.数据形式的转换。

理论上,可以将表达形式各异的混合数据转换为其中的任一类数据。而实际上,人们往往仍倾向于将混合数据转化为点值数据。这并非表示采用混合数据进行综合评价与将混合数据统一转换为点值数据两者之间存在矛盾。混合数据的出现,其目的是为了更便于评价者表达意见,更好地体现复杂评价问题的数据环境,以期实现指标量化的可行和评价组织工作的便利。而至于将混合数据转化为何种形式这一问题,则需要考虑后续的评价方法选择,以及人们的日常决策习惯。故本文主要围绕混合数据的点值化处理进行阐述。但需要说明的是,在现有的评价方法体系中,已经提出了相对较为完善的处理方法,可实现不同数据类型之间的转换。

在混合数据的评价环境下,由于指标的表示方式不尽相同,也就造成了在数据完成转换后,各指标的取值区间可能并不一致。以点值数据为例,指标x1的取值区间为[0,10],而指标x2的取值区间为[20,100]。显然,此两项指标不具有可比性且无法直接综合。常用的处理思路是,对数据进行缩放以统一其取值范围,如等比例缩放或坐标平移的方式,当然也可根据变量的概率分布进行不等比例的缩放处理。

2.数据意义的统一。

即使混合数据实现了数据类型的统一,但由于评价数据的离散度、关键点数值含义这些方面的差异,群组意见或指标的综合集成仍无法有效实现。

围绕评价指标,群组评价中的离散度包括两个维度:评价个体的离散度和评价单元的离散度,从整体上反映指标间的特征差异。例如,n个评价单元在指标x′1的离散情况较为集中,大部分均集中在75左右(以100分为例);而指标x′2的离散情况较为分散。显然此时,指标的可集成性、可比性都较差。对于离散度问题,现有的常规处理方法是采用标准化或无量纲化(例如均值化、极差变换法等)。

而与之不同的是,关键点数值含义则体现各指标在某些特殊位置上取值的差异性特征,具体表现为:在同一状态特征下,指标值之间存在的数量差异,在描述定量指标的平均水平或主观指标的某种状态时,其影响尤为明显。需要说明的是,这种数量差异并不一定表示状态发生了本质的变化,例如,以百分制的指标取值为例,评价单元A在指标和的取值分别为20、60,但均为良好状态。在类似情况下,也就无法直接对多个评价单元进行综合比较了。特别地,在群组评价中,由于评价个体所持的主观评分尺度的差异、评价指标间的客观水平高低,经常造成关键点数值含义在不同评价单元上的差异。

对于以上问题的处理,现有文献普遍关注离散度,而忽视关键点数值含义差异。实际上,离散度可被视为指标的变异特征,而关键点数值含义则可以对指标的集中趋势进行描述。两者的处理,需要在同一框架下进行解决。

三、混合数据的转换方法

基于本文所讨论的混合数据形式,笔者采用点值化的思路,分别讨论区间值变量、语义变量的转换方法。

(一)区间值变量的转换方法

假设为区间值变量,其中,第i(1≤i≤n)个变量值为,、分别表示其下限与上限。基于正态分布的假设,陈骥等(2012)提出采用两个引理,将区间值变量转换为点值变量[11]。

引理1 设,、分别表示标准正态分布的密度函数和分布函数,则

(1)

其中,、为常数,且。

引理2 假设,现有n(1≤i≤n)个样品的具体观测值未知,但已知其落入区间,则参数、的最大似然估计、由式(2)确定:

(2)

根据引理1、引理2,通过估计区间变量的均值、方差,可将区间值转换为点值。

(二)语义变量的转换方法

二元语义变量中,第i(1≤i≤n)个变量值表示为,其中,sk为语义变量集中的第k(1≤k≤g)个语义等级,则表示其偏离sk中心的幅度,一般有。由于在变量集S中,语义值是按次序排列的,不失一般性,以语义的强烈程度由低到高为例。

由于语义等级具有分类特征,可将语义等级sk的中心位置定义为:M(sk)=k。而当偏离中心幅度为时,的相对位置发生变化,有:

(3)

其中,即可作为语义变量的点值转换结果。不难证明,其取值范围有。

四、考虑个体评价尺度波动的数据意义统一方法

群组评价中数据意义的非统一性,是由于评价个体所持有的评价尺度之间的不稳定所造成。这种不稳定包括两个方面:一是在同一指标下,评价个体的评价尺度各异;二是同一评价个体在针对不同指标的量化时,容易产生波动。前者可通过对指标的标准化或无量纲化处理解决,但后者则需要结合个体评价尺度的波动进行处理。

基于上文对离散度、关键点数据意义的处理需要在统一框架下开展的理解,笔者的处理思路是:在考虑评价个体量化尺度波动特征的情形下,以群组意见综合为控制目标,通过优化群组综合过程中的个体权重分配,从而修正个体尺度之间的差异性,以达到数据意义的统一。

(一)考虑个体评价尺度的群组意见集成方式

在群组评价时,由于要求各评价个体均独立地给出其评价意见,因此可将评价指标值视为一个随机变量。显然,该随机变量的数学期望体现了评价个体量化的集中性,而其方差则反映了变异程度。故而,评价个体i给出的量化值xi可被视为该随机变量的数学期望,即有,其方差为。

假设指标存在着理论上的“真值”,即评价个体i所给出的量化值与真值之间存在量化偏离,记为。虽然个体量化有偏,但群组的结果却是趋于无偏的①,即表明,当群组规模趋于大规模化时,则必定有成立。此时,若将n位个体量化值综合为群组意见,则需要考虑各评价个体的量化偏离的大小,通过对个体量化数据在群组意见对比中的“效力”的调整,来实现个体间数据的可比性。将此思路称为“考虑个体评价尺度的群组意见集成方式”,其等价于利用n维的随机变量,构造一个综合函数R,可表示为:

(4)

其中,是待定因子,有且成立。

(二)群组意见集成的目标

对于式(4),根据数学期望与方差的性质,可得:

显然,综合函数R的期望为(跟真值无偏),方差为。由于数据意义统一的目的是将具有尺度差异特征的评价个体量化值修正为尽量趋于一致的结果,故可将“R的方差极小化”设定优化目标,有

(5)

可构造Langrage算式: ,分别对和求偏导,联立方程并求解得:

(6)

从式(6)可以看出,因子是在各评价个体量化值的基础上,基于“一致性”的目标,通过调整个体的权重分配来实现对评价数据意义的修正。修正公式可表示为:

(7)

其中,yij表示完成数据无量纲化处理后,评价个体i在评价指标j上的结果。

显然,当评价个体的方差越大,其量化结果的修正幅度也应该越大。当需要开展多个指标的群组意见集成时,便可以通过观察评价个体在量化过程中的尺度波动并进行修正,这是解决个体之间评价尺度差异性的途径之一。个体评价尺度波动的计算公式为:

(8)

其中,aij表示经数据处理后的评价个体ei对指标j的量化值,为对应的指标均值,p为指标个数。

五、方法步骤

根据上文的阐述,为便于读者理解,笔者将混合数据情形下的群组评价数据处理方法的基本步骤归纳如下。

第一步,将混合数据转换为点值数据。利用式(1)和式(2)对区间值变量进行转换;利用式(3)对语义变量进行转换。

第二步,对转换后的数据进行无量纲化处理,并统一各指标的取值区间。

第三步,利用式(8),分别计算评价个体ei的评价尺度的波动方差。

第四步,利用式(6),计算各评价个体的数据修正幅度。

第五步,利用式(7)修正个体评价数据,并进行群组意见综合,对各评价单元进行评价。

六、应用举例

为推进跨境电子商务出口商品的品牌建设,H市组织开展了出口名牌的评定工作,邀请了来自商务、海关、统计、市场监督、高校等的9位专家(ei,1≤i≤9),按照品牌建设(I1)、品牌影响力(I2)、出口规模(I3)等3项指标,分别对参评品牌进行打分量化。组织者采用了数据类型混合的方式收集评价数据,其中,I1为区间值变量,I2表示为二元语义变量,I3则采用传统的点值数据。在I2中,语义等级分为5类,采用升序的方式给出;s1至s5依次定义为:很弱、较弱、一般、较强、很强。限于篇幅,本文节选了3个参评品牌(oj,1≤j≤3)进行说明。相关数据可见表1。

表1 跨境电商出口名牌评定指标

o1

o2

o3

I1 1

I1 2

I1 3

I2 1

I2 2

I3 2

I3 1

I3 2

I3 3

e1

[61,68]

(S2,0.4)

75

[76,86]

(S1,–0.2)

65

[71,82]

(S1,–0.3)

86

e2

[65,71]

(S1,–0.2)

83

[72,80]

(S1,0.3)

84

[58,91]

(S1,0.6)

80

e3

[58,64]

(S4,–0.5)

66

[68,79]

(S2,–0.3)

92

[68,81]

(S2,–0.3)

76

e4

[57,60]

(S4,–0.6)

90

[63,68]

(S3,0.2)

88

[72,76]

(S2,0.5)

62

e5

[62,66]

(S2,–0.1)

92

[71,77]

(S2,0.7)

75

[64,70]

(S2,0.2)

75

e6

[62,66]

(S2,–0.3)

83

[73,75]

(S2,0.5)

70

[66,68]

(S2,–0.1)

82

e7

[59,63]

(S3,–0.2)

85

[69,77]

(S2,0.3)

65

[63,74]

(S2,0.2)

78

e8

[52,57]

(S5,0.3)

74

[59,73]

(S3,–0.4)

74

[65,86]

(S1,–0.2)

66

e9

[57,64]

(S4,–0.4)

65

[64,82]

(S1,–0.3)

83

[64,77]

(S2,0.3)

69

根据本文所述的混合数据处理方法,相关应用过程如下。

第一步,进行点值化处理。利用式(1)和式(2),对区间值进行点值化处理,相应变量的均值和标准差的估计结果可见表2;利用式(3)将二元语义变量转换为点值。相关结果可见表3。

表2 区间变量的均值与标准差估计

I1 1

I2 1

I3 1

61.69

72.94

70.58

3.36

3.71

2.85

第二步,按列对指标进行无量纲化处理,公式采用:。对本例中所有评价单元均采用此处理方法,因此,可将数据的取值区间统一为0至100之间,相关结果见表4。

表3 数据形式转化后的评价数据

o1

o2

o3

I1 1

I1 2

I1 3

I1 1

I1 2

I1 3

I1 1

I1 2

I1 3

e1

64.76

0.40

75

74.32

0.13

65

71.47

0.12

86

e2

63.18

0.13

83

73.50

0.22

84

70.58

0.27

80

e3

61.53

0.58

66

73.01

0.28

92

70.90

0.28

76

e4

60.80

0.57

90

71.38

0.53

88

71.60

0.42

62

e5

62.30

0.32

92

73.17

0.45

75

69.69

0.37

75

e6

62.30

0.28

83

73.22

0.42

70

69.37

0.32

82

e7

61.51

0.47

85

72.95

0.38

65

70.37

0.37

78

e8

59.87

0.88

74

72.15

0.43

74

70.64

0.13

66

e9

61.45

0.60

65

72.94

0.12

83

70.57

0.28

69

max

64.76

0.88

92

74.32

0.53

92

71.6

0.42

86

表4 经无量纲化处理后的评价数据

o1

o2

o3

I1 1

I1 1

I1 1

I2 1

I2 2

I2 3

I3 1

I3 2

I3 3

e1

100

45.45

81.52

100

24.53

70.65

99.82

28.57

100

e2

97.56

14.77

90.22

98.90

41.51

91.30

98.58

64.29

93.02

e3

95.01

65.91

71.74

98.24

52.83

100

99.02

66.67

88.37

e4

93.89

64.77

97.83

96.04

100

95.65

100

100

72.09

e5

96.20

36.36

100

98.45

84.91

81.52

97.33

88.10

87.21

e6

96.20

31.82

90.22

98.52

79.25

76.09

96.89

76.19

95.35

e7

94.98

53.41

92.39

98.16

71.70

70.65

98.28

88.10

90.70

e8

92.45

100

80.43

97.08

81.13

80.43

98.66

30.95

76.74

e9

94.89

68.18

70.65

98.14

22.64

90.22

98.56

66.67

80.23

第三步,构造权重分配矩阵GI。群组在对评价指标进行初始量化时,不仅存在数据形式上的差异,而且还存在尺度上的不同。因此,为了保证可比性,将群组对不同评价单元在同一指标上的评价数据视为多次重复测量,故可分别构造各指标的个体权重分配矩阵。本例中有GIp(p=1,2,3),依次可表示为:

根据式(8)分别针对GIp矩阵,计算各评价个体的量化尺度标准差(1≤i≤9,1≤p≤3),整理后,个体的评价尺度波动向量分别为:

第四步,根据式(6),分别计算GIp矩阵所对应的个体权重,其向量为:

第五步,根据式(7),利用个体权重向量,将个体对各指标的量化结果集成为群组意见。同时,不失一般性,这里不考虑指标权重的差异性,采用简单算术平均,计算评价单元的评价值Yi(i=1,2,3);计算结果可见表5。由此可得评价单元的最终排序依次为:,即可优先认定为出口名牌。

表5 各指标的群组集成结果与综合评价值

I1

I2

I3

Y

o1

95.22

98.21

98.44

97.29

o2

54.76

61.48

72.64

62.96

o3

87.50

83.15

88.20

86.28

七、结束语

面向具有区间值、语义变量与实数型变量的混合数据,本文采用了数据转换思路,实行混合数据的形式统一。针对数据意义的非统一性问题,在定义相关测度的基础上,提出了基于个体评价尺度波动数据修正方法,并以跨境电商出口名牌的评定为例进行了案例应用。但两个问题值得注意,首先,虽然讨论了混合数据的点值化处理方法,但其目的是为了在评价数据形式不断扩展的情况下,更好实现传统的评价方法体系与评价数据扩展的衔接,当然根据实际需要,也可以设置其他数据形式作为数据转换的目标。其次,在评价数据的修正过程中,是以个体的公正性为前提的,即不存在诸如舞弊、倾向性评价等情况,而实际上却是有可能存在的。

参考文献

苏为华, 陈骥. 综合评价技术的扩展思路[J]. 统计研究, 2006, 23(2): 32-37.

陈骥, 苏为华, 张佳楠. 区间值综合评价问题研究[M]. 1版. 北京: 中国统计出版社, 2018.

潘亚虹, 耿秀丽. 基于Mo-RVIKOR的混合多属性决策方法[J]. 中国管理科学, 2019, 27(12): 143-150.

徐选华, 蔡晨光, 梁栋. 基于混合多属性信息的复杂多阶段决策方法[J]. 系统工程与电子技术, 2015, 37(10): 2315-2321.

关欣, 常进, 王虹, 等. 基于多源测量与属性混合信息的分类识别方法[J]. 计算机与数字工程, 2016, 44(4): 54-59.

丛东升, 尚建忠, 张瑞军, 等. 考虑混合不确定性信息的产品多属性方案评价[J]. 系统工程理论与实践, 2018, 38(9): 2409-2415.

张晓, 樊治平. 基于前景理论的风险型混合多属性决策方法[J]. 系统工程学报, 2012, 27(6): 772-781.

糜万俊, 戴跃伟. 基于前景理论的风险型混合模糊多准则群决策[J].控制与决策, 2017, 32(7): 1279-1285.

罗承昆, 陈云翔, 顾天一, 等. 基于前景理论和证据推理的混合型多属性决策方法[J]. 国防科技大学学报, 2019(5): 49-55.

龚承柱, 李兰兰, 卫振锋, 等. 基于前景理论和隶属度的混合型多属性决策方法[J]. 中国管理科学, 2014, 22(10): 122-128.

陈骥, 王炳兴. 基于正态分布点值化的区间主成分评价法及其应用[J]. 统计研究, 2012, 29(7): 91-95.

唐卫东, 丁冬, 刘圣保. 基于混合属性指标的供应商选择研究[J].合肥工业大学学报: 自然科学版, 2011, 34(3): 143-147.

赵萌, 任嵘嵘, 李刚. 基于模糊熵-熵权法的混合多属性决策方法[J]. 运筹与管理, 2013, 22(6): 78-83.

李伟伟, 易平涛, 郭亚军. 混合评价信息的随机转化方法和应用[J]. 控制与决策, 2014, 29(4): 753-758.

作者简介:

陈骥,男,1981年生,浙江乐清人,2010年毕业于浙江工商大学,获经济学博士学位,教授,现就职于浙江工商大学统计与数学学院,研究方向为综合评价与决策、商务统计与分析。

姚婷,女,1995年生,浙江南浔人,现为浙江工商大学统计与数学学院在读硕士研究生,研究方向为综合评价与数据挖掘。

(责任编辑: 黄煌)

中国城镇就业质量指数研究[footnoteRef:2] [2: ①课题组组长:贾毓慧。成员:冯帅章,卢晶亮,吴珊,郭航,张楠。本文执笔:冯帅章,贾毓慧。]

人口和就业统计司课题组①

内容摘要:高质量就业是人民美好生活的重要组成部分,也是经济高质量发展的内在要求。本文在对国际常用就业质量指标体系进行系统梳理的基础上,构建了涵盖工资水平、就业充分、就业稳定、工作生活平衡4个维度的就业质量指标体系,利用全国月度劳动力调查数据,对全国、各省(区、市)的月度、季度和年度就业质量指数进行测算。研究表明,2016—2018年,我国总体就业质量呈现不断上升趋势,但超时工作现象有所加剧,合同签订率有待提高;不同地区就业质量存在显著差异;就业质量与经济发展水平、产业结构等因素高度相关。同时,本文还提出了提高我国整体就业质量的政策建议。

关键词:劳动力;就业质量;指数研究

中图分类号:F224 文献标识码:A 文章编号:1004-7794(2020)06-0010-06

DOI: 10.13778/j.cnki.11-3705/c.2020.06.002

一、引言及文献综述

就业不仅是取得收入的手段,也是自我实现和融入社会的重要方式,就业质量的高低与劳动者的生活质量与获得感息息相关。十九大报告提出:“就业是最大的民生。要坚持就业优先战略和积极就业政策,实现更高质量和更充分就业。”2019年政府工作报告首次将就业优先政策置于宏观政策层面,旨在强化各方面重视就业、支持就业的导向,推动高质量发展。从某种程度上说,当前我国就业领域的主要矛盾已不是劳动者能否找到工作,而是劳动者的素质能否适应高质量发展的需求,就业质量能否满足人们对幸福生活的追求。因此建立反映我国就业质量的指标体系,监测就业质量变化,对弥补我国就业领域的短板和不足,更有针对性完善就业政策,保障和改善民生十分必要。

就业质量是一个多维概念,源于不同学科的理论基础,侧重考察就业的不同方面,如个体对工作的主观满意度、客观的工作环境、宏观的就业环境与劳动关系等。本文利用一系列对劳动者个人福祉有直接影响的工作和就业特征来衡量就业质量的高低。

国内外机构和学者相继提出了多种衡量就业质量的指标体系和方法。国外研究中比较具有代表性的有如下几类。国际劳工组织(ILO)建立的就业质量指标体系,涵盖就业机会、公平就业待遇、安全的工作环境、社会保障、社会对话、体面工作的经济和社会背景、体面的工作时间、稳定性和工作保障、充足的报酬、平衡工作和生活以及不可接受的工作等11个维度[1]。经济合作与发展组织(OECD)借鉴幸福感指标体系,建立了包含收入质量、劳动力市场保障及工作环境质量3个维度的就业质量指标体系。欧洲改善生活和工作条件基金会(Eurofound)的就业质量指标体系,包括工作环境、工作强度、工作时间质量、社会环境、技能和自由裁量权、工作前景以及工作报酬7个维度,每个维度下又设立了多个指标[2]。

国内学者对就业质量指标体系的研究,主要以国际组织测量指标为基础,根据数据可得性选取数量不等的维度、指标来构建相应的评价体系。苏丽锋(2013)、赖德胜等(2011)基于宏观数据建立我国的就业质量指标体系,并对全国就业质量的变动趋势和省份排名进行了分析[3-4]。基于微观数据的研究相对匮乏,主要集中在大学生、农民工等特定群体的就业质量研究,如张抗私等(2017)利用2014年大学毕业生就业质量问卷调查数据,运用结构模型方程探究影响大学生就业质量的因素[5]。

总体看来,目前我国有关就业质量的研究较少,且由于微观数据获取难度较大,侧重利用宏观指标构建指标体系,并选取了许多与就业质量并非直接相关的变量,如经济发展水平、产业结构、就业结构等,这些变量会影响就业质量,但并不直接反映就业质量的高低。本文在借鉴现有研究基础上,利用全国月度劳动力调查微观数据,选取与工作特征直接相关的指标对就业质量进行衡量,测算全国及分省就业质量指数,并提出相关政策建议。

二、数据来源和研究方法

(一)数据来源

本报告所用数据来自全国月度劳动力调查,时间范围为2016年1月至2018年12月,研究对象为16~65岁的城镇就业人员。由于西藏自治区的样本规模相对较小,分析中未包含该地区。利用月度劳动力调查微观数据研究构建就业质量指标体系具有显著优势:第一,调查频率高,每月都有调查数据;第二,样本量大,城镇就业人员样本规模超过10万人;第三,抽样精度高,数据对全国和省级都具有良好的代表性;第四,所有指标来源于同一项调查,统计口径一致,质量有保障。

(二)指标体系

在广泛参考现有研究成果,综合考虑数据可得性的基础上,本研究构建了5套备选指标体系,并分别采用简单加权平均与主成分分析两种方法对就业质量指数进行了测算,而后根据指标体系对于权重选择和测算结果排名的稳健性,确定最优指标体系。本文倾向于使用与工作特征直接相关的指标,采用月平均工资、未充分就业比例、超时工作比例、合同签订率4个指标构建就业质量指数,分别代表劳动工资、就业充分、工作生活平衡、就业稳定4个维度,每个维度均选取影响程度最大的关键因素作为评价指标,尽量避免指标间的信息重复或交叉。不足之处是,受劳动力调查内容限制,与欧洲主要指标体系相比,缺少关于工作强度、工作环境、职业发展前景和主观工作满意度等方面的考量。

月平均工资是反映就业质量的重要指标,劳动者通过就业能够获得合理的、稳步增长的报酬,有效改善家庭生活,体现自身社会价值,平均工资水平与就业质量存在显著正相关关系。未充分就业比例指周工作时间小于40小时且想要增加工作时间的就业人员比例,工作时间不足却无法增加工作时间是未充分就业的表现,该指标为负向指标,未充分就业比例越高,则就业质量越低。超时工作比例指周工作时间超过55个小时的就业人员比例,过长的工作时间会显著降低就业质量,该指标为负向指标,用来衡量工作生活平衡。合同签订率指雇员与单位或雇主签订劳动合同的比例,签订正式劳动合同意味着相应的社会保障和法律保护,该指标为正向指标,用于衡量就业稳定性。

(三)测算方法

本文以省(区、市)为单位,采用月度数据计算各类指标。为进行跨省和跨期比较,以2016年1月为基期,先对各指标进行最大–最小标准化处理,得到4个基础指数,再利用主成分分析法加权得到总指数。通过对月度指数进行算术平均,可得出季度指数和年度指数,对省级就业质量指数按就业人口加权,可进一步得出分地区指数和全国指数。考虑到月度指标的波动性较强,本文仅对季度和年度指数进行分析。

三、2016—2018年全国及各地区就业质量状况

(一)全国就业质量不断改善

测算结果显示,2016—2018年全国就业质量指数总体呈稳步上升趋势,从2016年1季度的30.3上升到2018年4季度的34.5,就业质量不断改善(见图1)。

图1 全国就业质量季度总指数变动趋势

分指标看,工资水平稳步上升,充分就业持续向好,劳动合同签订情况保持平稳,但超长时间工作现象有所加剧(见图2)。

图2 全国就业质量季度分项指数变动趋势

月平均工资指数呈持续上升趋势。除2016年2季度有波动下滑之外,从2016年1季度的23.8到2018年4季度的33.4,月平均工资指数实现较快增长,增长幅度在4个指标中居首位,表明劳动报酬稳步提高,劳动者获得感不断增强。然而从数值上看,该指数得分较低,原因在于月平均工资省份间差异较大,北京、上海等个别地区工资水平远高于其他省份。

未充分就业指数,总体呈稳步上升态势。从数值上看,因工作时间不足导致的未充分就业比重不断降低。该指数得分远高于总体就业质量指数得分,除海南等个别省份未充分就业比例偏高外,其他省份就业不充分的现象并不明显。

超时工作指数呈波动下降趋势。从2016年1季度的43.1下降到2018年4季度的31.7,工作时间过长的现象有所加剧。分产业结构与单位类型看,第三产业、私营企业与个体工商户周平均工作时间较长,随着市场经济活力不断激发,产业结构不断优化,第三产业成为吸纳就业的主力,私营企业与个体户发展迅速,就业人员占比稳步提高,工作时间较长也是这类单位长期以来的共同特点。受此影响,全国超时工作比例不断提高,就业人员工作与生活平衡关系有所恶化,作为逆向指标,该指数不断走低。与此同时,该指数季节性特征较为明显,1季度受春节及冬季天气偏冷等因素影响,部分行业处于生产经营淡季,周平均工作时间减少,超时工作情况有所缓解,每年 1季度该指数均有所回升。

合同签订指数走势平稳。三年来变化幅度较小,稳定在30.0~34.0之间。劳动者的合法权益得到维护,有利于保持就业稳定。分单位类型看,私营企业与个体工商户劳动合同签订率仍然较低,有待进一步提高。

(二)不同地区就业质量存在显著差异

东部沿海地区领跑全国,东北地区下滑(见图3)。本文按照八大经济区①划分标准,对全国各地区就业质量年度指数进行测算。结果显示,就业质量地区差异较为明显,北部、东部和南部沿海地区就业质量高于全国平均水平,其他地区就业质量低于全国平均水平。东部沿海地区领跑全国,就业质量指数最高且上升趋势持续;东北和黄河中游地

图3 各地区就业质量年度总指数变动趋势

区就业质量指数偏低,其中东北地区指数呈现下降趋势,表明其就业质量在进一步降低。

(三)各省(区、市)就业质量指数及排名

对2016—2018年全国30个省(区、市)(不包括西藏)就业质量年度总指数与分项指数测算,指数得分及排名情况见表1与表2。

表1 2016—2018年30个省(区、市)就业质量年度总指数得分及排名

省份

总指数得分

2018年较2016年得分变化

总指数排名

2018年较2016年排名变化

2016年

2017年

2018年

2016年

2017年

2018年

北京

94.7

100.3

106.8

12.1

1

1

1

上海

91.9

95.4

102.1

10.2

2

2

2

天津

69.9

72.4

74.8

4.8

3

3

3

江苏

56.7

58.0

60.5

3.8

4

4

4

浙江

47.1

49.6

51.6

4.5

5

5

5

广东

44.8

47.4

49.1

4.4

6

6

6

新疆

44.1

45.5

46.5

2.4

7

7

7

重庆

43.7

44.1

45.9

2.2

8

8

8

湖北

33.0

35.2

39.6

6.5

10

11

9

1

贵州

30.5

39.0

39.0

8.6

14

9

10

4

湖南

28.6

32.3

35.8

7.2

16

13

11

5

宁夏

36.4

36.3

35.2

–1.3

9

10

12

–3

四川

30.6

30.2

34.4

3.9

13

16

13

安徽

26.1

28.1

33.4

7.3

21

18

14

7

福建

28.1

28.9

32.3

4.2

17

17

15

2

青海

29.3

30.2

32.3

3.0

15

15

16

–1

山东

30.7

32.5

31.9

1.2

12

12

17

–5

陕西

32.7

31.0

31.2

–1.5

11

14

18

–7

云南

26.9

24.6

28.8

1.9

20

22

19

1

山西

22.4

25.8

28.6

6.2

23

21

20

3

内蒙古

27.1

26.7

26.0

–1.1

19

20

21

–2

辽宁

27.4

27.2

25.4

–2.0

18

19

22

–4

广西

20.5

23.1

23.7

3.1

24

24

23

1

海南

19.5

23.8

22.9

3.4

26

23

24

2

吉林

17.4

19.0

21.5

4.1

29

25

25

4

甘肃

17.6

16.8

20.9

3.3

28

29

26

2

江西

19.2

17.6

20.1

0.9

27

28

27

河北

19.8

18.8

19.6

–0.2

25

26

28

–3

黑龙江

23.4

18.6

17.3

–6.1

22

27

29

–7

河南

10.9

13.7

16.7

5.8

30

30

30

北京、上海、天津、江苏和浙江就业质量指数稳居全国前五位。其中北京与上海指数得分远高于其他省份,各分项指数均居全国前列。2018年,广东、新疆、重庆、湖北和贵州排名全国6~10位,除贵州2017年排名明显上升外,其余省份历年排名也较为稳定。湖南、宁夏、四川、安徽、福建、青海、山东、陕西、云南和山西排名全国11~20位,多为中西部省份,且多数省份

表2 2018年30个省(区、市)年度分项及总指数排名

省份

月平均工资指数

未充分就业指数

超时工作指数

合同签订指数

就业质量

总指数

北京

1

6

1

2

1

上海

2

2

2

1

2

天津

7

1

3

3

3

江苏

5

4

9

4

4

浙江

3

7

24

6

5

广东

4

9

15

7

6

新疆

8

24

19

5

7

重庆

14

3

7

8

8

湖北

15

17

13

10

9

贵州

12

20

4

16

10

湖南

11

25

12

17

11

宁夏

19

5

23

9

12

四川

17

27

11

13

13

安徽

18

13

17

14

14

福建

6

22

27

18

15

青海

9

8

29

15

16

山东

13

14

26

11

17

陕西

20

16

5

24

18

云南

16

26

6

28

19

山西

27

15

20

12

20

内蒙古

10

21

21

27

21

辽宁

24

11

22

20

22

广西

29

28

10

22

23

海南

26

30

8

19

24

吉林

23

10

28

21

25

甘肃

21

29

18

25

26

江西

22

18

14

30

27

河北

25

12

25

26

28

黑龙江

28

19

30

23

29

河南

30

23

16

29

30

在1~2个分项指数中排名较为落后。内蒙古、辽宁、广西、海南、吉林、甘肃、江西、河北、黑龙江和河南排名全国21~30位,多为西部和东北省份,在各分项指数上普遍排名落后,且历年排名变动不大,就业质量在全国处于较低水平。

分项指数呈现不均衡状态,全国排名差异较大。一些省份在某些维度上就业质量较好,而在另一些维度上就业质量较差。以2018年为例,浙江月平均工资指数、未充分就业指数、合同签订指数均居全国前列,但超时工作指数仅排全国24位;云南、海南超时工作指数排名靠前,但其余三个指标水平不高;辽宁、吉林、河北未充分就业指数排名全国10~12位之间,但其余三个指数均排在全国20位之后。

多数省份2018年就业质量总指数较2016年上升,就业质量稳步提高。宁夏、陕西、内蒙古、辽宁、河北和黑龙江指数有所下降。从分项指数看,由于工资水平存在刚性,其就业质量下降,不同程度地表现在未充分就业、超时工作与合同签订方面。

多数省份就业质量排名较为稳定,部分省份位次发生较大变化。排名前八的省份,指数排名三年间未发生变化,排名30的河南也始终位于全国末尾。安徽、湖南排名上升明显,2018年较2016年位次分别上升7位、5位,跻身全国前15位。黑龙江、陕西、山东排名下降明显,位次分别下降7位、7位、5位,均列全国后15位。

四、就业质量的影响因素

为深入研究就业质量的影响因素,本文对2016—2018年分省年度面板数据进行回归分析,考察了就业人员的年龄、学历、外来人口比重、就业结构、人均GDP、产业结构等因素对就业质量总指数及分项指数的影响(见表3),其中人均GDP和产业结构数据来源于《中国统计年鉴》,其他数据均来源于全国月度劳动力调查。

(一)经济发展水平越高的省份,就业质量一般越高

回归结果显示,对数人均GDP和就业质量指数、月平均工资指数、未充分就业比例指数均高度正相关。这是由于人均GDP越高的省份,经济

表3 就业质量指数及分项指数的影响因素:年度面板回归

指标

就业质量

总指数

月平均工资

指数

未充分就业

指数

超时工作

指数

合同签订

指数

男性就业人员比重

60.2

–60.7

368.6

56.6

–52.3

26~35岁就业人员比重

82.4

52.4

83.4

209.7

25.5

36~45岁就业人员比重

88.0

54.1

–86.1

166.6

195.6

高中学历就业人员比重

–51.5

–40.3

57.5

–331.4**

26.9

大专及以上学历就业人员比重

–1.5

86.4

–115.2

–182.8**

98.2*

已婚就业人员比重

–53.4

–87.4

–40.7

–245.4

94.9

外来就业人员比重

–13.1

34.2

–24.6

–210.5***

63.6

公共部门就业比重

75.1**

22.6

18.5

173.5***

103.9***

自营劳动者比重

–87.7***

–56.3*

–41.4

–151.3*

–104.9**

第三产业就业比重

–51.4

–85.2**

8.5

–227.1***

50.8

对数人均GDP

23.8**

19.0**

63.7**

5.1

6.0

第三产业增加值比重

30.4

2.2

185.8*

–83.6*

4.8

观测值

90

90

90

90

90

R平方

0.7

0.9

0.6

0.6

0.4

省份数

30

30

30

30

30

年度固定效应

注:***、**、*表示回归系数在1%、5%、10%的水平下显著。

发展水平也就越高,工资收入更高,工作机会更多,充分就业的比例更高,从而带动整体就业质量较高。但也不能认为人均GDP高的省份,就业质量一定高。以福建和山东为例,2018年人均GDP分列全国第6、8位,但就业质量仅排名全国第15、17位,原因在于这两个地区的超时工作指数分别排全国27、26位,超负荷工作的现象较严重,导致总体就业质量排名不高。与之相反,新疆、贵州人均GDP分列全国第19、28位,经济发展水平不高,但财政转移支付力度较大,月平均工资指数分别排全国第8、12位,加之正规就业占比高,合同签订及工作生活平衡情况较好,就业质量总指数均排进全国前10位。

(二)公共部门就业人员的就业质量较高

这里的公共部门指机关团体事业单位和国有企业。公共部门就业比重与就业质量总指数、合同签订指数呈显著正相关关系,与超时工作比例呈显著负相关关系。与私营企业相比,这些单位的用工更加规范,遵守相关法律法规情况较好,劳动合同签订率高,超时工作比例低,员工权益得到较好维护,就业质量相对较高。

(三)自营劳动者的就业质量较低

自营劳动者主要是个体工商户和灵活就业人员,与公共部门的情况相反,自营劳动者比重与就业质量总指数、月平均工资指数、合同签订指数均呈显著负相关关系,与超时工作比例呈显著正相关关系。个体工商户和灵活就业人员由于没有正规单位,缺少劳动合同保护,且多集中在批发零售、住宿餐饮和建筑业等行业,工作时间更长,但工资收入却不高,就业质量相对较低。

(四)服务业就业人员工资水平较低、工作时间较长,拉低就业质量

第三产业就业人员比重与月平均工资指数呈显著负相关关系,与超时工作比例呈显著正相关关系。与制造业相比,服务业的小微企业和个体工商户比重更高,劳动生产率较低,从业人员的整体工资水平也较低,与此同时,受批发零售、住宿餐饮、居民服务等吸纳就业人员较多行业的带动,服务业整体工作时间较长,超时工作比例较高,就业质量总体偏低。

(五)外来就业人员工作时间较长,影响就业质量提升

外来就业人员与超时工作比例呈显著正相关关系。与本地户籍人口相比,外来就业人员在非正规部门就业的比重更高,同时生活压力更大,对工资的预期较高,更愿意通过增加工作时间的方式来获得更高的收入,周平均工作时间明显高于本地就业人员,超时工作比例较高,成为制约就业质量提升的重要因素。

五、提高我国就业质量的政策建议

就业质量指数测算结果显示,2016—2018年全国就业质量总体呈现稳步上升趋势。但随着经济活力的不断激发,新就业形态不断涌现,就业人员逐渐从第一、二产业向第三产业转移,从正规部门向非正规部门转移,服务业成为吸纳就业的蓄水池。私营企业、个体工商户和灵活就业人员占比越来越高,在就业质量方面也存在着一些值得关注的问题。在经济发展的同时,要不断完善就业政策,补齐就业短板,有的放矢提高我国整体就业质量,政策建议如下。

(一)加强对中小企业和民营企业的扶持力度,促进服务业优化升级

继续加大“放管服”改革力度,持续推进营商环境改善,从融资贷款、政策支持、人才培养等方面对中小企业和民营企业一视同仁,从税收、社保费率、财政补贴等方面加大支持这些企业发展的政策力度,促进服务业优化升级,鼓励服务业企业做大做强,重点支持现代新兴服务业的发展。同时加强对中小企业和民营企业的引导,规范劳动合同签订、带薪休假、加班补偿和社保缴纳等行为,保障劳动者的合法权益,让更多劳动者共享改革发展成果。

(二)提升劳动者素质,加强职业技能培训

鼓励完成义务教育的学生继续升学深造,提升全社会人力资源素质,在条件合适的情况下推进12年义务教育。积极发展职业教育,加大已就业人员的职业技能培训力度,加强师资保障、培训经费和学历认证等职业技能方面政策的针对性,提升劳动者技能水平和就业能力,扩宽就业渠道,提高就业质量。

(三)加强劳动执法力度,建立适合灵活就业人员的社会保障制度

规范劳动合同签订,加强劳动仲裁力度和效率,无论企业的所有制和大小,加强对侵犯劳动者合法权益企业的执法和曝光力度。建立适合平台就业等新就业形态的社保缴纳机制,鼓励引导灵活就业人员缴纳社保费用,将全部灵活就业人员纳入国家社会保障体系。

(四)破除流动障碍,促进人力资源合理有序流动

进一步推进户籍、住房、教育和医疗等领域改革,促进公共服务均等化,使市场成为人力资源流动的决定性力量,破除阻碍劳动者在各类所有制企业、事业单位之间的流动障碍,在人才引进、职称评定等领域对所有单位一视同仁,进一步优化公务员的进出机制。

(五)充分发挥中西部和东北地区人力资源,加大产业转移和升级力度,促进区域平衡发展

专门出台针对中西部和东北地区的人才政策,使这些地区能够吸引人才、留住人才,增强经济发展的内生动力。同时,积极引导适当产业从东部向中西部和东北地区转移,注重培育发展新动能,缩小地区发展差距,促进区域平衡协调发展,从根本上提升中西部和东北地区的就业质量。

参考文献

Eurofound (2017), Sixth European Working Conditions Survey–Overview report (2017 update), Publications Office of the European Union, Luxembourg.

Cazes S, Hijzen A, Saint-Martin A (2015), “Measuring and Assessing Job Quality: The OECD Job Quality Framework”, OECD Social, Employment and Migration Working Papers, No. 174, OECD Publishing, Paris.

苏丽锋. 我国转型期各地就业质量的测算与决定机制研究[J]. 经济科学, 2013(4): 41-53.

赖德胜, 苏丽锋, 孟大虎, 等. 中国各地区就业质量测算与评价[J]. 经济理论与经济管理, 2011(11): 88-99.

张抗私, 朱晨. 大学毕业生就业质量的影响因素[J]. 人口与经济, 2017(1): 75-84.

(责任编辑: 王思瑶)

基于BP神经网络的油菜籽遥感识别研究

余新华 王 宏

内容摘要:针对传统分类方法易受到“同物异谱”和“异物同谱”的影响,农作物遥感分类准确性较低的问题,本文以四川盆地内的川中丘陵和川西成都平原为主要研究区域,选用Landsat-8 OLI遥感数据,构建了基于BP神经网络的土地覆盖分类模型,应用于研究区的主要作物油菜籽识别研究。以两幅Landsat-8 OLI遥感数据的14个波段作为输入,不断调节分类参数,最终确定了最优分类网络结构。结果显示,BP神经网络法油菜籽的分类总体精度为81.28%,较最大似然法提高了25.12个百分点,Kappa系数也有所提高。基于BP神经网络的遥感分类模型可高效精确地识别油菜籽。

关键词:BP神经网络;油菜籽;遥感影像;农作物遥感分类识别

中图分类号:P407.8 文献标识码:A 文章编号:1004-7794(2020)06-0016-09

DOI: 10.13778/j.cnki.11-3705/c.2020.06.003

一、引言和文献综述

农业生产是国家经济发展的重要基础,基于遥感影像的农作物分类是获取作物种植面积、产量、长势的重要依据,快速、准确地获取农作物类别信息对政府部门掌握农情,进行宏观调控具有重要意义。在众多的遥感分类方法中,传统的农作物遥感分类识别虽具有一定的意义,但因受到自然地理环境与复杂人地关系的影响,其分类识别精度也难以达到研究要求。目前基于遥感影像进行农作物分类识别的研究主要分为两类:一是根据农作物独特的光谱特征,利用高光谱遥感数据构建不同植被指数,进而反演提取出各农作物;二是利用遥感影像的光谱、纹理特征,根据不同的数据分类方法对遥感影像进行农作物遥感识别分类。Fang et al(2016)利用无人机多光谱影像数据,重新构建了多种植被指数对油菜不同时期的植被分数进行了拟合反演,有效地对油菜进行识别[1]。王东等(2018)利用高分系列遥感影像,通过构建植被指数模型和HSV变化,有效地对武穴市油菜进行了提取,总体分类精度达到了94.51%[2]。虽然上述研究也能达到分类精度要求,但由于不同农作物的光谱特征的特殊性,对遥感影像的要求较高,且在实际分类中易受到相邻其他农作物的影响,对分类精度造成误差,因此只使用光谱特征进行遥感影像分类存在一定缺陷。

在众多遥感监测方法中,人工神经网络法以其灵活的分类手段和简便的自主学习能力成为科研人员遥感分类应用的有效手段,其中由于BP神经网络克服了传统分类法需要考虑数据概率分布前提的缺陷,采用误差反向传播的学习算法,能很好地实现预测功能,针对遥感影像分类,能对不同类的非线性遥感影像数据进行有效拟合,并获得较好的分类效果,显著提高分类精度,成为当前广泛研究与应用的分类方法[3]。Kussul et al(2016)利用多时相遥感和SAR数据,采取BP神经网络方法对乌克兰基辅地区内的多种农作物进行分类,整体分类精度达到了94%[4]。针对BP神经网络反馈收敛速度慢、易产生局部极小值和过拟合的问题,杨剑等(2018)采用免疫遗传算法对BP神经网络模型进行优化,有效提高了算法的整体分类精度[5]。曹斌等(2017)将神经网络和粒子群算法结合起来,不仅能发挥神经网络的泛化映射能力,而且能使神经网络具有较快的收敛性、全局优化能力和较强的学习能力,进一步提高网络训练速度和预测精度[6]。田富有等(2019)在BP神经网络的基础上构建多层神经网络模型,利用SLIC对遥感影像分割,对研究区内的大豆进行提取,达到了较高的分类识别精度[7]。周扬帆(2018)选用Landsat-8 OLI影像,将实测的马铃薯等农作物的光谱信息与遥感影像纹理信息相结合,使用BP神经网络进行地物识别与分类[8]。Chellasamy et al(2016)选用春季和初夏两时相的WorldView-2卫星数据,结合遥感影像的纹理特征,使用多个BP神经网络计算基于像素的地物识别预测概率,实现对农作物的高精度分类,为政府作物种植多样性补贴提供科学依据[9]。由于高分辨率遥感影像的重访周期较长,范迎迎等(2017)利用单时相多源遥感数据,组合不同植被特征指数,对棉花进行遥感监测[10]。Zhong et al(2019)利用农业统计数据并结合遥感影像,构建了一个深度神经网络结构对美国堪萨斯州和德克萨斯州北部的冬小麦进行遥感识别,提高了数据泛化能力[11]。贾洁琼等(2018)采用高分遥感影像,将不同植被指数作为输入变量输入到BP神经网络中进行训练,得到了精度较高的玉米叶面指数,精确高效地对玉米空间分布进行识别[12]。

本文采用BP神经网络构建了多光谱农作物遥感分类识别模型,耦合作物纹理等影像特征,对BP神经网络进行训练,对分布于研究区内的主要农作物油菜籽展开研究,以提高其遥感识别精度。

二、研究区与研究数据

(一)研究区概况

本研究选取四川盆地内的川中丘陵和川西成都平原为主要研究区域,涉及到的城市包括成都市、眉山市、乐山市、自贡市、内江市、资阳市、遂宁市、德阳市、绵阳市,并对研究区内的特色农作物油菜籽展开遥感影像识别研究。研究区区位图如图1所示。

图1 研究区区位图

(二)研究数据

1.遥感数据。

本文采用30米空间分辨率的多光谱Landsat-8 OLI遥感影像作为实验数据源,以研究基于BP神经网络的主要农作物油菜籽的遥感影像分类识别。采用遥感处理软件对获取的遥感影像进行几何校正、大气校正、辐射定标等数据预处理,降低数据获取过程中产生的误差对遥感影像质量的影响,保证研究区内油菜籽识别的精度。油菜籽在不同的生长期具有不同光谱纹理特征,为提高识别精度,本文选取了不同时相的两幅Landsat-8 OLI遥感影像数据。Landsat-8 OLI遥感影像由多个不同波段组成,不同波段包含不同的地类特征数据,为较好地将油菜籽与其他农作物、非农作物进行分类识别,分别选取生长季期间的两幅Landsat-8 OLI遥感影像(影像获取时间分别为2019年3月26日、2019年4月22日)的14个波段作为输入数据源进行农作物遥感分类研究。

2.油菜籽生长物候期。

根据野外实地调研并结合农作物生长阶段性特征,得出了研究区内主要农作物夏收油菜籽的生长物候表,如表1所示。油菜籽一般是越冬生

表1 油菜籽生长物候表

农作物

上一年9-12月

1月

2月

3月

4月

5月

上旬

中旬

下旬

上旬

中旬

下旬

上旬

中旬

下旬

上旬

中旬

下旬

上旬

中旬

下旬

上旬

油菜籽

播种出苗期

开盘期

蕾苔期

开花期

角果发育成熟期

成熟

调研世界 2020年第6期 ·3·

长,常在9月、10月份播种,经过移栽后在翌年正常生长,依次经过开盘期、蕾苔期、开花期等阶段后,在5月上旬逐渐成熟。考虑到研究区内农作物种植的复杂性,在进行遥感识别分类时易受到不同作物间异物同谱的影响,而油菜籽在3月到4月为开花期和角果发育成熟期,在这一阶段油菜籽长势旺盛,与其他作物间的光谱差异性最为显著,在多光谱遥感影像中最易识别。基于油菜籽的生长物候特性,本文选取了两幅采样时间为3月和4月的Landsat-8 OLI遥感影像来进行遥感分类识别,以期提高油菜籽遥感识别精度。

3.样方数据。

为精确高效利用训练样本完成对遥感影像的分类识别,提高对研究区内主要农作物油菜籽识别精度,真实可靠地拟合地表实际地物情况,为后续的油菜籽遥感识别精度评价及其空间分布制图提供依据。本文采用野外调研的方法采集训练样方,在调查过程中使用GPS设备记录各样本点的经纬度,并拍照留存样本点农作物的作物类型及其特征,保证选取的各个样方点内的农作物类型单一化。考虑到野外调研面临的潜在限制因素,本文在实际采样过程中并未完全依据样本点空间均匀分布的原则,而是优先考虑交通可达性、临近道路的原则进行采样,并对选取的样本点空间分布进行显著性检验,尽可能的减小训练样方对遥感识别精度的影响,便于后续研究工作的开展。本文选取的油菜籽和其他农作物的样本点空间分布如图2所示。

三、遥感分类识别方法

(一)BP神经网络

BP神经网络(Back Propagation Neural Network)是基于梯度下降这一思想,采用误差逆向传播算法构建的多层前馈网络,通过梯度搜索不断向前反馈训练学习,调整优化连接权值和阈值,使得网络实际输出值在误差控制范围内[13]。

常用的BP神经网络模型一般由输入层、隐含层、输出层这三层神经网络构成,依据对分类精度和迭代效率的要求,隐含层可设置为不小于1的任意层数,本文为提高分类识别速度,将隐含层设置为1层,在构建BP神经网络时每一层内部各个神经元之间彼此没有联系,而相邻的各层神经元之间相互建立单向联系,通过连接权值和阈值来控制输入输出值,BP神经网络模型如图3所示。

图2 油菜籽和其他农作物样本点空间分布图

图3 BP神经网络模型

(二)BP神经网络模型建立

1.输入样本归一化。

在对遥感影像进行BP神经网络的训练分类之前,为避免网络前后传播过程中发生震荡及过饱和现象,将待分类的遥感影像数据进行样本归一化处理,充分提高数据的可挖掘性,计算公式如下:

(1)

式中,x为输入向量的初始值,x′为归一化处理后的输入值,xmin和xmax为输入栅格样本向量中的最小值和最大值。

2.BP神经网络正向传播。

输入样本经过初始化后,采用Sigmoid激励函数对神经网络中的各层输入值进行非线性映射处理,将数据压缩在一定范围内,提高样本数据的区分能力[14],Sigmoid激励函数如下所示:

(2)

式(2)中,Sigmoid激励函数的定义域为(–∞,+∞),值域为(0,1)。

对于输入的n个训练样本对(xnum,ynum)(n=1,2,3,···),设输入层、隐含层和输出层的神经元个数分别为i、j、m;隐含层和输出层神经元的输入、输出值分别为Ij、Oj和Im、Om;输入层与隐含层、隐含层与输出层各神经元之间的连接权值分别为Wij、Wjm;隐含层和输出层神经元的阈值分别为、[15-16]。

对于任一训练样本点(x, y),设x=(x1,x2,···,xi)T为神经网络的输入向量,y=(y1,y2,···,yi)T为神经网络的期望输出,将x经过输入层依次输入到网络中,即可依次得到期望输出y,计算过程如下。

隐含层神经元个数:

(3)

式(3)中,a为1~10之间的常数。

隐含层输入值:

(4)

隐含层输出值:

(5)

输出层输入值:

(6)

输出层输出值:

(7)

经过上述处理信息从输入层经过逐层的传递到达输出层,完成了一次正向传播。

3.BP神经网络反向传播。

BP神经网络的一个重要过程为反向传播过程,在这一过程中采用误差梯度下降的方式,从输出节点开始对各层结点的连接权值和阈值进行修正调整,使得最终的输出结果在误差控制范围内[17],误差函数计算公式如下:

(8)

式(8)中,Om为网络实际输出值,Ym为期望输出值。

依次计算误差函数对隐含层和输出层神经元的误差值、,

(9)

(10)

根据误差梯度下降法,设隐含层各神经元的权值修正量为,输出层各神经元的权值修正量为,隐含层学习率为,输出层学习率为,由此可进行权值误差和阈值修正。

隐含层神经元权值修正量:

(11)

输出层神经元权值修正量:

(12)

隐含层权值修正:

(13)

输出层权值修正:

(14)

隐含层阈值修正:

(15)

输出层阈值修正:

(16)

其中,和为修正系数。根据BP神经网络正向传播过程求得隐含层和输出层的输出结果,通过式(8)~(16)完成反向传播过程计算,获得修正后的各层神经元之间的连接权值和阈值,然后以递增模式逐个代入其他训练样本,按上述过程依次重复修正权值和阈值,直至总误差E最小或满足给定的允许误差,从而完成BP神经网络的训练分类。

(三)最大似然分类法

最大似然分类法(Maximum Likelihood Classification)是一种基于概率判别函数和贝叶斯判别规则,假定输入遥感影像中各波段中每类地物的光谱信息符合正态分布,利用判别函数计算各像元的最大归属概率,完成遥感影像的地物分类识别。

基于上述的两种分类原理,本文选取传统监督分类中使用较多且分类效果较好的最大似然法与基于机器学习的BP神经网络法这两种方法,对研究区内的主要农作物油菜籽进行遥感识别,获取其空间分布情况。

四、研究结果与分析

(一)遥感影像分类精度评价

任何遥感影像分类方法都存在一定的误差,不论采用何种分类模型或优化,分类结果很难达到理想状态,因此通过精度评价显得尤为重要。通过精度评价既能客观的评价采用的分类方式是否能较好对地物进行区分,也给进一步优化分类方法模型,提高整体分类精度提供了依据。

遥感影像分类结果的精度评价通常有像素级和特征级两个尺度,基于像素级的评价尽可能的保留了影像数据特征,评价结果更为客观可信[18]。结合本文拟研究的分类对象类别,选择基于光谱信息的像素级评价对各分类方法的评价结果进行精度检验,分析不同分类类别间的混分情况,尽可能客观地体现分类精度。

用来进行分类精度评价的混淆矩阵形式如下:

(17)

式(17)中,m为类别总数,xij为应属于i类但被错分为j类的像元总数,反映了分类精度。

本文的分类精度评价由单地物和整体精度评价两部分组成,即生产精度、用户精度、总体精度、Kappa系数[19]。生产精度(PA)是指被正确分类像元占真实像元总数的比例,公式为:

(18)

用户精度(UA)是指某一类别的正确分类像元数占该分类像元总数的比例,公式为:

(19)

总体精度(OA)是指被正确分类的像元总数占总像元数的比例,公式为:

(20)

Kappa系数是一种离散型计算方法,是对混淆矩阵的信息进行全面统计,是分类精度的综合评价指标,公式为:

(21)

(22)

其中,xij为矩阵对角线元素,xi+为矩阵的列和,代表某一地物的像元总数;x+i为矩阵的行和,代表被分某类地物的像元总数;N代表分类地物个数的总数。

(二)BP神经网络精度评价

当构建的BP神经网络完成对输入样本的训练后,便可得到一个适合该研究区内遥感影像分类的网络结构各层固定的节点数目、修正后的网络连接权值和阈值、各层学习率和动量因子等参数,输入样本在新参数下利用正向传播将输入数据源进行网络输出分类,通过比较每类输出像元的输出分量的大小,判别该类像元对应的地物类型,进而实现对整幅遥感影像的地物分类识别[20-21]。

本文采用混淆矩阵及各个评价参数来实现对遥感影像地物分类识别结果的精度评价,选取已知的样本数据点来构建混淆矩阵,将分类后每个像元的类别与实际地物进行比较计算。首先将经人工解译、实地调查的已知验证数据输入到选取的分类训练模型中,获得其在该分类器下的所属类别,然后耦合验证样本数据与网络实际输出数据,建立精度评价混淆矩阵,利用公式(18)~(22)计算各精度评价指标参数。

(三)最大似然法精度评价

最大似然法主要是利用地物(或对象)在遥感影像上反映出来的光谱特征,基于概率判别函数和贝叶斯判别规则来进行识别与分类,能较好的与先验知识融合,是一种在多光谱遥感影像分类中广泛应用的监督分类方法[22]。最大似然法假定输入遥感影像波段数据在空间上符合正态分布,每类地物集中在特定的空间中,不同地物间离散程度高。通过假定地物光谱特征服从正态分布,其判别函数为:

(23)

(24)

(25)

其中,x为光谱特征向量,xik为第i特征第k个特征值,N为第i特征的特征值总个数,ui为第i类的均值向量。

由公式(23)~(25)可知,对于各拟分类的地物在采取训练样本时,只有当样本的波谱频率直方图符合正态分布,具有唯一的特征时才能取得最优的分类效果。而在进行地物遥感分类识别时,利用单波段遥感数据进行分类识别时,因光谱信息有限很难准确区分,常进行多波段组合,但波段组合后各拟分类的地物选取训练样本很难满足其光谱特性服从正态分布,导致存在大量“同物异谱” “同谱异物”的像元,光谱的频率直方图出现多个波峰,一定程度上最大似然法分类的精度依旧不高。

(四)分类结果分析

为了有效地对分类结果进行精度分析,本文通过传统监督分类中使用较多且分类效果较好的最大似然法与基于机器学习的BP神经网络法在分类精度上进行验证比较。为客观的评价两种分类方法的优劣,在分类时选择相同的训练样本和验证样本数据,对于选取的训练样本和验证样本均为经过实地调查采样的真实可信数据,同时对选取的样本点空间分布进行显著性检验,保证了样本点在空间上的均质分布,避免了因样本点随机选取对油菜籽分类识别精度的影响。

使用上述两种方法分别对研究区内的油菜籽进行遥感分类识别,两种分类方法得到的油菜籽分类结果如图4、图5所示。

图4 基于BP神经网络法的油菜籽遥感识别结果

图5 基于最大似然法的油菜籽遥感识别结果

将上述两种分类方法的分类结果依次构建混淆矩阵、计算评价指标参数,两种分类方法的精度评价结果如表2、表3所示。

表2 基于BP神经网络的精度评价

油菜籽

其他农作物

非农作物

用户精度

油菜籽

675

87

179

71.73%

其他农作物

36

508

143

73.94%

非农作物

36

11

953

95.30%

生产精度

90.36%

83.83%

74.75%

总体精度

81.28%

Kappa系数

0.71

表3 基于最大似然法的精度评价

油菜籽

其他农作物

非农作物

用户精度

油菜籽

344

29

568

36.56%

其他农作物

26

206

455

29.99%

非农作物

68

6

926

92.60%

生产精度

78.54%

85.48%

47.51%

总体精度

56.16%

Kappa系数

0.31

根据表2可知,采用BP神经网络进行分类总体精度达到了81.28%,Kappa系数为0.71,整体上分类效果质量良好。对于待研究的油菜籽分类而言,其生产精度达到了90.36%,分类效果较好,说明分类结果各地物漏分、错分情况较少,在一定程度上避免了受遥感影像波谱特征而导致的“异物同谱”现象;研究区域内存在其他作物及植被,因此对于非农作物分类的生产精度而言,其分类后的地物存在与油菜籽光谱特征一样的地物,导致了分类地物漏分、错分现象较为严重。总体上基于BP神经网络各地物之间的分类效果较好,尤其是针对本文研究的油菜籽的分类效果质量较好。

根据表3可知,采用最大似然法进行分类总体精度仅为56.16%,Kappa系数为0.31,整体上分类效果质量一般,未能较好进行地物分类。对待分类的油菜籽、其他农作物、非农作物而言,三类地物分类结果出现了较为严重的漏分、错分现象,就用户精度这一评价指标而言,油菜籽和其他农作物的分类效果很差,正确分类的像元数比例低,相反非农作物的分类效果质量较好,这说明了对单地物如油菜籽、其他农作物的样本区中包含的实体不止一种,同时由于经最大似然法分类的输入遥感数据是多波段融合后的数据,导致即使训练样本点的选择符合显著性要求,但其波段信息不符合正态分布,使得分类效果较差,分类结果中出现了大量的“同物异谱” “同谱异物”像元,最大似然法分类的整体分类效果不够理想,分类精度较低。

结合表2、表3可以看出,最大似然法分类各地物的生产精度和用户精度均较低,很多像元被误分到其他地类中,漏分、错分现象较为严重;BP神经网络法分类各地物的生产精度和用户精度均较高,训练样本分离程度高,较好的将不同地物进行了区分,整体分类精度显著提高。其总体精度较最大似然法提高了25.12个百分点,Kappa系数提高了0.40,油菜籽的生产精度和用户精度都有较大幅度的提升。BP神经网络通过其优越高效的自学习能力,不断反馈学习调整网络模型参数,使得输出分类结果无限逼近真实地物类型,而最大似然法是基于样本数据符合概率分布,对输入样本的数据质量有严格要求,极易受到地物像元“同物异谱” “同谱异物”的影响。因此对比分类效果,BP神经网络分类要优于最大似然分类,更适合用于对油菜籽进行遥感影像分类。

基于两种分类方法的原理可以看出最大似然法受地物光谱特性的影响较为严重,较难将不同地物相区分,存在很大的不足;BP神经网络消除传统遥感影像分类带来的模糊性和不确定性,实现了影像像元的有效区分,地物分类整体较高。

五、结论与展望

(一)研究结论

本研究利用四川盆地内的川中丘陵和川西成都平原区域内的Landsat-8 OLI遥感影像作为数据源,利用BP神经网络构建了三层网络模型,对研究区内的主要农作物油菜籽的空间分布展开遥感分类识别研究,并将分类结果与假定概率分布的传统遥感分类方法最大似然法的分类结果进行对比,验证了BP神经网络这一分类方法的有效性。通过研究得出以下结论。

第一,利用BP神经网络对地物进行遥感影像分类识别时,针对拟分类的地物类型,结合地物的光谱特征信息,选择合理的波段进行组合并输入网络模型中,能够充分挖掘并利用遥感影像信息,显著提高地物分类识别效率与精度。本研究通过对14个波段的融合,使油菜籽的识别精度达到了90.36%,分类效果质量较高,更适用于一般区域的分类处理和信息提取。

第二,与最大似然法相比,BP神经网络法简单高效,自学习能力强,能有效地在多光谱遥感数据内部建立非线性映射,在一定程度上消除了地物光谱特征对分类识别精度的影响,较好反映了实际地物类型。BP神经网络法分类总体精度为81.28%,较最大似然法提高了25.12个百分点,Kappa系数也相比提高,是一种较为有效的农作物遥感影像分类技术。

第三,在油菜籽遥感分类研究中,为提高遥感分类的精度,可充分考虑季相与物候,依据油菜籽的生长特性,选取多组不同时相数据研究对比,得到更符合实际种植情况的油菜籽空间分布信息,提高农作物遥感分类识别精确性。

(二)后续研究展望

第一,针对农作物遥感分类识别而言,训练样本的选取对其识别精度影响较大,本文在实地调查采样时受地形因素的影响,选取样方在空间上没有均匀分布,尽管本文选取的训练样方满足显著性检验,但难免会对识别精度产生影响。在后续的研究中可考虑适当增加训练样方的数量和空间分布范围,增强遥感分类的自学习能力,提高对油菜籽的遥感识别精度。

第二,本文选取的研究区域内地形多为平原和丘陵,其内农作物分布广泛,为消除异物同谱的影响,本文选取了多波段遥感影像作为数据源,并耦合了纹理信息,但实际地表情况复杂,不同类农作物间混种现象严重,产生混合像元,分类结果中仍存在部分像元混分、错分的问题。在后续的研究中可考虑使用米级的遥感影像作为数据源,消除影像识别不足的问题,同时进一步依据待分类地物的光谱特征,进行不同波段组合运算,从遥感影像空间分辨率和地物光谱两方面来提高油菜籽识别精度。

第三,本文验证了BP神经网络相较于最大似然法在油菜籽遥感识别的优越性,但BP神经网络也暴露了其算法上的不足,对于大量的遥感数据,易产生过拟合和局部收敛过慢的问题,对识别精度造成影响。在后续的研究中可引入免疫遗传算法、粒子群算法等对网络模型进行优化,提高BP神经网络学习训练速率和遥感识别精度。

本文利用BP神经网络构建了油菜籽遥感分类识别模型并展开研究,这一研究可对研究区内油菜籽的生长情况实现动态监测,对油菜籽的种植面积和预期产量进行较为准确的预测,科学有效推进农业发展,也对我国西南部平原地区基于高分辨率影像的土地利用、土地覆盖资源调查具有一定的参考和指导意义。

参考文献

Fang S, Tang W, Peng Y, et al. Remote Estimation of Vegetation Fraction and Flower Fraction in Oilseed Rape with Unmanned Aerial Vehicle Data[J]. Remote Sensing, 2016, 8(5): 416.

王东, 方圣辉, 王政. 基于光谱特征和颜色特征的油菜提取研究[J]. 农业机械学报, 2018, 49(3): 158-65.

刘哲, 刘帝佑, 朱德海, 等. 作物遥感精细识别与自动制图研究进展与展望[J]. 农业机械学报, 2018, 49(12): 8-19.

Kussul N, Lavreniuk M, Shelestov A Y, et al. Along the Season Crop Classification in Ukraine based on Time Series of Optical and SAR Images Using Ensemble of Neural Network Classifiers[C]//The International Geoscience and Remote Sensing Symposium 2016 (IGARSS 2016). IEEE, 2016.

杨剑, 宋超峰, 宋文爱, 等. 基于遗传算法的模糊RBF神经网络对遥感图像分类[J]. 小型微型计算机系统, 2018, 39(3): 223-226.

曹斌, 邱振戈, 朱述龙, 等. BP神经网络遥感水深反演算法的改进[J]. 测绘通报, 2017,(2): 40-44.

田富有, 吴炳方, 曾红伟, 等. 基于多层神经网络与Sentinel-2数据的大豆种植区识别方法[J]. 地球信息科学学报, 2019, 21(6): 918-927.

周扬帆. 基于BP神经网络方法提取马铃薯空间分布研究[D]. 中国农业科学院, 2018.

Chellasamy M, Ferre T P A, Greve M H. Evaluating an Ensemble Classification Approach for Crop Diversity Verification in Danish Greening Subsidy Control[J]. International Journal of Applied Earth Observation and Geoinformation, 2016, 49: 10-23.

范迎迎, 钱育蓉, 杨柳, 等. 基于BP神经网络的遥感影像棉花识别方法[J]. 计算机工程与设计, 2017, 38(5): 1356-1360.

Zhong L, Hu L, Zhou H, et al. Deep Learning Based Winter Wheat Mapping Using Statistical Data as Ground References in Kansas and Northern Texas, US[J]. Remote Sensing of Environment, 2019, Vol.233.

贾洁琼, 刘万青, 孟庆岩, 等. 基于GF-1 WFV影像和机器学习算法的玉米叶面积指数估算[J]. 中国图象图形学报, 2018, 23(5): 719-729.

黄善春, 方贤勇, 周健, 等. 基于BP神经网络的图像局部模糊测量[J]. 中国图象图形学报, 2015, 20(1): 20-28.

黄林生, 江静, 黄文江, 等. SentineI-2影像和BP神经网络结合的小麦条锈病监测方法[J]. 农业工程学报, 2019, 35(17): 178-185.

杨朦朦, 汪汇兵, 欧阳斯达, 等. 基于双树复小波分解的BP神经网络遥感影像分类[J]. 遥感技术与应用, 2018, 33(2): 313-320.

田静, 邢艳秋, 姚松涛, 等. 基于元胞自动机和BP神经网络算法的Landsat-TM遥感影像森林类型分类比较[J]. 林业科学, 2017, 53(2): 26-34.

周林飞, 姚雪, 芦晓峰. 基于相容粗糙集的BP神经网络湿地覆被信息提取——以双台子河口湿地为例[J]. 资源科学, 2016, 38(8): 1538-1549.

Tian H, Wang P, Tansey K, et al. An IPSO-BP neural network for estimating wheat yield using two remotely sensed variables in the Guanzhong Plain, PR China[J]. Computers and Electronics in Agriculture, 2020, 169.

黄健熙, 侯矞焯, 苏伟, 等. 基于GF-1 WFV数据的玉米与大豆种植面积提取方法[J]. 农业工程学报, 2017, 33(7): 164-170.

林杰, 潘颖, 杨敏, 等. 1988—2013年基于BP神经网络的植被叶面积指数遥感定量反演[J]. 生态学报, 2018, 38(10): 3534-3542.

Aneece I, Thenkabail P. Accuracies Achieved in Classifying Five Leading World Crop Types and their Growth Stages Using Optimal Earth Observing-1 Hyperion Hyper-spectral Narrow bands on Google Earth Engine[J]. Remote Sensing, 2018, 10(12): 2027.

刘焕军, 杨昊轩, 徐梦园, 等. 基于裸土期多时相遥感影像特征及最大似然法的土壤分类 [J]. 农业工程学报, 2018, 34(14): 132-139, 304.

作者简介:

余新华,男,1970年生,江西丰城人,1992年毕业于上海财经大学统计学院,获经济学学士学位,2001年获中国社会科学院农村发展研究所农林经济管理硕士学位,现为北京师范大学在读博士研究生,研究方向为土地利用与生态响应。

王宏,男,1979年生,陕西长武人,2008年毕业于北京师范大学资源学院,获管理学博士学位,现为北京师范大学副教授,研究方向为土地利用/覆盖变化。

(责任编辑: 刘雅欣)

[,]

lu

iii

xcc

=

%

i

D

12

,,,

n

xxx

L

(

)

1

n

iii

i

R

bx

=

=-D

å

i

b

[0,1]

i

b

Î

1

1

n

i

i

b

=

=

å

(

)

(

)

[

]

00

11

nn

iiiiii

ii

ERExx

bxbmm

==

éù

=-D=-+=

ëû

åå

(

)

(

)

(

)

222

111

nnn