一种初中数学知识本体的构建与评估 ·...

12
10 22 Vol.10 No.22 2017 11 November 2017 一种初中数学知识本体的构建与评估 丛,朱郑州 * (北京大学软件与微电子学院,北京 100871摘要结合骨架法和七步法这两种常见本体构建方法的优点,提出适用于初中数学知识本体的构建方法,借助 Protégé 工具实现初中数学知识本体的构建,利用 Jena 开源包对本体进行关系推理,并从体系结构和实例两个 维度建立评估指标,验证构建的本体是否层次分明、关系丰富,清晰地描述初中数学体系结构中各知识点的 属性和知识点之间的逻辑关系。本研究对个性化教学系统的建设有实用价值,对初中数学知识的有效管理有 一定的理论意义。 关键词:计算机应用;本体;知识体系;关系推理;本体评估 中图分类号:TP399 文献标识码:A 文章编号:1674-2850(2017)22-2484-12 Construction and evaluation of a junior high school mathematics knowledge ontology SUN Cong, ZHU Zhengzhou (School of Software and Microelectronics, Peking University, Beijing 100871, China) Abstract: A new suitable method for junior high school mathematics knowledge ontology is put forward, which combines the advantages of the skeleton and seven steps methods. The knowledge ontology building is realized with the help of Protégé. The Jena open source package is also used for relationship inference. The evaluation indexes are established from two dimensions: the architecture and the instance. It is concluded that the ontology is well arranged and has rich relationship. It clearly describes the attributes of each knowledge point and the logical relation between the knowledge points. It has practical value for the construction of personalized teaching system, and certain theoretical significance to the effective management of junior high school mathematics knowledge. Key words: computer applications; ontology; knowledge architecture; relationship inference; ontology evaluation 0 引言 伴随科技的发展,网络正在变革人们接受教育的方式。如今,网络上存在大量的初中数学教育资源, 这些资源为网络教育的发展提供了可能。但与此同时,这些资源因没有统一的知识结构和知识间的逻辑 关系,造成了混乱。网络上无章可循的初中数学学习资源导致数学学习没有规律和联系,很难有效地指 导学习。 在整个数学教育中,初中是一个关键阶段,初中数学承接和利用小学知识,并为高中更加有深度的 数学知识打基础。因此,研究初中数学各概念及其之间的逻辑关系,揭示初中数学的学习规律,对数学 思维的培养具有重要意义。 基金项目:国家自然科学基金青年基金(61402020);高等学校博士学科点专项科研基金(20130001120021作者简介:孙丛(1992—),女,硕士,主要研究方向:软件开发 通信联系人:朱郑州,副教授,主要研究方向:教育大数据、项目管理文化与环境. E-mail: [email protected]

Transcript of 一种初中数学知识本体的构建与评估 ·...

Page 1: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期 Vol.10 No.22 2017 年 11 月 November 2017

一种初中数学知识本体的构建与评估 孙 丛,朱郑州*

(北京大学软件与微电子学院,北京 100871)

摘要:结合骨架法和七步法这两种常见本体构建方法的优点,提出适用于初中数学知识本体的构建方法,借助

Protégé 工具实现初中数学知识本体的构建,利用 Jena 开源包对本体进行关系推理,并从体系结构和实例两个

维度建立评估指标,验证构建的本体是否层次分明、关系丰富,清晰地描述初中数学体系结构中各知识点的

属性和知识点之间的逻辑关系。本研究对个性化教学系统的建设有实用价值,对初中数学知识的有效管理有

一定的理论意义。

关键词:计算机应用;本体;知识体系;关系推理;本体评估 中图分类号:TP399 文献标识码:A 文章编号:1674-2850(2017)22-2484-12

Construction and evaluation of a junior high school mathematics knowledge ontology

SUN Cong, ZHU Zhengzhou

(School of Software and Microelectronics, Peking University, Beijing 100871, China)

Abstract: A new suitable method for junior high school mathematics knowledge ontology is put forward, which combines the advantages of the skeleton and seven steps methods. The knowledge ontology building is realized with the help of Protégé. The Jena open source package is also used for relationship inference. The evaluation indexes are established from two dimensions: the architecture and the instance. It is concluded that the ontology is well arranged and has rich relationship. It clearly describes the attributes of each knowledge point and the logical relation between the knowledge points. It has practical value for the construction of personalized teaching system, and certain theoretical significance to the effective management of junior high school mathematics knowledge. Key words: computer applications; ontology; knowledge architecture; relationship inference; ontology evaluation

0 引言 伴随科技的发展,网络正在变革人们接受教育的方式。如今,网络上存在大量的初中数学教育资源,

这些资源为网络教育的发展提供了可能。但与此同时,这些资源因没有统一的知识结构和知识间的逻辑

关系,造成了混乱。网络上无章可循的初中数学学习资源导致数学学习没有规律和联系,很难有效地指

导学习。 在整个数学教育中,初中是一个关键阶段,初中数学承接和利用小学知识,并为高中更加有深度的

数学知识打基础。因此,研究初中数学各概念及其之间的逻辑关系,揭示初中数学的学习规律,对数学

思维的培养具有重要意义。

基金项目:国家自然科学基金青年基金(61402020);高等学校博士学科点专项科研基金(20130001120021) 作者简介:孙丛(1992—),女,硕士,主要研究方向:软件开发 通信联系人:朱郑州,副教授,主要研究方向:教育大数据、项目管理文化与环境. E-mail: [email protected]

Page 2: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2485

初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

明确、形式化的方式刻画数学知识体系结构,将散乱的知识点转变为有结构的组织,各知识概念层次分

明,逻辑清晰。此外,初中数学本体还具有强大的推理功能,可以实现概念间的关系推理,挖掘更多的

概念联系,有助于知识网络的形成和知识体系的建立。利用初中数学知识本体不仅可以增强学习者对初

中数学知识的整体把握,还能加强学习者对单个知识点的全方位解读,为学习者的个性化学习提供基础。

1 相关研究 本体源自于哲学,通过描述事物的内在本质,明确地阐述一个系统。本体因其可以清晰地描述系统

中概念属性和关系的内在联系,在知识工程和人工智能领域很快得到了广泛应用。常见的本体构建方法

有骨架法[2]、评估法[3]、METHONTOLOGY 法[4]、循环获取法[5]和七步法[6],各方法的优缺点如表 1 所示。

表 1 常见本体构建方法的优缺点 Tab. 1 Advantages and disadvantages of common ontology construction methods

构建方法 优点 缺点

骨架法 由建模流程得出构建本体的框架,各步骤均有参考价

值,有本体评价和本体文档化操作 没有构建过程和本体评价的详细说明,而这两部分对于

本体的创建具有重要意义 评估法 提出完备性理论需求问题,适用于企业本体的构建 各阶段没有详细的步骤说明,也没有文档记录过程和具

体的评价方法 METHONTOLOGY法 建立在骨架法的基础上,适合开发大型本体,提出撰

写本体规格说明书 没有本体评价的具体方法和构建本体的详细步骤

循环获取法 采用循环式结构开发,有利于不断改进和扩展本体 各环节没有详尽的操作方法

七步法 细化构建本体的具体步骤,为本体的构建提供可行的

操作说明,提出重用现有本体 无本体编码和评估步骤

对于初中数学知识体系结构,国内的主要公办学校普遍选用的是教育部规定的大纲教材,以北京市

课程改革版教材为例,该知识体系罗列的知识概念具有绝对权威性,且知识点全面,但只是简单地堆砌

知识点,知识间关联稀疏,不利于知识的综合掌握。国内第一家在美国上市的中小学教育辅导机构——好

未来于 2010 年提出中学创新六级体系结构[7],该体系具有一定的逻辑关系性,但关系种类单一,且知识

层级较少,不利于知识扩展。新东方提出了中学思维导图[8],直观生动,但缺少多种知识点间的关系表示。 2011 年,基于本体的数学知识库,借助 Protégé 工具采用七步法将本体构建成初等几何本体[9]。根据

常用的大型本体中几何学科的分类词汇捕获概念集合,提取出公理类、关系类、定理类、概念类、公式

类、单位类、性质类、角类、平面图形、立体图形、点类和线类 12 个类。但该本体仅包含几何部分的知

识内容,对初中数学知识的覆盖并不全面。 2013 年,中国科学院合肥智能机械研究所采用七步法完成了基于本体的初中数学大纲知识的实现[10]。

该本体以 2012 年版初中数学新课标为基础,依据初中数学大纲的教育领域内容捕获核心概念集,将知识

划分为 5 类建立本体的概念模型,得到概念 55 个,属性 24 个,关系 64 个。但该本体中知识划分粒度过

粗,仅对初中数学中的主要概念及其之间的关系进行了研究,没有具体到知识点及知识点之间的关系,

不能很好地给予学习者在逻辑上的指导。 以上现有的初中数学知识体系结构或多或少存在一些不足,因此有必要在这些研究的基础上建立一个

知识点全面、知识间关系丰富的初中数学知识本体。

2 知识本体的构建 本文借鉴骨架法的整体流程,同时参考七步法对构建环节的详细说明,结合两种方法的优点,遵循

Page 3: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期

2017 年 11 月 孙 丛等:一种初中数学知识本体的构建与评估 2486

教学设计的规律[11],提出适用于初中数学知识本体的构建方法,具体流

程如图 1 所示。

2.1 初中数学知识本体需求的确定

构建本体之前,首先应确定和分析本体的实际需求,为本体的构建

提供方向性和针对性。本文构建的是初中数学知识本体,目的是提供对

初中数学知识体系结构和组织方式的共识和理解,并给出知识概念的属

性及其之间多种复杂的关系。

2.2 本体构建

本体应用的好坏取决于本体构建的质量与效率,为保证本体的正确

性和规范化,本体的构建要遵循 GRUBER[12]提出的 5 条基本原则: 1)明确性与客观性,本体中的所有定义必须清晰明确,有效、客

观地揭示概念的内在涵义; 2)一致性,一个本体推理前后应当一致,即推理前后的概念定义

及特征应保持一致; 3)可扩展性,当要添加新的词汇时,用现有概念对新的词汇进行

定义,实现单调扩展; 4)最小编码偏差,本体是对领域知识的概念化模型,与本体如何

编码没有关系; 5)最小本体承诺,在给出必要的共享知识概念的条件下,本体还

应当要求实现最小化。

2.2.1 列出本体中的重要术语

在领域本体的范畴内,尽可能地罗列该领域中重要的概念和术语。

以 2016 年版北京市课程改革初中数学教科书为主要数据来源,结合好未来、新东方等教育机构的知识结

构,穷举出初中数学课程中所有的概念和术语,并对这些知识概念进行分类。划分的概念及其个数分别

为课程知识 1 个,知识类别 3 个,知识模块 12 个,章知识 26 个,节知识 53 个,知识点 146 个,知识点

项 45 个,公式口诀 19 个,基本覆盖初中数学的全部知识内容。

2.2.2 定义类与类的层次关系

在本体的领域范围内,提取出概念类,并建立类层次结构关系。在研究了多种现有初中数学知识体

系结构的基础上,根据 2.2.1 节中划分的类概念,定义课程知识、知识类别、知识模块、章知识、节知识、

知识点、知识点项、公式口诀 8 个类。采用自顶向下法,按照课程知识→知识类别→知识模块→章知识→

节知识→知识点[13]的层级模式,知识点项组合作为知识点学习的服务资源,公式口诀作为知识点记忆的

额外补充,将初中数学知识进行划分,最终形成类的层次结构,如图 2 所示。

2.2.3 定义类的属性及其限制

定义类之后,要为各类增加属性以便更好地解释类的含义,并对各个属性的定义域和值域等限制

和约束进行定义。结合实际学习过程中各概念需要考虑的一些属性,为初中数学知识本体定义以下类

的属性[14]:

图 1 初中数学知识本体构建方法 Fig. 1 Construction method of the

junior high school mathematics knowledge ontology

Page 4: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2487

图 2 初中数学知识本体层次结构

Fig. 2 Hierarchical structure of the junior high school mathematics knowledge ontology

1)Title,知识的题目。

2)Keywords,关键词,赋予知识显著标识的关键词汇。

3)ChineseDescription,知识内容的中文注释,有利于加强对知识的理解。

4)EnglishDescription,知识内容的英文注释。

5)Creator,创建人。

6)CreateTime,创建知识内容的时间。

7)TargetUser,针对对象,明确学习知识的各种对象以便知识概念的选取更具有针对性。

8)Content,重点内容,明确知识的要点。

9)Important,知识的重要性,分为 4 个等级,不重要、一般、重要、非常重要。

10)ReachDegree,所需达到的水平,分为知道、理解、掌握 3 个等级。

11)LearningObjectives,学习目标或培养能力,明确学习目标将有助于学习者有目的地进行学习,

提高学习效率。该属性分为 3 类,运算求解能力、空间想象能力、数据处理能力。

12)Level,难度程度,分为简单、较难、难 3 个等级。

13)ThresholdValue,过关阈值,即某一知识点的学习达到所要求的水平时,对应测试题成绩需要达

到的阈值,只有通过了该阈值,方可学习后继的知识点。

14)Type,学习资源的类型,如课件文档、视频、测试题等,为知识的学习提供服务。

15)Url,学习资源的网络地址。

各类具有的属性定义如表 2 所示。

Page 5: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期

2017 年 11 月 孙 丛等:一种初中数学知识本体的构建与评估 2488

表 2 初中数学知识本体各类具有的属性 Tab. 2 Attributes of each class in the junior high school mathematics knowledge ontology

类 属性

课程知识 Title,Keywords,ChineseDescription,Creator,EnglishDescription,CreateTime,TargetUser

知识类别 Title,Keywords,ChineseDescription,CreateTime,EnglishDescription,Creator,LearningObjectives

知识模块 Title,Keywords,ChineseDescription,Creator,EnglishDescription,CreateTime

章知识 Title,Keywords,ChineseDescription,CreateTime,EnglishDescription,Creator

节知识 Title,Keywords,ChineseDescription,Creator,EnglishDescription,CreateTime 知识点 Title,Keywords,ChineseDescription,Creator,EnglishDescription,CreateTime,Content,Important,ReachDegree,

Level,ThresholdValue 知识点项 Title,Keywords,CreateTime,Creator,ChineseDescription,EnglishDescription,Type,Url

公式口诀 Title,Keywords,ChineseDescription,Creator,EnglishDescription,CreateTime,ReachDegree

2.2.4 定义类间的关系及其限制

类不仅具有自身的内在属性,还与其他类之间存在关联关系。为各类增加属性后,还要确定各种关系[15],

并对关系的约束进行定义。本文定义了以下 8 种初中数学知识本体类之间的关系: 1)contain,包含关系。类层次模式中,各概念类上层细分出下层,这种上层与下层的关系是类间的

包含关系,是知识体系中最基本的一种关联关系。如“一元二次方程”,本章包含了节知识“一元二次方

程的解法”,形成了包含关系。 2)partOf,属于关系。各概念类的下层隶属于上层,这种下层与上层的关系是类间的属于关系,它

与包含关系相反。 3)isSuccessor,前驱依赖关系。在初中数学知识体系结构中,学习概念 A 之前,需要先学习概念 B,

则 B 是 A 的前驱,A 对 B 形成前驱依赖关系。这种展示知识学习前后顺序的关系叫作依赖关系。 4)isPrecursor,后继依赖关系。学习概念 A 之后,可以学习概念 B,则概念 B 是概念 A 的后继,概

念 A 对 B 形成后驱依赖关系。它与前驱依赖关系相反,也是依赖关系的一种。 5)isParallel,并列关系。隶属于同一概念下但没有依赖关系的两个平行概念形成并列关系,具有平

行关系的两个概念互换位置不会产生影响。如不论是加减消元法还是代入消元法都是解二元一次方程组

的方法,这两种方法是并列关系。 6)hasReference,参照关系。指同一课程中有联系的两个概念,学习概念 A 时,参照概念 B 可以加

深对 A 的理解和认识。 7)contrast,对比关系。由相反的两个概念形成,学习过程中可以通过比较进行学习和分析。如等

式与不等式,将它们各自的基本性质进行对比学习,形成对比关系。 8)extend,延伸关系。若一个概念延伸出课程或大纲以外的其他概念,就构成了延伸关系。如超出

大纲外的特殊方法“十字相乘法”和一元二次方程的解法就是延伸关系。 根据以上对各关系的分析,本文研究了类间存在的关联关系,定义了所有关系及约束条件,如表 3 所示。

2.2.5 构建实例

在完成构建概念类属性的情况下,依次为概念类添加实例。以 2.2.1 节列举本体中的重要术语作为实

例来源。创建实例时,首先为实例添加题目,判断实例所属的类,并根据 2.2.3 节和 2.2.4 节中类具有的

属性和关系,为实例添加对应的属性值和与其他实例间的关系,这样逐步建立起初始本体,共添加实例

305 个。

Page 6: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2489

表 3 初中数学知识本体关系的约束条件 Tab. 3 Constraint conditions of each relation in the junior high school mathematics knowledge ontology

关系 定义域 值域 互逆关系 传递性 contain 课程知识,知识类别,知识模块,章知识,

节知识,知识点 知识类别,知识模块,章知识,节知识,

知识点,知识点项,公式口诀 partOf yes

partOf 知识类别,知识模块,章知识,节知识,

知识点,知识点项,公式口诀 课程知识,知识类别,知识模块,章知识,

节知识,知识点 contain yes

isSuccessor 知识模块,章知识,节知识,知识点 知识模块,章知识,节知识,知识点 isPrecursor yes

isPrecursor 知识模块,章知识,节知识,知识点 知识模块,章知识,节知识,知识点 isSuccessor yes

isParallel 知识点 知识点 — yes

hasReference 节知识,知识点 节知识,知识点 — no

contrast 知识点 知识点 — no

extend 知识点 知识点 — no

2.3 形式化编码

构建初中数学知识本体的最终目的是使机器能够理解初中数学中的概念和关系,即计算机用编程语

言描述本体,并记录和存储结果。本研究使用 Protégé 工具进行建模,形成能覆盖整个知识领域的概念

结构,构建的初中数学知识本体需要使用形式化语义进行表现,选用资源描述框架模式(resource description framework schema,RDFS)[15]实现本体编码,准确描述知识的类、属性和实例及其之间的关系。

2.4 Jena 推理扩展

Jena 是美国惠普实验室语义网研究项目中的一个基于 Java 开发语言的语义开发工具 [16]。

com.hp.hpl.jena.reasoner 包是实现 Jena 推理功能的开源包,使用 Jena 可以对本体进行推理。推理的重点

在于制定规则,规则是对所在领域内概念属性或关系的阐释。 一般地,对领域内概念属性的阐释由一个一阶逻辑构成,形式为

[rule-name:(?a R1 ?b)→(?b R2 ?a)], 其中,rule-name:为规则名称;a、b 为两个不同的概念;R1 为 a 与 b 之间的显性关系;→为推导符号;

R2 为经过推导后,得出的 b 与 a 之间的隐性关系。 对领域内概念间关系的阐释,一般形式为

[rule-name:(?a R1 ?b),(?b R2 ?c)→(?a R3 ?c)], 即如果 a 与 b 之间存在 R1 关系,且 b 与 c 之间存在 R2 关系,那么可以推出 a 与 c 之间存在一种推理关

系,记为 R3. 根据上面对推理的分析,本文制定以下推理规则。 1)根据包含关系和属于关系互逆: [rule1:(?a contain ?b)→(?b partOf ?a)]; 2)根据前驱和后继依赖关系互逆: [rule2:(?a isSuccessor ?b)→(?b isPrecursor ?a)]; 3)根据前驱依赖关系和并列关系具有传递性: [rule3:(?a isSuccessor ?b),(?b isParallel ?c)→(?a isSuccessor ?c)]; 4)根据并列关系和后继依赖关系具有传递性: [rule4:(?a isParallel ?b),(?b isPrecursor ?c)→(?a isPrecursor ?c)]. 在 Eclipse 中,应用 Jena 提供的应用程序接口(applicatian programming interface,API),使用上述

Page 7: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期

2017 年 11 月 孙 丛等:一种初中数学知识本体的构建与评估 2490

推理规则可以得到知识点的扩展关系集,在本体中增加扩展的关系进行更新。经过以上处理得到知识点

所有维度的关系覆盖集,清晰地展现知识点间的复杂关系,对课程的制定和学习路径的选择有重要的指

导意义。如初中数学知识中有知识点:二元一次方程和它的解,二元一次方程组和它的解,用代入消元

法解二元一次方程组,用加减消元法解二元一次方程组,二元一次方程的应用。已经存在的关系集如表 4所示。

表 4 知识点关系集 Tab. 4 Knowledge points relationship set

关系 知识点 知识点

前驱依赖关系 二元一次方程和它的解 二元一次方程组和它的解

前驱依赖关系 二元一次方程组和它的解 用代入消元法解二元一次方程组

并列关系 用代入消元法解二元一次方程组 用加减消元法解二元一次方程组

前驱依赖关系 用加减消元法解二元一次方程组 二元一次方程的应用

根据表 4 可得知识点关系,如图 3 所示,其中蓝色线段表示前驱依赖关系,红色表示平行关系。 由推理规则 rule2、rule3、rule4,经过推理得到扩展的知识点关系,如图 4 所示,其中绿色线段表示

后继依赖关系。

2.5 知识点学习路径的获取

根据构建的初中数学知识本体体系结构,本文通过 Echarts 接口编码实现对知识点学习路径的获取。

图 5 为方程模块的知识点学习路径,其中黄色圆圈表示知识点,紫色箭头线段表示概念间的前驱依赖关

系,箭头方向由前驱指向后继,表明学习的先后顺序,揭示了知识点间存在的逻辑关系,各知识点间通

过紫色线段连接生成学习路径,在学习路径上每个知识点都有对应的视频、文档或测试题等学习资源,

点击这些学习资源可跳转至该知识点的学习。

3 知识本体的评估 本体构建完成后,为保证本体应用质量,需要对本体进行评估。本体评估的关键在于要从多个维度

对本体质量进行全面分析,许多研究者从不同角度出发提出了多种本体评估方法,归纳出以下 4 类本体

评估方法。

图 3 知识点关系

Fig. 3 Knowledge points relationship

图 4 扩展的知识点关系图

Fig. 4 Extended knowledge points relation graph

Page 8: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2491

图 5 方程模块的知识点学习路径展示

Fig. 5 Knowledge points learning path demonstration of equation modules

1)基于“黄金标准”的评估方法[17]:寻找一个较为成熟的本体作为黄金标准,将构建好的本体与

该黄金标准对比进行评估。

2)基于本体应用的评估方法[18]:在语义网等应用环境中,测试不同版本的本体,根据测试结果判

断出哪个本体最适合该应用。

3)基于语料库的评价方法[19]:采用术语抽取算法从语料库中获得相关领域术语,对比本体和语料

库中的术语,评估术语的覆盖范围。

4)基于多标准的评估方法[20]:预先设定一组评估指标,给出每个指标的评估方法,根据得到的计

算结果对本体进行评价。

通过研究和分析,上述 4 类评估方法的优缺点如表 5 所示。

表 5 4 类本体评估方法的优缺点 Tab. 5 Advantages and disadvantages of 4 kinds of ontology evaluation methods

本体评估方法 优点 缺点

基于“黄金标准”的评估方法 操作方便 难以找到黄金标准的本体

基于本体应用的评估方法 操作方便 耗费劳力、成本高

基于语料库的评价方法 准确评估术语覆盖指标 评估角度单一

基于多标准的评估方法 评估具有全面性和标准性 合理制定指标衡量策略有难度

在此基础上,本文采用基于多标准的评估方法,参照 OntoQA 工具[21]设置的指标,根据教学本体的

特点,提出了初中数学知识本体的评估指标和策略。主要将评估指标分为两大类:一类是体系结构指标,

一类是实例指标。从不同视角给出具体指标的衡量方法,定量分析本体的适用性和质量。

Page 9: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期

2017 年 11 月 孙 丛等:一种初中数学知识本体的构建与评估 2492

3.1 指标术语

在指标度量方法中,主要的术语及解释如下: 1)C,本体中类的集合; 2)R,本体中类间存在的关系集合; 3)HC,本体中类间存在的包含关系集合; 4)A,本体中类的属性集合; 5)I,本体中实例的集合; 6)Ci(I),各类具有的实例集合,表明实例所属的类; 7)inst(Ii, Ij),实例间具有的关系集合,表明实例拥有的关系; 8)inst(Ai),实例具有的属性集合,表明实例拥有的属性。

3.2 体系结构指标度量方法

体系结构指标组是一系列评估本体模式的指标。研究定义体系结构指标组的评估指标由关联关系丰

富度(relation richness,RR)和属性丰富度(attribute richness,AR)两个指标构成。

3.2.1 关联关系丰富度

关联关系丰富度指标反映的是本体模式中关系的丰富程度。包含关系是知识本体中最常见的一种关

系,但一个知识本体模式中如果仅有一种包含关系,则会丢失很多知识间的其他关系。如果模式中除包

含关系外还存在多种关联关系,往往比仅有包含关系能传达出更多的有效信息。本文定义用除包含关系

外的关系数量除以关系总量计算关联关系丰富度。计算公式如下:

| | | |RR .| |

CR HR−

=

(1)

根据式(1),本文对比了初中数学知识本体与初中数学大纲本体的关系丰富度,结果如表 6 所示。

由表 6 可知,知识本体的 RR 值更高,说明本文构建的本体具有更丰富的类间关系,便于知识网络的

建立。

3.2.2 属性丰富度

各类具有的属性可以反映出类的相关信息。一般来说,属性越多,传达的信息越丰富。因此各类具

有的属性个数可以用于衡量本体设计的质量。本文定义用所有属性的数量除以所有类的数量计算属性丰

富度作为其衡量标准。计算公式定义如下:

| |AR .| |AC

= (2)

根据式(2),本文对比了知识本体与大纲本体的属性丰富度,结果如表 7 所示。由表 7 可知,知识

本体中类的平均属性个数明显比大纲本体多,表明知识本体可以揭示更多的概念信息和含义。

表 7 属性丰富度指标对比 Tab. 7 Attribute richness index comparison

指标 初中数学知识本体 初中数学大纲本体

|A| 58 24

|C| 8 5

AR 7.25 4.8

表 6 关系丰富度指标对比 Tab. 6 Relationship richness index comparison 指标 初中数学知识本体 初中数学大纲本体

|R| 26 9

|H C| 6 4

RR 0.77 0.56

Page 10: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2493

3.3 实例指标度量方法

实例指标组是一系列评估本体中实例分布的指标。实例数据及其分布可以衡量本体包含的概念是否

充足合理。本文定义实例指标组的评估指标由实例平均度(instance average,IA)、类的实例分布度(class instance distribution,CID)、实例属性丰富度(instance attribute richness,IAR)、实例关系丰富度(instance relation richness,IRR)4 个指标构成。

3.3.1 实例平均度

实例平均度指标为衡量本体是否具有足够多实例提供条件。本文定义用本体中所有实例的数量除以

类的数量,即用类具有的平均实例数计算实例平均度。计算公式如下:

| |IA .| |

IC

= (3)

根据式(3),本文对比了两本体的实例平均度,结果如表 8所示。由表 8 可知,知识本体中类具有的平均实例是大纲本

体的 3 倍多,说明知识本体列举的实例数量充足。

3.3.2 类的实例分布度

类的实例分布度指标通过各类具有的实例数在总实例数中的占比评估类的分布重点,有利于确定哪

些类是本体重点关注内容以及哪些类提供的是边缘信息。 本文定义用当前类具有的实例数量除以所有实例的数量

计算类的实例分布度。计算公式定义如下:

| ( ) |CID .

| |iC II

= (4)

根据式(4),本文对每个类的实例分布度值分布进行计算,

结果如表 9 所示。如果一个类的实例分布度小,说明这个类与

其他类相比在该本体中的重要性不强,相反则表明该类非常重

要。由表 9 可知,知识点类的实例分布度最高,表明该本体的

重点类是知识点类,知识点是知识概念层次中最基本的知识单

元,只有掌握好知识点,才能把握好整个学科的知识。

3.3.3 实例属性丰富度

实例属性丰富度指标反映了类的属性在实例级别实际使用了多少,表明在创建实例过程中对定义的

属性的利用程度。本文定义用所有实例属性的总和除以所有实例的数量,即用每个实例具有的平均属性

个数计算实例属性丰富度。计算公式定义如下:

| inst( ) |IAR .

| |iA

I= (5)

根据式(5),本文对比了知识本体与大纲本体的实例属性丰富度,结果如表 10 所示。由表 10 可知,

大纲本体的实例属性丰富度仅为 0.436,可以推测大纲本体中有些实例没有属性,而知识本体的实例属性

丰富度为 8.8,即每个实例拥有的平均属性是 8.8 个,说明知识本体可以更好地描述实例本身信息。

3.3.4 实例关系丰富度

实例关系丰富度指标反映了在实例级别实际使用了多少种关系。实例间使用的关系数越多,知识间

表 8 实例平均度指标对比 Tab. 8 Instance average index comparison

指标 初中数学知识本体 初中数学大纲本体

|I| 305 55

|C| 8 5

IA 38.125 11

表 9 类的实例分布度 Tab. 9 Class instance distribution index

类 |Ci(I)|

|I| CID

课程知识 1 305 0.003 3

知识类别 3 305 0.009 8

知识模块 12 305 0.039 3

章知识 26 305 0.085 2

节知识 53 305 0.173 8

知识点 146 305 0.478 7

知识点项 45 305 0.147 5

公式口诀 19 305 0.062 3

Page 11: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

第10卷 第22期

2017 年 11 月 孙 丛等:一种初中数学知识本体的构建与评估 2494

的联系就越多,越有利于形成知识网。本文定义用实例拥有的所有关系数量除以所有实例的数量,即

用每个实例具有的平均关系个数计算实例关系丰富度。计算公式定义如下:

| inst( , ) |IRR .

| |i jI I

I= (6)

根据式(6),本文对比了两本体的实例关系丰富度,结果如表 11 所示。由表 11 可知,知识本体中

的实例具有更多的关系,表明知识本体中各实例间的连接更为紧密,关联关系更加丰富。

3.4 评估结论

如表 12 所示,初中数学知识本体相较于其他知识体系结构知识点更加全面,关系种类更加丰富,且

易于扩展,有利于构建初中数学个性化教学系统。但本体的构建过程复杂耗时,构建和评估需要根据时

代的发展,不断对本体进行更新和改进,以保证本体在实际应用中的正确性。 表 12 各知识体系结构的优缺点对比

Tab. 12 Advantages and disadvantages comparison of each knowledge structure

知识体系结构 优点 缺点

大纲教材 知识点全面 知识点间缺乏联系

创新六级体系 具有一定的逻辑性 可扩展性差

中学思维导图 直观生动 知识间关系不丰富

初等几何本体 知识点间关系较丰富 涵盖知识内容不全

初中数学大纲本体 可扩展性好 知识划分粒度过粗

初中数学知识本体 具有全面性、逻辑性、可扩展性和关系丰富性 构建过程十分耗时

4 结论 本文结合骨架法和七步法两种构建方法的优点,利用 Protégé 工具开发完成了初中数学知识本体的构

建,共包含概念 305 个,关系 995 个,属性 2 673 个,几乎覆盖了初中数学的全部重要概念,描述了知

识间的多种逻辑关系,并利用 Jena 开源包实现了知识点关系的推理。结合基于多标准的评估方法,提出

了知识本体的评估策略,计算本体的多个指标,并与已有的初中数学大纲本体进行指标对比,最终评估

出本文构建的知识本体层次清晰、关联丰富,有利于指导初中数学知识的学习。初中数学知识本体通过

揭示知识点间丰富的逻辑关系,对知识点学习路径的获取和建设初中数学个性化教学系统具有重要意义。

[参考文献] (References)

[1] 甘健侯,姜跃,夏幼明. 本体方法及其应用[M]. 北京:科学出版社,2011. GAN J H, JIANG Y, XIA Y M. Ontology method and its application[M]. Beijing: Science Press, 2011. (in Chinese)

[2] USCHOLD M, GRÜNINGER M. Ontologies: principles, methods and applications[J]. The Knowledge Engineering Review, 1996, 11(2): 93-136.

[3] GRÜNINGER M, FOX M S. Methodology for the design and evaluation of ontologies[C]//Proc. IJCAI’95 Workshop on Basic Ontological Issues in Knowledge Sharing, 1995.

表 10 实例属性丰富度指标对比 Tab. 10 Instance attribute richness index comparison

指标 初中数学知识本体 初中数学大纲本体

|inst(Ai) | 2 673 24

|I| 305 55

IAR 8.8 0.436

表 11 实例关系丰富度指标对比 Tab. 11 Instance relation richness index comparison

指标 初中数学知识本体 初中数学大纲本体

|inst(Ii, Ij)|

995 64

|I| 305 55

IRR 3.26 1.16

Page 12: 一种初中数学知识本体的构建与评估 · 初中数学的知识本体可以清晰展现初中数学的知识体系结构及知识概念间的内在联系[1]。它以一种

Vol.10 No.22

November 2017 中国科技论文在线精品论文 2495

[4] FERNÁNDEZ-LÓPEZ M, GÓMEZ-PÉREZ A, JURISTO N. METHONTOLOGY: from ontological art towards ontological engineering[C]//Proceedings of the AAAI97 Spring Symposium Series. Palo Alto: AAAI, 1997: 33-40.

[5] 李善平,尹奇韡,胡玉杰,等. 本体论研究综述[J]. 计算机研究与发展,2004,41(7):1041-1052. LI S P, YIN Q W, HU Y J, et al. Overview of researches on ontology[J]. Journal of Computer Research and Development, 2004, 41(7): 1041-1052. (in Chinese)

[6] NOY N F, McGUINNESS D L. Ontology development 101: a guide to creating your first ontology[J]. Stanford Knowledge Systems Laboratory, 2001. https://doi.org/10.1016/j.artmed.2004.01.014.

[7] 好未来教育集团 . 学而思领先中考培优六级体系介绍 [EB/OL]. [2016-10-08]. http://tj.aoshu.com/z2013/2013cms/ index.shtml. TAL (Tomorrow Advancing Life) Education Group. Introduction to the excellent training of six level system in junior high school[EB/OL]. [2016-10-08]. http://tj.aoshu.com/z2013/2013cms/index.shtml. (in Chinese)

[8] 新东方. 中学思维导图[EB/OL]. [2016-07-06]. http://zhongkao.koolearn.com/20160706/851306. Koolearn. Mind map of middle school[EB/OL]. [2016-07-06]. http://zhongkao.koolearn.com/20160706/851306. (in Chinese)

[9] 阮怀伟,汪超永,孙丙宇. 基于本体的初中数学大纲知识表示方法研究[J]. 中国西部科技,2013,12(9):99-101. RUAN H W, WANG C Y, SUN B Y. Knowledge representation for the outline mathematics of junior high school based on ontology[J]. Science and Technology of West China, 2013, 12(9): 99-101. (in Chinese)

[10] 蒋彦. 基于本体的数学知识库的构建及其应用[D]. 成都:电子科技大学,2011. JIANG Y. Construction and application of mathematical knowledge base based on ontology[D]. Chengdu: University of Electronic Science and Technology of China, 2011. (in Chinese)

[11] 谢娟,崔新春,乔鸿. “C++程序设计”领域构建研究[J]. 现代教育技术,2010,20(4):33-37. XIE J, CUI X C, QIAO H. Study on domain ontology construction of C++ programming[J]. Modern Educational Technology, 2010, 20(4): 33-37. (in Chinese)

[12] GRUBER T R. Toward principles for the design of ontologies used for knowledge sharing[J]. International Journal of Human-Computer Studies, 1995, 43(5-6): 907-928.

[13] 李明洋,吴开贵,朱郑州 . 基于本体论的知识点关系推理研究[EB/OL]. 北京:中国科技论文在线[2008-08-15]. http://www.paper.edu.cn/releasepaper/content/200808-207. LI M Y, WU K G, ZHU Z Z. Knowledge relation reasoning based ontology[EB/OL]. Beijing: Sciencepaper Online, [2008-08-15]. http://www.paper.edu.cn/releasepaper/content/200808-207. (in Chinese)

[14] 李世清. 基于《计算机组成原理》课程本体学习研究及实现[D]. 重庆:重庆大学,2011. LI S Q. Research and implementation of learning computer organization principle based on course ontology[D]. Chongqing: Chongqing University, 2011. (in Chinese)

[15] SWICK R R. Resource description framework (RDF) model and syntax specification W3C recommendation[J]. W3C Recommendation World Wide Web Consortium, 1999.

[16] Apache Jena. Jena 2 Ontology Api[CP/OL]. [2016-12-11]. http://jena.sourceforge.net. [17] BRANK J, MLADENIĆ D, GROBELNIK M. Gold standard based ontology evaluation using instance assignment[J].

Progress in Particle & Nuclear Physics, 2006, 42(1): 279-293. [18] PORZEL R, MALAKA R. A task-based approach for ontology evaluation[J/OL]. [2016-12-10]. http://www.smartweb-project.

org/Vortraege/porzel_and_malaka2.pdf. [19] 马文峰,杜小勇. 领域本体评价研究[J]. 图书情报工作,2006,50(10):68-71.

MA W F, DU X Y. An evaluation framework for domain ontology[J]. Library and Information Service, 2006, 50(10): 68-71. (in Chinese)

[20] LOZANO-TELLO A, GÓMEZ-PÉREZ A, SIAU K. ONTOMETRIC: a method to choose the appropriate ontology[J]. Journal of Database Management, 2004, 15(2): 1-18.

[21] TARTIR S, ARPINAR I B. Ontology evaluation and ranking using ontoQA[C]//Proceedings of the International Conference on Semantic Computing. Washington DC: IEEE Computer Society, 2007: 185-192.