Patent Data Standard Public

75
中中中中中中中中 www.cnpat.com.cn 中中中中中中中中中中中中 Lihua Gao 2011 中 11 中

Transcript of Patent Data Standard Public

Page 1: Patent Data Standard Public

中国专利信息中心 www.cnpat.com.cn

公开专利数据规范评审汇报

Lihua Gao 2011 年 11 月

Page 2: Patent Data Standard Public

2

23/4/12www.cnpat.com.cn

公开专利数据规范

项目概述项目概述

标准制定的技术路线和方法标准制定的技术路线和方法

标准正文、附录及之间关系标准正文、附录及之间关系

标准模块化、规范化的应用标准模块化、规范化的应用

标准的数据验证标准的数据验证

Page 3: Patent Data Standard Public

3

23/4/12www.cnpat.com.cn

数据加工缺少 统一标准系统建设缺少 数据标准指导WIPO 相关数据资 源国际标准正在制定过程中

系统应用全国专利信息服务

国际数据交换

国 知 局 公 开 专 利 数 据

应 用 现 状

公开专利数据资源来源复杂数据内容、格

式各不相同

国 知 局 公 开 专 利

数 据 资 源 现 状

数 据 标 准

现 状

项目背景

Page 4: Patent Data Standard Public

4

23/4/12www.cnpat.com.cn

11

22

33

数据资源零件化、模块化:把数据资源划分为具有独立、特定含义的最小逻辑单元,形成数据元素列表,数据元素可灵活地按需组合成满足应用的数据产品。

数据资源标准化、规范化:对全部数据元素所包含的数据项的内容、属性、格式、值域等予以明确、科学的定义和规范。

数据资源唯一标识:编制数据资源唯一标识规则用于机器识别相关信息。使得系统在不需解析文件的情况下,可直接获取该文件的基本信息,并实现信息关联和共享。

项目目标

Page 5: Patent Data Standard Public

5

23/4/12www.cnpat.com.cn

10. 4-12 11. 01-7 11. 1-07 11.8-

分析报告分析报告

标准正文及附录 标准正文及附录

验证程序 验证程序

征求意见稿征求意见稿

送审稿送审稿

2010 2011 201104 08 10 12 01 03 07

201101 03 07 08 09

公开专利数据规范工作进展情况

各国数据分析

标准编写

数据验证

征求意见

标准的修改

项目计划及目前进展

11.1011.10

Page 6: Patent Data Standard Public

6

23/4/12www.cnpat.com.cn

标准化的范围和内容标准化的范围和内容

《《公开专利数据规范公开专利数据规范 》》标准化的范围和内容标准化的范围和内容

Page 7: Patent Data Standard Public

7

23/4/12www.cnpat.com.cn

全文文本

全文图像

辅助检索

著录项目文摘

专利文献扉页信息

权利要求书全文说明书说明书附图

外观简要说明……

扉页权利要求书全文说明书

外观图片专利公报

……

同族数据引文数据分类数据化学结构数据……

标准化的文献范围标准化的文献范围

Page 8: Patent Data Standard Public

8

23/4/12www.cnpat.com.cn

标准化的数据资源范围

局内加工业务数据分析 17 项, 102 个国家和组织数据分析: 201 项

数据量

亚洲组 74项

欧洲组 72项

美洲组 52项DOCDB 1 项

DWPI 1 项

局内加工业务 17项共计 201项

Page 9: Patent Data Standard Public

9

23/4/12www.cnpat.com.cn

公开专利数据规范标准化的内容公开专利数据规范标准化的内容

1

专利数据文件名 ---- 标识码

2

数据元素的规范(数据内容的规范)

3

采用最先进的网络技术—Schema格式(数据格式的规范)

Page 10: Patent Data Standard Public

10

23/4/12www.cnpat.com.cn

10

标准化的内容标准化的内容 11 ::专利数据文件名—标识码

XB KS

YYYYMMDD格式的日期

4位年

2位专利种类

2位种类代码

3位字符;

备用,无备用取零

5-8 9-17 33 34 35-37 51 52

YYYY NNNNNNNNN K 2 S R C

18 19 20-32

C2 NNNNNNNNNNNNN

2 3 4

K 1 Y

40-47

YY Y MM D DL L

38 39

2位的语言代码

1

备用

号码年代

文献流水号

种类代码

专利类型

法律生效日期

语言代码

数据资源代码

DOI号,存放于3-32位(共30位)

1

C

国别

2位国别代码

校验

本号码的校验位

S

48

来源

表示数据的来源

50

申请流水号 国别

2位国别代码

13位顺序号,不足的左补0

9位顺序号,不足的左补0

49

同族号、复审号、司法判决号等,存放于3-17位(共15位),不足的前补大写字母0

Page 11: Patent Data Standard Public

11

23/4/12www.cnpat.com.cn

标准化的内容标准化的内容 22 ::数据元素的规范示例2011,3 月莫斯科第18次 PCT 条约会议

会议指出:pct 最低文献量要求中国专利符合 ST.96

Page 12: Patent Data Standard Public

12

23/4/12www.cnpat.com.cn

标准化的内容标准化的内容 33 ::采用最先进的网络技术 --Schema

Schema 的新特性 DTD 的局限性

可以用能处理 XML 文档的工具处理 不遵守 XML 语法(写 XML 文档实例时候用一种语法,写 DTD 的时候用另外一种语法)。只描述 XML 文档结构,不支持

数据类型检查。

扩充了数据类型,可以自定义数据类型 数据类型有限(与数据库数据类型不一致)

支持元素的继承,可重用性:属性分组,使关系显示化等 不可扩展

对结构和数据类型进行验证 只进行结构验证

支持(自动)开发环境 开发环境受限

支持命名空间 不支持命名空间(命名冲突)

Schema是数据表示上比 DTD 有着明显的优越性。符合标准的五大属性:适用性、前瞻性、公开性、可 执行性和可扩展性

Page 13: Patent Data Standard Public

13

23/4/12www.cnpat.com.cn

Schema 应用举例

Page 14: Patent Data Standard Public

14

23/4/12www.cnpat.com.cn

公开专利数据规范

项目概述项目概述

标准制定的技术路线和方法标准制定的技术路线和方法

标准正文、附录及之间关系标准正文、附录及之间关系

标准模块化、规范化的应用标准模块化、规范化的应用

标准的数据验证标准的数据验证

Page 15: Patent Data Standard Public

15

23/4/12www.cnpat.com.cn

15

项目路线

数据分析阶段

验证修改阶段

调研、分析,形成分析报告,提取元素

转换验证修改、完善

向专家征求意见完善元素处理

编写附录,完善

标准编写阶段

元素分类,命名,融合,表示,目录,标识码规范 ;编写专利数据标准文本

标准评审阶段

局内外专家和业务部门正式评审

形成征求意见稿

Page 16: Patent Data Standard Public

16

23/4/12www.cnpat.com.cn

项目路线— 1.102 个国家和地区数据分析思路

各种单项数据分析报告各种数据资源

分析

……

提取

各种单项数据的数据元素表

汇总

国家 \ 地区 \ 组织的数据元素

选取适合国家标准的数

据元素元素目录

元素的 XML Schema 创建

数据元素整理思路:

Page 17: Patent Data Standard Public

17

23/4/12www.cnpat.com.cn

项目路线— 2. 标准编写工作

ISO11179 信息技术 元数据注册 GB18391 信息技术 元数据注册 W3C 万维网联盟 SIPO 制订的各项国标、行标 ST.36 用 xml 处理专利数据 ST.86 用 XML 处理外观设计数据 XML4IP 用 XML 处理工业产权数据

(ST.96) WIPO ST.1、 6、 10、 13、 14、 16、

50 等

标准编写所参考的标准 标准编写所参考的标准

Page 18: Patent Data Standard Public

18

23/4/12www.cnpat.com.cn

公开专利数据规范

项目概述项目概述

标准制定的技术路线和方法标准制定的技术路线和方法

标准正文、附录及之间关系标准正文、附录及之间关系

标准模块化、规范化的应用标准模块化、规范化的应用

标准的数据验证标准的数据验证

Page 19: Patent Data Standard Public

19

23/4/12www.cnpat.com.cn

公开专利数据规范公开专利数据规范

《《公开专利数据规范公开专利数据规范 》》

Page 20: Patent Data Standard Public

20

23/4/12www.cnpat.com.cn

前言

引言

正文

附录

本标准按照 GB/T 1.1—2009给出的规则起草。

本标准由中华人民共和国国家知识产权局专利局 提出。

本标准由中华人民共和国国家知识产权局专利局 归口。

本标准起草单位:中华人民共和国国家知识产权局 《公开专利数据规范》制订工作组。

本标准主要起草人:宁珑、张宇、曲晓光、高立华、王潜、张松、许家升、曲超、李兵兵、阚忠阳、孙全胜、陈刚、侯晓艳、许凯、唐俊松、那英、吴泉洲、余洋、董小灵、路志明、张迪、杨晓春、张秉斋、冀小强、郑红。

公开专利数据规范公开专利数据规范

Page 21: Patent Data Standard Public

21

23/4/12www.cnpat.com.cn

引言

前言

正文

附录

为什么:数据标准不统一;信息孤岛;数据重复加工,结果不一,数据标准不统一;信息孤岛;数据重复加工,结果不一,给我局信息利用,国家 / 地区间的专利数据共享造成困难。

干什么:规范我局的各种公开专利数据资源,提高对现有专利数据资源的利用率,满足国家知识产权局信息化建设的需要。

有什么:提供了专利文件名、数据元素和数据格式的设计方法、表示规范以及管理办法。

公开专利数据规范公开专利数据规范

Page 22: Patent Data Standard Public

22

23/4/12www.cnpat.com.cn

正文

前言

引言

附录

术语、定义和缩略语术语、定义和缩略语3

范围范围1

引用文件引用文件2

公开 专利数据元素的设计方法 公开 专利数据元素的设计方法 4

公开 专利数据文件名的设计方法公开 专利数据文件名的设计方法5

公开 专利外部实体的设计方法公开 专利外部实体的设计方法6

公开 专利数据规范的应用和维护公开 专利数据规范的应用和维护7

公开专利数据规范公开专利数据规范

Page 23: Patent Data Standard Public

23

23/4/12www.cnpat.com.cn

正文

前言

引言

附录 A

1. 范围:本标准规范了公开专利数据,包 括中外专利文献数据和专利检索相关数据。

范围

2. 规范性引用文件 GB/T 18391.1 信息技术 元数据注册系统 (MDR)

引用文件

3. 术语、定义和缩略语

一般术语,用于本标准的特定术语,缩略语术语和定义

公开专利数据规范公开专利数据规范

Page 24: Patent Data Standard Public

24

23/4/12www.cnpat.com.cn

六个附录及附录间关系六个附录及附录间关系六个附录及附录间关系六个附录及附录间关系

环环相扣,相辅相成

元素类别的名称及编号:参照WIPO ST.9 INID代码

附录 B

元素目录:B.1 基础类

B.2 业务类

B.3 复杂元素

Schema :元素和模块的代码。

文件名规范办法:对专利文件做唯一标识

模块化指南:按需组合,实现模块化 。

附录 A 附录 C 附录 D 附录 E

公开专利数据规范附录及附录间关系公开专利数据规范附录及附录间关系

图像规范:PDF. TIFF .

JPEG

附录 F

Page 25: Patent Data Standard Public

25

23/4/12www.cnpat.com.cn

25

附录 A 元素类别的名称及编号 ( 规范性 )

基础类BA

时间 0100 Date/Time

地址簿 0200 AddressBook

地址 0210 Address

名称 0220 Name/NameGroup

表格 0300 Tables

图像 0400 Images

文档页 0500 DocPage

化学 0600 Chemistry

数学 0700 Maths

列表 0800 Lists

文档结构 0900 DocumentStructure

字体的格式 1000 Format

引用文献的描述信息1100 Citation

文献标识 1200 DocumentID

签名 1300 Signature

其它 1400 Other

业务类BU

专利文献 0100 PatentDocument

文献标识 0101 DocumentIdentification

申请信息 0102 ApplicationData

优先权 0103 PriorityData

┅权利要求书 0119 Claims

检索报告 0120 SearchReport

全文图像 0121 FullImage

┅非专利文献 0200 NonPatentDocument

复审审查决定 0300 AppealDecision

┅司法判决书 0400 PatentVerdict

┅专利族 0500 PatentFamily

引文(加工) 0600 CitingAndCitedDocuments

法律状态 0700 PRS

词典 0801 Dictionary

参照WIPO ST.3 INID代码进行分类和命名

Page 26: Patent Data Standard Public

26

23/4/12www.cnpat.com.cn

26

附录 B 数据元素目录 ( 规范性 )

附录 B.1 业务数据元素目录( 700 个) 附录 B.2 基础数据元素目录( 202 个) 附录 B.3 复杂数据元素目录( 40 个) 零件化;便于查询;按需组合,便于实现

模块化。

参照WIPO ST.36,96, DOCDB,DERWENT 等数据标准,融合、取舍;取其精华,并合理创新数据资源

分组提取元素数

亚洲组 614

欧洲组 1184

美洲组 926

DOCDB 268

DWPI 325

局 17 个加工业务

2715

合计 6032

Page 27: Patent Data Standard Public

27

23/4/12www.cnpat.com.cn

元素融合

申请号

欧洲Bibiograph of

granted European

Patents 数据:Application

Number

DocDB:Application

-Reference

…PRS 数据:L002EP

ESPACE EP 数据:

B210

融合实例

Page 28: Patent Data Standard Public

28

23/4/12www.cnpat.com.cn

标识符 BU0101001

名称

中文名称 文献标识信息

英文名称 PublicationReference

定义 一篇专利的文献标识信息集合

子元素 DocumentID

属性 id, applType, dataFormat, status, isRespective, dataSource, sequence

值域 id 标识号,可选;applType ,申请的类型,取值范围参照专利数据标识码规范的“专利类型 (K1)” ,可选;status ,数据状态信息,可选;isRespective ,在专利族中是否具有代表性,取值 Y或 N ,可选;dataFormat ,数据格式,取值情况如下:当 dataFormat=‘common’( required )时 , 文献标识信息用

WIPOST3Code、 DocNumber、 Kind 和 Date 表示 , 分别遵循WIPO 标准 ST.3,WIPO 标准 ST.6, WIPO 标准 ST.16和WIPO 标准 ST.2 。其中公布号 DocNumber仅由数字组成,数字总数量最大不超过 13 ,由各工业产权局根据需要确定,满足这些需求的数字位应尽可能短。文献种类 Kind为 1位字母或 1位字母 +1位数字。 Date 文献公布日期, INID 代码 40 到 48 中提供的文献公布日期, YYYYMMDD 格式;当 dataFormat='original'( 可选的 ), 有原始公开信息要求 提供该种表现形式 ; dataFormat='other'根据数据产品实际情况进行选择性要求。 dataSource, 数据来源 , 只能与 dataFormat='original' 一起使用 dataSource='national office', 表示原始公开信息来 自国家局 dataSource='docdb', 表示原始公开信息来 自 docdbsequence ,顺序号,按 dataFormat,dataSource从 1 开始编号。

数据类型

附录 B 数据元素目录 ( 规范性 )数据内容的规范:每个元素采用十一个属性进行描述

Page 29: Patent Data Standard Public

29

23/4/12www.cnpat.com.cn

附录 C 模块化指南 ( 规范性 )

申请信息ApplicationData( BU0102 )

BU0102001 ApplicationReference 专利申请标识信息

BU0102002 ApplicationLanguage 申请使用的语言 (inid25)

BU0102003 ApplicationNumber 申请号

BU0102004 ApplicationDate 申请日

BU0102005 USApplicationSeriesCode 美国专利申请序列码

BU0102006 DesignApplicationSource 外观设计申请来源

BU0102007 TotalDesign 包含在申请中的外观设计数

BU0102008 PublicationLanguage 申请公布的语种 (inid26)

BU0102009DateApplicationDeemed

Withdrawn申请的视为回撤日 (B237)

BU0102010DateApplicationPartially

Withdrawn申请的部分撤消日

与附录 B 元素

一一对应

与附录 B 元素

一一对应

Page 30: Patent Data Standard Public

30

23/4/12www.cnpat.com.cn

附录 D 元素与模块 Schema(资料性)

─PatentDocument │ ├─Elements │ │ AbstractElements.xsd 摘要及其深加工元素 │ │ ChemicalInformationElements.xsd 化学信息元素 │ │ …… │ │ SearchReportElements.xsd 检索报告元素 │ │ SequenceElements.xsd 生物序列元素 │ │ …… │ └─Modules │ AbstractABS.xsd 摘要 │ BibliographicDataBIB.xsd 著录项目 │ ChemicalSubstanceInformationCHS.xsd 化学信息 │ ClaimsCLA.xsd 权利要求书 │ ClassificationIPCRDetailsICR.xsd 国际专利分类 │ …… │ FullDocImageIMG.xsd 全文图像 │ InventionTitleTIT.xsd 发明名称 │ MedicalFormulaInformationTCM.xsd 中药方剂

数据格式的规范数据格式的规范

Page 31: Patent Data Standard Public

31

23/4/12www.cnpat.com.cn

附录 E 文件名规范办法 ( 规范性 )

专利数据标识码 专利数据标识码

XB KS

YYYYMMDD格式的日期

4位年

2位专利种类

2位种类代码

3位字符;

备用,无备用取零

5-8 9-17 33 34 35-37 51 52

YYYY NNNNNNNNN K 2 S R C

18 19 20-32

C2 NNNNNNNNNNNNN

2 3 4

K 1 Y

40-47

YY Y MM D DL L

38 39

2位的语言代码

1

备用

号码年代

文献流水号

种类代码

专利类型

法律生效日期

语言代码

数据资源代码

DOI号,存放于3-32位(共30位)

1

C

国别

2位国别代码

校验

本号码的校验位

S

48

来源

表示数据的来源

50

申请流水号 国别

2位国别代码

13位顺序号,不足的左补0

9位顺序号,不足的左补0

49

同族号、复审号、司法判决号等,存放于3-17位(共15位),不足的前补大写字母0

Page 32: Patent Data Standard Public

32

23/4/12www.cnpat.com.cn

XB KS

YYYYMMDD格式的日期

4位年

2位专利种类

2位种类代码

3位字符;

备用,无备用取零

5-8 9-17 33 34 35-37 51 52

YYYY NNNNNNNNN K 2 S R C

18 19 20-32

C2 NNNNNNNNNNNNN

2 3 4

K 1 Y

40-47

YY Y MM D DL L

38 39

2位的语言代码

1

备用

号码年代

文献流水号

种类代码

专利类型

法律生效日期

语言代码

数据资源代码

DOI号,存放于3-32位(共30位)

1

C

国别

2位国别代码

校验

本号码的校验位

S

48

来源

表示数据的来源

50

申请流水号 国别

2位国别代码

13位顺序号,不足的左补0

9位顺序号,不足的左补0

49

同族号、复审号、司法判决号等,存放于3-17位(共15位),不足的前补大写字母0

32

示例:一份 公开的,公开 号为 CN101046762 的中国发明,申请号为

,假设来源于 ,要标识该文献的 信息 :

标识码示例

2007年 10月 03 日

加工单位 02 说明书

0 2006 00 0 DES ZH 20071003 02 00 0

CN200610060101.3

0060101

A

CN 1 A101046762101046762CNCN0000

Page 33: Patent Data Standard Public

33

23/4/12www.cnpat.com.cn

专利标识码的作用

•XML 文件命名

命名,标识命名,标识 数据入库数据入库

传输和交换时,无需解析即可通过标识码获取该 XML

文件所包含的基本信息 ,例如属于哪篇文献 /哪件申请,是什么数据等

Page 34: Patent Data Standard Public

34

23/4/12www.cnpat.com.cn

附录 F:图像规范

附录 F:图像规范

F.2 TIFF 格式( Tagged Image File Format )

F.3 JPEG 格式( Joint Photographic Experts Group )

F.1 PDF 格式( Portable Document Format )

F.4 其他特殊格式(超大图、 3DMax 图, AutoCAD 机械图

等)

图像本身的技术要求

在专利数据中的应用

图像本身的技术要求

在专利数据中的应用

图像本身的技术要求

在专利数据中的应用

图像本身的技术要求

在专利数据中的应用

Page 35: Patent Data Standard Public

35

23/4/12www.cnpat.com.cn

公开专利数据规范公开专利数据规范——关于图像关于图像

我局最 大数据资源我局最 大数据资源——图像数据的规范图像数据的规范

Page 36: Patent Data Standard Public

36

23/4/12www.cnpat.com.cn

PDF 格式

所有的该格式的文件应满足以下要求:——和 Adobe Acrobat v1.4兼容;——没有压缩的文本;——没有加密的文本;——没有数字签名; —— 所有的字体应是内嵌的并且是许可发布的; ——PDF 中图片的分辨率应在 150DPI和 400DPI 之间,推荐分辨

率 300DPI;

公开专利数据中的全文图像文件, 推荐采用带标签的 PDF格式,标签的语言与专利全文的语言保持一致

—— 对于发明和实用新型全文 PDF 文件,应设置扉页Bibliography 、权利要求书 Claims 和说明书 Description 标签,如说明书包含附图,则还应对其设置说明书附图 Drawings 标签;

—— 对于外观设计全文 PDF 文件,标签应设置扉页 Bibliography和外观设计附图 DesignPicture 标签。

1.对图像数据的标准化 -PDF格式

Page 37: Patent Data Standard Public

37

23/4/12www.cnpat.com.cn

TIFF 格式

所有的该格式的文件应作为 XML 文件中的引用文件,并且满足以下要求:

——TIFF V6.0版,采用 Group 4 压缩方式,单 strip , Intel编码方式;

——推荐分辨率 300DPI;——整页图像尺寸采用 A4( 210×297mm )格式或者 Letter

( 215.9×279.4mm )格式,其他图像的最大尺寸应小于170mm×255mm 。

公开专利数据中的 黑白电子图像推荐采用 TIFF 格式。

2.对图像数据的标准化 --TIFF格式

Page 38: Patent Data Standard Public

38

23/4/12www.cnpat.com.cn

JPEG 格式

所有的该格式的文件应作为 XML 文件中的引用文件,并且满足以下要求:—— 分辨率应在 150DPI和 400DPI 之间,推荐分辨率 300DPI;—— 最大图像尺寸 170mm×255mm;——压缩比应小于 20: 1;

公开专利数据中的 灰度电子图像推荐采用 8位JPEG 格式,彩色电子图像推荐采用 24位 JPEG 格式。

3. 对图像数据的标准化 -- JPEG格式

Page 39: Patent Data Standard Public

39

23/4/12www.cnpat.com.cn

特殊格式的图像

对于公开专利数据中的一 些特殊格式的图像,如超大图像, 3DMax 图像, AutoCAD 机械图文件等,暂时难以进行标准化,推荐仍保持原格式。

4. 对图像数据的标准化– 特殊格式

Page 40: Patent Data Standard Public

40

23/4/12www.cnpat.com.cn

公开专利数据规范

项目概述项目概述

标准制定的技术路线和方法标准制定的技术路线和方法

标准正文、附录及之间关系标准正文、附录及之间关系

标准模块化、规范化的应用标准模块化、规范化的应用

标准的数据验证标准的数据验证

Page 41: Patent Data Standard Public

41

23/4/12www.cnpat.com.cn

数据验证方法

41

外部工具

Altova

MapForce

DTD/Schema新旧元素之间的对应

图视化映射

数据验证

自主编程

Visual

Studio.Net

C#语言 某些元素(申请号 /

日期等)格式的规范

Page 42: Patent Data Standard Public

42

23/4/12www.cnpat.com.cn

序号 数据源 加工单位 格式1 外观图形提取服务 出版社 xml

2 国外外观切图 出版社 xml

3 中国专利申请及中间文件数据代码化 出版社 xml

4 中国专利生物序列数据库建设 出版社 word

5 中国化学药物专利数据库建设 出版社 word

6 中药专利数据库 出版社 word

7 中药数据的英文翻译 出版社 word

8 复审决定、法院判决 出版社 xml

9 中国专利数据初加工 出版社 xml

10 法律状态信息翻译、法律状态变更信息翻译

出版社 Mdb

11 专项数据资源开发建设 出版社 文本、xml混合

数据验证的历程数据验证的历程

Page 43: Patent Data Standard Public

43

23/4/12www.cnpat.com.cn

序号 数据源 加工单位 格式12 检索配套 -世界专利文摘数据

检索配套 - EP/WO 全文文本数据检索配套 - 中国专利引文数据库检索配套 - 中国专利法律状态代码化

出版社 xml

13 首费采 信息中心 数据库14 中国专利文献标引 信息中心 Xml

15 中国专利文献翻译 信息中心 Xml

16 中国专利深加工 - 标引数据中国专利深加工 - 标题和摘要改写

开发公司 xml

17 非专利文献 检索中心 xml

18 日本专利文献 xml

19 美国专利文献 xml

20 欧洲专利文献 xml

21 DOCDB xml

22 DWPI xml

数据验证的历程数据验证的历程

Page 44: Patent Data Standard Public

44

23/4/12www.cnpat.com.cn

44

数据转换前

Page 45: Patent Data Standard Public

45

23/4/12www.cnpat.com.cn

45

数据转换后

Page 46: Patent Data Standard Public

46

23/4/12www.cnpat.com.cn

公开专利数据规范

项目概述项目概述

标准制定的技术路线和方法标准制定的技术路线和方法

标准正文、附录及之间关系标准正文、附录及之间关系

标准模块化、规范化的应用标准模块化、规范化的应用

标准的数据验证标准的数据验证

Page 47: Patent Data Standard Public

47

23/4/12www.cnpat.com.cn

公开专利数据规范公开专利数据规范——关于五书关于五书

专利文献五书的规范专利文献五书的规范

Page 48: Patent Data Standard Public

48

23/4/12www.cnpat.com.cn

1. 五书五书 ----摘要及摘要附图

PatentDocument/Modules/AbstractABS.xsd PatentDocument/Elements/AbstractElements.xsd

Page 49: Patent Data Standard Public

49

23/4/12www.cnpat.com.cn

2.2. 五书五书 ----权利要求书

PatentDocument/Elements/ClaimsElements.xsd PatentDocument/Modules/ClaimsCLA.xsd

Page 50: Patent Data Standard Public

50

23/4/12www.cnpat.com.cn

3.3. 五书五书 ----说明书

PatentDocument/Modules/DescriptionDES.xsd

Page 51: Patent Data Standard Public

51

23/4/12www.cnpat.com.cn

4. 五书五书 ----说明书附图

PatentDocument/Modules/DrawingsDRA.xsd

Page 52: Patent Data Standard Public

52

23/4/12www.cnpat.com.cn

公开专利数据规范公开专利数据规范——辅助检索类辅助检索类

辅助检索类数据的规范辅助检索类数据的规范

Page 53: Patent Data Standard Public

53

23/4/12www.cnpat.com.cn

1. 辅助检索类:法律状态

所使用的模块: …/LeagalStatus/Modules/PRS.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc

公开专利数据规范 附录 C 模块化指南 .doc

Page 54: Patent Data Standard Public

54

23/4/12www.cnpat.com.cn

2. 辅助检索类:司法判决

所使用的模块: …/PatentVerdict/Modules/PatentVerdictVER.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc

公开专利数据规范 附录 C 模块化指南 .doc

Page 55: Patent Data Standard Public

55

23/4/12www.cnpat.com.cn

公开专利数据规范公开专利数据规范——关于加工项目关于加工项目

我局四种加工项目标准应用举例我局四种加工项目标准应用举例

Page 56: Patent Data Standard Public

56

23/4/12www.cnpat.com.cn

1. 信息中心 -中国专利文献翻译标准化方法

所使用的模块: …/PatentDocument/Modules/BibliographicDataBIB.xsd …/PatentDocument/Modules/DesignBibliographicDataBIB.xsd …/ PatentDocument/Modules/AbstractABS.xsd …/ PatentDocument/Modules/DesignBriefExplanationBRI.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc

公开专利数据规范 附录 C 模块化指南 .doc

公开专利数据规范 Appendix D xsd

Page 57: Patent Data Standard Public

57

23/4/12www.cnpat.com.cn

2. 出版社 -专利文献初加工项目标准化方法

所使用的模块: …/Appendix D Schema/PatentDocument/Modules/BibliographicDataBIB.xsd …/Appendix D Schema/PatentDocument/Modules/AbstractABS.xsd …/ Appendix D Schema /PatentDocument/Modules/DescriptionDES.xsd …/ Appendix D Schema /PatentDocument/Modules/DrawingsDRA.xsd …/ Appendix D Schema /PatentDocument/Modules/ClaimsCLA.xsd …/ Appendix D Schema /PatentDocument/Modules/FullDocImageIMG.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc公开专利数据规范 附录 C 模块化指南 .doc公开专利数据规范 Appendix D xsd

Page 58: Patent Data Standard Public

58

23/4/12www.cnpat.com.cn

3. 检索中心 -非专利文献初加工 ( 参照 )标准化方法

所使用的模块: …/NonPatentDocument/Modules/NonPatentDocumentNPL.xsd (整合) 非专利文献著录项目( NBI ,提取 NonPatentDocumentAndRelatedID 、 InventionTitle、 ClassificationIPCRDetails、 OtherClassificationDetails 等设计模块xsd ) 化学结构 AssistedRetrievalData/Elements/ChemicalSubstanceDatabaseElements.xsd PatentDocument/Elements/MedicalFormulaElements.xsd AssistedRetrievalData/Elements/SynonymDataElements.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc公开专利数据规范 附录 C 模块化指南 .doc公开专利数据规范 Appendix D xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc公开专利数据规范 附录 C 模块化指南 .doc公开专利数据规范 Appendix D xsd

Page 59: Patent Data Standard Public

59

23/4/12www.cnpat.com.cn

4. 开发公司 -专利深加工标准化方法所使用的模块:cn-index-data…/PatentDocument/Modules/EnhancedKeywordDetailsKWS.xsd , …/PatentDocument/Modules/OrganizationCodeOCO.xsd…/PatentDocument/Modules/OtherClassificationDetailsICO.xsd …/PatentDocument/Modules/ClassificationIPCRDetailsICR.xsdcn-rewritten-abstract-title-data…/PatentDocument/Modules/InventionTitleTIT.xsd…/PatentDocument/Modules/EnhancedAbstractABE.xsdcn-patent-reference-and-family…/CitingAndCitedDocuments/Modules/CitedReferenceCIT.xsd

所参照的附录:公开专利数据规范 附录 B 数据元素目录 .doc公开专利数据规范 附录 C 模块化指南 .doc公开专利数据规范 Appendix D xsd

Page 60: Patent Data Standard Public

60

23/4/12www.cnpat.com.cn

公开专利数据规范的制定过程公开专利数据规范的制定过程

标准是标准是权衡、协调、统一权衡、协调、统一的艺术的艺术

Page 61: Patent Data Standard Public

61

23/4/12www.cnpat.com.cn

沟通合作

自动化部信息中心

文献部

开发公司

出版社

检索中心

公开专利数据规范的制定过程公开专利数据规范的制定过程

Page 62: Patent Data Standard Public

62

23/4/12www.cnpat.com.cn

62

23/4/12www.cnpat.com.cn

标准专家 9 次意见反馈、答复及改进

序号 讨论会时间 讨论内容

1 2011.4.13 路线、分类

2 2011.4.19 分类、申请号、文献号、摘要

3 2011.4.26 获知日期、分类、技术信息4 2011.5.10 公众获知日期、技术信息5 2011.5.17 技术信息、法律参引、当事方、 PCT

6 2011.5.24 技术信息、同族7 2011.5.31 外观、说明书、附图、化学、生物、方剂8 2011.6.14 复审 /司法、法律、同族、引文、词典 /库9 2011.7.5 正文、标识码、标识号

Page 63: Patent Data Standard Public

63

23/4/12www.cnpat.com.cn

分类的种类,取值可以是 field (表示范畴分类)、 PHC (表示药物范畴分类)、 practical(表示实用专利分类)、industrial (表示国民经济行业分类)

标准专家 9 次意见举例

Page 64: Patent Data Standard Public

64

23/4/12www.cnpat.com.cn

28 条意见,逐条审核,制作样例,随时反馈,不断修订

信息中心3 个项目4 条意见

出版社11 个项目11 条意见

检索中心1 个项目5 条意见

DHD JGDJ D J

征求意见及反馈

开发公司1 个项目8 条意见

征求意见稿的反馈、答复及改进

Page 65: Patent Data Standard Public

65

23/4/12www.cnpat.com.cn

申请人元素中有createDate和creator 属性,但发明人元素中无此属性,这两个属性是否必要?

加工单位对征求意见稿的反馈、答复及改进举例 申请人元素中有createDate和creator 属性,但发明人元素中无此属性,这两个属性是否必要?

Page 66: Patent Data Standard Public

66

23/4/12www.cnpat.com.cn

问题反馈、

样例宣讲

标准修改

标准宣讲

加工单位样例制作

持续的改进、磨合,不断达成共识

公开专利数据规范的制定过程公开专利数据规范的制定过程

Page 67: Patent Data Standard Public

67

23/4/12www.cnpat.com.cn

67

11年 8月

11年 9月

11年 11月

11年 12月

配合局标准 论证步伐配合局标准 论证步伐

专家评审

提交征求意见稿

工作计划

征求意见

报批

Page 68: Patent Data Standard Public

68

23/4/12www.cnpat.com.cn

公开专利数据规范的项目输出物公开专利数据规范的项目输出物

标准的输出物标准的输出物

Page 69: Patent Data Standard Public

69

23/4/12www.cnpat.com.cn

数据分析报告 四个分册公开专利数据规范正文及 其附录公开专利数据规范内外网页宣传

公开专利数据规范的项目输出物公开专利数据规范的项目输出物

Page 70: Patent Data Standard Public

70

23/4/12www.cnpat.com.cn

公开专利数据规范正文及其附录

Page 71: Patent Data Standard Public

71

23/4/12www.cnpat.com.cn

数据分析报告 四个分册

Page 72: Patent Data Standard Public

72

23/4/12www.cnpat.com.cn

公开专利数据规范内外网页宣传公开专利数据规范内外网页宣传

Page 73: Patent Data Standard Public

73

23/4/12www.cnpat.com.cn

73

组织结构与人员

自动化部

曲晓光 项目经理

曲晓光

项目管理 数据分析 标准制定 标准验证 商务谈判

高立华

高立华

王潜

张松

阚忠阳

曲超

李兵兵

席文雷

尹文元

侯晓艳

丰瑾

彭蕾

陈晓雨

李东雷

刘皓

许家升

张帆

高立华

鲁麒

项目顾问

徐锡涛

陈刚

张松

曲超

李兵兵

尹文元

刘皓

高立华

王潜

张松

阚忠阳

曲超

李兵兵

尹文元

许家升

...顾问1

顾问2

顾问12

王潜

许家升

席文雷

侯晓艳

丰瑾

陈晓雨

李东雷

刘皓

徐锡涛

陈刚

Page 74: Patent Data Standard Public

74

23/4/12www.cnpat.com.cn

各单位专家的大力支持

文献部 那 英 董小灵 余 洋

出版社 路志明 张 迪

开发公司 郑红 冀小强

检索中心 杨晓春 张秉斋

信息中心 唐俊松 许凯

Page 75: Patent Data Standard Public

中国专利信息中心 www.cnpat.com.cn

公开专利数据规范项目组