第二章 标准化、分类和编码

53
1 第第第 第第第 第第第第第

description

第二章 标准化、分类和编码. 本章的主要内容. 1. 标准及标准化 2. 分类法 3. 分类简史 4. 分类和编码问题 5. 分类系统 6. 当前发展. 标准及标准化. 1) 标准化定义 ISO 及 IEC 组织定义 见 P32. 例 : 传统病历. 传统的病历数据只使用手写形式,主要是自然语言形式,但有时也用(数字)数据形式,如化验结果等。病历主要记录病人的就医情况,如诊断,治疗和愈后。若其他医生应用这种手写的病历来建立新的病历就会遇到这样的问题:许多医学术语使用不规范,甚至意义不明确,模棱两可。. 电子病历. - PowerPoint PPT Presentation

Transcript of 第二章 标准化、分类和编码

Page 1: 第二章  标准化、分类和编码

1

第二章 标准化、分类和编码

Page 2: 第二章  标准化、分类和编码

2

本章的主要内容1. 标准及标准化 2. 分类法 3. 分类简史 4. 分类和编码问题 5. 分类系统 6. 当前发展

Page 3: 第二章  标准化、分类和编码

3

标准及标准化 1)标准化定义

ISO及 IEC组织定义

见 P32

Page 4: 第二章  标准化、分类和编码

4

例 : 传统病历 传统的病历数据只使用手写形式,主要

是自然语言形式,但有时也用(数字)数据形式,如化验结果等。病历主要记录病人的就医情况,如诊断,治疗和愈后。若其他医生应用这种手写的病历来建立新的病历就会遇到这样的问题:许多医学术语使用不规范,甚至意义不明确,模棱两可。

Page 5: 第二章  标准化、分类和编码

5

电子病历 由于当前越来越多地使用了电子病历

( CPR ),医学数据的应用领域得到扩展,除了传统的数据获取和报告之外,CPR 医学数据的其他优点也日渐显现。

Page 6: 第二章  标准化、分类和编码

6

决策支持系统 决策支持系统可根据 CPR 的数据,帮助医生

决定如何采取措施。

例如 : 开药物处方 ( 可运行决策支持系统以核查药物禁忌和药物交叉反应等情况 ) 。

首要条件 : 病人的所有的疾病都使用标准和统一的记录格式,才能使决策系统正常运行。

现实状况 : 许多医疗卫生数据如诊断、病历、体检、X线检查报告都是使用自然语言形式,这就引起表达上的无限可能性,而统计和决策系统只能处理有限的类别。

对病历记录的各种表达归类的规则必须按照客观标准。这种对多种表达的归类必然意味着数据的减少(即信息的丢失)。

Page 7: 第二章  标准化、分类和编码

7

标准化遵循的原理 1. 简化统一:在复杂多样化的表象内找

出简单明确的本质,并促成统一性。 2.” 一致同意”为基础 3. 定期修改 4. 实施价值 5. 采取强制实行

Page 8: 第二章  标准化、分类和编码

8

医学信息的特点(难题):1. 面广量大,更新速度快 ;

2. 种类繁多,表达形式不一、数据的标准不一、单位不一、难以标准化 ;

3. 量化困难,概念不精确 , 难以用数学语言表达 ;

4. 自然语言标准化的困难: 病史描述、医生水平、习惯

Page 9: 第二章  标准化、分类和编码

9

医学信息标准化

信息标准化

信息处理标准化

信息的结构化

编码和分类名词和术语报表格式

信息交换格式

硬件接口

软件接口

文档编制

医学信息标准化范畴

计算机 ,网络布线 ,存储设备

Page 10: 第二章  标准化、分类和编码

10

医学信息软件标准化 : 1997 年颁布《医院信息系统软件基本功

能规范》 ; 2002 年颁布《医院信息系统基本功能规

范》 , 强调了标准化是信息化的基础 , 并将

HIS 中数据 , 数据库 , 数据字典标准化作为一个独立章节予以阐述 , 突出了其重要地位。

Page 11: 第二章  标准化、分类和编码

11

分类: 分类是某一领域内概念的序化和原

理的序化。 分类的准则取决于这些类别的应用

目的。

例如 : 按照一定规则将疾病分门别类 , 并

对它们进行有序地排列。

Page 12: 第二章  标准化、分类和编码

12

分类的序化原理 :

分类法实质上是一个序化系统 ,即将某一要素或特征作为分类的依据 , 并按其序化原理或内在规律进行排序 .

1 、单轴分类系统 : 采用一个序化标准 2 、多轴分类系统 : 采用多个序化标准

Page 13: 第二章  标准化、分类和编码

13

具体分类 :依据特性中所包含的隶属关系再分类 :

类目 亚目 细目 … …

亚目 细目

若干 若干

同一目中只应有一个轴心 ( 每一个特征 ).

可取不同轴心

Page 14: 第二章  标准化、分类和编码

14

分类方法 : 1. 确立分类设计的目的。 2. 找出最本质的一个或多个特性 ( 每一

个特性即是一个轴心 ) 。 3. 围绕这个轴心进行具体分类 :

按特性的属性关系分亚目 -> 细目 -> 编码。

Page 15: 第二章  标准化、分类和编码

15

某些传染病和寄生虫的分类 :各个类目都是以病因为轴心进行分类 . A00: 霍乱 A01: 伤寒 A02: 沙门氏菌感染 A03: 志贺菌感染 A04: 大肠杆菌感染 A06: 阿米巴感染 A06.0: 急性阿米巴痢疾 A06.1: 慢性肠道阿米巴病 A06.2 阿米巴非痢疾性结肠炎

Page 16: 第二章  标准化、分类和编码

16

信息分类的基本方法 最常用的三种 : 线分类法 ; 面分类法 ; 混合分类法。 线分类法 : 也称层级分类法,它是将初始的分类对象,按选定的属性作为划分基础,逐级地分成相应的若干个层级类目,并排列成一个有层次的逐级展开的分类体系。

Page 17: 第二章  标准化、分类和编码

17

这种表现形式有大类、中类、小类等。将分类对象一层一层地具体进行划分,逐级展开。各个类之间构成并列或隶属关系,既不重复也不交叉。

目前按线分类法建立起来的国家标准已经不少。比较有代表性的有 :

国标: GB2260-90 《中华人民共和国行政区划代码》、 GB 4754-84 《国民经济行业分类和代码》、 GB 6665-86 《职业分类和代码》等。在制定野生生物种质资源数据库信息分类编码标准时,这些标准均可供参考。

Page 18: 第二章  标准化、分类和编码

18

面分类法 国家标准 GB 12403-90 《干部职务名称代码》,

就是采用面分类法进行编制的。面分类法不经常单独使用,往往是同线分类法结合构成混合分类法使用。

混合分类法 混合分类法的出现是由客观事物的复杂性所决

定的。在已有的分类目录中经常出现同时存在线分类和面分类两种方法结合的形式。

Page 19: 第二章  标准化、分类和编码

19

在分类系统中一般使用多种序化标准,因而情况较为复杂。如在疾病的分类中,一般考虑如下几个方面:

1 、解剖位置; 2 、病因学; 3 、形态学; 4 、功能障碍。 以上每一项都可以作为一种分类的依据。 这种贯穿整个分类过程的序化标准称为轴。多轴分类系统同时采用多种不同的序化标准。

排序原理

Page 20: 第二章  标准化、分类和编码

20

表 1 CPR 医学数据的优点

应用领域 医学数据编码的优点病人治疗 数据量减少进行质量控制 术语标准化医疗结果报告形式统一 可进行统计分析和研究比较(本单位)与其他单位及医疗中心的数据 有利于管理和规划协议管理 可与决策支持系统相结

合更深入的了解  

医学研究,包括流行病学研究  

计划和管理  

Page 21: 第二章  标准化、分类和编码

21

表 2  分类的条件分类所需的条件 计算机辅助编码系统所需的额

外条件领域完整性 允许使用同义词类间非重叠性(互斥性) 允许使用不同的词汇库可满足既定的目标 对拼写错误不敏感有序化标准的同一性(同一种级别只有

一个准则)可靠性

类别界限标准明显 操作的统一性(对术语排序不敏感)

应用要求明确而完整 准确性详细程度恰当  

Page 22: 第二章  标准化、分类和编码

22

表 3  类风湿性关节炎分类的 ARA 标准 *

1.晨起关节僵直 5.类风湿结节

2.三个以上的关节发炎 6.血清类风湿因子阳性

3.手关节发炎 7.典型 X 线病变

4.对称性关节炎  

Page 23: 第二章  标准化、分类和编码

23

术语与专业常用词汇 缺少统一的术语是在医疗卫生领域实行

统一记录所遇到的问题之一。 1933年,纽约医学院就开始医学术语的

数据库研究,即所谓标准疾病分类术语( the Standard Classified Nomenclature of Diseases )。

Page 24: 第二章  标准化、分类和编码

24

1961 年美国医学协会继续这项工作 ; 1965 年由美国病理学家协会( the American Coll

ege of Pathologists )出版了病理学系统术语 ( the Systematic Nomenclature of Pathology , S

NOP )编码系统。

SNOP奠定了人类与兽类医学系统术语( the Systematic Nomenclature of Human and Veterinary Medicine , SNOMED )的基础,成为一种术语的样本。

术语系统在自动产生标准化报告如出院报告中是很有用的。

Page 25: 第二章  标准化、分类和编码

25

编码编码的定义 : 把对某一类信息赋予代码的过程称为编码 (coding)。

信息编码( information coding)就是将表示信息的某种符号体系转换成便于计算机或人识别和处理的另一种符号体系;或在同一体系中,由一种信息表示形式改变为另一种信息表示形式的过程。

编码目的 : 编码的目的在于提高信息处理的效率。

Page 26: 第二章  标准化、分类和编码

26

代码有两类 : 一类是有意义的代码,即赋予代码一定

的实际意义,便于分类处理; 一类是无意义的代码,仅仅是赋予信息元素唯一的代号,便于对信息的操作。

Page 27: 第二章  标准化、分类和编码

27

代码可以分为以下几种:

数字代码: 一般以顺序的形式来表示,也可 以用随机的方式分配。

记忆代码: 是由字符组成,方便用户记忆,不使用于分类很多的系统,通常用于有限数目的类型。

例 :ECG,VCG,LD,LDL

Page 28: 第二章  标准化、分类和编码

28

分级代码:在已有代码的基础上在加一个或多个字符作为扩展的级代码,便于执行分级代码检索。

例 :S82 小腿骨折 S82.0 髌骨骨折 S82.01 髌骨开放性骨折

Page 29: 第二章  标准化、分类和编码

29

双重代码 ( 并列代码 ): 是有几段代码组合而成,每段代码都有自己的含义和特征。

例 :A18.0 H75.0*( 结核性乳突炎 )

复合代码: 适用于复杂庞大的分类。数值相加代码:在数值相加代码中,只用

2 的乘方表示数据的项和类,与复合代码一样,几个特征能复合成一个代码。

Page 30: 第二章  标准化、分类和编码

30

医学信息的分类和编码 分类学( taxonomy )是分类法的理论研究,包括其基本

原则、步骤和规则。分类学这一术语也可用来表示分类设计过程的最终结果,因此常常被作为分类法的同义词。

分类学的第一定义:分类法的科学;分类学感兴趣的是一般意义下的分类法。例如所有的哺乳动物形成一个类,而人、猫和鲸都属于

这一类。一个类还可以根据其他特征进一步分成子类。如狮子、老虎和家猫都属于猫科动物类。

在疾病分类系统如 ICD-9 中,分类和再分类是根据疾病发生的器官系统和其病因学进行的。

Page 31: 第二章  标准化、分类和编码

31

医学信息的分类和编码原则 :P38

科学性 , 标准化 , 准确性 ,唯一性 ,冗余性 , 结构化 , 实用性 ,易操作性 .

Page 32: 第二章  标准化、分类和编码

32

编码方法 : 根据每一种药品所属的类别 ,给予一个代码 , 用

以标识这一特指的药品 , 并包含了它的诸多药理特性 .

(1)代码位数 (2)代码符号 西药字典的分类代码 :

X1 X2X3 X4X5 X6X7

(项目 )2 位数字 ( 细目 ) 2 位数字 ( 亚目 ) 2 位数字 ( 类目 ) 2 位数字

Page 33: 第二章  标准化、分类和编码

33

分 类 简 史 在医疗卫生领域,最常用的分类系统是 ICD 以及 ICD派生出来的分类法。

1629年, London Bills首先尝试对死亡率进行统一登记。 1893年, Jacques Bertillon提出《国际化死亡原因编

目》的第一版, 1900年得到了正式认可。以后一直在 ISI 的监管下定期修订,直到 1938年的第五版。

1990年,世界卫生组织的国际健康协会采纳了第十版( ICD-10 )。

1933年,疾病的标准分类术语( SNDO )第一版在美国发行。

1965年,美国病理医学院出版了病理学的系统术语( SNOP )

Page 34: 第二章  标准化、分类和编码

34

编码问题 对病人的状况进行编码时,需要浏览大

量的诊断和医学过程的医学分类系统。 无论谁为病人的状况编码,都存在着分

类系统中的术语与对病人状况的全面表达有很大差异的困难。只有借助于合适计算机程序才能解决两者之间的差异。

Page 35: 第二章  标准化、分类和编码

35

有两种技术处理方法可为医生和编码者提供有效的帮助。

(1)有关分类系统的概念性索引 对输入语言进行形态 -语义分析,提炼出所

有的基本概念。这种分析方法是把所有的复合单词分解成几部分:前缀、词干和后缀。然后把类似的词干归类到更一般的种类中去。在此基础上,对所用分类系统中的语句进行分析,相应的索引就可估算出来。浏览过程中的进一步查询将在这一语境中处理。最终结果是有关分类系统的概念性索引,这比一般的词汇索引更有价值。

Page 36: 第二章  标准化、分类和编码

36

(2)常用词汇库 +同义表达 把常用词汇库与指向分类法某一入口的同义

表达结合起来。这样,对用户隐蔽的词汇库成为进行索引的词汇主体的一部分。通过大型词汇库,浏览内容可能就会大大增加,从而有可能建立包含其他语言或国家的特殊表达方式的医学词汇库。作为应用工具,医学分类法浏览器应能很方便地用于个人计算机上,通常还应有足够的反应次数。

Page 37: 第二章  标准化、分类和编码

37

分 类 系 统 (一) ICD—— 国际疾病分类 (二) ICPC—— 国际社区医疗分类 (三) DSM——精神疾病的诊断和统计手册 (四) SNOMED—— 人类与兽类医学系统术语 (五) ICD-O—— 国际肿瘤学疾病分类 (六) CPT——通用过程术语学 (七) ICPM—— 国际医疗过程分类 (八) RCC——Read临床分类 (九) ATC——解剖 -治疗 - 化学代码 (十) MeSH—— 医学主题词表 (十一) DRG—— 诊断分组

Page 38: 第二章  标准化、分类和编码

38

( 一 )ICD— 国际疾病分类 ICD 是根据疾病的某些特征 ( 病因 ,部位 , 病

理 ,临床表现 ), 按照规则将疾病分门别类 , 并用编码的方式来表示的系统 , 是一个多轴心的分类系统 (ICD-10) 。

ICD 是包含了三位核心代码的分类系统 类目 :3 位数 S80 亚目 :4 位数 S82.0 细目 :5 位数 S82.01 双重分类 :A18.8+I32.0*

Page 39: 第二章  标准化、分类和编码

39

表 4  ICD-9 中的 4 位代码级和 ICD-9-CM 中扩展的 5 位代码级示例代 码 疾 病001 – 139 感染性和寄生性疾病001 – 009 消化道感染性疾病003 其他沙门菌疾病-  003.0 沙门菌肠胃炎-  003.1 沙门菌败血症-  003.2 局部沙门菌感染-       003.20 非特异性局部沙门菌感染-       003.21 沙门菌脑膜炎-       003.22 沙门菌肺炎-       003.23 沙门菌关节炎-       003.24 沙门菌骨髓炎-       003.29 其他局部沙门菌感染-  003.8 其他特异性沙门菌感染-  003.9 非特异性沙门菌感染

Page 40: 第二章  标准化、分类和编码

40

表 5  ICPC 的二轴系统 A     一般的和非特指的 1-29    症状和主诉

B     血液 30-49   诊断性普查和预防

D     消化 50-59   治疗和药物处理

F     眼睛 60-61   化验结果

H     耳朵 62      管理

K     循环 63-69   其他

L     肌 -骨骼 70-99   诊断

N     神经  

P      心理  

R     呼吸  

S     皮肤  

T      内分泌和代谢  

U     泌尿学  

W     怀孕和计划生育  

X     女性生殖系统  

Y     男性生殖系统  

Z     社会性健康问题  

代码 器官系统

第一轴

器官系统

第二轴

医学组件

代码 医学组件

Page 41: 第二章  标准化、分类和编码

41

(四) SNOMED— 人类与兽类医学系统术语 SNOMED 支持疾病的多方面编码。 SNOMED第一版

于 1975年发行, 1979年修订。最新版称为国际 SNOMED 。 SNOMED 也是多轴系统。 SNOMEDⅡ的代码有 7 个轴,国际 SNOMED 有 11 个轴或模块,每个轴形成一个完整的等级分类系统(表 6 )。

在 SNOMED 中的诊断包含局部解剖学代码、形态学代码、微生物代码和功能代码。确切定义一个诊断需这 4 种代码复合。

如疾病代码 D-13510 (球菌性肺炎)等价于下列代码的复合:① T-28000 (肺部的解剖学代码,不表示其他情况);②M-4000 (炎症的形态学代码,不表示其他情况);③ L-25116 (链球菌性肺炎,按微生物轴)。见 P43

Page 42: 第二章  标准化、分类和编码

42

表 6  国际 SNOMED 的 11 个轴轴 定 义 说 明T 局部解剖学 解剖术语M 形态学 细胞、组织、器官的改变L 微生物 细菌和病毒C 化学制品 药物F 功能 体征和症状J 职业 描述职业的术语D 诊断 诊断术语P 过程 管理,诊断和治疗过程A 物理因素、力、作用 与疾病相关的设备和行为

S 社会关系 医学上的社会条件和重要关系

G 一般状况 语法连接和资格

Page 43: 第二章  标准化、分类和编码

43

(八) RCC—Read临床分类 Read临床分类( RCC ),又称 Read 编码,

是英国全科医生 James Read 于 20世纪 80年代初个人开发的。 1990年为英国国家医疗保健服务部( NHS )采用。

临床术语工程( Clinical Terms Project )对 RCC 进行了进一步扩展。临床术语工程是由 NHS首席执行官领导下的工作组,包括皇家医学院、联合顾问委员会、英国医学协会的总医疗服务委员会和 NHS执行官的代表加以实施。RCC 打算覆盖医疗卫生领域的所有范围

Page 44: 第二章  标准化、分类和编码

44

表 7  英国 RCC覆盖的领域疾病 手术过程职业 其他治疗过程病史 /症状 管理检查 / 体征 药物 /器械诊断过程 健康状态量度放射 / 诊断成像 诊断相关组预防过程  

Page 45: 第二章  标准化、分类和编码

45

表 8  RCC与 ICD-9-CM对应举例级 别 术 语 RCC ICD-9-CM

1 感染性 /寄生虫性疾病

A 001-139

2 发疹性病毒性疾病 A5 050-057

3 风疹 A56 056

4 风疹 +神经性并发症

A560 0560

5 风疹 +脑脊髓炎 A5601 056.01

Page 46: 第二章  标准化、分类和编码

46

(九) ATC—解剖 -治疗 - 化学代码 解剖 - 治疗 - 化学代码( ATC )是一种药物系统

分级分类法。在 19世纪 70年代初,挪威医学供应部( Norwegian Medicinal Depot )扩展了已有的欧洲制药市场研究协会解剖和治疗 3级分类系统,并增加了 2 个化学级。

后来, WHO药物应用研究组认可了 ATC 分类这一标准。现在,在奥斯陆的 WHO 关于药物统计方法合作中心负责维护 ATC代码。 ATC 的首写字母是 A代表解剖,即药品作用的机体器官系统; T代表治疗,即药品的治疗作用; C代表化学品,即其化学类。

Page 47: 第二章  标准化、分类和编码

47

表 9  以呋塞米(速尿)为例说明 ATC代码的 5级标准代 码 说 明

C 心血管系统( 1级,按解剖分组)

C03 利尿剂( 2级,按治疗分组)

C03C 利尿剂( 3级,按治疗分亚组)

C03CA 磺胺药( 4级,化学 / 疗法亚组)

C03CA01 呋喃苯胺酸( 5级,化学物质分组)

Page 48: 第二章  标准化、分类和编码

48

表 10  ATC代码中定义的单位和给药途径单位名称 单位符号 给药途径 给药途径的缩写克 g 吸入 Inhal

毫克 mg 经鼻 N

微克 µg 口服 O

单位 E 非肠道 P

千单位 TE 经直肠 R

百万单位 ME 舌下 /颊部 SL

毫摩尔 mmol   经皮 Td

毫升 ml 经阴道 V

Page 49: 第二章  标准化、分类和编码

49

UMLS元词汇 包含来自很多术语系统和词汇的生物医学概念和术语。元词汇存有源词汇编码 的信息,如术语的上下级关系、含义和其他属性。元词汇由概念构成,同一含义的多种名称(如同义词、词形变化、译名)都连接起来成为一个概念。元词汇把一些 信息增加到概念中,如语义类型、定义和概念的相互关系。元词汇有成千上万来自各种词汇汇编的概念,包括下列全部或部分术语:国际人类与兽类医学系统术语 (国际 SNOMED )、 Reed 词汇汇编、国际疾病分类法临床修改版( ICD9-CM )、世界医疗设备术语系统、 WHO药物副作用术语、护理性诊断分类法( NANDA )、护理性诊断和处理的家庭医疗保健分类法、通用过程术语学( CPT )、医学主题词表( MeSH )、精神疾病的诊断和统计手册( DSM-Ⅳ)、心理学索引术语汇编。另外,还包括被翻译成非英语其他语言的术语。

Page 50: 第二章  标准化、分类和编码

50

中国疾病分类 CCD 1921协和医院王星贤主编 :《疾病病理情况和

手术操作名称》 1980协和医院出版《疾病分类和手术分类名称》

包含 :CCD-D 现代医学诊断名称 CCD-T 传统医学诊断名称 CCD-S麻醉手术名称 CCD-P检验 , 诊断治疗方法名称 .为了与国际接轨 ,我国已不再使用 CCD 了 .

Page 51: 第二章  标准化、分类和编码

51

当 前 发 展 美国试验和材料协会( the American Society for Testing

and Materials , ASTM )正在研究扩展命名系统的标准化。

在欧洲,由欧盟承担这种标准化的工作。 例如,旨在发展医疗概念参考模型的 GALEN工程,它将独立于语言和现存编码系统,独立于电子病历系统的数据模型。

美国国家医学图书馆( NLM )正在开发统一医学语言系统( UMLS )。 UMLS 由包含医学概念的元词汇( metathesaurus )和语义网络两部分组成。语义网络提供关于医学概念的语义信息。这些概念来源于 SNOMED 、 ICD-9-CM 和 MeSH 中的词汇。

Page 52: 第二章  标准化、分类和编码

52

小 结 SNOMED 系统比 ICD-9-CM 等较为固定

的系统表达能力强,对几个编码系统表达能力方面的对比研究表明, SNOMED比 ICD-9-CM 的积分高得多。另一方面,统计性综述和专家系统在数据库查询中应用编码数据则更为复杂。

Page 53: 第二章  标准化、分类和编码

53

习题 1.下面的下列数据组 ( 数据组是一组不必结构化存放的数据 )

当中哪一个不包含一个辞典 ?A. · 一个诊断学编码的分级数据库B. · 一个包含高血压知识的数据组C. · 一所医院中的所有医师名字的数据库D. · 一个国家许可处方药的关系数据库 A 错。这是一个国际性的辞典。 辞典是一些术语的有限目录,

或者在一些特殊环境中经常使用的语汇。它独立于数据库的结构。 B.正确的。 知识库不是辞典。 C 错。这可能是一个本地的辞典。 D 错。这是一个国际性的辞典。 它独立于数据库的结构。