文 本 信 息 加 工

15

description

文 本 信 息 加 工. 以字母拼写方法的不同表达不同的含义. 字母文字. 象形文字. 使用自身的 “ 形 ” 直接昭示其含义. 一、文字及其处理技术. 体验文字处理技术. 汉字起源于象形文字,至今仍然保留了象形文字的特点。. 汉字的造字法有四种:象形、指事、会意、形声。. 象形. 这是一个指事字。从字体上看,就是本 字倒过来。上部为树头,下部为树梢, 在树梢上加一小横,就表示这里是树梢。 因此,末的最初的意义是树梢。. 指事. 一、文字及其处理技术. 体验文字处理技术. 金文「明」为日月幷照之会意字。. 会意. - PowerPoint PPT Presentation

Transcript of 文 本 信 息 加 工

Page 1: 文 本 信 息 加 工

文文本本信信息息加加工工

Page 2: 文 本 信 息 加 工

一、文字及其处理技术体验文字处理技术

字母文字 以字母拼写方法的不同表达不同的含义

象形文字 使用自身的“形”直接昭示其含义

汉字起源于象形文字,至今仍然保留了象形文字的特点。汉字的造字法有四种:象形、指事、会意、形声。

这是一个指事字。从字体上看,就是本字倒过来。上部为树头,下部为树梢,在树梢上加一小横,就表示这里是树梢。因此,末的最初的意义是树梢。

象形

指事

Page 3: 文 本 信 息 加 工

一、文字及其处理技术体验文字处理技术

金文「明」为日月幷照之会意字。 会意

东巴文字——现代活着的象形文字

Page 4: 文 本 信 息 加 工

文字及其处理技术 字母文字以字母拼写的方法的不同而表达

不同的含义,象形文字则使用自身的“形”直接昭示其含义。

Page 5: 文 本 信 息 加 工

一、文字及其处理技术体验文字处理技术

方块英文

Page 6: 文 本 信 息 加 工

一、文字及其处理技术体验文字处理技术

Aspiration city magazine Living

Page 7: 文 本 信 息 加 工

文字及其处理技术 20 世纪 80 年代开始,随着计算机技术的

普及,汉字的输入成为当时一重大难题。 不仅汉字可以利用计算机来处理,其他象

形文字同样可以数字化,比如日文、东巴文等等。

Page 8: 文 本 信 息 加 工

中文信息处理技术发展简史 20 世纪 80 年代初, CCDOS 成为我国第一个汉字操作系统; 1983 年,“王码五笔字型”输入法,突破了汉字数字化的瓶颈; 1984 年,联想公司成立并推出联想汉卡; 1985 年 5 月,北大方正研制的激光照排 II 型机,迎来了印刷业“告别铅

与火,迈入光与电”的时代; 1989 年 9 月,金山公司发布了中文字处理系统 WPS 1.0 ; 1992 年, PTDOS 1.0 ; 1993 年 10 月发布 UCDOS 3.0 ; 1994

年到 1997 年先后开发出 UCDOS 3.1~UCDOS 7.0 ; 1993 年 Windows 3.2 发布,这是第一个简体中文版的 Windows

操作系统,此后 Windows 及其中文版本不断升级; 1999 年,中国新一代的国产操作系统——红旗 Linux 推出。

Page 9: 文 本 信 息 加 工

一、文字及其处理技术体验文字处理技术

历史上使用的文字处理技术

手写 刻字 雕版印刷 活字印刷 机械式打字机

计算机文字处理

计算机文字处理

只能处理英文

可处理包括象形文字在内的任何文字

如何在计算机中处理汉字?

Page 10: 文 本 信 息 加 工

一、文字及其处理技术汉字的编码

目前计算机上使用的汉字编码主要有三种。

输入码(外码)

机内码(内码)

输出码(字型码)

用于输入汉字的编码

用于存储汉字的编码

用于输出汉字的编码

区位码 : 4860全拼编码: xiong

五笔字型: CEXO

用机内码表示、存储如国标码( GB )和

BIG5 码

用汉字字型输出汉字

Page 11: 文 本 信 息 加 工

汉字的编码 输出码(字型码): 字模(点阵、向量)

●● ● ●

●●

●●

● ●●●

→ 00010000→ 00010000→ 11111110→ 10010010→ 11111110→ 00010000→ 00010000→ 00010000

● ● ● ●●

●●●

● ● ●●

● ● ●● ● ● ● ● ● ●

●●●

储存这个字型码需要 8×8=64 位二进制,即 8 个字节( 1 字节 =8 位二进制)

Page 12: 文 本 信 息 加 工

补充说明:二进制 一个二进制数的值: 0 1 0 0 1 0 1 0 128 64 32 16 8 4 2 1 所以 01001010=64+8+2=74 单位: bit( 位 ) 、 Byte( 字节 ) : 8b=1B 1KB( 千字节 )=210=1024B 1MB( 兆字节 )=1024KB 1GB( 千兆字节 )=1024MB

Page 13: 文 本 信 息 加 工

汉字的处理过程

以“春”字为例: 1. 从键盘用拼音输入法输入外码“ chun” ; 2. 从外码表中找出与之对应的汉字机内码; 3. 按照“机内码”找到存放字型码的地址; 4. 取出“字型码”在屏幕上显示出来。

键盘输入(输入码)

编码转换(机内码)

编辑与输出(字型码)

Page 14: 文 本 信 息 加 工

一、文字及其处理技术汉字的编码

例:“春”字在计算机中的处理过程。

Page 15: 文 本 信 息 加 工

实践:

  应用 windows 附件中的 TrueType 程序造字。试试吧,手写体、生僻字就不用发愁了。