第九章 数据压缩编码技术与 JPEG 标准

28
多多 多多多多多多多 多多多 多多多多多多多多多 JPEG 多多 9.1 数数数数数数数数数数 9.2 数数数数 9.3 数数数数 9.4 数数数 9.5 数数数数 9.6 数数数数数数数数 JPEG

description

第九章 数据压缩编码技术与 JPEG 标准. 9.1 数据压缩编码技术概述 9.2 预测编码 9.3 变换编码 9.4 统计编码 9.5 其他编码 9.6 静态图像压缩标准 JPEG. 9.1 数据压缩编码技术概述. 9.1.1 信息为什么能压缩 从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不确定的信息,去除确定的信息 ( 可推知的 ) ,也就是用一种更接近信息本质的描述来代替原有冗余的描述。. 图 9-1 连续的几帧画面存在着相似性. 9.1.2 有损压缩与无损压缩 多媒体数据压缩可分为有损压缩和无损压缩两类。 - PowerPoint PPT Presentation

Transcript of 第九章 数据压缩编码技术与 JPEG 标准

Page 1: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

第九章 数据压缩编码技术与 JPEG 标准

9.1 数据压缩编码技术概述

9.2 预测编码

9.3 变换编码

9.4 统计编码

9.5 其他编码

9.6 静态图像压缩标准 JPEG

Page 2: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.1 数据压缩编码技术概述

9.1.1 信息为什么能压缩 从信息论的角度来看,压缩就是去掉信息中的冗余,即保留不

确定的信息,去除确定的信息 ( 可推知的 ) ,也就是用一种更接近信息本质的描述来代替原有冗余的描述。

图 9-1 连续的几帧画面存在着相似性

Page 3: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.1.2 有损压缩与无损压缩 多媒体数据压缩可分为有损压缩和无损压缩两类。 无损压缩算法是为保留原始多媒体对象(包括图像、语音和视

频)而设计的。在无损压缩中,数据在压缩或解压缩过程中不会改变或损失,解压缩产生的数据是对原始对象的完整复制。

当图像的冗余度很少(即同类像素重复性很小)时,用无损压缩技术不能得到可接受的结果,这时就要采用有损压缩。有损压缩会造成一些信息的损失,关键问题是看这种损失对图像质量带来的影响。只要这种损失被限制在允许的范围内,有损压缩就是可接受的。

有损压缩技术主要的应用领域是在影像节目、可视电话会议和多媒体网络这样的由音频、彩色图像和视频组成的多媒体应用中,并且得到了广泛的应用

Page 4: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.1.3 对称压缩和不对称压缩 压缩技术的基本方式有两种:即对称压缩和不对称压缩。

在对称压缩中,压缩的算法和解压缩的算法是一样的。它是一种可逆操作。对称压缩的优点在于双方都以同一种速度进行操作。

另一种压缩技术是不对称压缩,是指压缩和解压缩的运算速率是互不相同的。

Page 5: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.1.4 信息编码技术的发展 1. 经典编码技术 2.“ 第二代”编码方法

9.1.5 图像编码技术的标准化 如果没有一个共同的标准做基础,不同系统间不能兼容,除非

每一编码方法的各个细节完全相同,否则各系统间的联接十分困难。

Page 6: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

图 9-2 数据压缩编码方法的分类

Page 7: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.2 预测编码

9.2.1 预测编码的基本概念 预测编码是数据压缩理论的一个重要分支,它是根据离散信号

之间存在着一定的相关性,利用前面的一个或多个信号对下一信号进行预测,然后对实际值和预测值的差值进行编码。就图像压缩而言,预测编码可分为帧内预测和帧间预测两种类型。

9.2.2 差分脉冲编码 -DPCM DPCM ( Differential Pulse Code Modulation ,差分脉冲

编码调制)与 PCM 不同,它编码的不是采样样本值,而是样本值及其预测值的差分,即量化的是已知的样本值与预测值之间的差值。

Page 8: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

图 9-3 DPCM 工作原理方框图

Page 9: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.2.3 自适应差分脉冲编码 -ADPCM ADPCM 是自适应量化和自适应预测方法的总称。

图 9-4 ADPCM 编码框图

Page 10: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.3 变换编码

9.3.1 变换编码的基本方法 变换编码先对信号进行某种函数变换,从信号的一种表示空间

变换到信号的另一种表示空间,然后在变换后的域上,对变换后的信号进行编码 。

图 9-5 变换编码的工作过程

Page 11: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.3.2 离散余弦变换 离散余弦变换 DCT(Discrete Cosine Transformation)具有快速算法,且易于实现等优点,它的快速算法已可由专用芯片来实现,因而被广泛采用。

图 9-6 JPEG 将源图像划分为若干个子块 , 每个子块包含 8×8 个像素

Page 12: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

图 9-7 一个 8×8 个像素的子块的 DCT

变换

Page 13: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

公式 9-1 的物理意义是:这个变换的基本运算是将信号从一种表达形式(空间域,即图像的像素值)变成另一种等同的表达形式(频率域,即频率系数),并且这种变换过程是可逆的。

如果离散余弦变换是不可逆运算(即从 DCT 系数中恢复原始像素信息),那么这种变换是毫无意义的。事实上,有一个逆离散余弦变换 (IDCT) 公式能够将频率域的数据重新转换为像素值,如公式( 9-2 ) 。

Page 14: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.3.3 小波变换 小波变换是时间 (空间 ) 频率的局部化分析,它通过伸缩平移

运算对信号 (函数 )逐步进行多尺度细化,最终达到高频处时间细分,低频处频率细分,能自动适应时频信号分析的要求,从而可聚焦到信号的任意细节,解决了傅立叶变换的困难问题,成为继傅立叶变换以来在科学方法上的重大突破。

图 9-8 小波压缩效果示例(压缩比 :50:1 )

Page 15: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.4 统计编码

9.4.1 统计编码的基本概念 统计编码又称熵编码,就是利用信源的统计,减少信源所具有

的冗余度而缩短了码长的编码称为熵编码。

统计编码又可分为定长码和变长码。

常用的统计编码有霍夫曼( Huffman )编码、算术编码和行程编码三种。

Page 16: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.4.2 霍夫曼 (Huffman) 编码 霍夫曼压缩算法的编码思想如下:

1. 信源符号按概率递减顺序排列; 2.把两个最小的概率加起来,作为新符号的概率; 3. 重复步骤⑴与⑵,直到概率和等于 1 为止; 4. 完成上述步骤后,再沿路径返回进行编码。

图 9-9 霍夫曼编码过程

Page 17: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.4.4 行程编码 不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色

值,以及具有相同颜色的像素数目即可,或者存储一个像素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程长度编码,用 RLE(Run Length Encoding)表示,具有相同颜色并且是连续的像素数目称为行程长度。

图 9-10 由 1610 个像素组成的小图像

Page 18: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.5 其他编码

9.5.1 LZW 编码 9.5.2 分形编码

图 9-12 Koch 雪花曲线生成过程 图 9-13 用迭代函数产生的分形图形

Page 19: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.6 静态图像压缩标准 JPEG

9.6.1 JPEG 概述 JPEG 算法是一种适用于连续色调、多级灰度、静止图像的数字图像压缩编码方法。 JPEG 是国际上彩色、灰度、静止图像的第一个国际标准,也是一个适用范围广泛的通用标准。它不仅适用于静止图像的压缩,电视图像序列的帧内图像的压缩编码,也常采用 JPEG 压缩方法。

JPEG 压缩分四个步骤实现: 颜色模式转换及采样; DCT 变换; 量化; 编码

Page 20: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用图 9-15 JPEG 的编码与解码步骤

Page 21: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.6.2 颜色模式转换及采样 RGB 色彩模型是我们最常用的表示颜色的方式。 JPEG 采用

的是 YCbCr 色彩系统。这里 Y 代表亮度, Cb 和 Cr 则代表色度、饱和度。

9.6.3 DCT 变换 DCT 变换前后的空间域矩阵( P矩阵)和频率域矩阵( T矩阵)中数值的物理意义及其联系

图 9-16 DCT 变换是将源图像(图 a )的空间域(图 b )变换为频率域(图 c )

Page 22: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.6.3 量化 1. 量化过程

图 9-17 经量化后,源图像(左)与 IDCT 运算后得到的图像(右)会产生一定的失真,失真程度视量化等级而定

Page 23: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

量化的计算公式: 量化值 (i,j) = [T(i,j)/量化矩阵 (i,j)]

在解码过程中,逆量化公式为: T(i,j)=量化值 (i,j) 量化矩阵 (i,j)

Page 24: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

2. JPEG 推荐的量化表

Page 25: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.6.5 编码 1.直流系数( DC )的编码

相邻的子块DC 系数的差值可用公式 表示为:

2.交流系数( AC )编码与 Z 形扫描

1 iii DCDCDC

图 9-18 Z 字型扫描过程

Page 26: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

3.熵编码

源图像质量 文件容量 38384 bytes

高质量压缩 (High quality),文件容量 11331 bytes

Page 27: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

中等质量 (Medium quality),文件容量 6968 bytes

低质量 (Low quality),文件容量为 3687 bytes 的图像质量

图 9-19 JPEG 不同压缩率的图像质量对比 ( 图片来源 NASA)

Page 28: 第九章 数据压缩编码技术与 JPEG 标准

多媒体技术基础与应用

9.6.6 新一代静态图像压缩标准 ---JPEG2000

图 9-20 对图像感兴趣区域进行压缩