Distinctive Image Features from Scale-Invariant Keypoints

26
Distinctive Image Features from Scale- Invariant Keypoints DAVID G.LOWE 报报报 1

description

Distinctive Image Features from Scale-Invariant Keypoints. DAVID G.LOWE 报告人 : 张. CONTENTS. 1 引言 2 相关研究 3 尺度空间极值的检测 4 准确的关键点的定位 5 定向任务 6 局部图像描述子 7 目标识别的应用 8 识别实例 9 结论. 1 SIFT 综述 尺度不变特征转换( SIFT )是一种电脑视觉的算法,用来侦测与描述影像中局部特征。它在尺度空间中寻找极值点,并且提取其位置、尺度、旋转不变量。 2 SIFT 的特点 - PowerPoint PPT Presentation

Transcript of Distinctive Image Features from Scale-Invariant Keypoints

Page 1: Distinctive Image Features from Scale-Invariant  Keypoints

1

Distinctive Image Features from Scale-Invariant Keypoints

DAVID G.LOWE报告人:张

Page 2: Distinctive Image Features from Scale-Invariant  Keypoints

2

CONTENTS• 1 引言• 2 相关研究• 3 尺度空间极值的检测 • 4 准确的关键点的定位• 5 定向任务• 6 局部图像描述子• 7 目标识别的应用• 8 识别实例• 9 结论

Page 3: Distinctive Image Features from Scale-Invariant  Keypoints

3

• 1 SIFT综述• 尺度不变特征转换( SIFT )是一种电脑视

觉的算法,用来侦测与描述影像中局部特征。它在尺度空间中寻找极值点,并且提取其位置、尺度、旋转不变量。

• 2 SIFT的特点• 稳定性 独特性 多量性 • 高速性 可扩展性

Page 4: Distinctive Image Features from Scale-Invariant  Keypoints

4

SIFT 算法的主要步骤• 1 检测尺度空间的极值• 2 精确定位极值点• 3 为每个极值点指定参数方向(定向任务)• 4 关键点描述子的生成

Page 5: Distinctive Image Features from Scale-Invariant  Keypoints

5

Ⅰ.尺度空间的极值检测• 尺度空间理论:• 1 引入一个被视为尺度的参数

• 2 变化参数得到多尺度的图像表示序列

• 3 对这些尺度图像的序列进行尺度空间的主轮廓的提取

Page 6: Distinctive Image Features from Scale-Invariant  Keypoints

6

图像的尺度空间表示• 一副二维图像,在不同尺度下的尺度空间

表示可由图像与高斯核卷积得到:

• 式中, 代表图像的像素位置, 代表图像的尺度空间, 为尺度空间因子,其值越小则表征被平滑的越少,相应的尺度也就越小。同时大尺度对应于图像的概貌特征,小尺度对应于图像的细节特征。

),(*),,(,,( yxIyxGyxL

),( yx L

Page 7: Distinctive Image Features from Scale-Invariant  Keypoints

7

• 高斯卷积核是实现尺度变换的唯一线性核,其定义如下:

• 其中, 是空间坐标, 代表高斯正态分布的方差,亦即尺度坐标(在尺度空间中)。

2 2 2( )/22

1( , , )

2x yG x y e

),( yx

Page 8: Distinctive Image Features from Scale-Invariant  Keypoints

8

两个金字塔的引入• 要实现极值的检测要引入两个金字塔(形

象化的表示,算法中为了便于理解):1 建立高斯金字塔2 生成 DOG 金字塔( Difference-of-Gaussian )

• 高斯金字塔的构建:对图像做不同尺度的高斯模糊(平滑);对图像做降采样(隔点采样)

Page 9: Distinctive Image Features from Scale-Invariant  Keypoints

9

Page 10: Distinctive Image Features from Scale-Invariant  Keypoints

10

1.高斯金字塔有 O组(阶 ),每一阶有 S层尺度图像

2.Lowe 的文章中每组有s+3层图像将原始图像隔点采样生成下一组尺度空间。

Page 11: Distinctive Image Features from Scale-Invariant  Keypoints

11

• DOG金字塔的构建:• 为了有效提取稳定的关键点,利用不同尺

度的高斯差分核与图像卷积生成。

),,(),,(

),(*)),,(),,((),,(

yxLkyxL

yxIyxGkyxGyxD

Page 12: Distinctive Image Features from Scale-Invariant  Keypoints

12

•将每一组尺度空间中的相邻高斯尺度函数相减,生成高斯差分金字塔。

Page 13: Distinctive Image Features from Scale-Invariant  Keypoints

13

a 是第二组的第一层图像由第一组的的最后第二层图像隔点采样得到。 b是通过相邻高斯尺度空间图像相减得到。

a

b

Page 14: Distinctive Image Features from Scale-Invariant  Keypoints

14

相关的极值检测• 作为加快理解的两个金字塔相关背景介绍

完毕,下面提出的是关于极值检测的方法,极值的检测操作是基于第二个金字塔的,与第一个金字塔没有直接关系,并且搜索的基本原理我认为与 harris 的角点检测是十分接近的,其原理如下图:

Page 15: Distinctive Image Features from Scale-Invariant  Keypoints

15

图示如下

极值点的搜索是通过同一组内 DOG 相邻层之间比较完成的 .

为了寻找尺度空间的极值点,每一个采样点都要和它所有的相邻点比较,以确保在尺度空间和二维图像空间都检测到极值点。

Page 16: Distinctive Image Features from Scale-Invariant  Keypoints

16

Ⅱ. 关键点的精确定位• 通过拟合三维二次函数以精确确定关键点的位

置,同时去除低对比度的关键点和不稳定的边缘响应点(因为 DOG 算子会产生较强的边缘响应)以增强匹配稳定性、提高抗噪声能力。

• 在关键点处用泰勒展开式得到:

• 式中 为关键点的偏移量 , 是 在关键点处的值。

XX

DXX

X

DDXD T

T

2

2

2

1)(

TyxX ),,( D ),,( yxD

Page 17: Distinctive Image Features from Scale-Invariant  Keypoints

17

• 求导让上方程等于 0 ,可以得到极值点为:

• 如果 (相对于插值中心点的偏移量)在任一方向(一共 3 维)上的偏移大于 0.5 时,就意味着该关键点与另一采样点(检测点)非常接近,这样的点就要删除。

XX

DDX

2

12

X

Page 18: Distinctive Image Features from Scale-Invariant  Keypoints

18

• 为了增强匹配的稳定性,需要删除低对比度的点。将上求出的极值点代入原方程求出 的极值:

可以用来衡量特征点的对比度,如果 则 为不稳定的特征点,应当删除。 的经验值为 0.03 。

)(XD

XX X

DDD

T

2

1)(

XD

)(XD X

Page 19: Distinctive Image Features from Scale-Invariant  Keypoints

19

• 因为 DOG 算子会产生较强的边缘响应,所以应去除低对比度的边缘响应点,以增强匹配的稳定性,提高抗噪声能力。一个平坦的 DOG 响应峰值往往在在横跨边缘的地方有较大的主曲率,而在垂直边缘的方向有较小的主曲率。

• 主曲率通过一个 2*2 的 Hessian矩阵 求出:H

yyxy

xyxx

DD

DDH

Page 20: Distinctive Image Features from Scale-Invariant  Keypoints

20

• 导数 通过相邻采样点的差值计算。 的主曲率和 的特征值成正比,

• 令 , 为最大,最小特征值,则

• 令 为最大特征值与最小特征值的比值,则

D DH

2)()(

)(

xyyyxx

yyxx

DDDHDet

DDHtr

2

2

222 )1()()(

)(

)(

HDet

Htr

Page 21: Distinctive Image Features from Scale-Invariant  Keypoints

21

• 为了检测主曲率是否在某阈值 下,只需检测

• 的经验值为 10 。

22 )1(

)(

)(

HDet

Htr

Page 22: Distinctive Image Features from Scale-Invariant  Keypoints

22

Ⅲ. 确定关键点的主方向• 为了实现图像的实现旋转不变性,需要根据检测到的特征点局部图像结构求得一个方向基准。用图像梯度的方法求取该局部结构的稳定方向。对于已检测到的特征点,我们已经知道该特征点的尺度值 ,因此根据这一尺度值,得到接近这一尺度值的高斯图像。

Page 23: Distinctive Image Features from Scale-Invariant  Keypoints

23

• 上式中, 和 分别为高斯金字塔 处梯度的大小和方向, 所用到的尺度为每个关键点所在的尺度。

),(*),,(,,( yxIyxGyxL

)1,()1,(

),1(),1(arctan),(

))1,()1,(()),1(),1((),( 22

yxLyxL

yxLyxLyx

yxLyxLyxLyxLyxm

),( yxm yx, yx,L

Page 24: Distinctive Image Features from Scale-Invariant  Keypoints

24

• 以关键点为中心的邻域窗口内采样,并用直方图统计邻域像素的梯度方向。梯度直方图的范围是 0~360 度,其中,每 10 度一个柱,共 36 个柱。直方图的主峰值(最大峰值)代表了关键点处邻域梯度的主方向,即关键点的主方向。

• 至此,图像的关键点已检测完毕,每个关键点有三个信息:

• 位置、所处尺度、方向。

Page 25: Distinctive Image Features from Scale-Invariant  Keypoints

25

Ⅳ. 生成 sift 特征描述算子• 首先,将坐标轴旋转到关键点的主方向。只有以主方向为零点方向来描述关键点才能使其具有旋转不变性。

• 其次,以关键点为中心取 8*8的窗口。进而计算每个 4*4的小块上计算 8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点。每个种子点有 8个方向向量信息。

Page 26: Distinctive Image Features from Scale-Invariant  Keypoints

26

• 为了增强匹配的稳健性, Lowe 建议对每个关键点可使用 4*4共 16 个种子点来描述,这样对于一个关键点就可以产生 128 个数据,即最终形成 128 维的 sift 特征矢量。

• 此时 sift 特征向量已经去除了尺度变化、旋转等几何变形因素的影响,再继续将特征向量的长度归一化,则可以进一步去除光照变化的影响