基于内容的视频检索系统
-
Upload
eliana-maldonado -
Category
Documents
-
view
62 -
download
0
description
Transcript of 基于内容的视频检索系统
基于内容的视频检索系统
—— 开题答辩
目录 项目背景概要 项目边界 关键问题及难点的分析 项目计划与管理 开发工具及开发模型 系统测试 参考文献
项目背景 随着多媒体技术和网络技术的发展,人们越来
越容易创建和传播数字多媒体产品。传统的视频检索系统主要是基于人工注释的文本检索,但是这种方法明显的存在不足。为了满足如今海量的视频检索需求,基于内容的视频检索技术便应运而生。
项目背景(续) 国内外的发展现状 第一代视频信息检索系统:
项目背景(续) 国内外的发展现状 第二代视频信息检索系统:(基于内容的视频检索) 如 QBIC ( IBM )、 JACOB ( PLERMO 大学)、
Tv-FI (清华大学) K 、 iVideo( 中科院 ) ,基于镜头质心特征向量的视频相似度衡量方法(浙大潘云鹤)
项目概要(开发内容)
我们团队的工作任务就是设计一款基于内容的视频检索软件,该软件可以对多媒体对象的内容以及上下文予以环境进行检索,如针对视频中的图像颜色,纹理,形状,场景镜头的运动等进行检索比对。
待开发的视频检索系统:(核心内容)
项目概要(团队) 项目管理人员:负责软件项目的管理工作,指导老师叶勇 开发人员: 掌握了开发一个产品或应用所需的专门技术,胜任包
括需求分析、设计、编码、测试等各种相关的开发岗位
黄芳芳、时佳楠、郑海宏、武彦杰
小组的组织形式 层次式小组(介于搞结构化和松散结构两者之间)
项目边界 项目名称:基于内容的视频检索系统 项目用途:针对有关足球比赛这一范畴内
的特定视频信息检索 视频格式: MPEG-7 视频长度: 90MIN 信息检索分类: 1. 射门 2. 边界球 3. 角球 4. 任意球
项目边界 检索系统的基本结构
关键问题及难点分析关键问题: 特征数据库的形成阶段 1. 镜头分割 2. 关键帧提取 3. 特征提取
关键问题及难点分析(续) 难点处理
1. 镜头分割 首先使用 DirectShow 将视频划分为若干个帧。 镜头分割方法:基于彩色直方图的分割。 有若干种方法,选取直方图帧差法 (B2B)
其中 N 为像素总数, Fd 大于某一值时,可定位分割点
x
jid xhxhNF |)()(|)2/1(
关键问题及难点分析(续) 难点处理
2. 关键帧提取 直方图平均值法 基于镜头方法 基于内容分析方法 基于运动分析的方法系统采用基于内容分析方法定义两幅图像 fi 和 fj 的帧差为:
通过比较两个候选帧距离 D(fi,fj)与预定阀值 T 的大小关系,可以确定关键帧
yx
jiji yxfyxfffD,
|),(),(|),(
关键问题及难点分析(续) 难点处理
3. 特征提取 可以由MEPG-7 的视频格式特性来提取出相关特征(如颜色,
纹理,形状等)来建立特征索引
4. 建立索引 该系统采用 Hash 索引作为视频数据库的索引方式 有点:迅速,准确的检索出其属性值与查询所指定的属性值相
一致的记录集合。 如:射门,角球等。 映射规则: F(x) = x mod N N 为哈希表的桶数, x 为属性值,可用数字形式表示
项目计划与管理 项目分解 目的:明确项目所包含的各项工作; 项目分解的结果就是 WBS 图
基于内容的视频检索
系统
开题报告
系统分析
系统设计
系统开发
系统测试
问题界定
关键技术
计划进度
需求分析
概要设计
详细设计 编码
项目人员 项目管理人员:负责软件项目的管理工作,指导老师叶勇 开发人员:掌握了开发一个产品或应用所需的专门技术,胜任包括需求分
析、设计、编码、测试等各种相关的开发岗位 黄芳芳、时佳楠、郑海宏、武彦杰
小组的组织形式 层次式小组(介于搞结构化和松散结构两者之间)
项目计划与管理(续)
项目计划与管理(续) 进度估算 目标:确保软件项目在规定时间内按期完成,本小组采用甘特图来建立项目进度表
项目计划与管理(续) 分工问题
开题报告:时佳楠、武彦杰、黄芳芳
需求分析:郑海宏、黄芳芳、武彦杰
概要设计:郑海宏、黄芳芳、时佳楠
详细设计:武彦杰、时佳楠、黄芳芳
编码实现:武彦杰、郑海宏、时佳楠
系统测试:时佳楠、武彦杰
质量管理:黄芳芳、郑海宏
项目计划与管理(续) 质量管理 考虑到要在预算和进度范围内交付,因此在项目进
行过程中要对偏差进行控制
质量控制 采用技术手段保证软件质量 组织技术评审 加强软件测试
质量保证 软件评审在软件工程过程的每个活动的后期进行 两个主要的评审活动:项目管理评审和技术评审
平台及工具平台及工具 应用环境: Microsoft Window XP
设计环境: Microsoft Visual Studio 2008
设计语言: C++
数据库工具: MySQL
使用工具: DirectShow ( DirectX SDK9. 0 ) OCR 软件
测试工具: Rational Robot
Rational Purify
由于视频流大多是以压缩格式存在的视频文件,如 MPEG 、 AVI 等,因此工作的第一步就是要实时地捕获视频帧。微软公司已经提供了完整的解决方案,它所提供的 DirectShow 工具可在多种格式的视频流中获得完整的帧数据。
利用 OCR 软件,实现视频流中的文字识别。
开发模型: 瀑布模型
系统测试 1. 以单元测试为主。 主要以基本算法为单位。一个关键性算法为一
个测试单元进行白盒测试。
2. 功能测试以黑盒测试为主。编写测试用例进行功能测试。
关键帧特征提取 基于关键帧特征检索
参考文献 寿航军 .基于内容的视频检索系统研究与设计 . 西安电子科技大学硕士学位论文 徐丹 .基于内容的视频检索系统研究 .武汉理工大学硕士学位论文 刘伟 .基于内容的视频检索系统的研究与实现 . 北京交通大学专业硕士学位论文 贾庆萍 .视频镜头分割技术与基于内容的视频检索系统研究 .山东大学硕士学位论
文 肖明 .基于内容的多媒体信息索引与检索概论 .人民邮电出版社 ,2009 冯大淦 ,萧允治 ,张宏江 .多媒体信息检索与管理 .清华大学出版社 ,2009.11 张洪德 .基于内容的视频检索技术研究.国防科学技术大学硕士学位论文 ,2002 罗凤玲 .视频检索中的特征提取方法研究.国防科学技术大学硕士学位论文 ,2002 章毓晋 .基于内容的视觉信息检索 .科学出版社 ,2003