分类筛选
分类筛选:

关于相似度自考开题报告范文 和基于跨媒体相关模型的相似度融合图像标注方面论文例文

版权:原创标记原创 主题:相似度范文 类别:毕业论文 2024-03-19

《基于跨媒体相关模型的相似度融合图像标注》

本文是关于相似度论文范文例文与跨媒体和图像和标注类自考开题报告范文。

摘 要:针对图像自动标注领域存在的语义鸿沟,本文提出一种基于跨媒体相关模型的相似度融合图像标注算法.提出算法对图像分块进行聚类操作,采用跨媒体相关模型形成图像本地标签概率候选集;然后对标注图像采用固定网格划分提取颜色直方图,与训练集颜色特征库构建直方图似然矩阵;最后通过文本标签概率和颜色直方图似然权重构造整体似然函数,实现图像的自动标注.在Corel图像数据集进行标注模型的训练和图像的标注.实验结果表明,对比几种前沿的标注方法,本文获得了良好的性能.

关键词:图像自动标注;相似度;颜色直方图;跨媒体相关模型

一、前言

图像自动标注就是计算机系统根据已标注图像和对应标签的关系,预测未标注图像对应的标签并标注图像.但由于存在语义鸿沟,视觉特征相似的图像很可能在语义上是不相关的.为了获得语义相关的检索结果,同时避免大量的手工标注,图像自动标注成为目前关键的具有挑战性的课题[1,2].Duygulu 等[3]将对象识别模型描述为机器翻译,在这个模型中,图像被分割成区域,这些区域使用各种特征被分类为区域类型;然后使用基于EM[4] 的方法来学习与图像一起提供的区域类型和关键字之间的映射.Jeon 等人[5] 提出的跨媒体相关模型(cross-mediarelevance model,简称CMRM) 也采用分割区域来表示图像,但与翻译模型不同,它并不认为图像的关键词和区域之间是一对一的对应关系,而是通过学习关键词和区域的联合概率分布为整幅图像标注若干关键词,但是CMRM 需要将图像的特征进行聚类,标注的质量将在很大程度上受限于聚类的好坏.Lrenko等人[6] 随后提出类似的连续空间相关模型(continuous-spacerelevance model,简称CRM).李志欣等[7] 在PLSA 模型和PLSAWORDS模型的基础上提出了PLSA-FUSION 标注方法,该方法分别从文本模态和视觉模态中学习两组潜在主题并融合为一个潜在主题空间,并使用BOW 模型对不同的特征进行集成,但图像特征数据在量化过程中仍会丢失重要信息,从而影响图像标注和检索的性能.为了解决上述遇到的问题,本文提出了一种基于跨媒体相关模型的相似度融合图像标注算法.

二、跨媒体相关模型

3.1.2 余弦相似度

余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小.相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上.其公式如下:

与欧几里德距离类似,基于余弦相似度的计算方法也是把图像的n- 维坐标系中的一个点,通过连接这个点与坐标系的原点构成一条直线(向量),两个数据之间的相似度值就是两条直线(向量)间夹角的余弦值.在三角系数中,角的余弦值是在[-1, 1]之间的,0度角的余弦值是1,180度角的余弦值是-1.借助三维坐标系来看下欧氏距离和余弦相似度的区别:

从图上可以看出距离度量衡量的是空间各点间的绝对距离,跟各个点所在的位置坐标(即个体特征维度的数值)直接相关;而余弦相似度衡量的是空间向量的夹角,更加的是体现在方向上的差异,而不是位置.如果保持A 点的位置不变,B点朝原方向远离坐标轴原点,那么这个时候余弦相似度cos 是保持不变的,因为夹角不变,而A、B 两点的距离显然在发生改变,这就是欧氏距离和余弦相似度的不同之处.

3.2 直方图匹配

直方图匹配,分别计算两幅待匹配图像的直方图,然后计算两个直方图的归一化相关系数(巴氏距离,直方图相交距离)等等.这种思想是基于简单的数学上的向量之间的差异来进行图像相似程度的度量,这种方法是目前用的比较多的一种方法,直方图能够很好的归一化,比如通常的256 个bin 条的.那么两幅分辨率不同的图像可以直接通过计算直方图来计算相似度很方便,而且计算量比较小.

四、融合图像相似度的图像语义标注

为了弥补CMRM 标注模型的堆特征聚类效果的过分依赖,本文采用欧式距离算法计算图像颜色特征之间相似度,生成一个权重融入CMRM 标注模型中,提高了图像标注的质量.

具体算法步骤如下:

1. 对于训练图像集I,进行固定网格划分,提取颜色特征直方图,生成颜色特征库histDB;

2. 对于待标注图像m,进行固定网格划分,提取颜色特征直方图histm;

3. 利用公式(1)计算histm 和histDB 之间的相似度,对相似度进行归一化处理,生成一个相似度矩阵A;

4. 取矩阵A 中相似度大于0 的图片,然后统计已标注图像关键字与关键词字典进行比对,分别统计每个关键字个数记为N,利用下式

五、实验结果及分析

本文在Corel5K 图像集上进行仿真实验,Corel5k 图像库分为三个部分:训练集4000 张图片(用于训练模型),验证集500 张图片(用于确定最优参数),测试集500 张图片(用于评价算法的性能).验证集和训练集合并起来组成新的含有4500 张图片的训练集.该图像库中的每幅图片都被标注了1~5个关键词,其中在训练集总共用到了374 个关键词,在测试集中总共用到了260 个关键词.

5.2 评价标准.图像标注的评价标准为精度precision 和召回率recall.对于一个给定的语义关键词w,

precision(w)等于B/A

recall(w)等于B/C

其中,A 表示所有自动标注了关键词w 的图像个数,B 表示正确标注了关键词w 的图像个数,C 表示原始标注中包含关键词w 的图像个数.本文采用所有标注词的平均精度和平均召回率评价图像的标注性能.

5.3 实验分析

六、结语

本文提出了一种基于跨媒体相关模型的相似度融合图像标注算法,在很大程度上提高了图像标注质量.但是本模型对特征的提取方法比较单一,接下来的工作是利用多种特征融合,进一步优化本模型.

相似度论文参考资料:

小结:此文为一篇关于跨媒体和图像和标注方面的相似度论文题目、论文提纲、相似度论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

相关免费毕业论文范文

热门有关优秀论文题目选题

和你相关的