期刊58网
关于我们论文发表发表论文流程职称论文发表常见问题职称论文发表信用说明 职称论文发表价格职称论文发表联系我们
网站首页关于我们论文发表发表流程常见问题付款方式 联系我们评审政策
发表论文范文论文范文
期刊加盟期刊加盟
论文分类论文分类
论文投稿
论文投稿
 当前位置您现在的位置:首页 >> 发表论文 >> 艺术论文 >>

图像设计论文范文2篇

发布时间:2017-10-09 09:29 本文地址:http://www.qikan58.com/Info-detail-23838.html 来源:期刊58网 点击数:781

基于SIFT特征点改进聚类的图像检索方法研究

张磊磊 陈丽芳

摘 要:由于SIFT特征点能对图像局部特征进行合理、精确描述,有效使用SIFT特征点实现基于内容的图像检索成为当前计算机视觉领域中的热点问题。针对该问题,提出一种基于SIFT特征点的改进聚类的图像检索新方法。该方法包括图像颜色转换、特征点改进聚类算法,以及基于该算法的更有效的灰度直方图构建方法。与现有基于流光法的检索方法相比,该方法能有效解决聚类后特征点分组不确定和依赖特征点颜色信息和空间信息权重的问题。从公共图像库上的实验结果可以看出,该方法与现有方法相比具有较高的检索精度。

关键词:图像检索;SIFT特征点;聚类算法

DOI:10.11907/rjdk.171512

中图分类号:TP317.4 文献标识码:A 文章编号:1672-7800(2017)009-0188-04

Abstract:Because SIFT feature points can represent the local feature of images effectively and accurately, how to realize content-based image retrieval by SIFT feature points is a hot issue in the computer vision. So, a novel image retrieval method based on the improvement combinatorial clustering of SIFT feature points is proposed. The proposed method consists of image color space transformation, improvement combinatorial clustering algorithm of SIFT feature points and effective local color histogram building approach. Compared with existing methods based on FLOW feature points and local color histogram, the proposed method can solve the problem that uncertain sets of feature points after clustering and existing methods are sensitive to the weight of position and the color of feature points. According to experimental results on public image database, it can be seen that the proposed method is more effective than existing methods.

Key Words:content-based image retrieval; SIFT feature points; improvement combinatorial clustering

0 引言

基于內容的图像检索一直是计算机视觉领域的研究热点[1-2],其实现主要是通过抽取图像特征来表示图像内容,通过计算特征间的相似性来表示两幅图像是否相似,从而找出与检索条件最为相似的图像。近年来,基于特征点的局部特征能有效描述图像内容[4],因此被广泛应用于图像检索中。

在已有特征点的基础上,再通过局部颜色直方图,既可实现对像素点颜色进行取值统计,又不会忽略像素点的空间分布特征。基于特征点组合聚类图像检索方法的主要思想是根据视频流光算法或者SIFT算法得到图像的特征点;然后根据聚类的思想[3]对特征点的颜色和空间位置进行聚类分组,得到一系列特征点集合;每个集合构建一个局部颜色直方图,通过计算局部颜色直方图之间的距离来表示图像间的相似性[4]。虽然这种方法具有一定的有效性,但仍存在以下问题:①图像特征点聚类分组依赖像素点的颜色信息和空间信息,颜色信息和空间信息权重对结果的影响很大;②图像特征点聚类后特征点分组结果不确定,计算图像的相似度时影响比较大;③计算图像相似性时,局部直方图的距离算法没有充分考虑特征点分组后的空间信息;④在聚类和匹配过程中没有对算法进行优化,匹配速度较慢。

针对上述存在的一些问题,本文基于SIFT特征点的空间信息聚类方法,在聚类时不用考虑颜色信息和空间信息的权重问题,而且匹配结果是确定的。计算图像相似性时,充分考虑分组后直方图的空间信息,同时对聚类和局部灰度直方图匹配算法进行了一定的优化。实验结果表明,本文方法具有一定的有效性和速度优势。

1 基于SIFT特征点改进聚类的检索方法

SIFT算法由DAVID G L于1999年提出[5],并于2004年进行了发展和完善[6],MIKOLAJCZYK[7]对多种描述子进行实验分析,结果证实了当图像进行旋转、平移、尺度缩放、仿射变换时,SIFT特征具有很好的稳定性和鲁棒性。

基于SIFT特征点改进聚类的检索方法包含5个步骤:①图像颜色转换;②使用SIFT算法提取图像的特征点;③使用改进聚类算法将特征点进行分组;④统计每个分组特征点的灰度值,构建一个灰度直方图,该直方图为图像的局部灰度直方图;⑤根据直方图计算图像之间的距离,返回匹配结果。

1.1 颜色转换

颜色是检索系统中最常用的图像特征。颜色表示模型有很多种,数字图像一般使用RGB表示模型存储其二进制数据,其可分辨色差是非线性的。HSV颜色表示模型是基于人眼对色彩的识别,是一种从视觉角度定义的颜色表示模型。本文在特征点提取之前,首先将图像从RGB模型转为HSV模型。endprint

HSV颜色模型中,H表示色调,S表示饱和度,V表示亮度。RGB颜色表示模型与HSV颜色表示模型之间的转换公式如下:T=arccos(R-G)+(R-B)2(R-G)2+4(R-B)(R-G)

H=T,B≤G

2π-T,B>G

S=max(R,G,B)-min(R,G,B)max(R,G,B)

V=max(R,G,B)255 其中,R,G,B∈[0~255],由公式得到H、S、V的值,H∈[0~360],S∈[0~1],V∈[0~1]。按照上式转换图片颜色模型。

1.2 图像特征點提取

图片颜色转换之后,使用SIFT算法提取图像的特征点。传统SIFT算法主要分为4个步骤:①检测尺度空间极值点;②精确定位极值点;③为每个关键点指定方向参数;④关键点描述子的生成。

SIFT特征点提取时使用OpenCV库中的SIFT算法对图片进行处理,得到特征点后使用聚类算法进行分组。

1.3 改进的聚类算法

传统聚类算法步骤如下:

输入:聚类对象集合A={a1,a2,…,an},其中每个对象ai由m个特征向量表示,ai=(v1i,v2i,…,vmi);簇中心数目k(k

输出:k个簇中心。

流程如下:

(1)给出k个初始的簇中心与算法迭代次数的变量t:c1=d1,c2=d2,…,ck=dk

t=0 (2)计算A中每个对象到各簇中心的距离。若ai=(1≤i≤n)与cj(1≤j≤k)的距离值最小,则ai属于第j个簇。

(3)一轮分簇结束后,再计算簇中心,记录k个新的簇中心。

(4)t=t+1,若t

(5)新旧簇中心二者比较,若不相同返回步骤(2);若相同则算法收敛,算法结束。

传统聚类算法中,初始簇中心是随机选取的,同一个图片特征点在两次聚类后,特征点分组情况是不同的,如图1所示,结果导致最后的检索查全率和查准率不稳定。

针对以上问题,本文方法中,提出了确定聚类初始簇中心的新方法。

计算集合A的中心点,即平均值cm;集合对象A中距离cm最远的对象d1为第一个初始簇中心c1;集合对象中距离c1最远的对象d2为第二个初始簇中心c2;集合对象中距离c1和c2的中心点最远的对象d3为第三个初始簇中心c3;重复上一步直至找到第k个初始簇中心ck。

对特征点进行聚类时,使用像素点的位置信息,若pi表示第i个特征点,有:pi=(xi,yi) 其中,xi,yi表示pi的位置信息。

若聚类对象ai和第j类中心cj分别为ai=(v1i,v2i)和cj=(v1j,v2j),则二者的欧氏距离为:d(ai,cj)=(v1i-v1j)2+(v1j-v2j)2 分组时,本文方法的好处是每次初始化簇的中心是确定的,分类之后的结果是唯一的,图像检索的结果是确定的,而且避免了聚类后结果匹配的不确定性。同时,本文方法计算特征点距离时只考虑空间信息,避免检索结果对权重的依赖。本文算法对同一个图片聚类后结果如图2所示,这说明基于改进聚类算法的检索方法可以克服现有方法中存在的问题。

1.4 相似度计算方法

当一幅图像表示为多个局部颜色直方图时,图像间相似性的计算过程为:计算对应的两个直方图之间的距离,再将多个距离值进行相加,距离值的总和即可用来表示两幅图像间的相似性,该值越小,图像间的相似性越小。

在文献[4]流光子算法特征点组合聚类算法中,通过计算局部灰度直方图之间的欧氏距离,若两个直方图之间的距离最小,则二者存在对应关系。将所有具有两两对应关系的直方图间的距离进行累加,最终得到两个图像间的距离,以此表示两幅图像的相似性,值越小,相似度越大。然而计算过程中会出现一幅图像里多个局部灰度直方图匹配另一个图像里一个局部灰度直方图的情况。如图3所示,在两幅图为不同类别的情况下,由于没有充分考虑局部灰度直方图的空间信息,在计算图像相似性时,局部灰度直方图会发生局部匹配,一部分局部直方图没有参加匹配,导致错误的匹配结果。

为解决这一问题,在本文方法中,使用改进的图像距离计算算法。假设待检索图像与库中的一幅图像可以分别表示为两个直方图的集合:Hi=(h1i,h2i,…,hni)和Hj=(h1j,h2j,…,hnj) 则二者间距离:

d1为Hi和Hj里直方图间欧氏距离最小值,去掉集合中两个匹配最小值的直方图,得到两个新的直方图集合H1i和H1j;d2为H1i和H1j里直方图间欧氏距离最小值,去掉两个匹配最小值的直方图,得到两个新的直方图集合H2i和H2j;重复上述步骤最终得到dn;累加直方图距离得到图像距离D:D=d1+d2+…+dn 图4为从图片库中选择一幅图使用文献[4]中的图像距离计算方法匹配后的结果。由于没有充分考虑图像局部灰度直方图之间的空间信息,匹配结果中出现了错误的匹配。

图5为本文方法检索后返回的前十幅图的结果,由于充分考虑了图像的局部灰度直方图之间的空间信息,较文献[4]中方法,本文方法更具有效性。

1.5 算法优化

图像匹配过程主要分为前期图像预处理和后期图像距离计算并返回结果两部分。前期图像预处理主要包括SIFT特征点提取和特征点聚类分组,后期匹配结果使用K近邻算法返回前K个距离最小的有效值。

针对以上情况,主要从以下两方面进行算法优化:①SIFT特征点提取时,只计算特征点的坐标值,忽略特征点描述信息的计算;②聚类算法和K近邻算法中排序算法占了很大一部分,基于此,提出改进的二分法插入排序算法。

传统二分法插入排序在插入第i个元素时,对前面的0~i-1元素进行折半,先与它们中间的那个元素相比,如果小,则对前半再进行折半,否则对后半进行折半,直到left>right,然后将第i个元素前1位与目标位置之间的所有元素后移,再把第i个元素放在目标位置上。

本文提出的二分插入排序算法是:①在第j个元素成功插入后记录其在有序数组中的位置lj,其中left≤lj≤right;②插入第j+1个元素时,先与第j个元素比较大小;如果小,使right=lj;如果大,使left=lj;③如果right≥left,在left和right之间继续二分查找,否则找到元素待插入位置lj+1;④将lj+1以及后面的元素向后依次移位,将第j+1个元素插入该位置。

通过以上两部分算法优化,可以减少不必要的计算步骤,能够有效提高匹配速度。

2 实验结果对比

为了验证本文方法的有效性,在公共图像库上分别用流光法算法和本文算法来实现图像检索,通过检索结果的比较来验证本文方法的优越性。实验中,所选公共图像库为Simplicity系统评测时所采用的图像库[8],该图像库包含了取自Corel图像库的1 000幅图像,这些图像来自不同的10个类别,本文为了客观地对两种检索方法进行对比,将图像库中的每一幅图像都作为检索条件,执行一次检索过程,最后统计1 000次检索后的平均检索精度。

整个实验包括两个部分,其中第一部分是比较两种检索方法的平均性能,第二部分比较每一类的检索性能。

实验1 两种检索方法的性能比较

在该部分实验中,每幅图先用SIFT算法提取图像的特征点,然后特征点通过改进聚类算法分配到3个集合中。图像检索结果中,排序靠前的图像往往被视为有效结果。实验中,分别将返回图像的前十到前五十位作为有效检索结果,并计算检索精度来进行性能评价。假设有效结果数目为N,其中正确结果数目为Ne,则检索精度P为:P=(NeN)×100% 如图6所示,基于SIFT特征点改进聚类的平均性能最优,原因在于该算法对特征点的分组更加合理有效。而且本文匹配正確率随着检索结果数量的增加而比较稳定,表明本文对图像间的距离计算方法更合理有效。

实验2 每一类图像的检索性能

利用改进聚类方法对特征点分簇时,只考虑了特征点的空间信息。针对TOP10结果计算检索精度,每类图像所对应的检索精度平均值由表1给出。其中,F-MAX为文献[4]中每类匹配的最大值,F-MEAN为文献[4]中每类匹配的平均值。不难看出,针对大多数类别而言,在使用SIFT算法提取特征点时,仅考虑空间信息时,其平均搜索精度优于使用流光子算法。避免了文献中既要考虑空间信息又要考虑颜色信息,并且检索结果依赖于空间信息和颜色信息之间的权重。

实验二的结果验证了基于SIFT特征点改进聚类的方法中,聚类分组时使用SIFT特征点的空间信息在图像检索中仍然具较好的有效性。为了进一步提高检索性能,适当使用特征点的其它描述信息值得进一步研究。

实验3 检索速度比较

算法优化之前,由于前期SIFT特征点提取与聚类分组和后期匹配的影响,从检索开始到返回结果,耗费时间太长,用户体验较差。

在原来算法基础上通过改良SIFT特征点提取算法和改进的二分插入排序算法。图7结果表明,在不影响匹配正确率的情况下,能有效提高检索速度。

3 结语

基于SIFT特征点改进聚类的图像检索方法,是一种以局部颜色直方图作为图像特征的检索方法。与文献[4]相比,该方法包含3个创新点:①使用SIFT特征点代替流光子特征点;②使用改进的聚类算法;③使用改进的图像局部直方图距离算法;④对匹配过程中算法进行了一定的优化。

本文在公共图像库上进行了实验验证分析,从最终结果的对比分析可以看出,仅仅以局部颜色直方图作为图像特征时,本文方法在检索正确率和检索速度方面要优于现有方法。

在后续研究工作中,为了进一步提高检索性能,可以考虑使用特征点的其它描述信息,并且,在不影响检索性能的情况下,重点考虑进一步提高检索速度。

参考文献:

[1] SMEULDERS A, WORRING M, SANTINI S, et al. Content-based image retrieval at the end of the early years [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2000,22(12):1349-1380.

[2] LEW M S, SEBE N, DJERABA C, et al. Content-based multimedia information retrieval: state of the art and challenges[J]. ACM Transactions on Multimedia Computing, Communications and Applications,2006,2(1):1-19.

[3] 孙吉贵,刘杰,赵连宇.聚类算法的研究[J].软件学报,2008,19(1):48-61.

[4] 齐恒,李克秋,申彦明,等.基于特征点组合聚类的图像检索新方法[J].大连理工大学学报,2014(4):477-481.

[5] DAVID G L. Object recognition from local scale-invarint features[C]. International Conference on Computer Vision,1999:1150-1157.

[6] DAVID G L. Distinctive image features from scale-invariant key-points[J]. International Journal of Computer Vision,2004,60(2):91-110.

[7] MIKOLAJCZYK K, SCHMID C. A performance evaluation of local descriptors [J].IEEE Transactions on Pattern Analysis,2008.

[8] WANG J Z, LI JIA, WIEDERHOLD G. SIMPLIcity: semantics-sensitive integrated matching for picture libraries[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2001,23(9):947-963.

一种自适应变换在图像编码上的应用

林文浩

摘 要:为节省有限的存储资源及传输带宽,高效的图像编码方案尤为重要。KLT是Karhunen-Loeve Transform的缩写,具有最理想的能量聚集特性,变换核基于源数据统计特性计算得出,可以适应图像多样性。JPEG 全称Joint Photographic Experts Group(联合图像专家小组),是第一个国际图像压缩标准,因其高效的编码性能且易于实现而被广泛应用。JPEG图像变换编码采用DCT(Discrete Cosine Transform)。DCT是固定核,不适应图像的多样性,在图像编码上有一定局限性。为此,提出了一种更为有效的变换方法——KLT与DCT自适应变换,有效利用了图像的统计特性,提高了编码性能。经验证,该方法比主流的JPEG图像编码标准性能提高3.1%。

关键词:JPEG;变换编码;DCT;KLT;编码性能

DOI:10.11907/rjdk.171268

中图分类号:TP317.4 文献标识码:A 文章编号:1672-7800(2017)009-0192-03

Abstract:In order to save limited storage resources and transmission bandwidth, efficient image coding method is very important. KLT is the abbreviation of Karhunen-Loeve Transform, which has the best energy compaction characteristics. The transform kernel of KLT is calculated based on the statistical properties of the source data and can be adapted to the image diversity. JPEG (Joint Photographic Experts Group), is the first international image compression standard.Because of its efficient coding performance,easy to implement and widely used,JPEG image transform coding using DCT (Discrete Cosine Transform). DCT is a fixed kernel, not to adapt to the diversity of images, which has some limitations on image coding. A more effective transformation method-KLT and DCT adaptive transform is proposed, which effectively utilizes the statistical characteristics of the image and improves the coding performance. It is proven that the performance of this method is 3.1% higher than that of the mainstream JPEG image coding standard.

Key Words:JPEG; transform coding; DCT; KLT; coding performance

0 引言

变化编码是图像视频编码的重要步骤,原理是把图像数据从时域转换到频域,使图像的大部分信息聚集在低频,也就是能量聚集性[1]。经过后续量化处理,去除高频少量信息,设置合适的量化参数,熵编码后数据比原始数据大大减少,经解码后觉察不到信息损失,与原图像差别不大。KLT具有理想的能量聚集特性,是其它变换编码性能的评判标准[2],在变换编码应用上一直是研究热点。一般来说,KLT要在编码时变换核,开销较大,且没有快速算法,所以使用受到限制。DCT是固定变换核,有相应的快速算法,且能在Markov-1模型下接近KLT[3],成为目前应用最广泛的变换编码。并非所有图像符合Markov-1模型,现实世界中符合Markov-1模型的图像大概只有50%[4]。

如何将KLT应用在图像视频编码系统是众多研究者致力解决的问题[3-9]。茅一民、高西奇[5]用一类典型的指纹图像样本训练KLT矩阵;方凌江等[6]对高光谱图像进行无监督分类,针对波段对每一类进行KLT;牛万红等[7]根据KLT在多光谱遥感图像中的应用原理,分别设计了大分块KLT算法和小分块KLT算法;Matthias Kramm[8]基于分类KLT在群体图像编码上的应用,Miaohui Wang等[9]在H.264中对采样训练KLT矩阵,使编解码端计算出一致结果,避免了KLT变换核的编码传送而造成的额外开销;Moyuresh Biswas等[10]采用运动补偿块平移,旋转计算KLT变换核,同样避免了KLT变换核的编码。

本文提出了一种在图像上应用KLT自适应变换编码方法,有效运用KLT特性,避免了编码KL变换核带来的额外开销,显著提高了图像编码性能。

编码流程:首先采集大量樣本图像,然后对图像的每个块分类,把相同类的块聚集,训练KLT变换核。在图像编码系统中,编码块自适应选择相应类的KLT或DCT进行变换编码。图1是编码系统流程。

1 分类方法

本文采用的分类方法是一种类H.264帧内预测简化方案。H.264的帧内预测是根据当前块的左邻块与上邻块预测方向[11],而JPEG没有帧间预测。KLT是一种基于数据统计特性的变换,本文利用块的自身数据进行分类,能有效应用于KLT。endprint

如图2所示,中间的白色点是当前像素点,四周8个黑色点是其邻近点,对于边缘块,不存在的邻近点用像素值的量级平均值,即128代替。按照图示的16个方向分类。用邻域点及邻域插值点(也就是不在整像素上的点,如b、c、d)来估算当前点u的值。估算方法:如s-i方向,u′ = (s+i)/2。为了方便,本文将这种估算称作预测。插值点(如b、c、d)像素值用相邻整像素a、e插值计算得出,离整像素越近权值越大。

c = 1/2a + 1/2e;

d = 3/4a + 1/4e;

d = 1/4a + 3/4e。

其它非整像素值f、g、h、k、m、n、p、q、r用相同方法算出。在某个方向上预测块的所有像素点,16个方向都预测之后,使用MSE(Mean squared error)算法选择最接近原始块的方向作为块的类。

2 KLT变换核训练

2.1 KLT原理

KLT是对向量x做的一个正交变换:y=ΦTx,目的是变换到y后去除数据相关性。其中,ΦT是x特征向量组成的矩阵,满足ΦTΦ=I。当x都是实数时,ΦT是正交矩阵[12-14]。

用mx、my分别表示向量x、y的平均值,x、y的协方差矩阵分别记为∑x,∑y,y的协方差计算方法见式(1):∑y=E(yyT)-mymTy

(1) 将y=ΦTx带入式(1),推导得:∑y=E[(ΦTx)(ΦTx)T]-(ΦTmx)(ΦTmx)T

=E[ΦT(xxT)Φ]-ΦTmxmTxΦ

=ΦT[E(xxT)-mxmTx]Φ

=ΦT∑xΦ

(2) 要使∑x对角化,矩阵ΦT由∑x的特征矢量组成,接下来求∑x特征值及特征向量。完成KLT变换后,∑y成为对角阵,也就是对于任意i≠j,有cov(xi,yj)=0;当i=j时,有cov(xi,yj)=λi,去除数据相关性。yi的方差σ2i与x协方差矩阵的第i个特征值相等,即σ2i=λi。

2.2 KLT训练

本文利用块的方向特性训练KL变换核。训练样本的每个块分类之后,每个类都是含有若干块的集合,每个集合都看作相同维度的矩阵,按照KLT原理,计算矩阵协方差,使协方差对角化,即去除了编码块各个像素之间的相关性。根据矩阵理论,矩阵对角化就是求矩阵的特征值和特征向量,为了变换域能量分布量化方便,这些特征值按从大到小顺序排列,特征向量按照特征值顺序排列,得到一个正交矩阵T,这个矩阵就是KL变换核。使用相同方法,计算出所有类的KL变换核。KLT计算复杂,但整个训练过程并不在编解码过程中,所以不会对编解码速度产生影响。这样得到的是浮点KLT,将其缩放取整,可在变换编码时保证精度,提高运算速度。

3 自适应变换编码

在JPEG标准中,DCT采用可分离变换,即先进行(列)变换,再进行列(行)变换。Y=M·X·MT,M·MT=I

(3) Y为变换系数,X为源数据,M为可分离DCT矩阵,MT为M的转置,I为单位矩阵。本文KLT采用不可分离变换:Y=KX

(4) K为不可分离的KLT。但是不可分离的变换矩阵要比可分离矩阵大很多。比方说一个大小为N×N的可分离矩阵,对应的不可分離矩阵大小会达到N2×N2 。

按照常规方法使用KLT时,先计算块的分类,用相应的KLT变换核进行变换编码。这种方法弊端很大,块的分类信息需要编码,总共有16个类,每个块的分类需要4比特编码,以便解码端用相应的KLT变换核解码。相对固定核DCT来说,每个块多编码4比特,很可能使结果产生负增益。

图像的相邻块往往相关性很高,完全可以考虑从相邻块获取分类信息。编码时不能直接从相邻块获取分类信息,因为解码出的图像与原始图像存在误差。为了保持编解码端的一致性,在编码一个块后继而重构这个块,作为下一个块的分类依据。用预测分类相应的KL变换核对下一块进行变换编码,但这样预测得到的分类比较粗略,不能保证是否最适合KL变换核,也不能保证比DCT有更好的编码性能。考虑到这一点,利用RDO(Rate Distortion Optimization)从KLT和DCT中选择表现最佳者进行变换编码。RDO公式见式(5): J=D+λ·R

(5) J为率失真代价,D为块失真,R为块编码比特数,λ为拉格朗日系数。失真就是重构图像与原始图像的偏差,用MSE计算,见式(6):D=1N∑Ni=1(xi-x′i)2

(6) N为像素数,xi为原始数据,x′i为重构数据。失真越小,重构图像与原始图像偏差越小, D值就越小。较小的失真往往需要更多比特,RDO权衡了失真和比特率,是一种评价图像视频编码性能的主流方法。比较失真代价,如果JKLT

4 重构

图像解码是编码的反过程,也可以称作图像重构。图像编码后的大小及解码后对原图像的复原度是评价图像编码性能的重要指标,两者很难同时达到要求。BD-Rate是综合这两个因素判断图像编码性能的一个重要算法[16-17],本文实验采用这种方法。

本文的编码系统用到了重构过程,每个块在量化之后,进行反量化、反变换得到重构块,作为下一个块的分类依据。在解码系统中,根据解码信息确定使用DCT或KLT反变换。

5 实验结果

本文的编解码系统除了变换编码,其它部分均与JPEG标准相同,测试样本及训练样本为标准序列,均来自于网络[10],样本命名为kodim01~24。前7张图像序列kodim01~07作为测试样本,后面17张图像序列kodim08~24为训练样本。表1是自适应变换,以JPEG为参考的BD码率和PSNR的比较结果。

从结果可以看出,本文应用的KLT自适应变换编码比目前主流的图像编码标准JPEG在性能上有明显提升。

6 结语

本文训练了大量图像序列以获得适应各种统计特性的KLT,在变换编码时利用相邻块的相关性巧妙避免了分类信息的编码,从而避免了大量码流开销,并自适应选择表现最佳的变换。从实验结果看,本文的自适应变换比固定DCT有明显的改善。

参考文献:

[1] R C GONZALEZ, R E WOODS.Digital image processing [C].Addison-Wesley Publishing Co, Boston, MA,1992.

[2] 翁默颖,奚宁.使用K-L变换进行图像压缩的一种新方法[J].华东师范大学学报:自然科学版,1996(3):63-71.

[3] R J CLARKE.Relation between the karhunen-loève and cosine transforms[J].Proc Inst Electr Eng F, 1981,128(6):359-360.

[4] TORRES-URGELL L, KIRLIN R L. Adaptive image compression using karhunen-loeve transform[J]. Signal Processing, 1990,21(4):303-313.

[5] 高西奇,茅一民.基于KLT的指纹图像压缩[J].通信学报,1994(1):113-115.

[6] 方凌江,粘永健,王迎春.基于分类KLT的高光谱图像压缩[J].计算机技术与发展,2013(11):82-85.

[7] 牛万红,赵静,葛永斌.基于K-LT的高分辨率图像的分块算法[J].济南大学学报:自然科学版,2014(3):198-203.

[8] KRAMM A M. Compression of image clusters using karhunen loeve transformations[J]. Proc Spie, 2007(6492):101-106.

[9] WANG M, NGAN K N, XU L. Efficient H.264/AVC video coding with adaptive transforms[J]. IEEE Transactions on Multimedia, 2014,16(4):933-946.

[10] BISWAS M, PICKERING M R, FRATER M R. Improved H.264-based video coding using an adaptive transform[C]. IEEE International Conference on Image Processing. IEEE, 2010:165-168.

[11] TEW Y, WONG K S. An overview of information hiding in H.264/AVC compressed video[J]. Circuits & Systems for Video Technology IEEE Transactions on, 2014, 24(2):305-319.

[12] MAYCOCK J, ELHINNEY C P M, MCDONALD J B, et al. Independent component analysis applied to digital holograms of three-dimensional objects[J]. Optical Information Systems III, 2005(5908):42-50.

[13] ZENG R, WU J, SHAO Z, et al. Color image classification via quaternion principal component analysis network[J]. Neurocomputing, 2015(216):416-428.

[14] SHI J, SONG W. Sparse principal component analysis with measurement errors[J]. Journal of Statistical Planning & Inference, 2016(175):87-99.

[15] WALDEMAR P, T A RAMSTAD.Hybrid KLT-SVD image compression[C]. IEEE International Conference on Acoustics, 2007:79-89.

[16] WANG Q, JI X, DAI Q, et al. Free viewpoint video coding with rate-distortion analysis[J]. IEEE Transactions on Circuits & Systems for Video Technology, 2012, 22(6):875-889.

[17] M KARCZEWICZ, Y YE, I CHONG. Rate distortion optimized quantization[C].document VCEG-AH21, ITU-T Q.6/SG16 VCEG, Antalya,Turkey,2008.

[18] KODAK.Kodak lossless true color image suite[EB/OL].http://r0k.us/graphics/kodak/.


上一篇: 金融经济论文范文2篇

下一篇: 数据库论文范文2篇


付款方式- 联系我们 - 在线投稿 - 招聘合作 - 友情链接 - 帮助中心
Copyright © 2010-2018 期刊58网 (www.qikan58.com)版权所有 [网站地图] [网站地图导航] - -
论文发表服务热线:18912313198 论文发表投诉电话:18912313198  建议及客服QQ:发表论文QQ 776199675  Email:tougao@qikan58.com
论文发表电话:18912313198 公司名称:乌鲁木齐哈达数码图文有限公司 乌鲁木齐市哈达中路1号
论文发表免责声明:本网所提供的信息资源如有侵权、违规,请及时告知!
职称论文发表 教师论文发表 科技论文发表 如何发表论文
原创专区 在线咨询 发表论文