楊勇(1963-)
男,湖北淞滋人,大學(xué)本科,自動(dòng)化控制專業(yè)。
摘 要:為了能夠更好的去除圖像的噪聲和很好的保留圖像的邊緣信息,提出了基于HSV空間的均值移動(dòng)平滑算法。首先將圖像轉(zhuǎn)化到HSV空間,由于HSV空間三個(gè)分量的相關(guān)性弱,根據(jù)HSV三個(gè)分量不同的特性采取不同的步長(zhǎng)進(jìn)行圖像平滑處理,這樣很好的克服了由于RGB三分量相關(guān)性太強(qiáng)不便于分別平滑處理的缺點(diǎn)。試驗(yàn)表明該方法比基于RGB空間的均值移動(dòng)算法能更好的滿足對(duì)平滑結(jié)果的要求。
關(guān)鍵詞:均值移動(dòng);圖像平滑;HSV空間
Abstract: For reducing noise and preferably keeping the edge information, the mean-shift algorithm based on the HSV space was proposed. Firstly the image was transferred from RGB space to HSV space. Because the correlation of HSV was very little, H,S and V separately were smoothed based on the different step sizes. This can overcome the drawback that R,G, and B could not be separately smoothed due to their strong correlation. The experiments prove that this algorithm could get better result than the mean-shift based on RGB space.
Key words: mean-shift; image smoothing; HSV space
1 引言
數(shù)字圖像的平滑濾波一直是圖像處理和圖像分析領(lǐng)域的一項(xiàng)重要技術(shù)。這方面的研究成果很多,歸納起來(lái)主要有以下幾類方法[1]:鄰域平均法、多圖平均法、中值濾波法和頻域低通濾波法等。而本文所用的均值移動(dòng)法是一種非參數(shù)密度估計(jì)梯度法,通過(guò)有效的統(tǒng)計(jì)迭代算法,使每一個(gè)點(diǎn)“漂移”到密度函數(shù)的局部極大值點(diǎn)。均值移動(dòng)算法的原型“valley-seeking procedure[2]”由Fukunaga和Hostetler在1975年提出,但是并沒有得到學(xué)術(shù)界的重視。直到1995年Y.Cheng成功將此算法擴(kuò)展至計(jì)算機(jī)視覺領(lǐng)域[3-9],才引起了廣泛的關(guān)注。目前它已經(jīng)在圖像分割,圖像平滑和目標(biāo)跟蹤中得到了廣泛的應(yīng)用。
傳統(tǒng)的均值移動(dòng)算法主要集中在RGB空間進(jìn)行圖像處理。但RGB空間中三個(gè)分量的相關(guān)性強(qiáng)不利于分別處理。所以本文提出了一種基于HSV顏色空間的圖像平滑算法,即根據(jù)HSV三個(gè)分量的不同特性選擇不同的步長(zhǎng)進(jìn)行平滑,然后將平滑結(jié)果進(jìn)行融合得到最后的平滑結(jié)果。
2 均值移動(dòng)算法
均值遷移方法利用核函數(shù)的性質(zhì),無(wú)需對(duì)整個(gè)區(qū)域的概率密度進(jìn)行估計(jì),就能利用核對(duì)點(diǎn)的梯度進(jìn)行估計(jì),并進(jìn)一步導(dǎo)出均值遷移步長(zhǎng)。于是在介紹均值移動(dòng)算法之前首先介紹一下核密度估計(jì)。
2.1 核密度估計(jì)
目前幾種常用的核函數(shù)分別為均布核、Epanechnikov核、高斯核和裁剪過(guò)的高斯核、光滑多項(xiàng)式核。本文用高斯核進(jìn)行圖像平滑處理。
設(shè)d維空間Rd中有n個(gè)數(shù)據(jù)點(diǎn)xi,i=1…n,點(diǎn)x關(guān)于核函數(shù)K(x)和d×d的對(duì)稱正定帶寬矩陣H的多元核函數(shù)密度估計(jì)為:
(1)
其中: (2)
d元核函數(shù)K(x)為具有緊支集的有界函數(shù),滿足
(3)
(4)
(5)
(6)
式中為常數(shù),
是核
的協(xié)方差矩陣。多元核函數(shù)
可以由徑向基函數(shù)
合成。合成方法主要分為兩種,一種通過(guò)徑向基的乘積得到,即
(7)
另一種方法是在Rd空間中旋轉(zhuǎn)來(lái)合成,即
(8)
(9)
式中,是徑向?qū)ΨQ的,系數(shù)
保證
的積分為1。
為簡(jiǎn)化處理,通常采用一類特殊的徑向?qū)ΨQ核函數(shù)滿足。
(10)
(11)
式中,系數(shù)選取的原則是保證
的積分為1,
為非負(fù),遞減、分段連續(xù)的函數(shù)。令帶寬矩陣
,可以進(jìn)一步簡(jiǎn)化密度估計(jì)的復(fù)雜度,這樣只需確定一個(gè)帶寬參數(shù)h>0即可。值得注意的是,首先需要保證特征空間具有效的歐幾里得尺度。這樣核密度估計(jì)函數(shù)就可以寫成如下形式:
(12)
由式(10)(12)得到
(13)
在本文中k(x) =。
2.2 均值移動(dòng)算法
Mean-shift算法是一種基于核密度估計(jì)的無(wú)參快速模式匹配算法[3]。設(shè)A是嵌入在n維歐式空間X中的有限集合.K(x)中心對(duì)稱且滿足,k(x)定義在x≥0區(qū)間上。k(x)稱為K(x)的輪廓(profile)函數(shù)。于是核密度估計(jì)可以寫成:
(14)
使用核K(x)的密度估計(jì)梯度為
(15)
設(shè),于是g對(duì)應(yīng)一新核
。
新核的概率密度為: (16)
將g(x)代入式(15)得:
(17)
式(17)為均值移動(dòng)得移動(dòng)矢量。結(jié)合式(16)得
(18)
于是 (19)
從式(19)可以看出的運(yùn)動(dòng)方向與梯度的變化方向相同,大小與梯度的歸一化值成正比。下面證明均值移動(dòng)的收斂性。
設(shè)如果核k(x)的原型k(x),是單調(diào)遞減的凸函數(shù),則數(shù)列
和函數(shù)
密度收斂,且
單調(diào)遞增。
證明:由于核k(x)為單調(diào)遞減的凸函數(shù)。所以。(在證明過(guò)程中用
代替
)。
因?yàn)閚有界,所以為有界函數(shù),根據(jù)上面推導(dǎo),可知
為單調(diào)遞增函數(shù),所以
收斂。
3 圖像平滑
3.1 顏色空間轉(zhuǎn)換
顏色空間指的是某個(gè)三維顏色空間中的一個(gè)可見光子集。它包含某個(gè)顏色域的所有顏色。顏色空間的用途是在某個(gè)顏色域內(nèi)方便地指定顏色。一般圖像常采用RGB三元色彩色空間表示,但RGB三色空間中兩點(diǎn)間的歐氏距離與顏色距離不成線性比例,顏色受亮度的影響很大,各分量之間相關(guān)性強(qiáng)。本文采取了相關(guān)性弱,便于各分量分別處理的HSV空間進(jìn)行圖像平滑處理。
3.2 均值平滑
Mean-Shift的特征空間分析技術(shù)是獨(dú)立于具體應(yīng)用的,所以可以用來(lái)開發(fā)用途廣泛的算法,其中之一就是圖像平滑。
一幅圖像可以表示為一個(gè)具有r維矢量(像素)的2維網(wǎng)格,這里當(dāng)r為1的時(shí)候表示灰度圖像,為3表示彩色圖像,若r>3則表示多光譜圖像。網(wǎng)格所在的空間稱為空域,而灰度、色彩、光譜信息所在的空間稱為色度域。在兩個(gè)域中都采用歐氏度量。當(dāng)位置和色度矢量在一個(gè)維數(shù)為d=r+2的聯(lián)合域中時(shí),由于這兩者完全小同,必須通過(guò)適當(dāng)?shù)臍w一化處理進(jìn)行補(bǔ)償。雖然是把這兩種信息(空間和色度)聯(lián)合處理,但在處理時(shí),仍然要有所區(qū)別。而在各自的域內(nèi),就可以小加區(qū)別地處理。于是,多元核定義為兩個(gè)中心對(duì)稱的核的乘積,對(duì)每個(gè)域,歐氏度量使用一個(gè)單一的帶寬參數(shù)。公式如下:
(27)
其中是特征矢量的空間部分,
是強(qiáng)度部分,k(x)是用在兩個(gè)域的公共函數(shù)式,在本文使用高斯函數(shù),
和
是所用核的帶寬,C是相應(yīng)的歸一化常數(shù)。用戶只需要設(shè)置帶寬參數(shù)(
,
),這個(gè)參數(shù)通過(guò)控制核的大小,決定模式檢測(cè),h也就是濾波時(shí)的分辨率。
算法如下:
令分別表示d維聯(lián)合域中的原始和濾波后像素點(diǎn)。
表示分割后圖像中的第i個(gè)像素的標(biāo)號(hào)。
(1)對(duì)圖像進(jìn)行Mean Shift濾彼并把所有關(guān)于d維收斂點(diǎn)的信息都保存在中;
(2)在聯(lián)合域中生成聚類,把所有在空域距離小于
、并且在色度域距離小于
的點(diǎn)組合在一起,也就是把相似的收斂點(diǎn)的區(qū)域聯(lián)結(jié)起來(lái);
(3)將屬于一類的象素進(jìn)行標(biāo)號(hào),(p為類的類別號(hào));
(4)將面積小于一定閾值且色差小于一定閾值相臨區(qū)域合并。
4 實(shí)驗(yàn)分析
本文通過(guò)平滑受噪聲污染的狒狒圖像來(lái)驗(yàn)證本算法的有效性。圖1(a)為受噪聲干擾的圖像,圖1(b)為平滑前H分量立體圖,圖1(c)為平滑前S分量立體圖,圖1(d)為V平滑前立體圖。
圖1 原始圖像及其分量圖
圖2為本文算法得到的結(jié)果。圖2(a)為平滑后圖像,圖2(b)為H平滑后立體圖,圖2(c)為S平滑后立體圖,圖2(d)為V平滑后立體圖,H分量的步長(zhǎng)取0.1,S分量的步長(zhǎng)取0.05,V分量的步長(zhǎng)取0.1,空間步長(zhǎng)取7。
圖2 HSV空間平滑結(jié)果
圖3為基于RGB空間得到的平滑結(jié)果。圖3(a)為平滑后圖像,圖3(b)為R平滑后立體圖,圖3(c)為G平滑后立體圖,圖3(d)為B平滑后立體圖。顏色空間步長(zhǎng)取15,空間步長(zhǎng)取7。
圖3 RGB空間平滑結(jié)果
根據(jù)平滑的結(jié)果可以看到,本文所提算法不僅可以將一些不需要的紋理(如胡須和鼻子兩側(cè))和噪聲平滑掉而且保持了邊界清晰(如鼻子和臉的交界處)。RGB分量平滑的結(jié)果,由于噪聲太大并沒用很好的去除圖像中的一些噪聲。
由于RGB空間中RGB三分量的相關(guān)性太強(qiáng),在噪聲圖像中三分量會(huì)受不同程度噪聲的影響。在平滑過(guò)程中很難選取對(duì)RGB三分量都適應(yīng)的空間和顏色步長(zhǎng),當(dāng)噪聲和紋理較大時(shí)平滑結(jié)果可能保留部分噪聲和邊界不清晰,當(dāng)噪聲或紋理較小時(shí)可以較好的去除噪聲,但可能使相同顏色特征區(qū)域產(chǎn)生塊效應(yīng)。
本文所提平滑算法,主要考慮了HSV三分量相關(guān)性弱,可根據(jù)每個(gè)分量不同的特點(diǎn)選取不同的空間和顏色步長(zhǎng)進(jìn)行平滑處理??梢宰畲笙薅鹊膶⒃肼暤挠绊懭コ?。
5 結(jié)論
本文提出了一種基于HSV顏色空間分變量平滑的方法。此方法很好的克服了RGB空間各分量相關(guān)性強(qiáng),不便于分別平滑處理的缺點(diǎn)。但本算法仍然存在需要改進(jìn)的地方,如平滑速度不快,HSV各分量的步長(zhǎng)非自適應(yīng)選取,平滑后圖像中有的地方邊界不是很清晰等,這些將在以后的工作中解決。
參考文獻(xiàn):
[1] 朱秀昌,劉峰,胡棟. 數(shù)字圖像處理與圖像通信[M]. 北京: 北京郵電大學(xué)出版社,2002.
[2] Fukanaga K,Hostetler L D. The estimation of the gradient of a density function with applications in pattern recognition [J]. IEEE Trans Information Theory,1975,21 (1) .
[3] Y. Cheng,Mean Shift,Mode Seeking and Clustering [J],IEEE Trans. Pattern Analysis and Machine Intelligence,17(8),Aug.1995.
[4] NummiaroK,Koller-Meier E,Van Gool L. An adaptive color-based particle filter[J]. Image and Vision Computing,2002,21(1).
[5] Comaniciu D,Meer P. Mean shift: A robust approach toward feature space analysis [J]. IEEE Trans. on Pattern Analysis and Machine Intelligence,2002,24(5).
[6] Comaniciu D. An algorithm for data-driven band width selection [J].IEEE Trans. on Pattern Analysis and Machine Intelligence,2003,25(2).
[7] 彭寧嵩,楊 杰,劉 志,張風(fēng)超. Mean-Shift跟蹤算法中核函數(shù)窗寬的自動(dòng)選取[J]. 軟件學(xué)報(bào). 16(9),2005.
[8] 李鄉(xiāng)儒等. 均值漂移算法的收斂性[J]. 軟件學(xué)報(bào). 16(3),2005.
[9] M. Fashing and C. Tomasi. Mean shift is a bound optimization [J],IEEE Trans. Pattern Anal. Machine Intell,25(3),2005.
[10] Ardizzone Cascia M. Automatic video database indexing and retrieval[J]. Multimedia Tools and Applications,1997: 4(1): 29~56.
轉(zhuǎn)自《自動(dòng)化博覽》