文獻標識碼: A
文章編號: 0258-7998(2014)11-0120-03
0 引言
傳統的昆蟲識別主要是通過專家觀察昆蟲的外部特征并與標準的樣本進行鑒別,工作量大。為科學準確地識別害蟲與預防蟲害,利用計算機模式識別可有效地管理昆蟲圖像數據庫。基于內容的圖像檢索自動提取昆蟲的底層與高層特征,匹配視覺特征,將相似性較大的圖像反饋給用戶,不僅較少了工作量,且提高了檢索精度。
顏色特征作為重要的圖像視覺特征之一,其不受圖像的尺寸、平移、旋轉的影響。提取顏色特征的方法相對容易,研究者提出了基于顏色特征的諸多算法[1],如顏色直方圖、顏色矩、顏色熵、顏色聚合向量、顏色相關圖等。顏色特征檢索方法只是基于內容圖像檢索的一種方法, 在實際應用中應與其他特征檢索方法相結合, 檢索效果會更佳[2]。紋理特征是圖像另一個重要特征,不僅體現了灰度值間的相互關系,而且反映出紋理變化規律的周期性,成為分析圖像特征的重要方法。單一特征片面地描述圖像信息,丟失了圖像的部分信息,檢索通用性差,檢索效果不好[3]。采用綜合特征提取圖像視覺特征,可有效地改善檢索效果,更加符合人的視覺要求。本文首先實現了顏色特征和紋理特征的SVM圖像檢索仿真,在此基礎上結合圖像分塊,實現三者結合的SVM圖像檢索仿真。
1 算法描述
1.1 顏色矩
顏色矩于1995年被Stricker和Orengo提出,是一種簡單且有效的圖像顏色特征描述方法。圖像的顏色分布信息主要集中在低階矩中,采用顏色直方圖的一階矩、二階中心矩和三階中心矩就可以表達圖像的顏色特征[4]。
其中,hij表示第i個顏色通道分量中灰度為j的像素出現的概率,n表示灰度級。
1.2 灰度共生矩陣
灰度共生矩陣方法是公認的有效方法,具有較強的適應能力和魯棒性[5]。
假設f(x,y)為一幅灰度圖像,對圖像中任一區域R,定義S為區域中具有特定空間聯系的像素對的集合,則灰度共生矩陣可表示為:
其中,為圖像任意一點與其他相鄰點的偏離方向,d為偏離距離。在實際應用中,為減小計算量,需對式(4)進行歸一化,即式(5)所示:
為減少θ的方向數,通常計算4個方向的灰度共生矩陣,即θ取值為0°、45°、90°、135°。根據在共生矩陣基礎上提取的數字統計量,取主要5種描述紋理統計量,分別為能量、相關性、熵、對比度和逆差矩。
1.3 SVM
SVM(支持向量機)建立在統計學習和VC維理論的基礎上[6],在解決小樣本問題中存在特有的優勢,其主要思想是構造一個使分類間隔最大的超平面,使得離分類超平面最近的樣本點間的間隔最大,從而控制VC維大小,降低了機器學習的復雜度。在訓練小樣本情況下,不需要特定問題的先驗知識,可以很好地控制學習機器的推廣能力,因而在圖像檢索中可以有效地改善檢索結果[7]。
SVM解決分類問題,使得一些在低維特征空間不可分問題在高維空間變得可分。SVM分類器主要受兩個關鍵因素的影響:其一,誤差懲罰參數C;其二,核函數形式及其參數設置[8]。選擇不同的核函數以及相同核函數設置不同參數對其分類性能均有影響。這里借用MATLAB自帶的Libsvm軟件包,構造訓練模型,實現圖像樣本預測。LIBSVM中最重要的是核函數及其相關參數的選取。常用的核函數有線性核、多項式核和RBF核。一般選擇RBF核及徑向基核函數,它只有一個待定參數,其值越大,收斂速度越快[9]。
本實驗分別從正、負類圖像中選取前N張用于訓練集,其余的1 000-N用于測試集。選取SVM類型為e-SVR,核函數選用RBF(徑向基函數)核,又稱高斯核函數,SVM分類器優化問題就轉化式(6)的最小化問題:
其中,ai為拉格朗日乘子,C為懲罰參數。式(6)的最小值取決于參數(C,?酌)的設置,合適的參數可使得SVM分類器的性能最佳,其推廣能力最好。經過多次試驗,C取100,?酌取1/k,k為類數。用訓練數據訓練SVM分類器,預測測試樣本,同時,為了避免數值計算困難問題,采用尺度因子壓縮數據,用ROC曲線與AUC值作為評價分類器性能的指標。
2 改進算法
2.1 圖像分塊
圖像分塊通過綜合利用圖像全局特征和綜合特征,更好地描述了圖像內容。由于顏色空間分布存在差異性,故將圖像分成若干個子塊[10]。分塊圖像特征檢索方法具有良好的旋轉、平移和尺度不變性,得到的檢索結果能夠很好地滿足人的視覺感受[11]。圖像的空間分布信息對圖像相似性判斷的影響極大,圖像分塊注重了圖像的空間分布信息,實現了基于均勻分塊的圖像檢索算法[12],三者結合更加全面地描述了圖像信息,使得檢索結果更加準確。
2.2 Bag of Words算法描述
Bag of Words算法也稱為詞袋算法,是一種有效的基于語義特征提取與描述的物體識別算法。其基本思想是假定對于一個文本,忽略其詞序和語法、句法,僅僅將其看作是一些詞匯的集合,而文本中的每個詞匯都是獨立的[13]。Bag of Words算法首先要提取圖像的特征點,通過描述方式轉化為特征描述符,利用K-Means對描述符進行聚類,得到每個類的聚類中心,所有的聚類中心的集合成為視覺詞匯,最后利用機器學習的方法對多個類別的描述符進行訓練。
2.3 Bag of Words模型
Bag of Words模型應用于圖像表示,為了能表示一幅圖像,需將圖像視為文檔。K-Means算法是基于樣本間相似度測量的間接聚類算法,其特點:理論可靠、算法簡單、收斂速度快[14]。
實驗將圖像庫里的圖像大小分成50×50,采用重疊的分塊方式,并提取每塊的顏色紋理特征,由于圖像大小不同,故分塊的數量也不同。為了能用標準的SVM學習與檢索,借鑒Bag of Words模型,則步驟如下:
(1)用K-Means對所有訓練圖像的所有分塊的顏色與紋理特征進行聚類,找到聚類中心點,構造視覺詞匯;
(2)將每幅圖像的分塊特征向量在聚類中心點映射,得到圖像的映射向量;
(3)以圖像的映射向量作為圖像的特征向量,從而利用SVM學習與檢索。
用K-Means算法將訓練類的所有圖像示例聚成100類,并產生每一類的投影特征,建立每小類的視覺字,分別計算訓練與測試類的投影特征。
3 實驗分析
實驗選取蝴蝶、蜻蜓、蜜蜂、蟋蟀、蝗蟲、螳螂、天牛、棉鈴蟲(幼蟲)、瓢蟲與蚜蟲10類各100張圖片構建昆蟲圖像數據庫。分別采用顏色矩小波紋理綜合特征與圖像分塊結合顏色矩小波紋理綜合特征的方法,進行SVM圖像檢索。實驗結果如表1所示。
根據每類圖像的AUC值繪制PR曲線,如圖1所示。
實驗表明,圖像分塊特征結合顏色紋理綜合特征檢索效果比顏色紋理綜合特征SVM圖像檢索結果精度高,同時也表明了全面的綜合特征描述了圖像的完整信息。
4 結論
利用計算機模式識別可有效地識別昆蟲,通過提取綜合特征描述昆蟲圖像信息,構建訓練模型,使用SVM訓練樣本,并預測測試樣本。圖像分塊彌補了圖像空間分布信息,更加全面描述了圖像內容,SVM在圖像檢索中的應用提高了檢索精度。
參考文獻
[1] 李勃,章毓晉.基于特征元素和關聯規則的圖像分類方法[J].電子學報,2002,30(9):1262-1265.
[2] 李向陽,莊越挺,潘云鶴.基于內容的圖像檢索技術與系統[J].計算機研究與發展,2001,38(3):344-348.
[3] 肖秦琨,劉米娜,高嵩.基于顏色和紋理特征的遙感圖像檢索[J].計算機技術與發展,2013,23(4):107-110.
[4] 孫君頂,趙珊.圖像低層特征提取與檢索技術[M].北京:電子工業出版社,2009.
[5] 侯群群,王飛,嚴麗.基于灰度共生矩陣的彩色遙感圖像紋理特征提取[J].國土資源遙感,2013,25(12):26-32.
[6] Deng Yining,MANJUNATH B S.Unsupervised segmentation of color-texture regions in images and video[J].IEEE Trans-actions on Pattern Analysis and Machine Intelligence,2001,23(8):800-810.
[7] VAPNIK V.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[8] 奉國和.SVM分類核函數及參數選擇比較[J].計算機工程與應用,2011,47(3):126-127.
[9] 羅成石.基于LIBSVM 的糧食水分數據融合研究[J].科學技術與工程,2012,12(2):292-294.
[10] 陳雅芳,薛清福,陳方芳,等.基于圖像全局和局部顏色特征的圖像檢索[J].長春教育學院學報,2013,29(24):50-51.
[11] 郭麗,黃元元,楊靜宇.用分塊圖像特征進行商標圖像檢索[J].計算機輔助設計與圖形學報,2004,16(7):968-972.
[12] 張磊,林福宗,張鈸.基于支持向量機的相關反饋圖像索算法[J].清華大學學報,2002,42(1):80-83.
[13] 孫孟柯,張紅梅.基于Bag of words模型的圖像檢索系統的設計與實現[J].電腦知識與技術,2012,8(5):1139-1141.
[14] 曾接賢,王軍婷,符祥.K均值聚類分割的多特征圖像檢索方法[J].計算機工程與應用,2013,49(2):226-227.