支持向量數(shù)據(jù)描述在煙葉異物檢測(cè)中的應(yīng)用
發(fā)布時(shí)間:2019-08-24 來(lái)源: 幽默笑話 點(diǎn)擊:
摘 要:針對(duì)煙葉異物檢測(cè)中很難全面收集異物樣本數(shù)據(jù)的問題,提出一種基于支持向量數(shù)據(jù)描述方法(SVDD)的煙葉異物檢測(cè)方法。該方法只需要煙葉樣本數(shù)據(jù),就可建立單值分類器。首先,提取煙葉與幾種典型異物的RGB分量與HSV分量;然后,選取煙葉的HV分量作為特征向量,訓(xùn)練SVDD分類器,實(shí)現(xiàn)煙葉異物的分類識(shí)別;最后,通過(guò)接受者操作特性(ROC)曲線對(duì)比了SVDD與其他3種方法的分類效果。實(shí)驗(yàn)結(jié)果表明,采用HV分量降低了數(shù)據(jù)維數(shù),提高了計(jì)算效率;SVDD方法具有很好的分類效果和計(jì)算效率,能很好地區(qū)分煙葉與異物。
關(guān)鍵詞:支持向量數(shù)據(jù)描述;異物檢測(cè);煙葉樣本;HV分量;分類識(shí)別
中圖分類號(hào): TP274.3文獻(xiàn)標(biāo)志碼:A
?
Application of support vector data description to detection of foreign bodies in tobacco
?
HUANG Shi?jian??1,2?*?
?(
1.School of Physics and Electron Engineering, Yangtze Normal University, Chongqing 408100, China?;??
2.Key Laboratory of Optoelectronic Technology and Systems ?(?Chongqing University?),? Ministry of Education, Chongqing 400044, China
)?
Abstract:
It is difficult to fully collect foreign body sample in detecting foreign bodies from tobacco. A detection method based on Support Vector Data Description (SVDD) was proposed. Thus a one?class classifier can be developed by using tobacco samples soly. RGB and HSV of tobacco and several typical foreign bodies were firstly extracted; then the HV component was used as eigenvector. A developed SVDD classifier was applied to distinguish foreign bodies from tobacco by inputting the HV eigenvector. Finally through the Receiver Operating Characteristic (ROC) curve, the SVDD classifier was compared with three other methods in classification effect. The experimental results show that by adopting feature extraction with HV component, the data dimension was reduced and a higher computation efficiency was achieved. The SVDD classifier has a stronger classification ability and higher efficiency, which could distinguish foreign bodies from tobacco better.
?Key words:
Support Vector Data Description (SVDD); foreign body detection; tobacco sample; HV component; classification
?
0 引言?
國(guó)內(nèi)大多數(shù)煙草生產(chǎn)線上都采用金屬探測(cè)儀檢測(cè)和剔除金屬異物,并輔之以人工剔除其他異物的方法??[1-2]?,這些方法的異物剔除率受人為因素影響較大。因此研究煙葉異物自動(dòng)檢測(cè)系統(tǒng)極為重要,自動(dòng)檢測(cè)的關(guān)鍵技術(shù)多采用機(jī)器視覺技術(shù)與模式識(shí)別技術(shù)相結(jié)合??[3]?,其中分類方法的選擇是否恰當(dāng),直接影響最后的檢測(cè)結(jié)果。但近年來(lái)國(guó)內(nèi)外針對(duì)煙葉異物的分類技術(shù)卻鮮有報(bào)道,而常用的可以借鑒的分類方法有貝葉斯分類算法、支持向量機(jī)等傳統(tǒng)方法和支持向量數(shù)據(jù)描述??[4-6]?(Support Vector Data Description, SVDD)等單值分類算法。但貝葉斯分類等傳統(tǒng)分類方法在對(duì)訓(xùn)練樣本不平衡領(lǐng)域如煙葉異物檢測(cè)中異物種類繁雜甚至無(wú)法預(yù)知的情況時(shí)表現(xiàn)得力不從心,本文提出將支持向量數(shù)據(jù)描述方法運(yùn)用到煙葉異物檢測(cè)技術(shù)中,該方法已在很多訓(xùn)練樣本不平衡的領(lǐng)域(如機(jī)械故障診斷??[7-8]?、語(yǔ)音識(shí)別??[9]?、圖像識(shí)別等領(lǐng)域)得到了成功應(yīng)用??[10-12]?。運(yùn)用該方法只需用煙葉的HV分量數(shù)據(jù)訓(xùn)練單值分類器,就可實(shí)現(xiàn)分類,可以解決難以提取異物訓(xùn)練樣本的問題。?
1 顏色空間?
RGB顏色空間的基本原理是采用紅(R)、綠(G)、藍(lán)(B)3個(gè)顏色分量來(lái)表示所有的顏色。HSV顏色空間模型是孟塞爾色彩空間的簡(jiǎn)化形式,直接采用彩色特性意義的3個(gè)分量:色度(H)、飽和度(S)、亮度(V)來(lái)描述顏色,更符合人對(duì)顏色的描述習(xí)慣。?
RGB顏色空間有不均勻和不直觀的缺點(diǎn),HSV顏色空間的三分量相對(duì)獨(dú)立,易通過(guò)設(shè)定不同權(quán)值將其融合在一起,具有計(jì)算量小等優(yōu)點(diǎn)。?
2 支持向量數(shù)據(jù)描述算法簡(jiǎn)述?
SVDD的基本思想是把要描述的對(duì)象作為一個(gè)整體。假定一個(gè)目標(biāo)集(Target)?包含有n個(gè)需要描述的目標(biāo)對(duì)象{x?i|x?i∈R?d;i=1,2,…,n},構(gòu)成單值分類器的n個(gè)學(xué)習(xí)樣本。試圖找到一個(gè)體積最小的超球體,使全部(或盡可能多) 的x?i都包含在該超球體內(nèi),而非目標(biāo)樣本?(Outliers)?就位于超球體外, 為了增強(qiáng)分類的魯棒性,引入松弛變量ξ?i。最小化超球體的體積是一個(gè)二次規(guī)劃問題,即應(yīng)滿足:?
3 實(shí)驗(yàn)研究?
從人主觀觀察的角度看,煙葉異物在顏色、形狀、大小、輕重、材質(zhì)等方面都存在差異。但從機(jī)器視覺系統(tǒng)的角度來(lái)看,被檢測(cè)物的輕重材質(zhì)等特征難以獲取,而形狀、大小等參數(shù)又不具備明顯的規(guī)律性,這使得顏色成了煙葉異物檢測(cè)中最為重要的特征參量。?
在煙葉異物檢測(cè)中最重要的是識(shí)別出煙葉與非煙葉(即異物),如再進(jìn)一步識(shí)別出異物的具體類型費(fèi)時(shí)費(fèi)力且沒有必要,因此考慮用單值分類方法對(duì)煙葉異物進(jìn)行分類識(shí)別,把煙葉識(shí)為目標(biāo)樣本,將所有的異物都識(shí)為非目標(biāo)樣本。用煙葉的顏色特征數(shù)據(jù)訓(xùn)練SVDD單值分類器,即建立一個(gè)超球體緊緊包圍住煙葉數(shù)據(jù),再將煙葉異物混雜的特征數(shù)據(jù)輸入訓(xùn)練好的分類器進(jìn)行分類識(shí)別,把落在超球體內(nèi)的樣本判別為煙葉,把落在超球體外面的樣本判別為異物。?
在異物中選取橙紙、黑橡膠、、灰紙箱、紅紙、黃海綿、黃皮帶、綠紙這幾種典型異物作為非目標(biāo)樣本分析。在相同攝像條件下拍攝煙葉與異物圖像,并對(duì)煙葉和異物各抽取一定數(shù)量的樣本點(diǎn),提取出相應(yīng)的RGB分量,以及HSV分量。表1和表2分別為對(duì)煙葉異物的RGB與HSV各分量的均值方差統(tǒng)計(jì)。?
相關(guān)熱詞搜索:向量 煙葉 異物 描述 檢測(cè)
熱點(diǎn)文章閱讀