高光譜成像采集的三維數(shù)據(jù)塊能夠提供被檢樣品內(nèi)外部豐富的成分含量信息,但由于高光譜數(shù)據(jù)具有波段多、分辨率高、數(shù)據(jù)維度高、冗余性強(qiáng)等特點(diǎn),因此必須采取合適的的數(shù)學(xué)算法對(duì)數(shù)據(jù)進(jìn)行處理和分析。
通常高光譜圖像處理的流程一般包括:高光譜圖像的獲取、圖像的校正,圖譜信息的提取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)降維和特征變量提取、模型建立、結(jié)果分析等幾個(gè)方面??偨Y(jié)以上的幾個(gè)方面,可以將其分成三個(gè)方面:高光譜圖像校正、光譜數(shù)據(jù)降維以及檢測(cè)模型構(gòu)建。
1. 高光譜圖像校正和光譜預(yù)處理
在高光譜圖像采集過(guò)程中,由于圖像是未經(jīng)校正的原始圖像,在圖像的的采集過(guò)程中由于相機(jī)中的暗電流的存在會(huì)對(duì)采集系統(tǒng)產(chǎn)生一定的影響,使得采集的高光譜圖像穩(wěn)定性較差,另一方面由于原始高光譜圖像數(shù)據(jù)是光子的強(qiáng)度信息,需要通過(guò)反射校正來(lái)獲取相對(duì)反射率。因此對(duì)高光譜進(jìn)行黑白版校正是數(shù)據(jù)分析前一個(gè)必要的過(guò)程。另外,由于在光譜信息采集的過(guò)程中存在光散射、檢測(cè)物圖像不規(guī)則以及隨機(jī)噪聲等不利因素,會(huì)使光譜曲線(xiàn)出現(xiàn)不平滑,信噪比較低等問(wèn)題,所以在進(jìn)行相關(guān)數(shù)據(jù)分析之前都會(huì)進(jìn)行數(shù)據(jù)的預(yù)處理,常用的預(yù)處理方法有平滑、歸一化、求導(dǎo)、多元散射校正、傅里葉變換、小波分析等,通過(guò)預(yù)處理后的數(shù)據(jù)不僅提高了曲線(xiàn)的平滑性和信噪比,而且對(duì)后續(xù)所建模型的準(zhǔn)確性也有一定的提升。
2. 高光譜數(shù)據(jù)降維
由于高光譜采集的數(shù)據(jù)塊通常含有幾百甚至上千個(gè)波段的光譜信息,這就造成了過(guò)高維度的光譜信息和數(shù)據(jù)較大的冗余性,不僅使得計(jì)算過(guò)程繁瑣,而且還會(huì)降低無(wú)損檢測(cè)模型的準(zhǔn)確性,因此在建模前對(duì)高光譜數(shù)據(jù)塊進(jìn)行降維處理是進(jìn)行數(shù)據(jù)分析的重要一步。查閱文獻(xiàn)發(fā)現(xiàn),當(dāng)前應(yīng)用較多的降維處理方法主要有以下幾種:主成分分析法、獨(dú)立成分分析法、遺傳算法以及最小噪聲分離法等[19-22],通過(guò)相應(yīng)的降維算法處理后,大量的冗余信息被去除,并且特征波段和圖像被提取,這些對(duì)于簡(jiǎn)化計(jì)算過(guò)程和提高模型的準(zhǔn)確性發(fā)揮著重要的作用。
3. 檢測(cè)模型的構(gòu)建
通過(guò)對(duì)降維處理后的圖譜數(shù)據(jù)進(jìn)行建模,可將圖譜信息和待測(cè)品質(zhì)關(guān)聯(lián)起來(lái),目前常用的一些化學(xué)計(jì)量學(xué)建模方法有偏最小二乘法、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)、多元線(xiàn)性回歸法,線(xiàn)性判別分析,Fisher判別分析等算法,通常的做法是應(yīng)用多種建模方法,最后比較不同建模方法建模集和預(yù)測(cè)集結(jié)果來(lái)選出最優(yōu)模型,因此建模方法不是固定的,而是根據(jù)不同的數(shù)據(jù)類(lèi)型選用不同的建模算法,不匹配的建模方法通常會(huì)對(duì)結(jié)果準(zhǔn)確性會(huì)產(chǎn)生較大的影響。而對(duì)于降維后的圖像維,通常采用相應(yīng)的數(shù)字圖像處理技術(shù)對(duì)圖像進(jìn)行分割處理,從處理后的圖像中提取特征參數(shù)建立模型,進(jìn)而對(duì)被測(cè)樣本表面缺陷或殘留物進(jìn)行檢測(cè)和識(shí)別。