1、機(jī)器視覺部件發(fā)展迅速
CCD、CMOS是工業(yè)相機(jī)的核心固件,近年來越來越成熟。圖像傳感器件尺寸不斷縮小,像元數(shù)量和數(shù)據(jù)率有了很大提高,分辨率和幀率的提升,產(chǎn)品系列也越來越豐富,在增益、快門和信噪比等參數(shù)上不斷優(yōu)化,通過核心測(cè)試指標(biāo)(MTF、畸變、信噪比、光源亮度、均勻性、色溫、系統(tǒng)成像能力綜合評(píng)估等)來對(duì)光源、鏡頭和相機(jī)進(jìn)行綜合選擇,使得很多以前成像上的難點(diǎn)問題得以不斷突破。
2、圖像處理和模式識(shí)別發(fā)展迅速
圖像處理上,隨著圖像高精度的邊緣信息的提取,很多原本混合在背景噪聲中難以直接檢測(cè)的低對(duì)比度瑕疵開始得到分辨。
模式識(shí)別上,本身可以看作一個(gè)標(biāo)記過程,在一定量度或觀測(cè)的基礎(chǔ)上,把待識(shí)模式劃分到各自的模式中去。圖像識(shí)別中運(yùn)用得較多的主要是決策理論和結(jié)構(gòu)方法。決策理論方法的基礎(chǔ)是決策函數(shù),利用它對(duì)模式向量進(jìn)行分類識(shí)別,是以定時(shí)描述(如統(tǒng)計(jì)紋理)為基礎(chǔ)的;結(jié)構(gòu)方法的核心是將物體分解成了模式或模式基元,而不同的物體結(jié)構(gòu)有不同的基元串(或稱字符串),通過對(duì)未知物體利用給定的模式基元求出編碼邊界,得到字符串,再根據(jù)字符串判斷它的屬類。在特征生成上,很多新算法不斷出現(xiàn),包括基于小波、小波包、分形的特征,以及獨(dú)二分量分析;還有關(guān)子支持向量機(jī),變形模板匹配,線性以及非線性分類器的設(shè)計(jì)等都在不斷延展。
3、深度學(xué)習(xí)帶來的突破
傳統(tǒng)的機(jī)器學(xué)習(xí)在特征提取上主要依靠人來分析和建立邏輯,而深度學(xué)習(xí)則通過多層感知機(jī)模擬大腦工作,構(gòu)建深度神經(jīng)網(wǎng)絡(luò)(如卷積神經(jīng)網(wǎng)絡(luò)等)來學(xué)習(xí)簡(jiǎn)單特征、建立復(fù)雜特征、學(xué)習(xí)映射并輸出,訓(xùn)練過程中所有層級(jí)都會(huì)被不斷優(yōu)化。在具體的應(yīng)用上,例如自動(dòng)ROI區(qū)域分割;標(biāo)點(diǎn)定位(通過防真視覺可靈活檢測(cè)未知瑕疵);從重噪聲圖像重檢測(cè)無法描述或量化的瑕疵如橘皮瑕疵;分辨玻璃蓋板檢測(cè)中的真假瑕疵等。隨著越來越多的基于深度學(xué)習(xí)的機(jī)器視覺軟件推向市場(chǎng)(包括瑞士的vidi,韓國的SUALAB,香港的應(yīng)科院等),深度學(xué)習(xí)給機(jī)器視覺的賦能會(huì)越來越明顯。
4、3d視覺的發(fā)展
3D視覺還處于起步階段,許多應(yīng)用程序都在使用3D表面重構(gòu),包括導(dǎo)航、工業(yè)檢測(cè)、逆向工程、測(cè)繪、物體識(shí)別、測(cè)量與分級(jí)等,但精度問題限制了3D視覺在很多場(chǎng)景的應(yīng)用,目前工程上最先鋪開的應(yīng)用是物流里的標(biāo)準(zhǔn)件體積測(cè)量,相信未來這塊潛力巨大。