機器視覺是什么?能用來做什么?
要探討機器視覺的應(yīng)用,首先還是需要精準(zhǔn)把握什么是機器視覺,并把其與當(dāng)下熱門又有重疊部分的人工智能和深度學(xué)習(xí)區(qū)分開來。人工智能的外延范圍最大,包括了機器視覺、深度學(xué)習(xí)、機器人技術(shù)、生物識別技術(shù)和自然語言處理。
可以看出,人工智能包括了深度學(xué)習(xí)和機器視覺,研究的是人類智能活動規(guī)律,構(gòu)造具有一定智能的人工系統(tǒng),研究如何讓計算機去完成以往需要人的智力才能勝任的工作,也就是研究如何應(yīng)用計算機的軟硬件來模擬人類某些智能行為的基本理論、方法和技術(shù)。
深度學(xué)習(xí),是人工智能研究中的一個新的領(lǐng)域,其動機在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),它模仿人腦的機制來解釋數(shù)據(jù),例如視頻、聲音和文本。
深度學(xué)習(xí)在安防行業(yè)的應(yīng)用極為熱門,記者在評測產(chǎn)品時關(guān)于人臉和車輛的識別技術(shù)都基于深度學(xué)習(xí)。
究其原因,深度學(xué)習(xí)的關(guān)鍵要素是數(shù)據(jù),而占大數(shù)據(jù)總量60%以上的為視頻監(jiān)控數(shù)據(jù),所以,深度學(xué)習(xí)的在安防行業(yè)的方方面面得到了應(yīng)用:人臉檢測、車輛檢測、非機動車檢測、人臉識別、車輛品牌識別、行人檢索、車輛檢測、人體屬性、異常人臉檢測、人群行為分析、各種感興趣目標(biāo)的跟蹤等。
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。
通過分CMOS或CCD傳感器將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標(biāo)的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標(biāo)的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。
機器視覺主要是對圖像進行識別,因此機器視覺在人臉識別、車牌識別等方面得到大量運用。
以智能交通行業(yè)為例,機器視覺具有成本低、穩(wěn)定性強、準(zhǔn)確性高、應(yīng)用范圍廣等優(yōu)點,目前已經(jīng)在國內(nèi)外高速公路和公路的交通監(jiān)控系統(tǒng)中得到了廣泛的應(yīng)用,具體體現(xiàn)在車牌識別、車身顏色識別、車型識別、違章識別、車流量統(tǒng)計、流量控制等。
這時有人會產(chǎn)生疑惑,機器視覺和深度學(xué)習(xí)有太多重疊之處,是否兩者在安防行業(yè)是同一概念的不同表達。
其實不然,如果僅從視頻監(jiān)控行業(yè)來看,深度學(xué)習(xí)算法是機器視覺更高層面的應(yīng)用,因為基于巨大樣本采集把握了大量數(shù)據(jù)特征,而機器視覺主要在特征感知、圖像預(yù)處理、特征提取、特征篩選方面擅長,也就是說,機器視覺主要是在特征識別提煉部分,而深度學(xué)習(xí)是把特征和學(xué)習(xí)結(jié)合起來,比如用特征的感知和提取來預(yù)判數(shù)據(jù)。
安防的演進已不僅僅局限于視頻圖像的編解碼技術(shù)、存儲技術(shù),智能時代下,安防需要更多的ICT能力,把計算、存儲、聯(lián)接、云化、智能、安全等各個領(lǐng)域的珍珠串起來,在構(gòu)建“全棧云、全智能、全場景”的機器視覺和大數(shù)據(jù)解決方案基礎(chǔ)上,構(gòu)建“平臺+AI+生態(tài)”的智能安防開放體系。