圖像識別是計(jì)算機(jī)對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標(biāo)和對像的技術(shù)。影像測試卡是圖像識別的重要工具,本文簡單介紹了影像測試卡在智能圖像識別中的應(yīng)用。
目前的圖像識別技術(shù)是作為一個(gè)工具來幫助我們與外部世界進(jìn)行交互,只為我們自身的視覺提供了一個(gè)輔助作用,所有的行動(dòng)還需我們自己完成。而當(dāng)機(jī)器真正具有了視覺之后,它們完全有可能代替我們?nèi)ネ瓿蛇@些行動(dòng)。目前的圖像識別應(yīng)用就像是盲人的導(dǎo)盲犬,在盲人行動(dòng)時(shí)為其指引方向;而未來的圖像識別技術(shù)將會(huì)同其他人工智能技術(shù)融合在一起,成為盲人的全職管家,不需要盲人進(jìn)行任何行動(dòng),而是由這個(gè)管家?guī)椭渫瓿伤惺虑?。舉個(gè)例子,如果圖像識別是一個(gè)工具,就如同我們在駕駛汽車時(shí)佩戴谷歌眼鏡,它將外部信息進(jìn)行分析后傳遞給我們,我們再依據(jù)這些信息做出行駛決策;而如果將圖像識別利用在機(jī)器視覺和人工智能上,這就如同谷歌的無人駕駛汽車,機(jī)器不僅可以對外部信息進(jìn)行獲取和分析,還全權(quán)負(fù)責(zé)所有的行駛活動(dòng),讓我們得到完全解放。
在人工智能中,感知是通過解釋傳感器的響應(yīng)而為機(jī)器提供它們所處世界的信息,其中它們與人類共有的感知形態(tài)包括視覺、聽覺和觸覺,而視覺最為重要,因?yàn)橐曈X是一切行動(dòng)的基礎(chǔ)。人類感覺信息中的80%都是視覺信息,機(jī)器視覺之于人工智能的意義就是視覺之于人類的意義,而決定著機(jī)器視覺的就是圖像識別技術(shù)。
更重要的是,在某些應(yīng)用場景,機(jī)器視覺比人類的生理視覺更具優(yōu)勢,它更加準(zhǔn)確、客觀和穩(wěn)定。人類視覺有著天然的局限,我們看起來能立刻且毫無費(fèi)力的感知世界,而且似乎也能詳細(xì)生動(dòng)的感知整個(gè)視覺場景,但這只是一個(gè)錯(cuò)覺,只有投射到眼球中心的視覺場景的中間部分,我們才能詳細(xì)而色彩鮮明的看清楚。偏離中間大約10度的位置,神經(jīng)細(xì)胞更加分散并且只能探知光和陰影。也就是說,在我們視覺世界的邊緣是無色、模糊的。因此,我們才會(huì)存在“變化盲視”,才會(huì)在經(jīng)歷著多樣事物發(fā)生時(shí),僅僅關(guān)注其中一樣,而忽視了其他事物的發(fā)生,或者不知道它們的發(fā)生。而機(jī)器在這方面就有著更多的優(yōu)勢,它們能夠發(fā)現(xiàn)和記錄視力所及范圍內(nèi)發(fā)生的所有事情。拿應(yīng)用最廣的視頻監(jiān)控來說,傳統(tǒng)監(jiān)控需要有人在電視墻前時(shí)刻保持高度警惕,然后再通過自己對視頻的判斷來得出結(jié)論,但這往往會(huì)因?yàn)槿说钠?、視覺局限和注意力分散等原因影響監(jiān)控效果。但有了成熟的圖像識別技術(shù)之后,再加以人工智能的支持,計(jì)算機(jī)就可以自行對視頻進(jìn)行分析和判斷,發(fā)現(xiàn)異常情況直接報(bào)警,帶來了更高的效率和準(zhǔn)確度;在反恐領(lǐng)域,借助機(jī)器的人臉識別技術(shù)也要遠(yuǎn)遠(yuǎn)優(yōu)于人的主觀判斷。
圖像識別技術(shù),連接著機(jī)器和這個(gè)一無所知的世界,幫助它越發(fā)了解這個(gè)世界,并最終代替我們完成更多的任務(wù)。賽麥吉作為一家致力于影像測試卡的高新技術(shù)企業(yè),為我國的識別技術(shù)以及人工智能技術(shù)的進(jìn)步奉獻(xiàn)自己的力量。