想記錄眼前美景?不用再掏出相機或手機,只需一句語音指令,佩戴的輕巧時尚的谷歌眼鏡就能立刻拍出眼前的圖景;走在陌生的大街上,不用再查地圖或問路,只需將手機攝像頭對準街道,諾基亞“城市萬花筒”就能將眼前的商店、餐館和景點直接標注,覆蓋顯示在手機圖像上……這些以往多是在電影中看到的畫面,已成為普通人可以觸摸到的現(xiàn)實。機器視覺——這一“第三只眼”正以巨大的能量,改變著人們的生活和工作方式。記者就此專訪中國科學院自動化所專家,為讀者解密神奇的“第三只眼”
與人眼一決高低
“機器視覺就是用機器代替人眼來進行識別、測量、判斷等。機器視覺系統(tǒng)是通過攝像頭將拍攝對象轉(zhuǎn)換成圖像信號,然后再交由圖像分析系統(tǒng)進行分析、測量等?!敝袊茖W院自動化研究所模式識別國家重點實驗室研究員黃凱奇博士介紹:“機器視覺是一項典型的跨學科任務(wù),涉及到光學、計算機視覺、模式識別、機器學習、人工智能、統(tǒng)計學、認知心理學等等。”
機器視覺最早應(yīng)用于工業(yè)制造領(lǐng)域。通過機器視覺的自動識別功能,許多流水線上具有高度重復性的檢測工作都可以不再依靠人來完成,大大提高了檢測效率和精度。黃凱奇介紹,機器視覺系統(tǒng)最基本的特點就是提高生產(chǎn)的靈活性和自動化程度。在一些不適于人工作業(yè)的危險工作環(huán)境或者人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。同時,在大批量重復性工業(yè)生產(chǎn)過程中,用機器視覺檢測方法可以大大提高生產(chǎn)的效率和自動化程度。
一個典型的機器視覺系統(tǒng)包括照明、鏡頭、相機、圖像采集卡和視覺處理器5個部分。由于采集卡能更加迅速地傳輸圖像到存儲器,且計算機速度不斷加快,所以在目前的機器視覺系統(tǒng)中,視覺處理器的應(yīng)用逐漸減少。圖像采集卡在機器視覺系統(tǒng)中舉足輕重。比較典型的PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內(nèi)置的多路開關(guān),可連接多臺相機,能控制采集卡采用任意一個相機捕獲的信息。
伴隨著技術(shù)的發(fā)展,機器視覺的功能也在不斷擴展。黃凱奇說:“缺陷檢測是通過機器視覺手段來分析零部件信息,從而判斷其是否存在缺陷;測量是通過使用機器視覺來對考察對象的尺寸、形狀等信息進行度量;人機交互是利用機器視覺工具分析人或者其他機器發(fā)出的指令,從而實現(xiàn)對機器的操縱;環(huán)境建模是對機器周圍環(huán)境進行感知建模,比如移動機器人對路面環(huán)境進行感知建模等?!?
“目前總的看來,機器視覺在工業(yè)電子以及半導體行業(yè)應(yīng)用還是最為主要的,如PCB板缺陷檢測、IC芯片缺陷檢測等。交通領(lǐng)域的應(yīng)用如電子眼也較為廣泛,其他行業(yè)如制藥中的藥品成分分析、互聯(lián)網(wǎng)中的視覺計算廣告、物流中的物品分揀等等,都有機器視覺應(yīng)用的影子?!秉S凱奇說。
機器視覺——這“第三只眼”已在多個領(lǐng)域展現(xiàn)出了比人眼更強大的功能。黃凱奇表示:“機器視覺利用好了完全可以比人做得更好,因為不同的人在觀看時,信息得不到充分和及時的交流,主觀性也很強。而機器視覺不僅計算功能強大,而且獲取的信息通過協(xié)同分析后得到的知識會具有‘極高’的價值,尤其在其更趨于智能化之后?!?