機器視覺和智能圖像處理技術之間的對比關系

2019-07-09

具有智能圖像處理功能的機器視覺,相當于人們在賦予機器智能的同時爲機器按上了眼睛,使機器能夠“看得見”、“看得准”,可替代甚至勝過人眼做測量和判斷,使得機器視覺系統可以實現高分辨率和高速度的控制。而且,機器視覺系統與被檢測對象無接觸,安全可靠。

1、機器視覺技術

機器視覺的起源可追溯到20世紀60年代美國學者L.R.羅伯茲對多面體積木世界的圖像處理研究,70年代麻省理工學院(MIT)人工智能實驗室“機器視覺”課程的開設。到80年代,全球性機器視覺研究熱潮開始興起,出現了一些基于機器視覺的應用系統。90年代以後,隨著計算機和半導體技術的飛速發展,機器視覺的理論和應用得到進一步發展。

進入21世紀後,機器視覺技術的發展速度更快,已經大規模地應用于多個領域,如智能制造、智能交通、醫療衛生、安防監控等領域。目前,隨著人工智能浪潮的興起,機器視覺技術正處于不斷突破、走向成熟的新階段。

在中国,机器视觉的研究和应用开始于20世纪90年代。从跟踪国外品牌七次郎在线视频起步,经过二十多年的努力,国内的机器视觉从无到有,从弱到强,不仅理论研究进展迅速,而且已经出现一些颇具竞争力的公司和七次郎在线视频。估计随着国内对机器视觉研究、开发和推广的不断深入,赶上和超越世界水平已不是遥不可及的事情了。

常見機器視覺系統主要可分爲兩類,一類是基于計算機的,如工控機或PC,另一類是更加緊湊的嵌入式設備。典型的基于工控機的機器視覺系統主要包括:光學系統,攝像機和工控機(包含圖像采集、圖像處理和分析、控制/通信)等單元,如圖2所示。機器視覺系統對核心的圖像處理要求算法准確、快捷和穩定,同時還要求系統的實現成本低,升級換代方便。

机器视觉和智能圖像處理技術之间的关系

图2 机器视觉系统示例

2、智能圖像處理技術

機器視覺的圖像處理系統對現場的數字圖像信號按照具體的應用要求進行運算和分析,根據獲得的處理結果來控制現場設備的動作,其常見功能如下:

(1)圖像采集

圖像采集就是從工作現場獲取場景圖像的過程,是機器視覺的第一步,采集工具大多爲CCD或CMOS照相機或攝像機。照相機采集的是單幅的圖像,攝像機可以采集連續的現場圖像。就一幅圖像而言,它實際上是三維場景在二維圖像平面上的投影,圖像中某一點的彩色(亮度和色度)是場景中對應點彩色的反映。這就是我們可以用采集圖像來替代真實場景的根本依據所在。

如果相机是模拟信号输出,需要将模拟图像信号数字化后送给计算机(包括嵌入式系统)处理。现在大部分相机都可直接输出数字图像信号,可以免除模数转换这一步骤。不仅如此,现在相机的数字输出接口也是标准化的,如USB、VGA、1394、HDMI、WiFi、Blue Tooth接口等,可以直接送入计算机进行处理,以免除在图像输出和计算机之间加接一块图像采集卡的麻烦。后续的图像处理工作往往是由计算机或嵌入式系统以软件的方式进行。

(2)圖像預處理

對于采集到的數字化的現場圖像,由于受到設備和環境因素的影響,往往會受到不同程度的幹擾,如噪聲、幾何形變、彩色失調等,都會妨礙接下來的處理環節。爲此,必須對采集圖像進行預處理。常見的預處理包括噪聲消除、幾何校正、直方圖均衡等處理。

通常使用時域或頻域濾波的方法來去除圖像中的噪聲;采用幾何變換的辦法來校正圖像的幾何失真;采用直方圖均衡、同態濾波等方法來減輕圖像的彩色偏離。總之,通過這一系列的圖像預處理技術,對采集圖像進行“加工”,爲體機器視覺應用提供“更好”、“更有用”的圖像。

(3)圖像分割

圖像分割就是按照應用要求,把圖像分成各具特征的區域,從中提取出感興趣目標。在圖像中常見的特征有灰度、彩色、紋理、邊緣、角點等。例如,對汽車裝配流水線圖像進行分割,分成背景區域和工件區域,提供給後續處理單元對工件安裝部分的處理。

圖像分割多年來一直是圖像處理中的難題,至今已有種類繁多的分割算法,但是效果往往並不理想。近來,人們利用基于神經網絡的深度學習方法進行圖像分割,其性能勝過傳統算法。

(4)目標識別和分類

在制造或安防等七次郎在线视频,機器視覺都離不開對輸入圖像的目標進行識別和分類處理,以便在此基礎上完成後續的判斷和操作。識別和分類技術有很多相同的地方,常常在目標識別完成後,目標的類別也就明確了。近來的圖像識別技術正在跨越傳統方法,形成以神經網絡爲主流的智能化圖像識別方法,如卷積神經網絡(CNN)、回歸神經網絡(RNN)等一類性能優越的方法。

(5)目標定位和測量

在智能制造中,最常見的工作就是對目標工件進行安裝,但是在安裝前往往需要先對目標進行定位,安裝後還需對目標進行測量。安裝和測量都需要保持較高的精度和速度,如毫米級精度(甚至更小),毫秒級速度。這種高精度、高速度的定位和測量,倚靠通常的機械或人工的方法是難以辦到的。在機器視覺中,采用圖像處理的辦法,對安裝現場圖像進行處理,按照目標和圖像之間的複雜映射關系進行處理,從而快速精准地完成定位和測量任務。

(6)目標檢測和跟蹤

圖像處理中的運動目標檢測和跟蹤,就是實時檢測攝像機捕獲的場景圖像中是否有運動目標,並預測它下一步的運動方向和趨勢,即跟蹤。並及時將這些運動數據提交給後續的分析和控制處理,形成相應的控制動作。圖像采集一般使用單個攝像機,如果需要也可以使用兩個攝像機,模仿人的雙目視覺而獲得場景的立體信息,這樣更加有利于目標檢測和跟蹤處理。

3、機器視覺的應用

如圖3所示,機器視覺應用廣泛,如安防、制造、教育、出版、醫療、交通、軍事領域等。在這些機器數額的應用中,智能圖像處理都是不可或缺的,這裏僅簡要介紹其中幾個方面的應用。

机器视觉和智能圖像處理技術之间的关系

图3 常见机器视觉应用场合

(1)智能制造

爲了實現中國智能制造2025這一宏偉目標,離不開機器視覺。例如,在智能圖像處理一直處于領先地位的廣東迅通科技股份有限公司(以下簡稱“迅通科技”)針對這一需求開發出了機器視覺分析儀平台,見圖4。其中,迅通科技爲某知名汽車廠商裝配流水線開發的車門限位器自動定位、檢測和識別的系統,見圖5。該系統通過智能圖像識別方式,自動檢測型號是否正確,定位是否准確,完全代替了人工操作,檢測准確率達到100%。此前,每個工位需要4個工人用眼睛來檢查、定位16種型號限位器,員工不僅很容易疲勞,還時常出現差錯。

机器视觉和智能圖像處理技術之间的关系

图4 迅通机器视觉分析仪平台

机器视觉和智能圖像處理技術之间的关系

图5 工件识别/定位检测系统(现场)

(2)教育考試

考试试卷时常发现因排版或印刷错误影响学生考试,利用智能圖像處理技術,机器自动对印刷后的试卷和原版试卷进行比对,发现不一致之处,会自动提示并报警,完全替代之前只能通过人工对试卷进行校验。

(3)出版印刷

和教育考试类似,专业出版印刷厂由于印刷的图书、报纸杂志,以及承接来自企业七次郎在线视频包装和宣传资料的种类多,数量大,排版和印刷中经常出错。为此,需安排不少专业人员进行校对,耗费大量的资金和时间。通过利用智能圖像處理技術进行自动校对,既提高了校对准确度,又缩短了校对时间,降低了印刷成本,缩短了出版物的交付周期。

(4)安防監控

這是當前備受機器視覺關注的一個領域。機器視覺打破了傳統視頻監控系統的限制,增加了系統的智能,使得智能視頻分析得以逐步實現。以公共場所的視頻監控爲例,通過運用機器視覺技術,可以實現對可疑人物的自動檢測、人臉識別、實時跟蹤,必要時還可以實現多攝像機接連跟蹤,同時發出告警,存儲現場信息。

(5)智能交通

機器視覺在交通領域有著廣泛的應用。例如,在高速公路上及卡口處,對來往車輛進行車型、牌照等識別,甚至對行駛車輛的違規行爲進行識別。在汽車上對駕駛員面部圖像進行分析,判斷駕駛員是否處于疲勞駕駛狀態。再如,無人駕駛汽車借助于機器視覺技術,使用攝像頭、激光/毫米波/超聲波雷達、GPS等感知道路環境信息,自動規劃和控制車輛的安全行駛。

有数据显示,2016年全球机器视觉系统的市场规模约46亿美元, 2017年约50亿美元,预计2018年达到55亿美元,年增长率为10%左右。中国机器视觉市场的增长是从2010年开始的,2017年市场规模约68亿元,预计到2020年或达780亿元,市场增长率将超过100%。

4、技術瓶頸及今後的發展

在机器视觉的智能圖像處理技術的发展中,还存在不少技术瓶颈,如:

(1)穩定性:某種處理方法往往在研究和開發中表現良好,但在複雜多變的應用環境中,卻不時地出現問題。例如人臉識別系統,在目標配合時識別率可高達95%以上,但在實際監控環境下,識別率就會大大下降。

(2)實時性:如果圖像的采集速度、處理速度較慢,再加上新近引入的深度學習類算法,加大了系統實時處理的難度,跟不上機器運行和控制的節奏。

(3)准確性:機器視覺系統要求圖像識別和測量的准確性接近100%,任何微小的誤差都有可能帶來不可預測的後果。例如目標定位的誤差會使裝配出來的設備不符合要求。

(4)系統能力:目前的嵌入式圖像處理系統,存在芯片的計算能力不足,存儲空間有限等問題,常常不能滿足運算量較大的圖像處理運算,如神經網絡的叠代運算,大規模矩陣運算等。

今後機器視覺中智能圖像處理的發展主要體現在以下幾個方面:

(1)算法:傳統算法繼續不斷有所突破,新一波人工智能浪潮帶來不少新的性能優良的圖像處理算法,如深度學習(DL),卷積神經網絡(CNN),生成對抗網絡(GAN),等等。

(2)實時性:出現更多結構新穎、資源充足、運算快速的硬件平台支撐,例如基于多CPU、多GPU的並行處理結構的計算機,海量存儲單元等。

(3)嵌入式:新的高速的信號處理器陣列,超大規模FPGA芯片。

(4)融合處理:從單圖像傳感器發展到多傳感器(多視點)的融合處理,可更加充分地獲取現場信息。還可融合多類傳感器,如圖像傳感器、聲音傳感器、溫度傳感器等共同完對現場目標定位、識別和測量。


掃描二維碼分享到微信

在線咨詢
聯系七次郎在线视频

0757-86688699