【導(dǎo)讀】機器視覺(MV)是一種使機器人和自動駕駛汽車等其他機器能夠看到和識別周圍環(huán)境中物體的技術(shù)。在過去幾年里,機器視覺的進步使得許多機器人和自動駕駛汽車擁有了幾乎與人類相似的感知水平。這個過程主要是通過將光學(xué)傳感器與人工智能和可以分析和處理圖像數(shù)據(jù)的機器學(xué)習(xí)工具進行配對,此時搭載了機器視覺系統(tǒng)的機器人和自動駕駛汽車就能夠執(zhí)行非常復(fù)雜的任務(wù)了。
眼睛和大腦:
機器視覺和計算機視覺的主要區(qū)別
很多時候,機器視覺會與計算機視覺一詞混為一談。然而,事實上二者還是有區(qū)別的。對機器視覺而言,它通常與具備計算機視覺能力的工業(yè)應(yīng)用聯(lián)系在一起,需要攝像頭來捕捉和提供圖像數(shù)據(jù)。計算機視覺的任務(wù)則是將已有的圖像數(shù)字化,處理其中包含的數(shù)據(jù)并采取某種行動。
一般來講,機器視覺系統(tǒng)的處理能力相對較小,主要用于精益制造環(huán)境,通過高速執(zhí)行實際任務(wù)以獲取完成指定作業(yè)所需的數(shù)據(jù)。計算機視覺系統(tǒng)是處理視覺數(shù)據(jù)的人工智能(AI)和機器學(xué)習(xí)(ML)算法的所在,它需要收集盡可能多的關(guān)于物體或場景的數(shù)據(jù)并充分理解它們。因此,計算機視覺既要能夠分析來自運動檢測器、紅外傳感器等來源的圖像,又可以在沒有相機的情況下執(zhí)行任務(wù),掃描數(shù)字網(wǎng)絡(luò)照片或視頻,處理來自任何來源(包括互聯(lián)網(wǎng))的圖像。從本質(zhì)上講,機器視覺就是系統(tǒng)的眼睛,而計算機視覺則相當(dāng)于系統(tǒng)的大腦。
相機:
機器視覺系統(tǒng)中的重要組件
機器視覺是一項看似簡單但實際上相當(dāng)復(fù)雜的技術(shù)。首先,它需要使用專門的光學(xué)器件來捕捉周圍環(huán)境中的視覺信息。然后,再借助硬件和軟件的組合對圖像的某些特征進行處理、分析和測量。例如,作為制造系統(tǒng)的一部分的機器視覺應(yīng)用程序可以用于分析在裝配線上制造的零件的特定特性,確定零件是否符合質(zhì)量標(biāo)準(zhǔn)。
在實際應(yīng)用中,機器視覺常常被看作是計算機的一種視覺能力,其系統(tǒng)由一個或多個光學(xué)傳感器(如高分辨率相機)、模數(shù)轉(zhuǎn)換(ADC)和數(shù)字信號處理(DSP)等器件組成。相機和傳感器用于收集感光形式的圖像,并將其轉(zhuǎn)化為電信號,所產(chǎn)生的電信號經(jīng)數(shù)字化處理后被傳輸?shù)接嬎銠C進行分析并提供所需的輸出。在技術(shù)復(fù)雜性上,機器視覺與語音識別相似。
目前,用于制造業(yè)的機器視覺主要采用兩種類型的相機,即:面陣掃描相機和線陣掃描相機。
面陣掃描相機使用矩形傳感器在單個幀中拍攝照片,傳感器中的像素數(shù)量對應(yīng)于圖像的寬度和高度。線陣掃描相機是逐個像素地構(gòu)建圖像,它們適用于拍攝運動中或尺寸不規(guī)則的物品的圖像。在拍攝照片時,傳感器在物體上以線性運動通過,因此,線陣掃描相機不像面陣掃描相機那樣局限于特定的分辨率。
相機的靈敏度和分辨率是機器視覺系統(tǒng)的兩個重要參數(shù),其中,分辨率負責(zé)區(qū)分物體,而靈敏度是機器在光線昏暗或波長不可見的情況下檢測物體或微弱脈沖的能力。一般來說,分辨率越大,視野就越有限。靈敏度和分辨率是相互依存的,如果其他因素不變,增加靈敏度就會降低分辨率,而增加分辨率則會降低靈敏度。面陣相機的分辨率和掃描頻率一般均低于線陣相機。
許多機器視覺相機的分辨率超過4,500萬像素,這些相機能以極高的速度拍攝物體而不會失真。推動機器視覺功能的另一個進步是基于事件的視覺傳感器。這些傳感器處理圖像的方式與人眼的視神經(jīng)處理信息的方式類似。更具體地說,這些基于事件的視覺傳感器檢測每個像素的亮度變化。這種能力使機器視覺能夠在比傳統(tǒng)的基于幀的視覺傳感器暗得多的環(huán)境中使用。
Sony Spresense的ISX012是一款有效像素達到511萬像素的圖像傳感器,相機板在Spreseense的主板上使用了這款結(jié)構(gòu)緊湊、高分辨率的傳感器來擴展主板的功能。板載編碼器可以采集JPEG、RAW、Y/C或RGB格式的圖片。相機板通過專用的并行接口直接連接到主板,當(dāng)與主板上CXD5602微控制器的AI功能相結(jié)合時,可為物聯(lián)網(wǎng)設(shè)備提供先進的視覺功能。
圖1:可提供先進的視覺功能的
Sony Spresense相機板(圖源:Mouser)
當(dāng)然,出于應(yīng)用成本的考慮,機器視覺系統(tǒng)不是越復(fù)雜越好,而應(yīng)選擇適合的。一維(1D)視覺、二維(2D)視覺以及三維(3D)視覺這三種類型是常用的、面向不同任務(wù)的機器視覺系統(tǒng)。
01 1D視覺
1D視覺不會一次性完成整個物體圖像的分析,而是一次讀取一行,通常采用線陣掃描相機,這種類型的機器視覺常常用在制造過程中的產(chǎn)品檢測,比如用來發(fā)現(xiàn)傳送帶上產(chǎn)品中的缺陷;
02 2D視覺
2D視覺主要使用數(shù)碼相機收集圖像數(shù)據(jù),通過比較一幅圖像與下一幅圖像的變化來確定下一步應(yīng)采取的處理措施,這種類型的機器視覺通常用于物體跟蹤以及產(chǎn)品的類型驗證等;
03 3D視覺
3D視覺通常在不同位置使用多個數(shù)碼相機和其他傳感器來捕捉物體的數(shù)字模型或圖像,從而對其位置、大小和特征進行準(zhǔn)確的評估,因此,3D機器視覺非常適合幫助機器人導(dǎo)航周圍環(huán)境并執(zhí)行與訂單相關(guān)的任務(wù)。
隨著不同垂直行業(yè)對質(zhì)量檢測和自動化的需求不斷增加,3D機器視覺市場將以高于行業(yè)平均水平的速度實現(xiàn)快速增長。Grand View Research的分析數(shù)據(jù)表明,2022年,全球3D機器視覺市場規(guī)模為58.1億美元,預(yù)計2023年至2030年的復(fù)合年增長率(CAGR)將達到13.5%。
ams OSRAM公司的Mira220全局快門圖像傳感器是一款體積小巧、專為工業(yè)機器視覺應(yīng)用而設(shè)計的2D和3D解決方案,有效分辨率為1,600(H)x 1,400(V),幀速率可高達90fps,深度為12位。Mira220采用的先進背面照明(BSI)技術(shù)將傳感器層堆疊在數(shù)字/讀出層的頂部,這種設(shè)計產(chǎn)生了占位面積僅為5.3毫米×5.3毫米的芯片級封裝,特別適合空間受限產(chǎn)品的設(shè)計。
Mira220的功耗非常低,在睡眠模式下僅需4mW,在空閑模式下功耗40mW,而在90fps的全分辨率下也僅僅需要350mW。此外,Mira220傳感器還可以利用MIPI CSI-2接口方便地與處理器和FPGA進行交互。
圖2:專為工業(yè)機器視覺應(yīng)用而設(shè)計的ams OSRAM的Mira220全局快門圖像傳感器(圖源:ams OSRAM)
工業(yè):
機器視覺應(yīng)用的主戰(zhàn)場
機器人之所以能與人類做同樣的工作,主要歸功于機器視覺。機器人手臂用它來檢查從裝配線上下來的零件和產(chǎn)品,確定哪些符合質(zhì)量標(biāo)準(zhǔn)。此外,機器視覺還使機器人和人類之間的協(xié)作更加高效和安全。現(xiàn)在,機器視覺已經(jīng)成為工業(yè)4.0過程自動化的關(guān)鍵技術(shù),其中汽車、制藥、包裝、食品和飲料等垂直行業(yè)是使用機器人系統(tǒng)比較突出的領(lǐng)域。
據(jù)Grand View Research的分析,2022年,全球機器視覺市場規(guī)模為168.9億美元,預(yù)計2023年至2030年將以12.3%的復(fù)合年增長率(CAGR)增長,到2030年,市場規(guī)模將達到416億美元。按照產(chǎn)品劃分,機器視覺產(chǎn)品可細分為基于PC的和基于智能攝像頭的系統(tǒng)。2022年,基于PC的細分市場在全球的市場份額超過54.92%,接下來的幾年里預(yù)計這一趨勢仍將得到延續(xù)。
與機構(gòu)或教育應(yīng)用中使用的機器視覺系統(tǒng)相比,工業(yè)機器視覺系統(tǒng)通常更耐用,并要求較高的可靠性、穩(wěn)定性和準(zhǔn)確性,而它們的成本則比在軍事、航空航天、國防和政府應(yīng)用中使用的系統(tǒng)要低很多。這也是近些年機器視覺在工業(yè)領(lǐng)域日益普及的重要原因。
在工業(yè)應(yīng)用中,機器視覺常常被用于執(zhí)行各種任務(wù),下面我們就列舉一些:
01 電子元件的識別和分析。對元器件的準(zhǔn)確識別及跟蹤是整個制造或物流過程控制的重要環(huán)節(jié)。例如,將機器視覺用于電路板的焊接過程監(jiān)控,除了完成焊接質(zhì)量檢查,還能同步檢查元器件的放置是否正確。
02 印刷缺陷識別。印刷缺陷識別的目的是定位印刷異常,如不正確的色調(diào)或印刷品的缺失或有缺陷的部分,機器視覺的應(yīng)用大幅降低了人為因素可能出現(xiàn)的錯誤。
03 材料檢查。材料檢測系統(tǒng)中的機器視覺功能確保了產(chǎn)品的質(zhì)量控制,它能準(zhǔn)確識別產(chǎn)品中的缺陷甚至污染物。例如,可將機器視覺系統(tǒng)用于藥丸和片劑的過程監(jiān)控。
04 物體定位。在機器人制導(dǎo)等應(yīng)用中,機器視覺通常被用來尋找東西,其目的是確定目標(biāo)物體的坐標(biāo)和位置。這也是機器視覺普遍的應(yīng)用之一。
05 模式識別。機器視覺在當(dāng)今的醫(yī)學(xué)診斷方面發(fā)揮了重要作用。醫(yī)學(xué)成像分析使用基于機器視覺的模式識別、磁共振成像、血液掃描和大腦掃描等技術(shù)可對疾病進行準(zhǔn)確的診斷。
06 物體識別。在汽車行業(yè),自動駕駛汽車使用機器視覺系統(tǒng)中的攝像頭拍攝的圖像進行物體識別,得以準(zhǔn)確地分析出道路上的障礙物類型。隨著自動駕駛技術(shù)的不斷演進,這一領(lǐng)域?qū)⒊蔀闄C器視覺極具發(fā)展前景的應(yīng)用之一。
人工智能:
工業(yè)機器視覺技術(shù)發(fā)展的加速器
現(xiàn)代機器視覺系統(tǒng)開始越來越多地使用人工智能(AI)方法與技術(shù),如機器學(xué)習(xí)或深度學(xué)習(xí),以及人工神經(jīng)網(wǎng)絡(luò)。AI能夠處理大量以前難以收集的圖像和數(shù)據(jù)信息,加快了決策過程。例如,簽名和字符識別,有了人工智能的加持,機器視覺系統(tǒng)可以快速甄別其中的細微差別。
在制造業(yè)中,AI有助于物體識別和材料檢查,使機器視覺系統(tǒng)能夠理解物體或材料形狀和紋理的變化。在質(zhì)量保證方面,AI系統(tǒng)可以分析出現(xiàn)的異?,F(xiàn)象,而不是單純地檢出和拒絕不符合規(guī)范的產(chǎn)品。機器視覺與AI和深度學(xué)習(xí)相結(jié)合,擴大了機器人在執(zhí)行生產(chǎn)線任務(wù)中的作用,如挑選、分揀、放置和執(zhí)行生產(chǎn)線掃描。這種技術(shù)組合還使機器人能夠在其他環(huán)境中運行,如超市、醫(yī)院和餐館等?;贏I的機器視覺還可以在更廣泛的背景和照明設(shè)置中識別缺陷,并靈活應(yīng)對產(chǎn)品外觀和缺陷類型的變化,例如凹痕或變色。
深度學(xué)習(xí)是人工智能中一個更復(fù)雜、更強大的子集,在機器視覺應(yīng)用中也越來越多地被采用。在人工智能的支持下,機器視覺系統(tǒng)常常被用來執(zhí)行復(fù)雜的任務(wù),比如質(zhì)量控制、裝配控制、過程控制和機器人操控等。在過去幾年里,將人工智能融入機器視覺應(yīng)用是工業(yè)機器視覺技術(shù)發(fā)展的主要加速器。在“未來的工廠”中,機器視覺和AI技術(shù)將是過程自動化和提高效率的關(guān)鍵組成部分。
機器視覺與AI的技術(shù)進步離不開芯片組的支持。新一代嵌入式芯片的功能更強大,成本合理,適用于處理圖像和運行基于AI的機器視覺算法,可將深度學(xué)習(xí)訓(xùn)練時間從數(shù)周減少到數(shù)小時。
NXP的i.MX 95系列應(yīng)用處理器將eIQ Neutron神經(jīng)處理單元(NPU)、Arm Mali沉浸式3D圖形處理、異構(gòu)安全分區(qū)和網(wǎng)絡(luò)功能組合在一起,可實現(xiàn)機器學(xué)習(xí)和先進的邊緣應(yīng)用。此外,i.MX95還集成了NXP的圖像信號處理器(ISP),支持多種不同的圖像傳感器,從而實現(xiàn)工業(yè)、機器人、醫(yī)療和汽車等領(lǐng)域廣泛的視覺應(yīng)用。為此,NXP專門針對機器視覺應(yīng)用對這個ISP進行了優(yōu)化,能支持兩個目標(biāo)區(qū)域、兩個曝光的HDR合成、先進降噪和邊緣增強,支持彩色、單色和RGB-IR攝像頭傳感器。
在i.MX95 SoC中,主要通過集成的eIQ Neutron NPU實現(xiàn)機器視覺,在這里,NPU作為視覺處理通路的一部分,連通多個攝像頭傳感器和網(wǎng)絡(luò)連接的智能攝像頭。
圖3:NXP i.MX95系統(tǒng)框圖
(圖源:NXP)
本文小結(jié)
工業(yè)機器視覺是使用相機、鏡頭和照明設(shè)備對制成品進行自動視覺檢查。這是一種實時檢測部件的方法,既快速又準(zhǔn)確,它可以對高速生產(chǎn)線上的每一件產(chǎn)品進行拍攝和分析,通過復(fù)雜的算法來檢查和評估在工業(yè)環(huán)境中獲取的圖像,確保100%的質(zhì)量控制。它還可以自動化許多工業(yè)檢查,包括缺陷和問題的目視檢查、產(chǎn)品存在與否檢查、產(chǎn)品類型驗證、測量和產(chǎn)品代碼讀取等。今天,工業(yè)自動化正在以驚人的速度發(fā)展,機器視覺技術(shù)在其發(fā)展和擴張中發(fā)揮著至關(guān)重要的作用。
在剛剛過去幾年里,融入了人工智能的機器視覺技術(shù)幫助許多機器人和自動駕駛汽車實現(xiàn)了幾乎與人類相似的感知水平。通過使用大量先進的光學(xué)傳感器,如高分辨率相機,這些機器人和汽車最終能夠以自己的方式擁有“看”的能力。多種技術(shù)的融合和飛速發(fā)展使得新應(yīng)用的潛力顯著增加,這意味著未來的機器視覺技術(shù)將與更多的行業(yè)相關(guān),所創(chuàng)建的解決方案也將更加通用和智能。
免責(zé)聲明:本文為轉(zhuǎn)載文章,轉(zhuǎn)載此文目的在于傳遞更多信息,版權(quán)歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權(quán)問題,請聯(lián)系小編進行處理。
推薦閱讀: