你的位置:首頁(yè) > 傳感技術(shù) > 正文

3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代

發(fā)布時(shí)間:2017-03-17 責(zé)任編輯:wenwei

【導(dǎo)讀】3D深度視覺(jué)作為一個(gè)嶄新的技術(shù),已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等消費(fèi)級(jí)產(chǎn)品中,隨著硬件端技術(shù)的不斷進(jìn)步,算法與軟件層面的不斷優(yōu)化,3D深度視覺(jué)的精度和實(shí)用性得到大幅提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機(jī)+手勢(shì)/人臉識(shí)別”具備了大規(guī)模進(jìn)入移動(dòng)智能終端的基礎(chǔ)。
 
我們通過(guò)本報(bào)告,詳細(xì)地梳理了3D深度視覺(jué)不同技術(shù)方案與硬件結(jié)構(gòu)的差異,分析了國(guó)外公司在相關(guān)技術(shù)領(lǐng)域的布局。我們相信3D深度視覺(jué)進(jìn)入消費(fèi)級(jí)智能終端將是大勢(shì)所趨,這將為VCSEL、紅外CIS攝像頭(含紅外窄帶濾色片)、模組封裝帶來(lái)新的市場(chǎng)增量。移動(dòng)端手勢(shì)/人臉識(shí)別帶來(lái)顛覆性全新的用戶(hù)體驗(yàn),預(yù)計(jì)將實(shí)現(xiàn)快速的滲透與普及,由于消費(fèi)級(jí)智能終端龐大的用戶(hù)數(shù)量,這將創(chuàng)造一個(gè)龐大的新市場(chǎng)。
 
相關(guān)產(chǎn)業(yè)鏈?zhǔn)芤婀荆?/strong>
 
綜合技術(shù)方案提供商——海外:微軟、英特爾等科技巨頭,德州儀器、意法、英飛凌、AMS(收購(gòu)Heptagon)等芯片巨頭,SoftKinetic(索尼)、PrimeSense(蘋(píng)果)、LeapMotion等明星公司;國(guó)內(nèi):舜宇光學(xué)。
 
系統(tǒng)模組封裝——海外:LG Innotek、Sharp等;國(guó)內(nèi):舜宇光學(xué)、歐菲光等。
 
VCSEL設(shè)計(jì)——Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司。國(guó)內(nèi)相關(guān)標(biāo)的:光迅科技等。
 
VCSEL代工與封測(cè)——海外:全新、聯(lián)亞光電(外延片),宏捷科、穩(wěn)懋(代工),聯(lián)鈞、矽品、同欣(封測(cè))。國(guó)內(nèi)相關(guān)標(biāo)的:三安光電等。
 
紅外與可見(jiàn)光攝像頭——海外:大立光、玉晶光電、奇景光電、索尼、三星等;國(guó)內(nèi)相關(guān)標(biāo)的:北京君正(擬并購(gòu)豪威)、舜宇光學(xué)、歐菲光、丘鈦科技等。
 
紅外濾色片——海外:VIAVI等;國(guó)內(nèi):水晶光電等。
 
圖像處理芯片——海外:德州儀器、意法半導(dǎo)體、英飛凌、恩智浦等;國(guó)內(nèi):全志科技、北京君正、瑞芯微(國(guó)內(nèi)相關(guān)主題標(biāo)的)。
 
DOE與LENS——海外:奇景光電、精材、采鈺、臺(tái)積電等;
 
投資要點(diǎn):
 
移動(dòng)端3D深度視覺(jué)技術(shù)加速,有望創(chuàng)造一個(gè)全新的大市場(chǎng)。我們通過(guò)本報(bào)告,詳細(xì)地梳理了3D深度視覺(jué)不同技術(shù)方案與硬件結(jié)構(gòu)的差異,分析了國(guó)外公司在相關(guān)技術(shù)領(lǐng)域的布局。
 
我們相信3D深度視覺(jué)進(jìn)入消費(fèi)級(jí)智能終端將是大勢(shì)所趨,隨著硬件端技術(shù)的不斷進(jìn)步,算法與軟件層面的不斷優(yōu)化,3D深度視覺(jué)的精度和實(shí)用性得到大幅提升,這將為VCSEL、紅外CIS帶來(lái)新的市場(chǎng)增量。
 
移動(dòng)端手勢(shì)/人臉識(shí)別帶來(lái)顛覆性全新的用戶(hù)體驗(yàn),預(yù)計(jì)將實(shí)現(xiàn)快速的滲透與普及,由于消費(fèi)級(jí)智能終端龐大的用戶(hù)數(shù)量,這將創(chuàng)造一個(gè)龐大的新市場(chǎng)。
 
移動(dòng)端3D深度相機(jī)助力智能人機(jī)交互進(jìn)入新時(shí)代。從鍵盤(pán)、鼠標(biāo),到手寫(xiě)筆,再到觸控顯示屏,人機(jī)交互的大幅進(jìn)步引領(lǐng)了消費(fèi)電子的成功。但觸控顯示有著明顯的局限性,限制了用戶(hù)的使用靈活性。
 
基于3D視覺(jué)的手勢(shì)/人臉識(shí)別將對(duì)現(xiàn)有的消費(fèi)電子產(chǎn)品產(chǎn)生顛覆性的變化,帶來(lái)全新的用戶(hù)體驗(yàn),打開(kāi)更加廣闊的空間,在體感交互、運(yùn)動(dòng)控制、身份認(rèn)證等方面大幅提升用戶(hù)體驗(yàn)。
 
巨頭持續(xù)發(fā)力,提前布局移動(dòng)端3D視覺(jué)。一旦手勢(shì)識(shí)別進(jìn)入大規(guī)模普及,將對(duì)現(xiàn)有的消費(fèi)電子產(chǎn)品產(chǎn)生顛覆性的影響,人機(jī)交互將進(jìn)入全新的時(shí)代。
 
因此,包括蘋(píng)果、谷歌、微軟、英特爾、索尼、三星等科技巨頭,均在深度相機(jī)、體感交互、動(dòng)作捕捉等領(lǐng)域展開(kāi)了深度的布局,或內(nèi)部成立專(zhuān)門(mén)的研發(fā)團(tuán)隊(duì),或并購(gòu)創(chuàng)業(yè)型公司,快速獲得先進(jìn)的技術(shù),在技術(shù)方面實(shí)現(xiàn)儲(chǔ)備。
 
TOF方案技術(shù)水平大幅提升,移動(dòng)端3D視覺(jué)已具備大規(guī)模普及的基礎(chǔ)。目前在3D深度視覺(jué)領(lǐng)域,主流的方案為結(jié)構(gòu)光、TOF和雙目立體成像。TOF方案響應(yīng)速度快、深度信息精度高、識(shí)別距離范圍大、不易受環(huán)境光線(xiàn)干擾,因此是移動(dòng)端3D視覺(jué)比較可行的方案。
 
近年來(lái),在德州儀器、意法半導(dǎo)體、英飛凌、微軟等巨頭公司的推動(dòng)之下,TOF方案已經(jīng)越來(lái)越成熟,尤其是VCSEL技術(shù)的進(jìn)步,使得TOF方案已經(jīng)具備了在移動(dòng)端大規(guī)模普及的基礎(chǔ)。
 
移動(dòng)端3D視覺(jué)為VCSEL和紅外CIS攝像頭帶來(lái)市場(chǎng)新增量。如果3D深度視覺(jué)進(jìn)入移動(dòng)端應(yīng)用的話(huà),VCSEL將是重要的部件,原因就在于VCSEL可以提供高頻的調(diào)制、更快的響應(yīng)速度、高質(zhì)量的光束,同時(shí)功耗低,工藝兼容性好。
 
由于目前絕大多數(shù)智能終端已經(jīng)具備可見(jiàn)光前置和后置攝像頭,因此,3D視覺(jué)進(jìn)入消費(fèi)級(jí)智能終端之后,會(huì)增加紅外攝像頭的需求。同時(shí)3D視覺(jué)也將使紅外窄帶濾色片受益。
 
行業(yè)“增持”評(píng)級(jí),關(guān)注優(yōu)勢(shì)企業(yè)。目前海外公司在3D視覺(jué)領(lǐng)域較為領(lǐng)先,包括:綜合技術(shù)方案提供商——微軟、英特爾等巨頭,德州儀器、意法、英飛凌、AMS(收購(gòu)Heptagon)等芯片巨頭,SoftKinetic(索尼)、PrimeSense(蘋(píng)果)、LeapMotion等明星公司;系統(tǒng)模組封裝——LG Innotek、Sharp等;VCSEL設(shè)計(jì)——Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司。
 
臺(tái)灣公司在VCSEL代工和攝像頭方面比較領(lǐng)先,VCSEL由全新、聯(lián)亞光電等提供外延片,然后由宏捷科、穩(wěn)懋等進(jìn)行晶圓制造,再經(jīng)過(guò)聯(lián)鈞、矽品、同欣(基板)等的封測(cè),攝像頭方面有大立光、玉晶光電、奇景光電等。DOE與LENS光學(xué)器件——Heptagon、奇景光電、精材科技、臺(tái)積電等。
 
國(guó)內(nèi)方面:綜合技術(shù)方案與模組封裝提供商——舜宇光學(xué);VCSEL發(fā)射器——光迅科技、三安光電;紅外與可見(jiàn)攝像頭——北京君正(擬收購(gòu)豪威)、舜宇光學(xué)、歐菲光、丘鈦科技;紅外窄帶濾色片——水晶光電;圖像處理芯片——全志科技、北京君正等。
 
風(fēng)險(xiǎn)提示:3D視覺(jué)技術(shù)移動(dòng)端進(jìn)程過(guò)慢;國(guó)內(nèi)相關(guān)公司缺乏競(jìng)爭(zhēng)力。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
1.3D深度相機(jī)助力智能人機(jī)交互進(jìn)入新時(shí)代

1)從按鍵、觸控筆到觸摸屏,智能交互的進(jìn)步助力智能手機(jī)的輝煌
 
人機(jī)交互(簡(jiǎn)寫(xiě)HCI),是指人與計(jì)算機(jī)之間使用某種對(duì)話(huà)語(yǔ)言,以一定的交互方式,為完成確定任務(wù)的人與計(jì)算機(jī)之間的信息交換過(guò)程。
 
在上世紀(jì)計(jì)算機(jī)高速發(fā)展的過(guò)程中,除了硬件芯片技術(shù)和軟件系統(tǒng)技術(shù)的突飛猛進(jìn)之外,鍵盤(pán)和鼠標(biāo)這兩大交互設(shè)備的出現(xiàn),極大地推動(dòng)了計(jì)算機(jī)在普通消費(fèi)市場(chǎng)的應(yīng)用,普通用戶(hù)可以通過(guò)鍵盤(pán)和鼠標(biāo),來(lái)實(shí)現(xiàn)與計(jì)算機(jī)和網(wǎng)絡(luò)的交互。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
手機(jī)可以說(shuō)是最近二十年里最成功的消費(fèi)電子產(chǎn)品,而手機(jī)的發(fā)展史也伴隨著人機(jī)交互方式的變遷,可以說(shuō)人機(jī)交互的變革在一定程度上促進(jìn)了手機(jī)的輝煌。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2002年左右,大尺寸顯示技術(shù)更加成熟,手機(jī)正面的按鍵由于太占面積,而被大尺寸的屏幕所取代,為實(shí)現(xiàn)更加方便的交互,觸控筆開(kāi)始出現(xiàn),并且得到了普及。隨著無(wú)線(xiàn)通訊和手機(jī)性能的提升,手機(jī)可以像電腦一樣工作,2005年出現(xiàn)的黑莓手機(jī),采用全鍵盤(pán)設(shè)計(jì),實(shí)現(xiàn)快速辦公。
 
2007年蘋(píng)果手機(jī)的橫空出世,宣告了智能手機(jī)新時(shí)代的到來(lái),蘋(píng)果手機(jī)憑借其突破性的大尺寸觸控顯示、豐富的APP內(nèi)容資源、優(yōu)質(zhì)的拍照和音樂(lè)體驗(yàn)以及出色的產(chǎn)品質(zhì)量,成為了全球智能手機(jī)皇冠上的明珠。
 
尤其是第一代蘋(píng)果手機(jī)配有的大尺寸觸控顯示屏幕,具有劃時(shí)代的意義,為消費(fèi)者帶來(lái)了前所未有的用戶(hù)體驗(yàn),引領(lǐng)越來(lái)越多消費(fèi)者選擇智能手機(jī)。
 
根據(jù)IDC的統(tǒng)計(jì)數(shù)據(jù),2008年全球智能手機(jī)出貨量為1.5億部,到2015年提升到14.3億部,復(fù)合年均增速38.0%,尤其是2010-2013年間,增速在60%左右。如果與PC電腦相比的話(huà),智能手機(jī)在2007到2011年的5年時(shí)間內(nèi),出貨量就超過(guò)了已經(jīng)發(fā)展30多年的個(gè)人電腦(從1980年到2011年)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2)3D深度相機(jī)將進(jìn)一步解放雙手,打開(kāi)新的智能人機(jī)交互空間
 
現(xiàn)如今,大尺寸觸控顯示屏已經(jīng)是大多數(shù)智能終端的標(biāo)配,無(wú)論是智能手機(jī)、平板電腦,還是筆記本電腦,甚至于汽車(chē)中控臺(tái)、智能家電等。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
盡管觸控顯示屏的識(shí)別精度和清晰度越來(lái)越高,但是,觸控顯示屏的局限性非常明顯:手指必須接觸于屏幕表面,無(wú)法離開(kāi)屏幕工作,這極大地限制了用戶(hù)的使用空間和靈活性,為了解決這一問(wèn)題,語(yǔ)音控制與體感控制開(kāi)始出現(xiàn),并被廣泛看好。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
蘋(píng)果公司于2011年推出的iPhone4S配備了語(yǔ)音識(shí)別助手Siri,利用人工智能技術(shù),通過(guò)與消費(fèi)者的語(yǔ)言對(duì)話(huà),實(shí)現(xiàn)信息的交互。隨后,語(yǔ)音交互越來(lái)越多地出現(xiàn)在智能終端上,尤其是隨著人工智能語(yǔ)義識(shí)別技術(shù)的進(jìn)步,語(yǔ)音交互的準(zhǔn)確性和實(shí)用性大幅提升。亞馬遜于2015年推出的ECHO智能音箱便是典型成功例子。
 
語(yǔ)音識(shí)別可以完全解放雙手,但是在人機(jī)互動(dòng)方面的應(yīng)用場(chǎng)景有一定的局限性,對(duì)于游戲娛樂(lè)、互動(dòng)體驗(yàn)、拍照等領(lǐng)域,這些必須有用戶(hù)肢體參與的場(chǎng)景,語(yǔ)音交互無(wú)法滿(mǎn)足需求。因此,比現(xiàn)今觸控屏更高層次的體感交互成為了廣大廠商追求的目標(biāo)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
要實(shí)現(xiàn)體感交互,最重要的就是手勢(shì)識(shí)別,因?yàn)槭植縿?dòng)作是人體最豐富也是最常用的體感動(dòng)作。對(duì)于智能手機(jī)而言,如果手勢(shì)識(shí)別可以得到應(yīng)用,那么包括手機(jī)自拍、游戲、瀏覽網(wǎng)頁(yè)、購(gòu)物等眾多應(yīng)用場(chǎng)景,在用戶(hù)體驗(yàn)上均可以實(shí)現(xiàn)大幅提升,手機(jī)也將從觸控屏?xí)r代走向手勢(shì)識(shí)別時(shí)代。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
同時(shí),人臉識(shí)別與追蹤也是體感交互最具前景的方向之一。我們認(rèn)為,人臉識(shí)別在移動(dòng)端具有更加廣闊的應(yīng)用空間。例如目前指紋識(shí)別已經(jīng)成為智能手機(jī)的標(biāo)配,通過(guò)指紋識(shí)別來(lái)實(shí)現(xiàn)開(kāi)機(jī)、支付、登陸確認(rèn)等功能已經(jīng)被大眾所認(rèn)可,并且創(chuàng)造了巨大的市場(chǎng)價(jià)值,但是指紋識(shí)別的局限性在于必須通過(guò)手指完成,手指放置的位置、手指表面的潔凈度等因素都會(huì)極大地影響使用體驗(yàn),而人臉識(shí)別可以完全解放雙手,只需要借助攝像頭對(duì)人臉信息的采集便可以完成識(shí)別與交互。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3)手勢(shì)識(shí)別被廣泛看好,前景廣闊
 
無(wú)論是消費(fèi)級(jí)市場(chǎng)的游戲、娛樂(lè)、交互,還是商業(yè)領(lǐng)域的醫(yī)療、工業(yè)、軍事等,都需要豐富的手部動(dòng)作來(lái)參與,因此手勢(shì)識(shí)別具有非常廣泛的應(yīng)用場(chǎng)景。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
當(dāng)然,智能手機(jī)市場(chǎng)才是最吸引人的市場(chǎng),因?yàn)橹悄苁謾C(jī)可以說(shuō)已經(jīng)成為全球幾十億用戶(hù)的生活必需品,智能手機(jī)龐大的用戶(hù)數(shù)量以及用戶(hù)每日超長(zhǎng)的使用時(shí)間,都將帶來(lái)巨大的市場(chǎng)價(jià)值。
 
手機(jī)中集成手勢(shì)識(shí)別將帶來(lái)眾多的益處,包括:全新的用戶(hù)界面實(shí)現(xiàn)了超越觸摸屏的更深層次的控制功能,并將引領(lǐng)游戲和智能手機(jī)控制進(jìn)入全新時(shí)代;新的控制感知更為靈活,戴著手套或是手不干凈時(shí)也可進(jìn)行控制;帶來(lái)更豐富的用戶(hù)體驗(yàn),它無(wú)需機(jī)械開(kāi)關(guān)、無(wú)需觸摸屏或按鈕就可實(shí)現(xiàn)家居自動(dòng)化。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
受益于游戲機(jī)、PC電腦以及平板等移動(dòng)裝置的技術(shù)整合,市場(chǎng)研究機(jī)構(gòu)ABI Research預(yù)估,全球眼球追蹤、手勢(shì)以及距離傳感器技術(shù)領(lǐng)域在2016年創(chuàng)造近50億美元的收入。
 
根據(jù)IHS的數(shù)據(jù),2014 年全球手勢(shì)識(shí)別與傳感器市場(chǎng)達(dá)到了31.2億美元的規(guī)模,過(guò)去幾年的復(fù)合年增長(zhǎng)率為32.78%,預(yù)計(jì)到2022年該市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)321.6億美元。技術(shù)進(jìn)步使硬件精度大幅提升,從而進(jìn)一步拉升了對(duì)手勢(shì)識(shí)別與傳感器市場(chǎng)的需求。在智能手機(jī)與汽車(chē)領(lǐng)域,手勢(shì)識(shí)別與傳感器市場(chǎng)呈現(xiàn)指數(shù)增長(zhǎng),其中的關(guān)鍵因素為硬件成本低廉,同時(shí)可大幅改善用戶(hù)體驗(yàn)。
 
4)人臉識(shí)別從專(zhuān)業(yè)市場(chǎng)走向消費(fèi)市場(chǎng),應(yīng)用領(lǐng)域大幅擴(kuò)寬
 
早期的人臉識(shí)別主要用于身份認(rèn)證與安全檢測(cè),主要針對(duì)專(zhuān)業(yè)市場(chǎng)。例如在金融、政府、軍事、海關(guān)、監(jiān)獄等機(jī)密單位,通過(guò)人臉識(shí)別完成用戶(hù)身份的驗(yàn)證與權(quán)限的檢測(cè)等。隨著人臉識(shí)別算法的不斷優(yōu)化,人臉識(shí)別技術(shù)不再局限于簡(jiǎn)單的單體身份認(rèn)證,而是擴(kuò)展至群體的安防監(jiān)控領(lǐng)域。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
正如我們前文所述,人臉識(shí)別更大的機(jī)會(huì)在于消費(fèi)級(jí)市場(chǎng),人臉識(shí)別在移動(dòng)端具有更加廣闊的應(yīng)用空間,而目前人臉識(shí)別向消費(fèi)市場(chǎng)滲透的趨勢(shì)越發(fā)明顯,尤其是在人臉識(shí)別技術(shù)逐步提升的背景之下。
 
例如,人臉識(shí)別可以替代手勢(shì)識(shí)別完成移動(dòng)端的身份認(rèn)證、支付交易確認(rèn)、權(quán)限登錄等功能;人臉識(shí)別直接獲取消費(fèi)者面部表情、生理年齡或精神狀態(tài);人臉識(shí)別用于移動(dòng)端自拍的快速對(duì)焦,用戶(hù)自拍美顏等功能……
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2.主要巨頭在移動(dòng)端3D視覺(jué)領(lǐng)域的布局

1)蘋(píng)果——整合行業(yè)先驅(qū)PrimeSense,發(fā)力3D手勢(shì)與人臉識(shí)別
 
2013年11月,蘋(píng)果收購(gòu)以色列3D傳感器生產(chǎn)商PrimeSense,收購(gòu)費(fèi)用為3.45億美元。PrimeSense曾以給微軟Kinect體感控制器提供3D技術(shù)著稱(chēng),它將玩家的動(dòng)作作為Xbox游戲的一部分,這些傳感器允許玩家無(wú)需使用控制器就可跟游戲系統(tǒng)相連。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2010年年底,PrimeSense與華碩合作開(kāi)發(fā)了Xtion Pro,和Kinect采用了同樣的3D傳感器,在PC上使用。2012年,PrimeSense推出了當(dāng)時(shí)世界上體積最小的3D傳感器Capri,它的分辨率是前代產(chǎn)品的3倍,而體型是前代的十分之一,環(huán)境光的檢測(cè)性能是前代的50倍。自2013年收購(gòu)PrimeSense之后,蘋(píng)果推動(dòng)PrimeSense的3D體感控制器向小型化發(fā)展,希望可以將其裝配到電視、PC上,最終可以用在未來(lái)的iPhone上。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2016年7月,蘋(píng)果再次公布新型3D手勢(shì)控制專(zhuān)利,是一個(gè)圖形投影儀,內(nèi)嵌在一個(gè)諸如如iPhone手機(jī)這樣的iOS設(shè)備上,可以識(shí)別出用戶(hù)的手勢(shì)操作,由此可以作為把手勢(shì)作為游戲的控制桿或者控制器。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2017年1月15日,美國(guó)權(quán)威咨詢(xún)機(jī)構(gòu)Cowen and Company發(fā)布報(bào)告稱(chēng),蘋(píng)果的下一代iPhone可能會(huì)包含某種面部識(shí)別或手勢(shì)識(shí)別功能,由安裝在前置攝像頭附近的一款新的激光發(fā)射器和紅外感應(yīng)器支持,新款iPhone可能會(huì)配備一種新的深度感應(yīng)器,可以為未來(lái)的iPhone增添手勢(shì)識(shí)別、人臉識(shí)別,甚至增強(qiáng)現(xiàn)實(shí)AR功能。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2)英特爾——持續(xù)強(qiáng)化升級(jí)RealSense,“結(jié)構(gòu)光+雙目立體光”
 
早在2012年左右,英特爾便著重研發(fā)實(shí)感技術(shù),當(dāng)時(shí)叫Perceptual Computing,即感知計(jì)算,并開(kāi)放英特爾感知計(jì)算軟件開(kāi)發(fā)套件2013版。2013年1月,英特爾聯(lián)合Nuance等多家公司推出了“感知計(jì)算”,類(lèi)似于微軟的Kinect,可進(jìn)行手勢(shì)與人臉識(shí)別,缺點(diǎn)是設(shè)備體積大,必須借助PC電腦完成。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
前置實(shí)感3D攝像頭和Kinect原理一樣,它的工作原理是“結(jié)構(gòu)光”,需要一顆紅外傳感器。遠(yuǎn)距離的3D攝像頭,使用“雙目主動(dòng)立體成像原理”,需要兩顆紅外傳感器。后文我們會(huì)詳細(xì)拆解與分析。
 
經(jīng)過(guò)多年的努力,英特爾目前可以提供包括SR300獨(dú)立攝像頭、R200遠(yuǎn)距離后置攝像頭(3-4米,室內(nèi)室外使用,640*480分辨率)、F200近距離前置攝像頭(0.2-1.2米,室內(nèi)使用,640*480分辨率)等硬件產(chǎn)品。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3)微軟——從Kinect到Handpose,3D識(shí)別精度大幅提升
 
微軟是最早涉足3D視覺(jué)的公司之一,公司在游戲領(lǐng)域推出XBOX游戲機(jī),志在與索尼和任天堂的游戲機(jī)一較高下,為了形成自己的競(jìng)爭(zhēng)優(yōu)勢(shì),微軟在2010年與PrimeSense合作,推出了XBOX360體感周邊外設(shè)——Kinect1代。
 
但是,當(dāng)時(shí)采用結(jié)構(gòu)光原理的Kinect1代的游戲體驗(yàn)并不好,產(chǎn)品的準(zhǔn)確度、圖像的分辨率和響應(yīng)速度一直不理想。最大的問(wèn)題是精度很難提高,因?yàn)橛?jì)算斑點(diǎn)位移需要用圖像在一個(gè)小范圍區(qū)域內(nèi)的來(lái)做塊匹配,導(dǎo)致?tīng)奚讼袼丶?jí)別的細(xì)節(jié),凸凹不平的表面、物體邊緣、很細(xì)的物體很難檢測(cè)準(zhǔn)確的深度。
 
2012年微軟先后收購(gòu)了TOF(時(shí)間光)相機(jī)公司canesta和3dv,2013年微軟終止與PrimeSense的合作,自行開(kāi)發(fā)了Kinect2代(成為Kinect one),采用的是TOF(時(shí)間光)原理,無(wú)論精度、分辨率還是響應(yīng)時(shí)間都得到了很大的提升。
TOF原理發(fā)射一個(gè)強(qiáng)度隨時(shí)間周期變化的正弦信號(hào),通過(guò)獲得發(fā)射、接受信號(hào)的相位差來(lái)計(jì)算深度,精度高很多。關(guān)于Kinect2代的原理分析我們將在后文詳細(xì)闡述。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
4)谷歌——Tango項(xiàng)目野心勃勃,提前布局移動(dòng)端3D視覺(jué)
 
Project Tango是谷歌公司的明星研究項(xiàng)目,由谷歌先進(jìn)技術(shù)與項(xiàng)目部門(mén)和部分研究人員,以及硅谷Movidius(已被英特爾收購(gòu))合作研發(fā),后者提供的芯片技術(shù)可以分析和表達(dá)來(lái)自傳感器和攝像頭的數(shù)據(jù)。Project Tango項(xiàng)目的目標(biāo)是希望將人類(lèi)的視覺(jué)帶入移動(dòng)設(shè)備,為移動(dòng)設(shè)備加入類(lèi)似人類(lèi)對(duì)空間和運(yùn)動(dòng)的感知能力。
 
Project Tango包含三塊技術(shù):運(yùn)動(dòng)追蹤(MotionTracking),深度感知(Depth Perception)和區(qū)域?qū)W習(xí)(Area Learning)。首先是運(yùn)動(dòng)追蹤,設(shè)備可以通過(guò)內(nèi)置的姿態(tài)傳感器(加速度計(jì)和陀螺儀等)來(lái)感知當(dāng)前的位置;接下來(lái)是更深入的3D識(shí)別,可以檢查出周?chē)澜绛h(huán)境的形狀,類(lèi)似于英特爾的RealSense 3D攝像技術(shù),可以獲得更準(zhǔn)確的姿態(tài)控制以及3D對(duì)象渲染;最后就是對(duì)周?chē)沫h(huán)境和區(qū)域繪制地圖。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
5)索尼——收購(gòu)明星企業(yè)SoftKinetic,彌補(bǔ)短板
 
2015年10月,SONY 宣布收購(gòu)比利時(shí)傳感器技術(shù)提供商SoftKinetic。SoftKinetic是一家專(zhuān)門(mén)從事深度傳感攝像頭技術(shù)的電腦視覺(jué)初創(chuàng)型企業(yè),成立于2007年,專(zhuān)注研發(fā)體感技術(shù),其傳感器技術(shù)能夠追蹤諸如手勢(shì)等相關(guān)的圖像。
 
SoftKinetic技術(shù)能夠部署到安裝在增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)硬件上的攝像頭之中,從而增加手勢(shì)與面部追蹤的能力。SoftKinetic公司的攝像機(jī)采用TOF方案。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
6)三星——手勢(shì)識(shí)別助力凌空操作Gear VR
 
科技公司Gestigon和Pmd在16年6月宣布在三星GearVR上合作研發(fā)手勢(shì)識(shí)別,結(jié)合Pmd的CamBoard pico flexx深度傳感器和Gestigon的Carnival AR/VR Interaction Suite(增強(qiáng)/虛擬現(xiàn)實(shí)互動(dòng)套件),在現(xiàn)有的VR設(shè)備上進(jìn)行無(wú)觸摸手勢(shì)交互。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3.移動(dòng)端3D視覺(jué)主要技術(shù)背景與原理分析

1)計(jì)算機(jī)視覺(jué)技術(shù)主要分類(lèi)
 
如同人眼可以對(duì)所見(jiàn)到的圖像信息進(jìn)行分析與判斷一樣,計(jì)算機(jī)視覺(jué)技術(shù)的目的就是用攝影機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量等機(jī)器視覺(jué),并進(jìn)一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像。
 
計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展主要經(jīng)歷了:二維圖像靜態(tài)識(shí)別、二維圖像動(dòng)態(tài)識(shí)別、三維圖像動(dòng)態(tài)識(shí)別三個(gè)階段。
 
我們以手勢(shì)識(shí)別技術(shù)為例,可以粗略分為兩個(gè)階段:二維手勢(shì)識(shí)別和三維手勢(shì)識(shí)別,二維手勢(shì)識(shí)別又可以劃分為二維手型識(shí)別和二維手勢(shì)識(shí)別。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
相比較二維手勢(shì)識(shí)別,三維手勢(shì)識(shí)別增加了一個(gè)Z軸的信息,它可以識(shí)別各種手型、手勢(shì)和動(dòng)作。三維手勢(shì)識(shí)別也是現(xiàn)在手勢(shì)識(shí)別發(fā)展的主要方向。不過(guò)這種包含一定深度信息的手勢(shì)識(shí)別,需要特別的硬件來(lái)實(shí)現(xiàn),常見(jiàn)的有通過(guò)紅外光+光學(xué)傳感器來(lái)完成。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2)三種主流的3D機(jī)器視覺(jué)技術(shù)
 
根據(jù)硬件實(shí)現(xiàn)方式的不同,目前行業(yè)內(nèi)所采用的主流3D機(jī)器視覺(jué)大約有三種:結(jié)構(gòu)光、TOF時(shí)間光、雙目立體成像。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
結(jié)構(gòu)光(Structure Light)
 
通過(guò)激光的折射以及算法計(jì)算出物體的位置和深度信息,進(jìn)而復(fù)原整個(gè)三維空間。結(jié)構(gòu)光的代表產(chǎn)品有微軟的Kinect一代。
 
通過(guò)發(fā)射特定圖形的散斑或者點(diǎn)陣的激光紅外圖案,當(dāng)被測(cè)物體反射這些圖案,通過(guò)攝像頭捕捉到這些反射回來(lái)的圖案,計(jì)算上面散斑或者點(diǎn)的大小,跟原始散斑或者點(diǎn)的尺寸做對(duì)比,從而測(cè)算出被測(cè)物體到攝像頭之間的距離。
 
目前是業(yè)界比較成熟的深度檢測(cè)方案,很多的激光雷達(dá)和3D掃描技術(shù)都是采用的結(jié)構(gòu)光方案。
 
不過(guò)由于以折射光的落點(diǎn)位移來(lái)計(jì)算位置,這種技術(shù)不能計(jì)算出精確的深度信息,對(duì)識(shí)別的距離也有嚴(yán)格的要求。而且容易受到環(huán)境光線(xiàn)的干擾,強(qiáng)光下不適合,響應(yīng)也比較慢。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
典型的結(jié)構(gòu)光方案包括:PrimeSense(微軟Kinect1代)、英特爾RealSense(前置方案)。
 
光飛行時(shí)間(TIme of Flight)
 
TOF系統(tǒng)是一種光雷達(dá)(LIDAR) 系統(tǒng),可從發(fā)射極向?qū)ο蟀l(fā)射光脈沖,接收器則可通過(guò)計(jì)算光脈沖從發(fā)射器到對(duì)象,再以像素格式返回到接收器的運(yùn)行時(shí)間來(lái)確定被測(cè)量對(duì)象的距離。
 
TOF系統(tǒng)可同時(shí)獲得整個(gè)場(chǎng)景,確定3D范圍影像。利用測(cè)量得到的對(duì)象坐標(biāo)可創(chuàng)建3D影像,并可用于機(jī)器人、制造、醫(yī)療技術(shù)以及數(shù)碼攝影等領(lǐng)域的設(shè)備控制。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
TOF方案的優(yōu)點(diǎn)在于響應(yīng)速度快,深度信息精度高,不容易受環(huán)境光線(xiàn)干擾,這些優(yōu)點(diǎn)使其成為移動(dòng)端手勢(shì)識(shí)別最被看好的方案。代表廠商有微軟(Kinect2代)、意法半導(dǎo)體、英飛凌、德州儀器等。
 
多角立體成像(MulTI-camera)
 
現(xiàn)在手勢(shì)識(shí)別領(lǐng)域的佼佼者Leap MoTion使用的就是這種技術(shù)。它使用兩個(gè)或者兩個(gè)以上的攝像頭同時(shí)采集圖像,通過(guò)比對(duì)這些不同攝像頭在同一時(shí)刻獲得的圖像的差別,使用算法來(lái)計(jì)算深度信息,從而多角三維成像。
 
Leap MoTion方案使用2個(gè)攝像機(jī)獲得左右立體影像,該影像有些輕微偏移,與人眼同序。計(jì)算機(jī)通過(guò)比較這兩個(gè)影像,就可獲得對(duì)應(yīng)于影像中物體位移的不同影像。該不同影像或地圖可以是彩色的,也可以為灰階,具體取決于特定系統(tǒng)的需求。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
雙目多角立體成像方案的優(yōu)點(diǎn)在于不容易受到環(huán)境光線(xiàn)的干擾,適合室外環(huán)境,滿(mǎn)足7*24小時(shí)的長(zhǎng)時(shí)間工作要求,不易損壞。缺點(diǎn)是昏暗環(huán)境、特征不明顯時(shí)不適合,目前應(yīng)用在智能安防監(jiān)控、機(jī)器人視覺(jué)、物流檢測(cè)等領(lǐng)域。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3)典型3D視覺(jué)硬件拆解與分析

英特爾RealSense(結(jié)構(gòu)光+雙目立體成像)
 
RealSense前置實(shí)感 3D 攝像頭和 Kinect 1代原理一樣,它的工作原理是“結(jié)構(gòu)光”。主動(dòng)發(fā)出特定圖案的紅外光,紅外光遇到環(huán)境中的各種障礙物發(fā)生折射,然后由設(shè)備上的攝像頭接收這些折射光,并通過(guò)芯片進(jìn)行實(shí)時(shí)計(jì)算分析,計(jì)算出所處的空間位置。
 
RealSense遠(yuǎn)距離的3D攝像頭,英特爾使用“雙目主動(dòng)立體成像原理”,需要兩顆紅外傳感器。它模仿了人眼的“視差”原理,通過(guò)打出一束紅外光,以左紅外傳感器和右紅外傳感器追蹤這束光的位置,然后用三角定位原理來(lái)計(jì)算出 3D 圖像中的“深度”信息。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
根據(jù)國(guó)外科技媒體Chipworks對(duì)應(yīng)用在聯(lián)想電腦Yoga15上的RealSense前置相機(jī)的拆解,采用結(jié)構(gòu)光原理,與微軟Kinect1代和蘋(píng)果PrimeSense原理類(lèi)似,由紅外激光器發(fā)射出紅外光,經(jīng)過(guò)物體的反射,被紅外探測(cè)器所接收,反射光圖案的位置取決于反射物體的距離,通過(guò)分析反射圖案的幾何形狀,重建一個(gè)三維(3D)的場(chǎng)景。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
微軟Kinect 2代(TOF方案)
 
2013年5月,微軟發(fā)布了基于TOF原理的Kinect2代(Kinectone)設(shè)備,替代了1代的“結(jié)構(gòu)光”的測(cè)算方法,使新Kinect2代比原始Kinect1代更快、更準(zhǔn)確。
 
Kinect2代采用了1080p視頻傳感器,提高了深度傳感器所能支持的最大分辨率來(lái)允許捕捉更多的細(xì)節(jié),如手指動(dòng)作和肢體定位。Kinect2代每秒數(shù)據(jù)處理量可達(dá)2GB,采用了USB3.0的接口,動(dòng)作輸入延遲僅為66毫秒。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
根據(jù)chipworks對(duì)Kinect One的拆解,主要核心部件為三顆紅外激光二極管、一顆紅外光圖像傳感器、一顆可見(jiàn)光圖像傳感器和一顆圖像處理主芯片。
 
主要工作原理為,紅外激光二極管以正弦信號(hào)的形式發(fā)射近紅外激光,光碰到環(huán)境中的物體發(fā)生反射,紅外光圖像傳感器采集反射光,計(jì)算反射信號(hào)與發(fā)射信號(hào)的時(shí)間差,從而得知位置距離信息,采用三顆紅外激光二極管的原因在于提供空間自由度更大的探測(cè),可見(jiàn)光相機(jī)的作用是獲取環(huán)境實(shí)時(shí)的XY平面物體信息。
 
4.移動(dòng)端3D視覺(jué)產(chǎn)業(yè)鏈分析

1)移動(dòng)端3D視覺(jué)硬件與產(chǎn)業(yè)鏈結(jié)構(gòu)
 
目前在移動(dòng)端3D視覺(jué)方面,三種主流的方案(結(jié)構(gòu)光、TOF時(shí)間光、雙目立體成像)中,已經(jīng)比較成熟的是結(jié)構(gòu)光和TOF時(shí)間光。
 
其中結(jié)構(gòu)光方案最為成熟,已經(jīng)大規(guī)模應(yīng)用于工業(yè)3D視覺(jué)領(lǐng)域,但是極易受到外界光的干擾、響應(yīng)速度較慢、識(shí)別精度較低,而TOF方案在這幾個(gè)方面均比結(jié)構(gòu)光方案具有一定的優(yōu)勢(shì),因此TOF成為了目前在移動(dòng)端被看好的方案。
 
雙目立體成像方案抗環(huán)境光干擾強(qiáng),分辨率高,也是移動(dòng)端可選方案之一,但是技術(shù)較新不夠成熟,目前在機(jī)器人、自動(dòng)駕駛領(lǐng)域應(yīng)用較多。
 
蘋(píng)果公司在2017年的iPhone7中使用了意法半導(dǎo)體提供的基于TOF原理的前置距離傳感器(proximity sensor)。
 
而在此之前,蘋(píng)果的iPhone5和iPhone6s采用的都是Heptagon提供的LED+光探測(cè)器的方案,從LED+光探測(cè)器到TOF,表明移動(dòng)端TOF方案在技術(shù)方面已經(jīng)獲得了巨大的進(jìn)步。
 
通過(guò)Chipworks網(wǎng)站的拆解,可以看到意法為iPhone7提供的基于TOF原理的距離傳感器,主要包括一個(gè)VCSEL發(fā)射器和兩個(gè)SPAD(單光子雪崩二極管)探測(cè)器,被整合于一般的CMOS工藝中。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
TOF時(shí)間光相比于結(jié)構(gòu)光更加適合應(yīng)用到智能手機(jī)上,采用TOF原理來(lái)實(shí)現(xiàn)動(dòng)作追蹤和深度感知已經(jīng)出現(xiàn)在谷歌的Project Tango方案中,主要用于空間三維數(shù)據(jù)的采集,與應(yīng)用于手勢(shì)/臉部識(shí)別是非常接近的。
 
在景深傳感器方面,采用的是TOF原理,使用的是英飛凌和PMD合作開(kāi)發(fā)的技術(shù)方案。
 
根據(jù)日本Nomura公司的分析報(bào)告,聯(lián)想Phab2 Pro在紅外發(fā)射方面采用的是Princeton Optronics設(shè)計(jì)的VCSEL(垂直腔面發(fā)射器),由臺(tái)灣宏捷科(AWSC)提供代工;在紅外接收方面,英飛凌負(fù)責(zé)提供紅外CIS芯片,PMD提供飛時(shí)測(cè)距(TOF)形成景深數(shù)據(jù)部分;整個(gè)TOF模塊由中國(guó)舜宇光學(xué)提供封裝。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
通過(guò)詳細(xì)分析微軟Kinect二代(TOF原理),可以看到TOF方案的主要硬件結(jié)構(gòu)為:紅外光發(fā)射器(IR LD)、紅外光圖像傳感器(IR CIS)、可見(jiàn)光圖像傳感器(Vis CIS)、圖像處理芯片,硬件結(jié)構(gòu)與聯(lián)想Phab2 Pro相機(jī)是非常類(lèi)似的。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
整個(gè)三維視覺(jué)系統(tǒng)的工作原理為:首先紅外激光發(fā)射器(IR LD)發(fā)射出近紅外光(IR Light),經(jīng)過(guò)人手或人臉的反射之后,被紅外圖像傳感器(IR CIS)所接收,這個(gè)圖像信息用來(lái)計(jì)算人手所處的位置(Z軸);
 
同時(shí),可見(jiàn)光圖像傳感器采集二維平面(X與Y軸)的人手信息(Vis Light);兩顆圖像傳感器的信息匯總至專(zhuān)用的圖像處理芯片,從而得到人手或人臉的三維數(shù)據(jù),實(shí)現(xiàn)空間定位。
 
TOF與結(jié)構(gòu)光的區(qū)別在于對(duì)紅外光的使用方式不同,TOF通過(guò)計(jì)算紅外光發(fā)出光線(xiàn)與返回光線(xiàn)之間的向位移變化換算為位置信息,而結(jié)構(gòu)光依靠向物體投射一系列光線(xiàn)圖案組合,然后通過(guò)檢測(cè)光線(xiàn)的邊緣來(lái)測(cè)量距離,二者的硬件結(jié)構(gòu)是類(lèi)似的。
 
二者比較明顯的區(qū)別在于,在紅外光發(fā)射端,結(jié)構(gòu)光由于需要形成特定的光學(xué)圖案,所以需要添加特制的DOE(衍射光柵)和Lens(光學(xué)棱鏡)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2)硬件層面:VCSEL與紅外CIS攝像頭成為市場(chǎng)新增量
 
根據(jù)中國(guó)臺(tái)灣科技時(shí)報(bào)的統(tǒng)計(jì)數(shù)據(jù),對(duì)于移動(dòng)端3D視覺(jué)而言,紅外光發(fā)射器的成本在2-2.5美元/顆,是占比最高的單顆元器件;圖像處理芯片,為1-1.5美元/顆;紅外CIS與可見(jiàn)CIS的價(jià)格接近,為1-2美元/顆,在紅外CIS上還需要添加高質(zhì)量的紅外濾色片(IR Fliter),價(jià)格為0.5-1美元/顆。整個(gè)系統(tǒng)模組的封裝成本為3-4美元/顆。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
紅外光發(fā)射器
 
紅外主要波長(zhǎng)是700nm-2500nm。目前的攝像頭圖像傳感器對(duì)900nm以上的紅外光感應(yīng)差,需要更強(qiáng)的光才能感測(cè)到,這就要求紅外發(fā)射器有更大的電流,更多的功耗。
 
而800nm以下的波長(zhǎng),太靠近可見(jiàn)光,極其容易受到太陽(yáng)光的干擾,所以一般紅外的波長(zhǎng)在800nm-900nm。目前,可以提供800-900nm波段的光源主要有三種:紅外LED、紅外LD(激光二極管)和VCSEL(垂直腔面發(fā)射激光器)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
三星Note7和富士通ARROWS NXF-04G手機(jī)中搭載的虹膜識(shí)別功能,采用的就是紅外LED作為發(fā)光光源,波長(zhǎng)為810nm,歐司朗提供。
 
虹膜識(shí)別采用紅外LED的重要原因是LED可提供大角度散射光,消費(fèi)者在使用時(shí)位置即使眼睛位置有所偏差,虹膜也可以被照射到。
 
但是紅外LED不適合移動(dòng)端3D視覺(jué),尤其是集成到手機(jī)上的話(huà),因?yàn)槠涔饩€(xiàn)指向性差、功耗大、響應(yīng)速度較慢。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
紅外激光二極管是指可在一個(gè)頻率上產(chǎn)生相干紅外光束的半導(dǎo)體二極管,通常是由砷化鎵或摻雜有銦和鋁之類(lèi)其他材料的砷化鎵制成。
 
與LED相比,具有激光的定向性好、高亮度特點(diǎn),比較常見(jiàn)的是LD-DFB規(guī)格(以FP腔為諧振腔,發(fā)出多縱模相干光),為邊發(fā)射模式(簡(jiǎn)稱(chēng)EEL)。在激光通信、光存儲(chǔ)、光陀螺、激光打印、測(cè)距以及雷達(dá)等方面以及獲得了廣泛的應(yīng)用。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
VCSEL可以說(shuō)是紅外激光LD的一種,全名為垂直共振腔表面放射激光,顧名思義,它是可以垂直發(fā)射模式,與其他紅外LD的邊發(fā)射模式不同。
 
VCSEL的垂直結(jié)構(gòu)更加適合進(jìn)行晶圓級(jí)制造和封測(cè),規(guī)模量產(chǎn)之后的成本相比于邊發(fā)射LD有優(yōu)勢(shì),可靠性高,沒(méi)有傳統(tǒng)的激光器結(jié)構(gòu)如暗線(xiàn)缺陷的失效模式。相比于LED,VCSEL的光譜質(zhì)量高,中心波長(zhǎng)溫漂小,響應(yīng)速度快,優(yōu)勢(shì)明顯。
 
綜合分析三種方案,LED雖然成本低,但是發(fā)射光角度大,必須輸出更多的功率以克服損失。
 
此外,LED不能快速調(diào)制,限制了分辨率,需要增加閃光持續(xù)時(shí)間;邊發(fā)射LD也是手勢(shì)識(shí)別的可選方案,但是輸出功率固定,邊緣發(fā)射的模式在制造工藝方面兼容性不好。
 
VCSEL比LD-EEL的優(yōu)勢(shì)在于所需的驅(qū)動(dòng)電壓和電流小,功耗低,光源可調(diào)變頻率更高(可達(dá)數(shù)GHz),與化合物半導(dǎo)體工藝兼容,適合大規(guī)模集成制造。尤其是VCSEL功耗低、可調(diào)頻率高的優(yōu)點(diǎn),使其比LD-EEL更加適合消費(fèi)電子智能終端。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
VCSEL的制造依賴(lài)于MBE(分子束外延)或MOCVD(金屬有機(jī)物氣相沉積)工藝,在GaAs(80%左右的份額)或InP(15%左右的份額)晶圓上生長(zhǎng)多層反射層與發(fā)射層。
 
典型的VCSEL結(jié)構(gòu)包括:激光腔(laser cavity),頂部和底部分布式布拉格反射器(DBR),電極等部分,其中激光腔的主要部分是量子阱(quantum wells)和光限制層(confinement structure)。
 
由于VCSEL主要采用三五族化合物半導(dǎo)體材料GaAs或InP(含有In、Al等摻雜),因此移動(dòng)端VCSEL產(chǎn)業(yè)鏈與化合物半導(dǎo)體產(chǎn)業(yè)鏈結(jié)構(gòu)類(lèi)似。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
目前,全球范圍內(nèi)主要的設(shè)計(jì)者包括Finsar、Lumentum、Princeton Optronics、Heptagon、ⅡⅥ等公司,它們?cè)谝苿?dòng)端VCSEL處于前沿的研發(fā)角色。
 
由IQE、全新、聯(lián)亞光電等公司提供三五族化合物EPI外延硅片,然后由宏捷科(Princeton Optronics合作方)、穩(wěn)懋(Heptagon合作方)等公司進(jìn)行晶圓制造,再經(jīng)過(guò)聯(lián)鈞、矽品等公司的封測(cè),便變成了獨(dú)立的VCSEL器件。
 
然后由設(shè)計(jì)公司提供給意法半導(dǎo)體、德州儀器、英飛凌等綜合解決方案商,再提供給下游消費(fèi)電子廠商。
 
紅外光圖像傳感器
 
紅外CMOS圖像傳感器(IR CIS)用來(lái)接收被手部或臉部反射的紅外光,這是一個(gè)比較成熟的器件。
 
在搭載虹膜識(shí)別功能的三星Note7和富士通ARROWS NX F-04G手機(jī)中均出現(xiàn)IR CIS,其中三星的紅外CIS中傳感芯片由三星自家提供,鏡頭來(lái)自于韓國(guó)廠商Kolen,模組由韓國(guó)廠商Patron制造。
 
目前來(lái)看,紅外CIS供應(yīng)商主要包括意法半導(dǎo)體、奇景光電、三星電子、富士通等公司。
 
相比于可見(jiàn)光CIS,紅外CIS還是一個(gè)比較小的市場(chǎng),但是增速很快,隨著熱成像、汽車(chē)夜視、安防監(jiān)控、手勢(shì)識(shí)別、虹膜識(shí)別等的普及,紅外CIS出貨量有望快速增長(zhǎng)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
對(duì)于3D視覺(jué)而言,IR紅外攝像頭與RGB可見(jiàn)光攝像頭在濾色片方面存在較大的差異。傳統(tǒng)的RGB可見(jiàn)光攝像頭,需要采用高通紅外濾色片,將不必要的低頻近紅外光過(guò)濾掉,以免紅外光線(xiàn)對(duì)可見(jiàn)光部分造成影響,產(chǎn)生偽色或波紋,同時(shí)可以提高有效分辨率和彩色還原性。
 
但是紅外攝像頭,為了不受到環(huán)境光線(xiàn)的干擾,需要使用窄帶濾色片,只允許特定波段的近紅外光通過(guò),目前近紅外窄帶濾色片主要采用干涉原理,需要幾十層光學(xué)鍍膜構(gòu)成,相比于RGB吸收型濾色片具有更高的技術(shù)難度和產(chǎn)品價(jià)格。
 
目前,近紅外窄帶濾色片主要廠商包括VIAVI、水晶光電等。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
可見(jiàn)光圖像傳感器
 
可見(jiàn)光圖像傳感器(Vis CIS)是非常成熟的商業(yè)化產(chǎn)品,隨著智能手機(jī)拍照功能的不斷完善,可見(jiàn)光CIS的分辨率越來(lái)越高、功耗越來(lái)越小、技術(shù)也越來(lái)越先進(jìn)。
 
圖像處理芯片
 
圖像處理芯片需要將紅外光CIS采集的位置信息與可見(jiàn)光CIS采集的物體平面信息處理成單像素含有深度信息的三維圖像。
該芯片具有一定的技術(shù)壁壘,對(duì)于算法層面的要求較高,目前全球范圍內(nèi)可以提供該類(lèi)產(chǎn)品的公司為少數(shù)幾家芯片巨頭,包括意法半導(dǎo)體、德州儀器、英飛凌和恩智浦(已被高通收購(gòu))等。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
紅外光發(fā)射端DOE與Lens
 
對(duì)于結(jié)構(gòu)光方案而言,在紅外光發(fā)射端必須配有DOE(衍射光柵)和Lens(光學(xué)棱鏡),因?yàn)榻Y(jié)構(gòu)光需要以線(xiàn)條等圖案的形式發(fā)射紅外光,這需要特定的光柵和光學(xué)棱鏡的參與才能夠?qū)崿F(xiàn)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3)算法與軟件層面:AI人工智能將成為提升精度的重要因素
 
隨著AI人工智能技術(shù)的大幅進(jìn)步,人工智能方案已經(jīng)在語(yǔ)音識(shí)別、語(yǔ)義理解、圖片識(shí)別等領(lǐng)域取得成功,在物體識(shí)別、人臉識(shí)別方面也取得了長(zhǎng)足的進(jìn)步,3D視覺(jué)在算法方面與人工智能結(jié)合,將實(shí)現(xiàn)識(shí)別精度的大幅提升,對(duì)于更加復(fù)雜的手部動(dòng)作/面部表情可以進(jìn)行更加深刻的理解和分析,這將極大促進(jìn)3D視覺(jué)的推廣和實(shí)用價(jià)值。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
5.國(guó)內(nèi)外產(chǎn)業(yè)鏈相關(guān)公司分析
 
在主流的三種技術(shù)方案中,TOF方案響應(yīng)速度快,深度信息精度高,識(shí)別距離范圍大,不易受環(huán)境光線(xiàn)干擾,因此是移動(dòng)端3D視覺(jué)比較可行的方案;結(jié)構(gòu)光方案由于技術(shù)較為成熟,工業(yè)化產(chǎn)品較多,也被部分廠商所采用;雙目立體成像是比較新的技術(shù),參與的廠商較少,更適合室外強(qiáng)光條件和高分辨率應(yīng)用,目前主要應(yīng)用在機(jī)器人視覺(jué)、自動(dòng)駕駛等方面。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
1)綜合技術(shù)方案提供商
 
目前,在深度相機(jī)綜合技術(shù)方案方面,國(guó)外參與的公司眾多,既有微軟、英特爾等巨頭,也有德州儀器、意法半導(dǎo)體、英飛凌、AMS(Heptagon)等芯片巨頭,還包括SoftKinetic(索尼收購(gòu))、PrimeSense(蘋(píng)果收購(gòu))、LeapMotion等明星創(chuàng)業(yè)型公司。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
目前,國(guó)內(nèi)從事深度攝像頭綜合技術(shù)方案的主要公司包括:TOF方案——舜宇光學(xué)、??低暋⑸钲跇?lè)行天下,結(jié)構(gòu)光方案——深圳奧比中光、南京華捷艾米,雙目立體成像方案——上海圖漾科技。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
2)系統(tǒng)模組封裝與集成供應(yīng)商
 
由于3D視覺(jué)方案涉及較多的硬件部分,需要紅外發(fā)射端、紅外接收攝像頭、可見(jiàn)光攝像頭、圖像處理芯片四大部分的協(xié)同合作,紅外光的發(fā)射與接收之間的匹配對(duì)整個(gè)3D視覺(jué)方案的準(zhǔn)確度和響應(yīng)速度至關(guān)重要,因此整個(gè)系統(tǒng)模組的封裝和集成是非常關(guān)鍵的。
 
在聯(lián)想Phab2 Pro手機(jī)中,3D深度相機(jī)的模組封裝與集成由舜宇光學(xué)完成。除了舜宇光學(xué)之外,具備移動(dòng)端3D方案模組封裝的廠商還包括歐菲光、LG Innotek、Sharp等。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
3)紅外光發(fā)射器-VCSEL
 
由于VCSEL在高端短距離光通訊領(lǐng)域應(yīng)用廣泛,因此國(guó)內(nèi)光通訊器件龍頭光迅科技在VCSEL方面已經(jīng)有商業(yè)化產(chǎn)品推出。但是,致力于移動(dòng)端VCSEL設(shè)計(jì)的公司主要包括Finsar、Lumentum、PrincetonOptronics、Heptagon、ⅡⅥ等國(guó)外公司,國(guó)內(nèi)公司涉及較少。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
中科院長(zhǎng)春光機(jī)所在VCSEL科研領(lǐng)域處于世界前沿地位,2014年5月長(zhǎng)春光機(jī)所在國(guó)內(nèi)首次研制出堿金屬原子光學(xué)傳感技術(shù)專(zhuān)用的795nm和894nm 垂直腔面發(fā)射激光器(VCSEL)??勺鳛楹诵墓庠从糜谛酒?jí)原子鐘、原子磁力計(jì)、原子陀螺儀等堿金屬原子傳感器。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
VCSEL主要基于三五族化合物砷化鎵制造而成,目前在VCSEL和制造和封測(cè)方面,目前主要是臺(tái)灣化合物半導(dǎo)體廠商參與,包括外延片提供商IQE(英國(guó))、全新、聯(lián)亞光電,晶圓代工宏捷科、穩(wěn)懋,封測(cè)廠聯(lián)鈞、矽品等。
 
國(guó)內(nèi)方面,三安光電在化合物半導(dǎo)體外延生長(zhǎng)和晶圓制造領(lǐng)域發(fā)展迅速,具備較強(qiáng)的實(shí)力,公司在國(guó)家大基金的支持下建設(shè)年產(chǎn)30萬(wàn)片GaAs和6萬(wàn)片GaN的6寸生產(chǎn)線(xiàn),建設(shè)進(jìn)程順利。
 
4)紅外與可見(jiàn)CIS攝像頭
 
紅外CMOS圖像傳感器(IR CIS)用來(lái)接收被手部反射的紅外光,這是一個(gè)比較成熟的芯片。
 
紅外CIS供應(yīng)商主要包括意法半導(dǎo)體、奇景光電、三星電子、富士通等公司。相比于可見(jiàn)光CIS,紅外CIS還是一個(gè)比較小的市場(chǎng),但是增速很快,隨著熱成像、汽車(chē)、監(jiān)控、手勢(shì)識(shí)別、虹膜識(shí)別等的普及,紅外CIS出貨量有望快速增長(zhǎng)。
 
中國(guó)大陸目前已經(jīng)在攝像頭方面形成了完善的產(chǎn)業(yè)鏈結(jié)構(gòu),在CIS芯片方面有北京君正(OV)、格科微電子、比亞迪電子等公司,在光學(xué)透鏡方面有舜宇光學(xué)、聯(lián)創(chuàng)電子等,在模組制造方面有歐菲光、舜宇光學(xué)、丘鈦科技等公司。
 
根據(jù)前文我們的分析,對(duì)于3D視覺(jué)而言,IR紅外攝像頭與RGB可見(jiàn)光攝像頭在濾色片方面存在較大的差異。紅外攝像頭為了不受到環(huán)境光線(xiàn)的干擾,需要使用窄帶濾色片,只允許特定波段的近紅外光通過(guò)。目前,近紅外窄帶濾色片主要廠商包括VIAVI、水晶光電等。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
5)圖像處理芯片
 
該芯片具有一定的技術(shù)壁壘,對(duì)于算法層面的要求較高,目前全球范圍內(nèi)可以提供該類(lèi)產(chǎn)品的公司為少數(shù)幾家芯片巨頭,包括意法半導(dǎo)體、德州儀器、英飛凌、恩智浦、安霸,以及索尼、東芝、富士通等日本芯片巨頭。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
在圖像處理芯片方面,國(guó)內(nèi)公司全志科技、北京君正和瑞芯微具備一定的實(shí)力,尤其是在幾年前平板電腦爆發(fā)時(shí)得到了快速成長(zhǎng)。
 
3D視覺(jué)深度研究:智能交互進(jìn)入新時(shí)代
 
6)國(guó)內(nèi)產(chǎn)業(yè)鏈?zhǔn)芤婀緟R總
 
經(jīng)過(guò)我們前文的分析,移動(dòng)端3D視覺(jué)作為一個(gè)嶄新的技術(shù),已經(jīng)出現(xiàn)在微軟Kinect、英特爾RealSense等產(chǎn)品中,隨著硬件端技術(shù)的不斷進(jìn)步,算法與軟件層面的不斷優(yōu)化,3D視覺(jué)的精度和實(shí)用性不斷得到提升,尤其是TOF方案與VCSEL的快速成熟,使得“深度相機(jī)+手勢(shì)/面部識(shí)別”具備了大規(guī)模進(jìn)入移動(dòng)智能終端的基礎(chǔ)。
 
分析整個(gè)產(chǎn)業(yè)鏈的結(jié)構(gòu),無(wú)論是結(jié)構(gòu)光方案、TOF方案,還是雙目立體成像方案,主要可以劃分為:綜合技術(shù)方案提供商、算法與軟件商、硬件供應(yīng)商三部分,其中硬件又可以劃分為四大元器件(紅外發(fā)射器、紅外CIS攝像頭、可見(jiàn)光CIS攝像頭、圖像處理芯片,另外紅外攝像頭需要特制的窄帶濾色片,結(jié)構(gòu)光方案需要發(fā)射端光學(xué)棱鏡與DOE光柵,雙目立體成像方案多一顆紅外CIS攝像頭)。
 
綜合技術(shù)方案提供商
 
國(guó)內(nèi)從事深度攝像頭綜合技術(shù)方案的主要公司包括:TOF方案——舜宇光學(xué)(2382.HK)、深圳樂(lè)行天下,結(jié)構(gòu)光方案——深圳奧比中光、南京華捷艾米,雙目立體成像方案——上海圖漾科技。
 
系統(tǒng)模組封裝與集成供應(yīng)商
 
在聯(lián)想Phab2 Pro手機(jī)中,3D深度相機(jī)的模組封裝與集成由舜宇光學(xué)完成。歐菲光、丘鈦科技等相機(jī)模組制造商,由于在相機(jī)模組制造方面積累了豐富的經(jīng)驗(yàn),具備發(fā)展相應(yīng)技術(shù)的潛力。
 
算法與軟件商
 
目前,算法方面還沒(méi)有成為獨(dú)立的一環(huán),因?yàn)榇蟛糠志C合技術(shù)方案供應(yīng)商已經(jīng)在算法層面進(jìn)行優(yōu)化,目標(biāo)是為客戶(hù)提供硬件+算法一體化的方案。
 
硬件供應(yīng)商
 
紅外發(fā)射器
 
國(guó)內(nèi)在VCSEL方面起步較晚,在設(shè)計(jì)方面還不具有有競(jìng)爭(zhēng)力的公司,長(zhǎng)春光機(jī)所在VCSEL科研領(lǐng)域處于世界先進(jìn)水平;光迅科技曾開(kāi)發(fā)出光通信使用的VCSEL芯片。由于VCSEL主要材料為GaAs(摻雜In、Al等),在工藝方面與化合物半導(dǎo)體類(lèi)似,在化合物晶圓制造方面,三安光電具有較強(qiáng)的實(shí)力。
 
紅外與可見(jiàn)光CIS
 
中國(guó)大陸目前已經(jīng)在攝像頭方面形成了完善的產(chǎn)業(yè)鏈結(jié)構(gòu),在CIS芯片方面有北京君正(擬收購(gòu)OV和思必科)、格科微電子、比亞迪電子等公司,在光學(xué)透鏡方面有舜宇光學(xué)、聯(lián)創(chuàng)電子,在模組制造方面有歐菲光、舜宇光學(xué)、丘鈦科技等公司。
 
3D視覺(jué)方案需要克服環(huán)境光線(xiàn)的干擾,因此在紅外CIS上需要添加窄帶濾色片,國(guó)內(nèi)公司水晶光電具有深厚的技術(shù)基礎(chǔ)和較高的國(guó)際知名度,有望受益。
 
圖像處理芯片
 
在圖像處理芯片方面,國(guó)內(nèi)公司全志科技、北京君正和瑞芯微具備一定的實(shí)力,尤其是在幾年前平板電腦爆發(fā)時(shí)得到了快速成長(zhǎng)。
 
結(jié)構(gòu)光DOE與Lens
 
對(duì)于結(jié)構(gòu)光方案而言,需要通過(guò)衍射光柵DOE和光學(xué)棱鏡Lens,獲得特定形狀的光斑,一般采用MEMS工藝制造加工。
 
 
 
 
推薦閱讀:


傳感器知識(shí)大講堂之電渦流傳感器
防水技術(shù)仍是智能手機(jī)的一大痛點(diǎn)
這些領(lǐng)域的發(fā)展都離不開(kāi)溫濕度傳感器
石英晶體振蕩器分類(lèi)及選用指南
基礎(chǔ)知識(shí)科普:什么是電感式傳感器?
 
 


 
特別推薦
技術(shù)文章更多>>
技術(shù)白皮書(shū)下載更多>>
熱門(mén)搜索
?

關(guān)閉

?

關(guān)閉