人臉識(shí)別行業(yè)分析
人臉識(shí)別與其它生物識(shí)別技術(shù)相比,優(yōu)勢(shì)在于非接觸性、非侵?jǐn)_性、硬件基礎(chǔ)完善、可拓展性。本文主要跟大家分析一下人臉識(shí)別這個(gè)行業(yè),enjoy~
一、人臉識(shí)別概況
生物識(shí)別,是指依靠人體的身體特征來(lái)進(jìn)行身份驗(yàn)證的識(shí)別技術(shù),目前較為主流的識(shí)別技術(shù)有:人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別、語(yǔ)音識(shí)別等四類。
人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。通常采用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉。人臉識(shí)別系統(tǒng)主要包括四個(gè)組成部分,分別為人臉圖像采集及檢測(cè)、人臉識(shí)別預(yù)處理、人臉圖像特征提取以及匹配與識(shí)別。
人臉識(shí)別與其它生物識(shí)別技術(shù)相比,優(yōu)勢(shì)在于非接觸性、非侵?jǐn)_性、硬件基礎(chǔ)完善、可拓展性。指紋識(shí)別唯一性比較強(qiáng),采集成本較低,但是指紋可由指紋貼、指紋膜等復(fù)制,且接觸性、侵?jǐn)_性較強(qiáng),人臉識(shí)別與其相比接觸性和侵?jǐn)_性較低;虹膜識(shí)別最精準(zhǔn),但是采集成本非常高,識(shí)別效率較低,接觸性、侵?jǐn)_性也較強(qiáng),人臉識(shí)別與其相比,采集成本低、識(shí)別效率高;語(yǔ)音識(shí)別采集成本低,但語(yǔ)音具有可變性,人臉識(shí)別與其相比,識(shí)別效率高。
人臉識(shí)別技術(shù)原理簡(jiǎn)單來(lái)講主要是三大步驟:
- 一是建立一個(gè)包含大批量人臉圖像的數(shù)據(jù)庫(kù);
- 二是通過(guò)各種方式來(lái)獲得當(dāng)前要進(jìn)行識(shí)別的目標(biāo)人臉圖像;
- 三是將目標(biāo)人臉圖像與數(shù)據(jù)庫(kù)中既有的人臉圖像進(jìn)行比對(duì)和篩選。
根據(jù)人臉識(shí)別技術(shù)原理具體實(shí)施起來(lái)的技術(shù)流程則主要包含以下四個(gè)部分,即人臉圖像的采集與預(yù)處理、人臉檢測(cè)、人臉特征提取、人臉識(shí)別和活體鑒別。
1. 采集
需要考慮圖像大小,圖像分辨率,光照環(huán)境,模糊程度,遮擋程度,采集角度 。
人臉圖像的采集有兩種途徑,分別是:人臉圖像的批量導(dǎo)入和人臉圖像的實(shí)時(shí)采集。前者是指將采集好的人臉圖像批量導(dǎo)入至人臉識(shí)別系統(tǒng),系統(tǒng)會(huì)自動(dòng)完成個(gè)人臉圖像的采集工作;后者是指調(diào)用攝像機(jī)或攝像頭在設(shè)備的可拍攝范圍內(nèi)自動(dòng)實(shí)時(shí)抓取人臉圖像并完成采集工作。
人臉圖像的預(yù)處理是指對(duì)系統(tǒng)采集到的人臉圖像進(jìn)行光線、旋轉(zhuǎn)、切割、過(guò)濾、降噪、放大縮小等處理來(lái)使得該人臉圖像符合人臉圖像特征提取的標(biāo)準(zhǔn)要求。
目前主要有三種圖像預(yù)處理手段,即灰度調(diào)整、圖像濾波、圖像尺寸歸一化。 其中灰度調(diào)整是對(duì)地點(diǎn)、設(shè)備、光照等造成的圖像質(zhì)量差異進(jìn)行處理,圖像濾波是對(duì)噪聲造成的圖像質(zhì)量差異進(jìn)行降噪處理,圖像尺寸歸一化是針對(duì)圖像像素大小不同進(jìn)行尺寸處理。
2. 人臉檢測(cè)
在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小,并把其中有用的信息挑出來(lái)(如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等),然后利用信息來(lái)達(dá)到人臉檢測(cè)的目的。
人臉檢測(cè)是指判斷是否存在人臉及定位出人臉的位置、大小與姿態(tài)。目前的人臉檢測(cè)方法可分為三類,分別是基于膚色模型的檢測(cè)、基于邊緣特征的檢測(cè)、基于統(tǒng)計(jì)理論方法的檢測(cè)。
- 基于膚色模型的檢測(cè)是利用人臉的膚色特征建立膚色模型從而進(jìn)行檢測(cè),其優(yōu)點(diǎn)是人臉的檢測(cè)速度較高,對(duì)遮擋和光照有一定的魯棒性,不足是和其他方法不太兼容, 且不易處理復(fù)雜背景和多人物同框;
- 基于邊緣特征的檢測(cè)則是利用圖像的邊緣特征進(jìn)行人臉檢測(cè),優(yōu)點(diǎn)是計(jì)算量相對(duì)較小,可實(shí)現(xiàn)實(shí)時(shí)檢測(cè),與其它特征方法可融合, 缺點(diǎn)是在復(fù)雜背景下誤檢率比較高;
- 基于統(tǒng)計(jì)理論方法的檢測(cè)則是通過(guò)對(duì)人臉特征值的循環(huán)迭代來(lái)檢測(cè)人臉,其計(jì)算速度快,應(yīng)用廣泛,但是誤檢率較高。
3. 特征提取
人臉識(shí)別系統(tǒng)可使用的特征通常分為視覺(jué)特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的,也稱人臉表征,它是對(duì)人臉進(jìn)行特征建模的過(guò)程。主要方法有基于知識(shí)的表征方法(主要包括基于幾何特征法和模板匹配法)和基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法。
- 基于知識(shí)的提取方法是根據(jù)人臉五官結(jié)構(gòu)特征等先驗(yàn)知識(shí)來(lái)進(jìn)行提取,其特點(diǎn)是識(shí)別方法比較簡(jiǎn)單、容易理解, 檢測(cè)速度較快, 但是沒(méi)有形成統(tǒng)一的特征提取標(biāo)準(zhǔn),對(duì)動(dòng)態(tài)人臉圖像的魯棒性較差;
- 基于代數(shù)特征的提取方法是基于統(tǒng)計(jì)學(xué)習(xí)的特征提取方法, 特點(diǎn)是特征易抽取,識(shí)別精度較高,應(yīng)用廣泛, 但是需要與相應(yīng)的數(shù)據(jù)庫(kù)進(jìn)行統(tǒng)計(jì)訓(xùn)練。
4. 匹配與識(shí)別
這一精確篩選的過(guò)程分為兩類:一是一對(duì)一的篩選,即對(duì)人臉身份進(jìn)行確認(rèn)的過(guò)程;二是一對(duì)多的篩選,即根據(jù)人臉相似程度進(jìn)行匹配比對(duì)的過(guò)程。此外人臉識(shí)別包含活體鑒別環(huán)節(jié),即區(qū)別識(shí)別的特征信號(hào)是否來(lái)自于真正的生物體。
關(guān)鍵技術(shù)指標(biāo):檢測(cè)率、誤檢率、漏檢率、速度。識(shí)別中的精確率、召回率、錯(cuò)誤接受率/認(rèn)假率/誤識(shí)率、錯(cuò)誤拒絕率/拒真率/拒識(shí)率
二、行業(yè)概況
2.1 行業(yè)邏輯
2.1.1 人臉識(shí)別技術(shù)日趨成熟、準(zhǔn)確率高
2018 年 11 月 16 日,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)公布了全球權(quán)威人臉識(shí)別比賽(FRVT)最新報(bào)告,從前十名企業(yè)在千分之一的誤報(bào)率下的識(shí)別準(zhǔn)確率來(lái)看,其平均能達(dá)到 99.69%,在千萬(wàn)分之一誤報(bào)下的識(shí)別準(zhǔn)確率超過(guò)99%。
意味著機(jī)器幾乎可以做到在1000萬(wàn)人的規(guī)模下準(zhǔn)確識(shí)別每一個(gè)人,而人腦記憶并辨別 100 個(gè)人的身份都很有可能犯錯(cuò),相比于去年同期,全球人臉識(shí)別性能提升了80%,且中國(guó)企業(yè)占據(jù)榜單前五位,居世界領(lǐng)先水平,為人臉識(shí)別的技術(shù)落地提供技術(shù)面支撐。
從研究學(xué)者分布來(lái)看,中國(guó)占據(jù)世界第三的位置,人才儲(chǔ)備居優(yōu)勢(shì)地位。2018 年, AMiner 基于發(fā)表于國(guó)際期刊會(huì)議的學(xué)術(shù)論文,對(duì)人臉識(shí)別領(lǐng)域全 TOP1000 的學(xué)者進(jìn)行計(jì)算分析。
從全球范圍來(lái)看,美國(guó)人臉識(shí)別研究學(xué)者聚集最多的國(guó)家,在人臉識(shí)別領(lǐng)域的研究占有絕對(duì)的優(yōu)勢(shì);英國(guó)緊隨其后,位列第二;中國(guó)位列全球第三,占有一席之地??梢钥闯?,中國(guó)的追趕勢(shì)頭不容忽視。
從公開(kāi)專利數(shù)量來(lái)看, 2007-2017年,我國(guó)人臉識(shí)別專利公開(kāi)數(shù)量總體呈上升趨勢(shì),為人臉識(shí)別商業(yè)化應(yīng)用打下基礎(chǔ)。
從每年新增數(shù)量來(lái)看, 2007 年新增專利尚不足百例,至 2015 年迎來(lái)了爆發(fā),全年新增專利已達(dá)到 1398 例,至 2017 年,我國(guó)人臉識(shí)別專利公開(kāi)數(shù)量 2698 項(xiàng),達(dá)到近年來(lái)最大值;截至 2018年7月,專利公開(kāi)數(shù)量為2163 項(xiàng), 技術(shù)實(shí)力的顯著增強(qiáng)也為國(guó)內(nèi)商業(yè)化產(chǎn)品的迅速普及打下了堅(jiān)實(shí)的基礎(chǔ)。
2.1.2 政策推動(dòng)
長(zhǎng)期以來(lái),國(guó)家高度重視人臉識(shí)別產(chǎn)業(yè)落地的發(fā)展,出臺(tái)多項(xiàng)政策助推產(chǎn)業(yè)發(fā)展。
2015 年以來(lái),國(guó)家密集出臺(tái)了《關(guān)于銀行業(yè)金融機(jī)構(gòu)遠(yuǎn)程開(kāi)立人民幣賬戶的指導(dǎo)意見(jiàn)(征求意見(jiàn)稿)》,給人臉識(shí)別普及打開(kāi);其后,《安全防范視頻監(jiān)控人臉識(shí)別系統(tǒng)技術(shù)要求》、《信息安全技術(shù)網(wǎng)絡(luò)人臉識(shí)別認(rèn)證系統(tǒng)安全技術(shù)要求》等法律法規(guī),為人臉識(shí)別在金融、安防、醫(yī)療等領(lǐng)域的普及打下了堅(jiān)實(shí)的基礎(chǔ),掃清了政策障礙。
同時(shí), 2017 年人工智能首次寫(xiě)入國(guó)家政府報(bào)告,作為人工智能的重要細(xì)分領(lǐng)域,國(guó)家對(duì)人臉識(shí)別相關(guān)的政策支持力度在不斷的加大。 2017 年 12 月發(fā)布的《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020 年)》 則具體規(guī)劃“到 2020 年,復(fù)雜動(dòng)態(tài)場(chǎng)景下人臉識(shí)別有效檢出率超過(guò) 97%,正確識(shí)別率超過(guò) 90%”。
另外,工地場(chǎng)景上,住房和城鄉(xiāng)建設(shè)部、人力資源社會(huì)保障部印發(fā)《建筑工人實(shí)名制管理辦法(試行)》明確提出:建筑企業(yè)應(yīng)配備實(shí)現(xiàn)建筑工人實(shí)名制管理所必須的硬件設(shè)施設(shè)備,施工現(xiàn)場(chǎng)原則上實(shí)施封閉式管理,設(shè)立進(jìn)出場(chǎng)門(mén)禁系統(tǒng),采用人臉、指紋、虹膜等生物識(shí)別技術(shù)進(jìn)行電子打卡;不具備封閉式管理?xiàng)l件的工程項(xiàng)目,應(yīng)采用移動(dòng)定位、電子圍欄等技術(shù)實(shí)施考勤管理。相關(guān)電子考勤和圖像、影像等電子檔案保存期限不少于2年。
2.1.3 資金推動(dòng)
根據(jù) CB Insights 在 2018 年發(fā)布的《Top AI Trends To Watch In 2018》顯示,:中國(guó)在人工智能初創(chuàng)公司的資金支持方面已超過(guò)美國(guó),位列世界第一,其投入的資金主要專注于人臉識(shí)別核心技術(shù)。
2017 年,全球AI 創(chuàng)業(yè)公司獲得資金支持 152 億美元,其中 48%流向中國(guó), 38%流向美國(guó),中國(guó)在人工智能初創(chuàng)公司的資金支持方面已超過(guò)美國(guó), 而中國(guó)在人工智能上投入的資金主要專注于人臉識(shí)別核心技術(shù),僅在 2017 年就突破十億美元大關(guān),達(dá)到 16.40 億美元。
此外, 政府對(duì)人臉識(shí)別初創(chuàng)公司的資金支持已達(dá)億級(jí)以上。僅在 2017 年,就有廣州市政府和有國(guó)務(wù)院國(guó)資委背景的中國(guó)國(guó)有資本風(fēng)險(xiǎn)投資基金對(duì)云從科技、曠視科技投入億級(jí)以上資金。
人臉識(shí)別是AI領(lǐng)域融資最多的方向。
2.2 行業(yè)規(guī)模與結(jié)構(gòu)
2017 年,全球視覺(jué)人工智能市場(chǎng)規(guī)模約為 70 億美元,同比增長(zhǎng) 12.36%,而中國(guó)視覺(jué)人工智能市場(chǎng)規(guī)模達(dá)到 41 億元,同比增長(zhǎng) 259.6%,遠(yuǎn)高于全球市場(chǎng)的增速。隨著視覺(jué)人工智能技術(shù)的逐漸成熟及應(yīng)用領(lǐng)域的逐步擴(kuò)大,預(yù)計(jì)到 2020 年中國(guó)視覺(jué)人工智能市場(chǎng)規(guī)模將進(jìn)一步擴(kuò)大,達(dá)到 755.5 億元。
視覺(jué)人工智能是中國(guó)人工智能市場(chǎng)上最大的組成部分。根據(jù)中國(guó)信通院數(shù)據(jù),2017 年中國(guó)人工智能市場(chǎng)中視覺(jué)人工智能的占比超過(guò) 37%。在視覺(jué)人工智能領(lǐng)域,安防影像分析是最大的應(yīng)用場(chǎng)景,2017 年占比約 67.9%。其他主要應(yīng)用包括廣告、互聯(lián)網(wǎng)、云服務(wù)、手機(jī)等。
2.3 行業(yè)場(chǎng)景與應(yīng)用
最近三年,視覺(jué)人工智能技術(shù)不僅帶來(lái)了生產(chǎn)效率的提升,而且還催生了眾多新產(chǎn)業(yè)、新商業(yè)模式與新應(yīng)用場(chǎng)景,推動(dòng)了多行業(yè)產(chǎn)業(yè)鏈的重構(gòu)。隨著視覺(jué)人工智能技術(shù)的不斷發(fā)展,市場(chǎng)規(guī)模的不斷擴(kuò)大及行業(yè)應(yīng)用解決方案的建立和完善,視覺(jué)人工智能行業(yè)的應(yīng)用場(chǎng)景將進(jìn)一步滲透,助力各應(yīng)用行業(yè)解決痛點(diǎn),實(shí)現(xiàn)行業(yè)轉(zhuǎn)型和升級(jí),需求前景廣闊。
最近幾年機(jī)器視覺(jué)行業(yè)實(shí)現(xiàn)快速發(fā)展的背景是: 2015 年基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)算法在ImageNet 數(shù)據(jù)庫(kù)上的識(shí)別準(zhǔn)確率首次超過(guò)人類, 同年 Google 在開(kāi)源自己的深度學(xué)習(xí)算法。
這些帶動(dòng)中美兩國(guó)的科學(xué)家把計(jì)算機(jī)視覺(jué)算法運(yùn)用到安防、金融、互聯(lián)網(wǎng)、物流、零售、醫(yī)療、制造業(yè)等不同垂直行業(yè)。但在實(shí)際的運(yùn)用當(dāng)中,由于數(shù)據(jù)可得性,算法成熟度,服務(wù)的容錯(cuò)率等因素的影響,落地的速度開(kāi)始出現(xiàn)分化。 移動(dòng)互聯(lián)網(wǎng)/安防領(lǐng)跑,零售/物流跟進(jìn),醫(yī)療/無(wú)人駕駛發(fā)展較慢。
2.3.1 智能安防
安防領(lǐng)域是人臉識(shí)別技術(shù)最成熟的落地領(lǐng)域,也是 AI 視覺(jué)公司普遍首先切入的細(xì)分領(lǐng)域。安防領(lǐng)域的特性在于:
- 公共安全的剛需應(yīng)用,可極大提高效率;
- 市場(chǎng)預(yù)算分級(jí)、高度碎片化,且政府訂單為主,可有效貢獻(xiàn)收入;
- 深度賽道,不斷面臨新問(wèn)題與新需求,問(wèn)題難度跨度大(簡(jiǎn)單需求如車牌識(shí)別、困難需求如動(dòng)態(tài)識(shí)別與犯罪預(yù)防等)。
作為公共安全的剛需應(yīng)用,安防領(lǐng)域計(jì)算機(jī)視覺(jué)未來(lái)將繼續(xù)向多模態(tài)融合、萬(wàn)路以上廣聯(lián)網(wǎng)發(fā)展。
2.3.2 移動(dòng)互聯(lián)網(wǎng)
計(jì)算機(jī)視覺(jué)在移動(dòng)互聯(lián)網(wǎng)上的應(yīng)用目前主要包括:
- 互聯(lián)網(wǎng)直播行業(yè)的主播美顏;
- 鑒黃、廣告推薦等視頻分析;
- 智能手機(jī)里的 AI 美顏和人臉解鎖。
一方面,移動(dòng)互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)較為豐富,數(shù)據(jù)可得性較高;另一方面,由于應(yīng)用多為“錦上添花”型的娛樂(lè)、廣告應(yīng)用,容錯(cuò)率較高,技術(shù)難度相應(yīng)下降。因此計(jì)算機(jī)視覺(jué)在移動(dòng)互聯(lián)網(wǎng)得以快速順利落地。
移動(dòng)互聯(lián)網(wǎng)應(yīng)用的普及離不開(kāi)深度攝像頭的應(yīng)用,如面部識(shí)別可以使手機(jī)解鎖及支付更加安全快捷,手勢(shì)動(dòng)作識(shí)別可以增強(qiáng)游戲體驗(yàn),人形及物體建??梢允咕W(wǎng)絡(luò)購(gòu)物更加直觀方便快捷。通過(guò)與人工智能、虛擬現(xiàn)實(shí)等技術(shù)有機(jī)結(jié)合,深度攝像可廣泛應(yīng)用在智能手機(jī)、智能汽車、智能安防、智能家居、金融等領(lǐng)域,給消費(fèi)者帶來(lái)全新的用戶體驗(yàn),提高生產(chǎn)和生活效率。
因此,深度攝像擁有廣闊的市場(chǎng)空間,預(yù)計(jì)到 2021 年,全球范圍內(nèi)深度攝像頭市場(chǎng)規(guī)模有望達(dá)到78.9 億美元,較 2017 年的 22 億美元增長(zhǎng) 262.73%。
2.3.3 金融
金融領(lǐng)域中的人臉識(shí)別,主要用途分為身份核驗(yàn)和場(chǎng)景規(guī)?;瘧?yīng)用。身份核驗(yàn),也稱作 1:1 刷臉,廣泛地被應(yīng)用于互聯(lián)網(wǎng)金融、銀行的遠(yuǎn)程開(kāi)戶、遠(yuǎn)程身份認(rèn)證、遠(yuǎn)程支付,通過(guò)刷臉的方式進(jìn)行校驗(yàn)。場(chǎng)景規(guī)?;瘧?yīng)用也稱作 1:N 刷臉,多用在刷臉支付、取款等。
由于金融人群龐大,身份核驗(yàn)、場(chǎng)景應(yīng)用等環(huán)節(jié)給人臉識(shí)別技術(shù)發(fā)展提供助力, 預(yù)計(jì)可提供億級(jí)以上的市場(chǎng)體量。以銀行為例,人臉識(shí)別在銀行領(lǐng)域的業(yè)務(wù)點(diǎn)主要有私有云部署、智慧網(wǎng)點(diǎn)改造、自助機(jī)具改造、網(wǎng)點(diǎn) VIP。四大業(yè)務(wù)點(diǎn)市場(chǎng)體量都在百億元級(jí)別,智慧網(wǎng)點(diǎn)改造更是達(dá)千億元級(jí)別,人臉識(shí)別可發(fā)揮的空間巨大。
筆者認(rèn)為,金融行業(yè)容錯(cuò)率低,出于謹(jǐn)慎性原則,方案推行周期較長(zhǎng),且當(dāng)前很難大規(guī)模在全國(guó)推廣,因此爆發(fā)力有所欠缺。
2.3.4 其他場(chǎng)景
醫(yī)療領(lǐng)域: 醫(yī)療數(shù)據(jù)碎片化嚴(yán)重,各種疾病需要的影像資料不同, 數(shù)據(jù)標(biāo)注需要有專業(yè)醫(yī)師參與,成本高,進(jìn)展慢。導(dǎo)致發(fā)展低于預(yù)期。
無(wú)人駕駛: 無(wú)人駕駛涉及采集攝像頭、 雷達(dá)等多種數(shù)據(jù),并根據(jù)多重?cái)?shù)據(jù)進(jìn)行車輛、物體、 道路、 行人等不同識(shí)別后進(jìn)行決策。我們認(rèn)為離實(shí)現(xiàn)通用無(wú)人駕駛還早,在限定場(chǎng)景下實(shí)現(xiàn)商用的機(jī)會(huì)較大。
2.4 商業(yè)模式
視覺(jué)人工智能公司提供服務(wù)的方式主要包括 3 種,分別為 API、SDK 與解決方案。
- API 提供云端比對(duì)識(shí)別服務(wù),具有彈性、靈活、高效等特點(diǎn),互聯(lián)網(wǎng)金融公司多采用此種形式。
- SDK基于對(duì)數(shù)據(jù)的保護(hù)或?qū)崟r(shí)性要求,向客戶提供核心算法模塊,在用戶端或客戶的服務(wù)器端完成視覺(jué)計(jì)算,手機(jī)及互聯(lián)網(wǎng)娛樂(lè)公司多采用此種形式。
- 解決方案向客戶提供較為全面的軟硬件集成解決方案,可能涉及軟件系統(tǒng)、嵌入式解決方案、前端硬件設(shè)備、專有服務(wù)器部署等,公安、銀行多采用此種形式。
與服務(wù)方式相對(duì)應(yīng),視覺(jué)人工智能公司的主要收費(fèi)方式也包括 3 種,分別為按調(diào)用量或包時(shí)收費(fèi)、結(jié)合授權(quán)設(shè)備量及授權(quán)周期定價(jià)與結(jié)合具體項(xiàng)目收費(fèi),后續(xù)每年可有升級(jí)維保收入。API 服務(wù)大多采用第一種收費(fèi)方式,SDK 服務(wù)多采用第二種收費(fèi)方式,解決方案多采用第三種收費(fèi)方式。
目前市面曠視等主流廠商SDK價(jià)格約50-100元/臺(tái)設(shè)備。
2.5 產(chǎn)業(yè)鏈與競(jìng)爭(zhēng)格局
視覺(jué)人工智能產(chǎn)業(yè)鏈可以劃分為三個(gè)部分,分別為:
- 基礎(chǔ)支撐層:包含芯片(寒武紀(jì)、地平線)、傳感器(海康、大華、速騰創(chuàng)新、鐳神智能)、系統(tǒng)架構(gòu)和初級(jí)算法(谷歌 、百度、微軟、臉書(shū))等部分。
- 技術(shù)提供層:包含圖像識(shí)別平臺(tái)和嵌入式視覺(jué)軟件兩類。前者直接提供應(yīng)用服務(wù),后者需要和硬件進(jìn)行系統(tǒng)集成后在終端產(chǎn)品中使用。國(guó)內(nèi)主要廠商包括曠視科技、商湯科技、圖漾信息、格靈深瞳、虹軟科技等。
- 場(chǎng)景應(yīng)用層:直接解決具體應(yīng)用場(chǎng)景的需求,產(chǎn)品的形式可能是應(yīng)用系統(tǒng),也可能是軟硬件一體的終端產(chǎn)品或服務(wù),主要的應(yīng)用場(chǎng)景包括智能駕駛(佑駕創(chuàng)新、馭勢(shì)科技、格林深瞳)、智能安防(商湯科技、格靈深瞳、曠視科技、依圖科技)、智能醫(yī)療(商湯科技、依圖科技)、智能家居(速感科技、依圖科技)、智慧金融(格靈深瞳、曠視科技、商湯科技、依圖科技、云從科技)、智能硬件(云天勵(lì)飛、依圖科技)、智慧商業(yè)(商湯科技、曠視科技、碼隆科技、圖普科技)、娛樂(lè)(曠視科技、圖普科技)等。
2.5.1 上游芯片領(lǐng)域亟待突破,與算法、數(shù)據(jù)集共同解決算力問(wèn)題
人臉識(shí)別產(chǎn)業(yè)鏈上游,即基礎(chǔ)層,影響發(fā)展的三大要素是芯片、算法和數(shù)據(jù)集。
(1)芯片領(lǐng)域
在芯片領(lǐng)域,由于目前沒(méi)有專門(mén)用于人臉識(shí)別的處理芯片,只能采用通用芯片代為處理。因深度學(xué)習(xí)算法對(duì)算力資源需求高,一般采取核心處理器(如 CPU、 ARM 芯片)進(jìn)行視頻采集,把視頻中的人臉圖像摳取下來(lái),而核心數(shù)據(jù)處理芯片無(wú)法執(zhí)行人臉識(shí)別結(jié)構(gòu)化運(yùn)算,只能將圖像處理的工作交給更合適的專門(mén)處理芯片進(jìn)行結(jié)構(gòu)化處理。
目前常見(jiàn)芯片的有 GPU 顯示核心、 FPGA 現(xiàn)場(chǎng)可編程門(mén)陣列、 ASIC 專用集成電路, 其中 GPU 是 AI芯片的主導(dǎo)者。
- GPU 優(yōu)勢(shì)在于解決浮點(diǎn)運(yùn)算、數(shù)據(jù)并行計(jì)算問(wèn)題,在大量數(shù)據(jù)元素并行程序方面有極高的計(jì)算密度,但是仍有兩個(gè)致命缺點(diǎn),一是功耗大,需依托 X86 架構(gòu)服務(wù)器運(yùn)行,不適用于更為廣泛的人臉識(shí)別產(chǎn)品方案開(kāi)發(fā),尤其是人臉識(shí)別民用化趨勢(shì)日漸增強(qiáng)的當(dāng)下,GPU 不適于在小型化項(xiàng)目的采用。二是成本高昂,采用 GPU 方案,折算單路人臉識(shí)別成本在萬(wàn)元以上,相較其他千元級(jí),甚至是百元級(jí)的方案,毫無(wú)成本優(yōu)勢(shì)可言,不利于商業(yè)平民化推廣。目前在 GPU 芯片領(lǐng)域的龍頭企業(yè)為 NVIDIA(英偉達(dá)),其所占份額為 60%。其次是 Xeon Phi,所占份額為 21%。
- FPGA 具有可編程性,讓軟件與終端應(yīng)用公司能夠提供與其競(jìng)爭(zhēng)對(duì)手不同的解決方案,并且能夠靈活地針對(duì)自己所用的算法修改電路,但是其設(shè)計(jì)資源受到很大的限制,一旦型號(hào)選定,其邏輯資源上限就確定,其布線資源也受限制,不像 GPU 這樣走 ASIC flow,因此,在峰值性能方面,F(xiàn)PGA 要遠(yuǎn)遜于 GPU。
- ASIC 芯片的優(yōu)勢(shì)是運(yùn)算能力強(qiáng)、規(guī)模量產(chǎn)成本低,但開(kāi)發(fā)周期長(zhǎng)、單次流片成本高, 主要適用于量大、對(duì)運(yùn)算能力要求較高、開(kāi)發(fā)周期較長(zhǎng)的領(lǐng)域,比如大部分消費(fèi)電子芯片和實(shí)驗(yàn)。
為滿足當(dāng)下人臉識(shí)別等人工智能的發(fā)展需求,行業(yè)也推出了各種針對(duì)深度學(xué)習(xí)芯片,如 TPU、 NPU、DPU、 BPU 等,但因其受場(chǎng)景限制以及性能不及 GPU 等,市場(chǎng)上仍以 GPU 等通用芯片占主導(dǎo)。
從上游芯片市場(chǎng)看,高端市場(chǎng)均被國(guó)外企業(yè)壟斷。根據(jù)上文我們的分析,人臉識(shí)別芯片目前均采用人工智能通用芯片,而根據(jù)市場(chǎng)研究顧問(wèn)公司 Compass Intelligence 在 2018 年 5 月發(fā)布的關(guān)于 AI 芯片最新調(diào)研報(bào)告,排名靠前的均是國(guó)外企業(yè)——英偉達(dá)、英特爾、 IBM 與谷歌。
排行榜中共有七家中國(guó)人工智能芯片公司入圍榜單 Top24,華為排名 12,成中國(guó)大陸地區(qū)最強(qiáng)芯片廠商,其余六家中國(guó)公司分別為:聯(lián)發(fā)科、Imagination、瑞芯微、芯原、寒武紀(jì)、地平線。
而目前在中國(guó)人臉識(shí)別設(shè)備商中,商湯科技與瑞芯微達(dá)成戰(zhàn)略合作,將其 SDK 軟件包直接整合進(jìn)瑞芯微芯片平臺(tái)中;而云從科技則在布局“基于自研 SoC 芯片的高準(zhǔn)確度人臉識(shí)別產(chǎn)業(yè)化應(yīng)用”項(xiàng)目,人臉識(shí)別芯片仍有待突破。
(2)算法和數(shù)據(jù)集
在算法開(kāi)發(fā)市場(chǎng)上,根據(jù)最新的 FRVT 比賽排名,我國(guó)人臉識(shí)別依圖科技、商湯科技包攬前四名,識(shí)別率均在 99%以上,處世界前列。 此外,目前的算法主要是基于上文提到的基于代數(shù)特征的提取方法,算法需要不斷的進(jìn)行訓(xùn)練?;诖?, 測(cè)試中的算法準(zhǔn)確率與實(shí)際應(yīng)用中的準(zhǔn)確率仍有一定的差距,因此擴(kuò)充數(shù)據(jù)集以鍛煉算法的不斷升級(jí)成為重點(diǎn)。
目前主流的數(shù)據(jù)集有 FERET 人臉數(shù)據(jù)庫(kù)、 CMU Multi-PIE 人臉數(shù)據(jù)庫(kù)、 YALE 人臉數(shù)據(jù)庫(kù)、 MIT 人臉數(shù)據(jù)庫(kù)、 ORL 人臉數(shù)據(jù)庫(kù)、 BioID 人臉數(shù)據(jù)庫(kù)、 UMIST 圖像集、年齡識(shí)別數(shù)據(jù)集 IMDB-WIKI。
綜上所述,上游芯片領(lǐng)域由于缺乏人臉識(shí)別專用的芯片,在成本和性能上制約人臉識(shí)別技術(shù)的應(yīng)用,而在算法方面,目前中國(guó)已領(lǐng)跑世界,但在實(shí)際應(yīng)用的測(cè)試準(zhǔn)確性來(lái)說(shuō)仍是不夠的,而此時(shí)數(shù)據(jù)集的擴(kuò)充成為鍛煉算法的重要途徑。
2.5.2 中游3D 人臉識(shí)別技術(shù)是方向,但仍需進(jìn)行技術(shù)性突破
中游人臉識(shí)別技術(shù)市場(chǎng)的解決方案主要包括 2D 識(shí)別、 3D 識(shí)別,目前市場(chǎng)主流為 2D 識(shí)別,但 3D 識(shí)別有不可比擬的優(yōu)勢(shì),將成為未來(lái)人臉識(shí)別技術(shù)發(fā)展的趨勢(shì)。與 2D 人臉識(shí)別技術(shù)比較, 3D 人臉識(shí)別的優(yōu)點(diǎn)在于:
- 精準(zhǔn)度高——3D 人臉識(shí)別系統(tǒng)采集人體面部三維特征,識(shí)別精度高,錯(cuò)誤拒絕率和錯(cuò)誤接受率極低,大量面部特征和數(shù)據(jù)點(diǎn)足以區(qū)分雙胞胎;
- 環(huán)境穩(wěn)定性強(qiáng)——3D 人臉識(shí)別系統(tǒng)對(duì)光線、背景燈環(huán)境的實(shí)用性更強(qiáng),系統(tǒng)更穩(wěn)定;
- 防偽穩(wěn)定性高——3D 人臉識(shí)別系統(tǒng)更穩(wěn)定,系統(tǒng)不易被輕易愚弄、欺騙,而冒充身份者能夠通過(guò)合法用戶的視頻圖像或相片騙過(guò) 2D 人臉識(shí)別系統(tǒng);
- 實(shí)用性強(qiáng)——3D 人臉識(shí)別系統(tǒng)不需要用戶配合,當(dāng)人臉有姿態(tài)、角度、表情、面部遮擋物等時(shí),其識(shí)別性能穩(wěn)定,實(shí)用性強(qiáng),而 2D 人臉識(shí)別系統(tǒng)識(shí)別性能下降劇烈。
目前 3D 技術(shù)應(yīng)用程度并不高,主要是蘋(píng)果等手機(jī)廠商在應(yīng)用,而從 Counterpoint Research 的研究數(shù)據(jù)來(lái)看,未來(lái) 3D 技術(shù)在手機(jī)端將比 2D 技術(shù)占據(jù)更高的市場(chǎng)份額;而根據(jù) Yole Developpement 的研究數(shù)據(jù)顯示, 3D 技術(shù)不僅在 C 端市場(chǎng)份額進(jìn)一步擴(kuò)大,在 B 端商用領(lǐng)域也將進(jìn)一步擴(kuò)大市場(chǎng)份額。
目前, 主流的 3D 成像技術(shù)有三種:
- 結(jié)構(gòu)光(Structured Light):結(jié)構(gòu)光投射特定的光信息到物體表面后,由攝像頭采集。根據(jù)物體造成的光信號(hào)的變化來(lái)計(jì)算物體的位置和深度等信息,進(jìn)而復(fù)原整個(gè)三維空間。代表性產(chǎn)品應(yīng)用為蘋(píng)果 X。
- TOF(Time Of Flight): 通過(guò)專有傳感器,捕捉近紅外光從發(fā)射到接收的飛行時(shí)間,判斷物體距離。
- 雙目測(cè)距(Stereo System):利用雙攝像頭拍攝物體,再通過(guò)三角形原理計(jì)算物體距離。
具體而言,結(jié)構(gòu)光技術(shù)具有低光下表現(xiàn)良好,分辨率較高,成本、功耗適中等優(yōu)點(diǎn),但易受陽(yáng)光影響,識(shí)別距離短,識(shí)別速度稍慢;而 TOF 技術(shù)具有響應(yīng)時(shí)間快,抗光照表現(xiàn)尚可,深度信息精確度高、識(shí)別距離遠(yuǎn),但分辨率低、成本高、功耗高、模塊太大;而雙目測(cè)距技術(shù)分辨率高,模塊小,成本低,但是昏暗環(huán)境下不適用,算法開(kāi)發(fā)難度大,識(shí)別速度慢。
盡管 3D 人臉識(shí)別相較 2D 人臉識(shí)別有質(zhì)的飛越,但是可以從現(xiàn)在主流的 3D 結(jié)構(gòu)光技術(shù)抗光照能力弱、識(shí)別速度不高、硬件成本高以及工作距離短的缺點(diǎn)以及尚未普及的 TOF 技術(shù)分辨率低、精度低的缺點(diǎn)看出, 3D 人臉識(shí)別仍有技術(shù)難關(guān)需要攻破。
在中游技術(shù)解決方案市場(chǎng)上,由于在 B 端普遍的人臉識(shí)別技術(shù)方案是 2D 人臉識(shí)別技術(shù),市場(chǎng)格局并未明朗,各方根據(jù)場(chǎng)景應(yīng)用均采取差異化戰(zhàn)略。如商湯科技、曠視科技、阿里巴巴、騰訊等采用圖像人臉識(shí)別技術(shù),??低暤炔扇∫曨l對(duì)象提取分析技術(shù), 而云從科技則在于 2018 年 2 月 7 日首發(fā)國(guó)內(nèi) 3D 結(jié)構(gòu)光人臉識(shí)別技術(shù)。
2.5.3 下游場(chǎng)景應(yīng)用是決定未來(lái)人臉識(shí)別行業(yè)競(jìng)爭(zhēng)格局的關(guān)鍵
在人臉識(shí)別下游場(chǎng)景應(yīng)用領(lǐng)域,廠商眾多。 在占據(jù)人臉識(shí)別市場(chǎng)大部分份額的 B 端領(lǐng)域,既有做傳統(tǒng)安防起家的海康威視在布局,也有人臉識(shí)別四大獨(dú)角獸——依圖科技、曠視科技、商湯科技、云從科技在布局,并且云從科技是人臉識(shí)別銀行領(lǐng)域第一供應(yīng)商,??低暈榘卜李I(lǐng)域龍頭。
而在體量很小的 C 端領(lǐng)域,有騰訊、 阿里巴巴、 商湯科技等企業(yè)布局, 市場(chǎng)較為分散, 其中互聯(lián)網(wǎng)巨頭騰訊、阿里巴巴等依據(jù)自己在 C 端產(chǎn)品的優(yōu)勢(shì)有手機(jī) QQ 人臉識(shí)別登錄、支付寶“smile to pay”, 商湯科技則為小咖秀、美圖等 C端 APP 提供人臉識(shí)別技術(shù)。
人臉識(shí)別對(duì)場(chǎng)景要求非常強(qiáng),產(chǎn)品能否達(dá)到實(shí)際使用要求,核心并不只在于算法本身,還在于對(duì)場(chǎng)景的深耕。對(duì)于下游應(yīng)用場(chǎng)景本身而言,人臉識(shí)別終歸落地成產(chǎn)品形態(tài),并且在商用和民用領(lǐng)域價(jià)值巨大,從上文對(duì)人臉識(shí)別應(yīng)用的主要兩個(gè)領(lǐng)域——安防、金融來(lái)看,這兩個(gè)領(lǐng)域由于與細(xì)分市場(chǎng)的商家聯(lián)系緊密。
(1)行業(yè)參與者
視覺(jué)人工智能領(lǐng)域內(nèi)的企業(yè)可劃分為工業(yè)巨頭(直接面向該領(lǐng)域客戶,在該行業(yè)已有較長(zhǎng)時(shí)間積累,市場(chǎng)份額大)、互聯(lián)網(wǎng)巨頭(從事計(jì)算機(jī)視覺(jué)相關(guān)研究的互聯(lián)網(wǎng)巨頭,技術(shù)水平領(lǐng)先)與創(chuàng)業(yè)公司(從事計(jì)算機(jī)視覺(jué)技術(shù)服務(wù)的創(chuàng)業(yè)公司)。這三類公司的技術(shù)獲取方式、優(yōu)劣勢(shì)與發(fā)展預(yù)期都不盡相同。
計(jì)算機(jī)視覺(jué)技術(shù)在中國(guó)的快速落地,吸引了以商湯、 曠視、 依圖為代表的以算法為核心競(jìng)爭(zhēng)力的 AI 初創(chuàng)公司, 擁有強(qiáng)大數(shù)據(jù)采集及軟件開(kāi)發(fā)能力的互聯(lián)網(wǎng)公司, ??怠⒋笕A、 宇視等深耕安防行業(yè)的公司,以及華為、 平安等科技行業(yè)巨頭。 經(jīng)過(guò)一年多的發(fā)展, 各個(gè)公司根據(jù)自己資源稟賦的不同,企業(yè)戰(zhàn)略出現(xiàn)了分化。
初創(chuàng)企業(yè)在算法與模型訓(xùn)練上占優(yōu);互聯(lián)網(wǎng)企業(yè)則擁有天然的數(shù)據(jù)優(yōu)勢(shì);安防企業(yè)則憑借極強(qiáng)的工程能力加速安防項(xiàng)目落地。后起之秀如深蘭則選擇細(xì)分市場(chǎng)廣泛落地。
互聯(lián)網(wǎng)巨頭利用自己強(qiáng)大的數(shù)據(jù)優(yōu)勢(shì)和豐富的內(nèi)部應(yīng)用場(chǎng)景,提升自身業(yè)務(wù)場(chǎng)景的增值服務(wù), 如阿里巴巴的淘寶拍立淘、騰訊優(yōu)圖在手機(jī) QQ 與微信的應(yīng)用、今日頭條的短視頻甄別等。
AI 頭部初創(chuàng)企業(yè)近年來(lái)融資動(dòng)作頻繁,受到資本市場(chǎng)的青睞,在資金方面暫無(wú)瓶頸, 然而面臨互聯(lián)網(wǎng)巨頭的挑戰(zhàn),商湯等初創(chuàng)企業(yè)或應(yīng)依托已有的獨(dú)立設(shè)計(jì)算法的能力,構(gòu)建平臺(tái)型解決方案,在研發(fā)能力與方案落地速度上取勝。
AI 頭部創(chuàng)業(yè)公司布局思路各異:在商湯、曠視、依圖等頭部企業(yè)看,各家戰(zhàn)略思路差異明顯。
商湯致力于構(gòu)造平臺(tái),專注底層基礎(chǔ)應(yīng)用,力圖在完善平臺(tái)后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現(xiàn)出對(duì)安防、醫(yī)療兩大領(lǐng)域的專注深耕,依托產(chǎn)品化、工程化能力深入落地。
(2)國(guó)外企業(yè)
美、日等國(guó)視覺(jué)人工智能的發(fā)展已經(jīng)過(guò)了快速增長(zhǎng)階段,進(jìn)入穩(wěn)定增長(zhǎng)期。國(guó)外巨頭一方面利用資源優(yōu)勢(shì)積極進(jìn)行底層架構(gòu)建設(shè),并將技術(shù)廣泛應(yīng)用到已有的產(chǎn)品升級(jí)中,另一方面利用資金優(yōu)勢(shì)大量收購(gòu)優(yōu)秀的技術(shù)和數(shù)據(jù)創(chuàng)業(yè)公司,迅速?gòu)浹a(bǔ)技術(shù)短板、數(shù)據(jù)短板和人才短板。
例如:蘋(píng)果、英特爾、Facebook、谷歌和亞馬遜等互聯(lián)網(wǎng)巨頭沿著與主業(yè)有協(xié)同效應(yīng)的方向并購(gòu)布局,對(duì)象多為圖像識(shí)別、建模。而我國(guó)計(jì)算機(jī)視覺(jué)起步較晚,技術(shù)主要沿襲國(guó)外,產(chǎn)業(yè)發(fā)展仍處于初創(chuàng)期,投融資空間大。
國(guó)內(nèi)視覺(jué)人工智能企業(yè)主要集中于場(chǎng)景應(yīng)用層,以多點(diǎn)垂直化企業(yè)服務(wù)切入,在工控領(lǐng)域的應(yīng)用主要集中在系統(tǒng)集成應(yīng)用,而消費(fèi)領(lǐng)域的應(yīng)用多與人臉識(shí)別、圖像處理相關(guān)。
對(duì)于頭部企業(yè)來(lái)說(shuō),底層算法的同質(zhì)化問(wèn)題嚴(yán)重,因此目前最重要的任務(wù)是迅速將技術(shù)商業(yè)化,落地相關(guān)應(yīng)用場(chǎng)景。商業(yè)壁壘的構(gòu)建除前沿算法之外,也有賴于產(chǎn)品、服務(wù)、市場(chǎng)等綜合建設(shè)。
作者:作者:阿旺,著名投資人兼連續(xù)創(chuàng)業(yè)者,會(huì)從自身投資以及創(chuàng)業(yè)經(jīng)歷,不定期輸出各類行業(yè)研究,如您想了解更多關(guān)于創(chuàng)業(yè)以及投資方面的內(nèi)容,歡迎關(guān)注本人公眾號(hào):awangblog
本文由 @阿旺 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議
厲害了
果斷關(guān)注了!期待作者的下一次更新~
謝謝支持哈
太棒了,謝謝作者的分享?。?!
謝謝支持,歡迎多多關(guān)注
精彩
感謝支持,希望能夠繼續(xù)關(guān)注,謝謝
特別棒
感謝支持,我會(huì)繼續(xù)創(chuàng)作優(yōu)秀的作品的
很精彩
感謝支持,希望能夠持續(xù)關(guān)注,謝謝