人臉識(shí)別行業(yè)分析

11 評(píng)論 17948 瀏覽 156 收藏 43 分鐘

人臉識(shí)別與其它生物識(shí)別技術(shù)相比,優(yōu)勢(shì)在于非接觸性、非侵?jǐn)_性、硬件基礎(chǔ)完善、可拓展性。本文主要跟大家分析一下人臉識(shí)別這個(gè)行業(yè),enjoy~

一、人臉識(shí)別概況

生物識(shí)別,是指依靠人體的身體特征來(lái)進(jìn)行身份驗(yàn)證的識(shí)別技術(shù),目前較為主流的識(shí)別技術(shù)有:人臉識(shí)別、指紋識(shí)別、虹膜識(shí)別、語(yǔ)音識(shí)別等四類。

人臉識(shí)別,是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。通常采用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉。人臉識(shí)別系統(tǒng)主要包括四個(gè)組成部分,分別為人臉圖像采集及檢測(cè)、人臉識(shí)別預(yù)處理、人臉圖像特征提取以及匹配與識(shí)別。

人臉識(shí)別與其它生物識(shí)別技術(shù)相比,優(yōu)勢(shì)在于非接觸性、非侵?jǐn)_性、硬件基礎(chǔ)完善、可拓展性。指紋識(shí)別唯一性比較強(qiáng),采集成本較低,但是指紋可由指紋貼、指紋膜等復(fù)制,且接觸性、侵?jǐn)_性較強(qiáng),人臉識(shí)別與其相比接觸性和侵?jǐn)_性較低;虹膜識(shí)別最精準(zhǔn),但是采集成本非常高,識(shí)別效率較低,接觸性、侵?jǐn)_性也較強(qiáng),人臉識(shí)別與其相比,采集成本低、識(shí)別效率高;語(yǔ)音識(shí)別采集成本低,但語(yǔ)音具有可變性,人臉識(shí)別與其相比,識(shí)別效率高。

人臉識(shí)別技術(shù)原理簡(jiǎn)單來(lái)講主要是三大步驟:

  • 一是建立一個(gè)包含大批量人臉圖像的數(shù)據(jù)庫(kù);
  • 二是通過(guò)各種方式來(lái)獲得當(dāng)前要進(jìn)行識(shí)別的目標(biāo)人臉圖像;
  • 三是將目標(biāo)人臉圖像與數(shù)據(jù)庫(kù)中既有的人臉圖像進(jìn)行比對(duì)和篩選。

根據(jù)人臉識(shí)別技術(shù)原理具體實(shí)施起來(lái)的技術(shù)流程則主要包含以下四個(gè)部分,即人臉圖像的采集與預(yù)處理、人臉檢測(cè)、人臉特征提取、人臉識(shí)別和活體鑒別。

1. 采集

需要考慮圖像大小,圖像分辨率,光照環(huán)境,模糊程度,遮擋程度,采集角度 。

人臉圖像的采集有兩種途徑,分別是:人臉圖像的批量導(dǎo)入和人臉圖像的實(shí)時(shí)采集。前者是指將采集好的人臉圖像批量導(dǎo)入至人臉識(shí)別系統(tǒng),系統(tǒng)會(huì)自動(dòng)完成個(gè)人臉圖像的采集工作;后者是指調(diào)用攝像機(jī)或攝像頭在設(shè)備的可拍攝范圍內(nèi)自動(dòng)實(shí)時(shí)抓取人臉圖像并完成采集工作。

人臉圖像的預(yù)處理是指對(duì)系統(tǒng)采集到的人臉圖像進(jìn)行光線、旋轉(zhuǎn)、切割、過(guò)濾、降噪、放大縮小等處理來(lái)使得該人臉圖像符合人臉圖像特征提取的標(biāo)準(zhǔn)要求。

目前主要有三種圖像預(yù)處理手段,即灰度調(diào)整、圖像濾波、圖像尺寸歸一化。 其中灰度調(diào)整是對(duì)地點(diǎn)、設(shè)備、光照等造成的圖像質(zhì)量差異進(jìn)行處理,圖像濾波是對(duì)噪聲造成的圖像質(zhì)量差異進(jìn)行降噪處理,圖像尺寸歸一化是針對(duì)圖像像素大小不同進(jìn)行尺寸處理。

2. 人臉檢測(cè)

在圖像中準(zhǔn)確標(biāo)定出人臉的位置和大小,并把其中有用的信息挑出來(lái)(如直方圖特征、顏色特征、模板特征、結(jié)構(gòu)特征及Haar特征等),然后利用信息來(lái)達(dá)到人臉檢測(cè)的目的。

人臉檢測(cè)是指判斷是否存在人臉及定位出人臉的位置、大小與姿態(tài)。目前的人臉檢測(cè)方法可分為三類,分別是基于膚色模型的檢測(cè)、基于邊緣特征的檢測(cè)、基于統(tǒng)計(jì)理論方法的檢測(cè)。

  • 基于膚色模型的檢測(cè)是利用人臉的膚色特征建立膚色模型從而進(jìn)行檢測(cè),其優(yōu)點(diǎn)是人臉的檢測(cè)速度較高,對(duì)遮擋和光照有一定的魯棒性,不足是和其他方法不太兼容, 且不易處理復(fù)雜背景和多人物同框;
  • 基于邊緣特征的檢測(cè)則是利用圖像的邊緣特征進(jìn)行人臉檢測(cè),優(yōu)點(diǎn)是計(jì)算量相對(duì)較小,可實(shí)現(xiàn)實(shí)時(shí)檢測(cè),與其它特征方法可融合, 缺點(diǎn)是在復(fù)雜背景下誤檢率比較高;
  • 基于統(tǒng)計(jì)理論方法的檢測(cè)則是通過(guò)對(duì)人臉特征值的循環(huán)迭代來(lái)檢測(cè)人臉,其計(jì)算速度快,應(yīng)用廣泛,但是誤檢率較高。

3. 特征提取

人臉識(shí)別系統(tǒng)可使用的特征通常分為視覺(jué)特征、像素統(tǒng)計(jì)特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。人臉特征提取就是針對(duì)人臉的某些特征進(jìn)行的,也稱人臉表征,它是對(duì)人臉進(jìn)行特征建模的過(guò)程。主要方法有基于知識(shí)的表征方法(主要包括基于幾何特征法和模板匹配法)和基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)的表征方法。

  1. 基于知識(shí)的提取方法是根據(jù)人臉五官結(jié)構(gòu)特征等先驗(yàn)知識(shí)來(lái)進(jìn)行提取,其特點(diǎn)是識(shí)別方法比較簡(jiǎn)單、容易理解, 檢測(cè)速度較快, 但是沒(méi)有形成統(tǒng)一的特征提取標(biāo)準(zhǔn),對(duì)動(dòng)態(tài)人臉圖像的魯棒性較差;
  2. 基于代數(shù)特征的提取方法是基于統(tǒng)計(jì)學(xué)習(xí)的特征提取方法, 特點(diǎn)是特征易抽取,識(shí)別精度較高,應(yīng)用廣泛, 但是需要與相應(yīng)的數(shù)據(jù)庫(kù)進(jìn)行統(tǒng)計(jì)訓(xùn)練。

4. 匹配與識(shí)別

這一精確篩選的過(guò)程分為兩類:一是一對(duì)一的篩選,即對(duì)人臉身份進(jìn)行確認(rèn)的過(guò)程;二是一對(duì)多的篩選,即根據(jù)人臉相似程度進(jìn)行匹配比對(duì)的過(guò)程。此外人臉識(shí)別包含活體鑒別環(huán)節(jié),即區(qū)別識(shí)別的特征信號(hào)是否來(lái)自于真正的生物體。

關(guān)鍵技術(shù)指標(biāo):檢測(cè)率、誤檢率、漏檢率、速度。識(shí)別中的精確率、召回率、錯(cuò)誤接受率/認(rèn)假率/誤識(shí)率、錯(cuò)誤拒絕率/拒真率/拒識(shí)率

二、行業(yè)概況

2.1 行業(yè)邏輯

2.1.1 人臉識(shí)別技術(shù)日趨成熟、準(zhǔn)確率高

2018 年 11 月 16 日,美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院(NIST)公布了全球權(quán)威人臉識(shí)別比賽(FRVT)最新報(bào)告,從前十名企業(yè)在千分之一的誤報(bào)率下的識(shí)別準(zhǔn)確率來(lái)看,其平均能達(dá)到 99.69%,在千萬(wàn)分之一誤報(bào)下的識(shí)別準(zhǔn)確率超過(guò)99%。

意味著機(jī)器幾乎可以做到在1000萬(wàn)人的規(guī)模下準(zhǔn)確識(shí)別每一個(gè)人,而人腦記憶并辨別 100 個(gè)人的身份都很有可能犯錯(cuò),相比于去年同期,全球人臉識(shí)別性能提升了80%,且中國(guó)企業(yè)占據(jù)榜單前五位,居世界領(lǐng)先水平,為人臉識(shí)別的技術(shù)落地提供技術(shù)面支撐。

從研究學(xué)者分布來(lái)看,中國(guó)占據(jù)世界第三的位置,人才儲(chǔ)備居優(yōu)勢(shì)地位。2018 年, AMiner 基于發(fā)表于國(guó)際期刊會(huì)議的學(xué)術(shù)論文,對(duì)人臉識(shí)別領(lǐng)域全 TOP1000 的學(xué)者進(jìn)行計(jì)算分析。

從全球范圍來(lái)看,美國(guó)人臉識(shí)別研究學(xué)者聚集最多的國(guó)家,在人臉識(shí)別領(lǐng)域的研究占有絕對(duì)的優(yōu)勢(shì);英國(guó)緊隨其后,位列第二;中國(guó)位列全球第三,占有一席之地??梢钥闯?,中國(guó)的追趕勢(shì)頭不容忽視。

從公開(kāi)專利數(shù)量來(lái)看, 2007-2017年,我國(guó)人臉識(shí)別專利公開(kāi)數(shù)量總體呈上升趨勢(shì),為人臉識(shí)別商業(yè)化應(yīng)用打下基礎(chǔ)。

從每年新增數(shù)量來(lái)看, 2007 年新增專利尚不足百例,至 2015 年迎來(lái)了爆發(fā),全年新增專利已達(dá)到 1398 例,至 2017 年,我國(guó)人臉識(shí)別專利公開(kāi)數(shù)量 2698 項(xiàng),達(dá)到近年來(lái)最大值;截至 2018年7月,專利公開(kāi)數(shù)量為2163 項(xiàng), 技術(shù)實(shí)力的顯著增強(qiáng)也為國(guó)內(nèi)商業(yè)化產(chǎn)品的迅速普及打下了堅(jiān)實(shí)的基礎(chǔ)。

2.1.2 政策推動(dòng)

長(zhǎng)期以來(lái),國(guó)家高度重視人臉識(shí)別產(chǎn)業(yè)落地的發(fā)展,出臺(tái)多項(xiàng)政策助推產(chǎn)業(yè)發(fā)展。

2015 年以來(lái),國(guó)家密集出臺(tái)了《關(guān)于銀行業(yè)金融機(jī)構(gòu)遠(yuǎn)程開(kāi)立人民幣賬戶的指導(dǎo)意見(jiàn)(征求意見(jiàn)稿)》,給人臉識(shí)別普及打開(kāi);其后,《安全防范視頻監(jiān)控人臉識(shí)別系統(tǒng)技術(shù)要求》、《信息安全技術(shù)網(wǎng)絡(luò)人臉識(shí)別認(rèn)證系統(tǒng)安全技術(shù)要求》等法律法規(guī),為人臉識(shí)別在金融、安防、醫(yī)療等領(lǐng)域的普及打下了堅(jiān)實(shí)的基礎(chǔ),掃清了政策障礙。

同時(shí), 2017 年人工智能首次寫(xiě)入國(guó)家政府報(bào)告,作為人工智能的重要細(xì)分領(lǐng)域,國(guó)家對(duì)人臉識(shí)別相關(guān)的政策支持力度在不斷的加大。 2017 年 12 月發(fā)布的《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020 年)》 則具體規(guī)劃“到 2020 年,復(fù)雜動(dòng)態(tài)場(chǎng)景下人臉識(shí)別有效檢出率超過(guò) 97%,正確識(shí)別率超過(guò) 90%”。

另外,工地場(chǎng)景上,住房和城鄉(xiāng)建設(shè)部、人力資源社會(huì)保障部印發(fā)《建筑工人實(shí)名制管理辦法(試行)》明確提出:建筑企業(yè)應(yīng)配備實(shí)現(xiàn)建筑工人實(shí)名制管理所必須的硬件設(shè)施設(shè)備,施工現(xiàn)場(chǎng)原則上實(shí)施封閉式管理,設(shè)立進(jìn)出場(chǎng)門(mén)禁系統(tǒng),采用人臉、指紋、虹膜等生物識(shí)別技術(shù)進(jìn)行電子打卡;不具備封閉式管理?xiàng)l件的工程項(xiàng)目,應(yīng)采用移動(dòng)定位、電子圍欄等技術(shù)實(shí)施考勤管理。相關(guān)電子考勤和圖像、影像等電子檔案保存期限不少于2年。

2.1.3 資金推動(dòng)

根據(jù) CB Insights 在 2018 年發(fā)布的《Top AI Trends To Watch In 2018》顯示,:中國(guó)在人工智能初創(chuàng)公司的資金支持方面已超過(guò)美國(guó),位列世界第一,其投入的資金主要專注于人臉識(shí)別核心技術(shù)。

2017 年,全球AI 創(chuàng)業(yè)公司獲得資金支持 152 億美元,其中 48%流向中國(guó), 38%流向美國(guó),中國(guó)在人工智能初創(chuàng)公司的資金支持方面已超過(guò)美國(guó), 而中國(guó)在人工智能上投入的資金主要專注于人臉識(shí)別核心技術(shù),僅在 2017 年就突破十億美元大關(guān),達(dá)到 16.40 億美元。

此外, 政府對(duì)人臉識(shí)別初創(chuàng)公司的資金支持已達(dá)億級(jí)以上。僅在 2017 年,就有廣州市政府和有國(guó)務(wù)院國(guó)資委背景的中國(guó)國(guó)有資本風(fēng)險(xiǎn)投資基金對(duì)云從科技、曠視科技投入億級(jí)以上資金。

人臉識(shí)別是AI領(lǐng)域融資最多的方向。

2.2 行業(yè)規(guī)模與結(jié)構(gòu)

2017 年,全球視覺(jué)人工智能市場(chǎng)規(guī)模約為 70 億美元,同比增長(zhǎng) 12.36%,而中國(guó)視覺(jué)人工智能市場(chǎng)規(guī)模達(dá)到 41 億元,同比增長(zhǎng) 259.6%,遠(yuǎn)高于全球市場(chǎng)的增速。隨著視覺(jué)人工智能技術(shù)的逐漸成熟及應(yīng)用領(lǐng)域的逐步擴(kuò)大,預(yù)計(jì)到 2020 年中國(guó)視覺(jué)人工智能市場(chǎng)規(guī)模將進(jìn)一步擴(kuò)大,達(dá)到 755.5 億元。

視覺(jué)人工智能是中國(guó)人工智能市場(chǎng)上最大的組成部分。根據(jù)中國(guó)信通院數(shù)據(jù),2017 年中國(guó)人工智能市場(chǎng)中視覺(jué)人工智能的占比超過(guò) 37%。在視覺(jué)人工智能領(lǐng)域,安防影像分析是最大的應(yīng)用場(chǎng)景,2017 年占比約 67.9%。其他主要應(yīng)用包括廣告、互聯(lián)網(wǎng)、云服務(wù)、手機(jī)等。

2.3 行業(yè)場(chǎng)景與應(yīng)用

最近三年,視覺(jué)人工智能技術(shù)不僅帶來(lái)了生產(chǎn)效率的提升,而且還催生了眾多新產(chǎn)業(yè)、新商業(yè)模式與新應(yīng)用場(chǎng)景,推動(dòng)了多行業(yè)產(chǎn)業(yè)鏈的重構(gòu)。隨著視覺(jué)人工智能技術(shù)的不斷發(fā)展,市場(chǎng)規(guī)模的不斷擴(kuò)大及行業(yè)應(yīng)用解決方案的建立和完善,視覺(jué)人工智能行業(yè)的應(yīng)用場(chǎng)景將進(jìn)一步滲透,助力各應(yīng)用行業(yè)解決痛點(diǎn),實(shí)現(xiàn)行業(yè)轉(zhuǎn)型和升級(jí),需求前景廣闊。

最近幾年機(jī)器視覺(jué)行業(yè)實(shí)現(xiàn)快速發(fā)展的背景是: 2015 年基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)算法在ImageNet 數(shù)據(jù)庫(kù)上的識(shí)別準(zhǔn)確率首次超過(guò)人類, 同年 Google 在開(kāi)源自己的深度學(xué)習(xí)算法。

這些帶動(dòng)中美兩國(guó)的科學(xué)家把計(jì)算機(jī)視覺(jué)算法運(yùn)用到安防、金融、互聯(lián)網(wǎng)、物流、零售、醫(yī)療、制造業(yè)等不同垂直行業(yè)。但在實(shí)際的運(yùn)用當(dāng)中,由于數(shù)據(jù)可得性,算法成熟度,服務(wù)的容錯(cuò)率等因素的影響,落地的速度開(kāi)始出現(xiàn)分化。 移動(dòng)互聯(lián)網(wǎng)/安防領(lǐng)跑,零售/物流跟進(jìn),醫(yī)療/無(wú)人駕駛發(fā)展較慢。

2.3.1 智能安防

安防領(lǐng)域是人臉識(shí)別技術(shù)最成熟的落地領(lǐng)域,也是 AI 視覺(jué)公司普遍首先切入的細(xì)分領(lǐng)域。安防領(lǐng)域的特性在于:

  1. 公共安全的剛需應(yīng)用,可極大提高效率;
  2. 市場(chǎng)預(yù)算分級(jí)、高度碎片化,且政府訂單為主,可有效貢獻(xiàn)收入;
  3. 深度賽道,不斷面臨新問(wèn)題與新需求,問(wèn)題難度跨度大(簡(jiǎn)單需求如車牌識(shí)別、困難需求如動(dòng)態(tài)識(shí)別與犯罪預(yù)防等)。

作為公共安全的剛需應(yīng)用,安防領(lǐng)域計(jì)算機(jī)視覺(jué)未來(lái)將繼續(xù)向多模態(tài)融合、萬(wàn)路以上廣聯(lián)網(wǎng)發(fā)展。

2.3.2 移動(dòng)互聯(lián)網(wǎng)

計(jì)算機(jī)視覺(jué)在移動(dòng)互聯(lián)網(wǎng)上的應(yīng)用目前主要包括:

  1. 互聯(lián)網(wǎng)直播行業(yè)的主播美顏;
  2. 鑒黃、廣告推薦等視頻分析;
  3. 智能手機(jī)里的 AI 美顏和人臉解鎖。

一方面,移動(dòng)互聯(lián)網(wǎng)行業(yè)數(shù)據(jù)較為豐富,數(shù)據(jù)可得性較高;另一方面,由于應(yīng)用多為“錦上添花”型的娛樂(lè)、廣告應(yīng)用,容錯(cuò)率較高,技術(shù)難度相應(yīng)下降。因此計(jì)算機(jī)視覺(jué)在移動(dòng)互聯(lián)網(wǎng)得以快速順利落地。

移動(dòng)互聯(lián)網(wǎng)應(yīng)用的普及離不開(kāi)深度攝像頭的應(yīng)用,如面部識(shí)別可以使手機(jī)解鎖及支付更加安全快捷,手勢(shì)動(dòng)作識(shí)別可以增強(qiáng)游戲體驗(yàn),人形及物體建??梢允咕W(wǎng)絡(luò)購(gòu)物更加直觀方便快捷。通過(guò)與人工智能、虛擬現(xiàn)實(shí)等技術(shù)有機(jī)結(jié)合,深度攝像可廣泛應(yīng)用在智能手機(jī)、智能汽車、智能安防、智能家居、金融等領(lǐng)域,給消費(fèi)者帶來(lái)全新的用戶體驗(yàn),提高生產(chǎn)和生活效率。

因此,深度攝像擁有廣闊的市場(chǎng)空間,預(yù)計(jì)到 2021 年,全球范圍內(nèi)深度攝像頭市場(chǎng)規(guī)模有望達(dá)到78.9 億美元,較 2017 年的 22 億美元增長(zhǎng) 262.73%。

2.3.3 金融

金融領(lǐng)域中的人臉識(shí)別,主要用途分為身份核驗(yàn)和場(chǎng)景規(guī)?;瘧?yīng)用。身份核驗(yàn),也稱作 1:1 刷臉,廣泛地被應(yīng)用于互聯(lián)網(wǎng)金融、銀行的遠(yuǎn)程開(kāi)戶、遠(yuǎn)程身份認(rèn)證、遠(yuǎn)程支付,通過(guò)刷臉的方式進(jìn)行校驗(yàn)。場(chǎng)景規(guī)?;瘧?yīng)用也稱作 1:N 刷臉,多用在刷臉支付、取款等。

由于金融人群龐大,身份核驗(yàn)、場(chǎng)景應(yīng)用等環(huán)節(jié)給人臉識(shí)別技術(shù)發(fā)展提供助力, 預(yù)計(jì)可提供億級(jí)以上的市場(chǎng)體量。以銀行為例,人臉識(shí)別在銀行領(lǐng)域的業(yè)務(wù)點(diǎn)主要有私有云部署、智慧網(wǎng)點(diǎn)改造、自助機(jī)具改造、網(wǎng)點(diǎn) VIP。四大業(yè)務(wù)點(diǎn)市場(chǎng)體量都在百億元級(jí)別,智慧網(wǎng)點(diǎn)改造更是達(dá)千億元級(jí)別,人臉識(shí)別可發(fā)揮的空間巨大。

筆者認(rèn)為,金融行業(yè)容錯(cuò)率低,出于謹(jǐn)慎性原則,方案推行周期較長(zhǎng),且當(dāng)前很難大規(guī)模在全國(guó)推廣,因此爆發(fā)力有所欠缺。

2.3.4 其他場(chǎng)景

醫(yī)療領(lǐng)域: 醫(yī)療數(shù)據(jù)碎片化嚴(yán)重,各種疾病需要的影像資料不同, 數(shù)據(jù)標(biāo)注需要有專業(yè)醫(yī)師參與,成本高,進(jìn)展慢。導(dǎo)致發(fā)展低于預(yù)期。

無(wú)人駕駛: 無(wú)人駕駛涉及采集攝像頭、 雷達(dá)等多種數(shù)據(jù),并根據(jù)多重?cái)?shù)據(jù)進(jìn)行車輛、物體、 道路、 行人等不同識(shí)別后進(jìn)行決策。我們認(rèn)為離實(shí)現(xiàn)通用無(wú)人駕駛還早,在限定場(chǎng)景下實(shí)現(xiàn)商用的機(jī)會(huì)較大。

2.4 商業(yè)模式

視覺(jué)人工智能公司提供服務(wù)的方式主要包括 3 種,分別為 API、SDK 與解決方案。

  1. API 提供云端比對(duì)識(shí)別服務(wù),具有彈性、靈活、高效等特點(diǎn),互聯(lián)網(wǎng)金融公司多采用此種形式。
  2. SDK基于對(duì)數(shù)據(jù)的保護(hù)或?qū)崟r(shí)性要求,向客戶提供核心算法模塊,在用戶端或客戶的服務(wù)器端完成視覺(jué)計(jì)算,手機(jī)及互聯(lián)網(wǎng)娛樂(lè)公司多采用此種形式。
  3. 解決方案向客戶提供較為全面的軟硬件集成解決方案,可能涉及軟件系統(tǒng)、嵌入式解決方案、前端硬件設(shè)備、專有服務(wù)器部署等,公安、銀行多采用此種形式。

與服務(wù)方式相對(duì)應(yīng),視覺(jué)人工智能公司的主要收費(fèi)方式也包括 3 種,分別為按調(diào)用量或包時(shí)收費(fèi)、結(jié)合授權(quán)設(shè)備量及授權(quán)周期定價(jià)與結(jié)合具體項(xiàng)目收費(fèi),后續(xù)每年可有升級(jí)維保收入。API 服務(wù)大多采用第一種收費(fèi)方式,SDK 服務(wù)多采用第二種收費(fèi)方式,解決方案多采用第三種收費(fèi)方式。

目前市面曠視等主流廠商SDK價(jià)格約50-100元/臺(tái)設(shè)備。

2.5 產(chǎn)業(yè)鏈與競(jìng)爭(zhēng)格局

視覺(jué)人工智能產(chǎn)業(yè)鏈可以劃分為三個(gè)部分,分別為:

  1. 基礎(chǔ)支撐層:包含芯片(寒武紀(jì)、地平線)、傳感器(海康、大華、速騰創(chuàng)新、鐳神智能)、系統(tǒng)架構(gòu)和初級(jí)算法(谷歌 、百度、微軟、臉書(shū))等部分。
  2. 技術(shù)提供層:包含圖像識(shí)別平臺(tái)和嵌入式視覺(jué)軟件兩類。前者直接提供應(yīng)用服務(wù),后者需要和硬件進(jìn)行系統(tǒng)集成后在終端產(chǎn)品中使用。國(guó)內(nèi)主要廠商包括曠視科技、商湯科技、圖漾信息、格靈深瞳、虹軟科技等。
  3. 場(chǎng)景應(yīng)用層:直接解決具體應(yīng)用場(chǎng)景的需求,產(chǎn)品的形式可能是應(yīng)用系統(tǒng),也可能是軟硬件一體的終端產(chǎn)品或服務(wù),主要的應(yīng)用場(chǎng)景包括智能駕駛(佑駕創(chuàng)新、馭勢(shì)科技、格林深瞳)、智能安防(商湯科技、格靈深瞳、曠視科技、依圖科技)、智能醫(yī)療(商湯科技、依圖科技)、智能家居(速感科技、依圖科技)、智慧金融(格靈深瞳、曠視科技、商湯科技、依圖科技、云從科技)、智能硬件(云天勵(lì)飛、依圖科技)、智慧商業(yè)(商湯科技、曠視科技、碼隆科技、圖普科技)、娛樂(lè)(曠視科技、圖普科技)等。

2.5.1 上游芯片領(lǐng)域亟待突破,與算法、數(shù)據(jù)集共同解決算力問(wèn)題

人臉識(shí)別產(chǎn)業(yè)鏈上游,即基礎(chǔ)層,影響發(fā)展的三大要素是芯片、算法和數(shù)據(jù)集。

(1)芯片領(lǐng)域

在芯片領(lǐng)域,由于目前沒(méi)有專門(mén)用于人臉識(shí)別的處理芯片,只能采用通用芯片代為處理。因深度學(xué)習(xí)算法對(duì)算力資源需求高,一般采取核心處理器(如 CPU、 ARM 芯片)進(jìn)行視頻采集,把視頻中的人臉圖像摳取下來(lái),而核心數(shù)據(jù)處理芯片無(wú)法執(zhí)行人臉識(shí)別結(jié)構(gòu)化運(yùn)算,只能將圖像處理的工作交給更合適的專門(mén)處理芯片進(jìn)行結(jié)構(gòu)化處理。

目前常見(jiàn)芯片的有 GPU 顯示核心、 FPGA 現(xiàn)場(chǎng)可編程門(mén)陣列、 ASIC 專用集成電路, 其中 GPU 是 AI芯片的主導(dǎo)者。

  • GPU 優(yōu)勢(shì)在于解決浮點(diǎn)運(yùn)算、數(shù)據(jù)并行計(jì)算問(wèn)題,在大量數(shù)據(jù)元素并行程序方面有極高的計(jì)算密度,但是仍有兩個(gè)致命缺點(diǎn),一是功耗大,需依托 X86 架構(gòu)服務(wù)器運(yùn)行,不適用于更為廣泛的人臉識(shí)別產(chǎn)品方案開(kāi)發(fā),尤其是人臉識(shí)別民用化趨勢(shì)日漸增強(qiáng)的當(dāng)下,GPU 不適于在小型化項(xiàng)目的采用。二是成本高昂,采用 GPU 方案,折算單路人臉識(shí)別成本在萬(wàn)元以上,相較其他千元級(jí),甚至是百元級(jí)的方案,毫無(wú)成本優(yōu)勢(shì)可言,不利于商業(yè)平民化推廣。目前在 GPU 芯片領(lǐng)域的龍頭企業(yè)為 NVIDIA(英偉達(dá)),其所占份額為 60%。其次是 Xeon Phi,所占份額為 21%。
  • FPGA 具有可編程性,讓軟件與終端應(yīng)用公司能夠提供與其競(jìng)爭(zhēng)對(duì)手不同的解決方案,并且能夠靈活地針對(duì)自己所用的算法修改電路,但是其設(shè)計(jì)資源受到很大的限制,一旦型號(hào)選定,其邏輯資源上限就確定,其布線資源也受限制,不像 GPU 這樣走 ASIC flow,因此,在峰值性能方面,F(xiàn)PGA 要遠(yuǎn)遜于 GPU。
  • ASIC 芯片的優(yōu)勢(shì)是運(yùn)算能力強(qiáng)、規(guī)模量產(chǎn)成本低,但開(kāi)發(fā)周期長(zhǎng)、單次流片成本高, 主要適用于量大、對(duì)運(yùn)算能力要求較高、開(kāi)發(fā)周期較長(zhǎng)的領(lǐng)域,比如大部分消費(fèi)電子芯片和實(shí)驗(yàn)。

為滿足當(dāng)下人臉識(shí)別等人工智能的發(fā)展需求,行業(yè)也推出了各種針對(duì)深度學(xué)習(xí)芯片,如 TPU、 NPU、DPU、 BPU 等,但因其受場(chǎng)景限制以及性能不及 GPU 等,市場(chǎng)上仍以 GPU 等通用芯片占主導(dǎo)。

從上游芯片市場(chǎng)看,高端市場(chǎng)均被國(guó)外企業(yè)壟斷。根據(jù)上文我們的分析,人臉識(shí)別芯片目前均采用人工智能通用芯片,而根據(jù)市場(chǎng)研究顧問(wèn)公司 Compass Intelligence 在 2018 年 5 月發(fā)布的關(guān)于 AI 芯片最新調(diào)研報(bào)告,排名靠前的均是國(guó)外企業(yè)——英偉達(dá)、英特爾、 IBM 與谷歌。

排行榜中共有七家中國(guó)人工智能芯片公司入圍榜單 Top24,華為排名 12,成中國(guó)大陸地區(qū)最強(qiáng)芯片廠商,其余六家中國(guó)公司分別為:聯(lián)發(fā)科、Imagination、瑞芯微、芯原、寒武紀(jì)、地平線。

而目前在中國(guó)人臉識(shí)別設(shè)備商中,商湯科技與瑞芯微達(dá)成戰(zhàn)略合作,將其 SDK 軟件包直接整合進(jìn)瑞芯微芯片平臺(tái)中;而云從科技則在布局“基于自研 SoC 芯片的高準(zhǔn)確度人臉識(shí)別產(chǎn)業(yè)化應(yīng)用”項(xiàng)目,人臉識(shí)別芯片仍有待突破。

(2)算法和數(shù)據(jù)集

在算法開(kāi)發(fā)市場(chǎng)上,根據(jù)最新的 FRVT 比賽排名,我國(guó)人臉識(shí)別依圖科技、商湯科技包攬前四名,識(shí)別率均在 99%以上,處世界前列。 此外,目前的算法主要是基于上文提到的基于代數(shù)特征的提取方法,算法需要不斷的進(jìn)行訓(xùn)練?;诖?, 測(cè)試中的算法準(zhǔn)確率與實(shí)際應(yīng)用中的準(zhǔn)確率仍有一定的差距,因此擴(kuò)充數(shù)據(jù)集以鍛煉算法的不斷升級(jí)成為重點(diǎn)。

目前主流的數(shù)據(jù)集有 FERET 人臉數(shù)據(jù)庫(kù)、 CMU Multi-PIE 人臉數(shù)據(jù)庫(kù)、 YALE 人臉數(shù)據(jù)庫(kù)、 MIT 人臉數(shù)據(jù)庫(kù)、 ORL 人臉數(shù)據(jù)庫(kù)、 BioID 人臉數(shù)據(jù)庫(kù)、 UMIST 圖像集、年齡識(shí)別數(shù)據(jù)集 IMDB-WIKI。

綜上所述,上游芯片領(lǐng)域由于缺乏人臉識(shí)別專用的芯片,在成本和性能上制約人臉識(shí)別技術(shù)的應(yīng)用,而在算法方面,目前中國(guó)已領(lǐng)跑世界,但在實(shí)際應(yīng)用的測(cè)試準(zhǔn)確性來(lái)說(shuō)仍是不夠的,而此時(shí)數(shù)據(jù)集的擴(kuò)充成為鍛煉算法的重要途徑。

2.5.2 中游3D 人臉識(shí)別技術(shù)是方向,但仍需進(jìn)行技術(shù)性突破

中游人臉識(shí)別技術(shù)市場(chǎng)的解決方案主要包括 2D 識(shí)別、 3D 識(shí)別,目前市場(chǎng)主流為 2D 識(shí)別,但 3D 識(shí)別有不可比擬的優(yōu)勢(shì),將成為未來(lái)人臉識(shí)別技術(shù)發(fā)展的趨勢(shì)。與 2D 人臉識(shí)別技術(shù)比較, 3D 人臉識(shí)別的優(yōu)點(diǎn)在于:

  1. 精準(zhǔn)度高——3D 人臉識(shí)別系統(tǒng)采集人體面部三維特征,識(shí)別精度高,錯(cuò)誤拒絕率和錯(cuò)誤接受率極低,大量面部特征和數(shù)據(jù)點(diǎn)足以區(qū)分雙胞胎;
  2. 環(huán)境穩(wěn)定性強(qiáng)——3D 人臉識(shí)別系統(tǒng)對(duì)光線、背景燈環(huán)境的實(shí)用性更強(qiáng),系統(tǒng)更穩(wěn)定;
  3. 防偽穩(wěn)定性高——3D 人臉識(shí)別系統(tǒng)更穩(wěn)定,系統(tǒng)不易被輕易愚弄、欺騙,而冒充身份者能夠通過(guò)合法用戶的視頻圖像或相片騙過(guò) 2D 人臉識(shí)別系統(tǒng);
  4. 實(shí)用性強(qiáng)——3D 人臉識(shí)別系統(tǒng)不需要用戶配合,當(dāng)人臉有姿態(tài)、角度、表情、面部遮擋物等時(shí),其識(shí)別性能穩(wěn)定,實(shí)用性強(qiáng),而 2D 人臉識(shí)別系統(tǒng)識(shí)別性能下降劇烈。

目前 3D 技術(shù)應(yīng)用程度并不高,主要是蘋(píng)果等手機(jī)廠商在應(yīng)用,而從 Counterpoint Research 的研究數(shù)據(jù)來(lái)看,未來(lái) 3D 技術(shù)在手機(jī)端將比 2D 技術(shù)占據(jù)更高的市場(chǎng)份額;而根據(jù) Yole Developpement 的研究數(shù)據(jù)顯示, 3D 技術(shù)不僅在 C 端市場(chǎng)份額進(jìn)一步擴(kuò)大,在 B 端商用領(lǐng)域也將進(jìn)一步擴(kuò)大市場(chǎng)份額。

目前, 主流的 3D 成像技術(shù)有三種:

  1. 結(jié)構(gòu)光(Structured Light):結(jié)構(gòu)光投射特定的光信息到物體表面后,由攝像頭采集。根據(jù)物體造成的光信號(hào)的變化來(lái)計(jì)算物體的位置和深度等信息,進(jìn)而復(fù)原整個(gè)三維空間。代表性產(chǎn)品應(yīng)用為蘋(píng)果 X。
  2. TOF(Time Of Flight): 通過(guò)專有傳感器,捕捉近紅外光從發(fā)射到接收的飛行時(shí)間,判斷物體距離。
  3. 雙目測(cè)距(Stereo System):利用雙攝像頭拍攝物體,再通過(guò)三角形原理計(jì)算物體距離。

具體而言,結(jié)構(gòu)光技術(shù)具有低光下表現(xiàn)良好,分辨率較高,成本、功耗適中等優(yōu)點(diǎn),但易受陽(yáng)光影響,識(shí)別距離短,識(shí)別速度稍慢;而 TOF 技術(shù)具有響應(yīng)時(shí)間快,抗光照表現(xiàn)尚可,深度信息精確度高、識(shí)別距離遠(yuǎn),但分辨率低、成本高、功耗高、模塊太大;而雙目測(cè)距技術(shù)分辨率高,模塊小,成本低,但是昏暗環(huán)境下不適用,算法開(kāi)發(fā)難度大,識(shí)別速度慢。

盡管 3D 人臉識(shí)別相較 2D 人臉識(shí)別有質(zhì)的飛越,但是可以從現(xiàn)在主流的 3D 結(jié)構(gòu)光技術(shù)抗光照能力弱、識(shí)別速度不高、硬件成本高以及工作距離短的缺點(diǎn)以及尚未普及的 TOF 技術(shù)分辨率低、精度低的缺點(diǎn)看出, 3D 人臉識(shí)別仍有技術(shù)難關(guān)需要攻破。

在中游技術(shù)解決方案市場(chǎng)上,由于在 B 端普遍的人臉識(shí)別技術(shù)方案是 2D 人臉識(shí)別技術(shù),市場(chǎng)格局并未明朗,各方根據(jù)場(chǎng)景應(yīng)用均采取差異化戰(zhàn)略。如商湯科技、曠視科技、阿里巴巴、騰訊等采用圖像人臉識(shí)別技術(shù),??低暤炔扇∫曨l對(duì)象提取分析技術(shù), 而云從科技則在于 2018 年 2 月 7 日首發(fā)國(guó)內(nèi) 3D 結(jié)構(gòu)光人臉識(shí)別技術(shù)。

2.5.3 下游場(chǎng)景應(yīng)用是決定未來(lái)人臉識(shí)別行業(yè)競(jìng)爭(zhēng)格局的關(guān)鍵

在人臉識(shí)別下游場(chǎng)景應(yīng)用領(lǐng)域,廠商眾多。 在占據(jù)人臉識(shí)別市場(chǎng)大部分份額的 B 端領(lǐng)域,既有做傳統(tǒng)安防起家的海康威視在布局,也有人臉識(shí)別四大獨(dú)角獸——依圖科技、曠視科技、商湯科技、云從科技在布局,并且云從科技是人臉識(shí)別銀行領(lǐng)域第一供應(yīng)商,??低暈榘卜李I(lǐng)域龍頭。

而在體量很小的 C 端領(lǐng)域,有騰訊、 阿里巴巴、 商湯科技等企業(yè)布局, 市場(chǎng)較為分散, 其中互聯(lián)網(wǎng)巨頭騰訊、阿里巴巴等依據(jù)自己在 C 端產(chǎn)品的優(yōu)勢(shì)有手機(jī) QQ 人臉識(shí)別登錄、支付寶“smile to pay”, 商湯科技則為小咖秀、美圖等 C端 APP 提供人臉識(shí)別技術(shù)。

人臉識(shí)別對(duì)場(chǎng)景要求非常強(qiáng),產(chǎn)品能否達(dá)到實(shí)際使用要求,核心并不只在于算法本身,還在于對(duì)場(chǎng)景的深耕。對(duì)于下游應(yīng)用場(chǎng)景本身而言,人臉識(shí)別終歸落地成產(chǎn)品形態(tài),并且在商用和民用領(lǐng)域價(jià)值巨大,從上文對(duì)人臉識(shí)別應(yīng)用的主要兩個(gè)領(lǐng)域——安防、金融來(lái)看,這兩個(gè)領(lǐng)域由于與細(xì)分市場(chǎng)的商家聯(lián)系緊密。

(1)行業(yè)參與者

視覺(jué)人工智能領(lǐng)域內(nèi)的企業(yè)可劃分為工業(yè)巨頭(直接面向該領(lǐng)域客戶,在該行業(yè)已有較長(zhǎng)時(shí)間積累,市場(chǎng)份額大)、互聯(lián)網(wǎng)巨頭(從事計(jì)算機(jī)視覺(jué)相關(guān)研究的互聯(lián)網(wǎng)巨頭,技術(shù)水平領(lǐng)先)與創(chuàng)業(yè)公司(從事計(jì)算機(jī)視覺(jué)技術(shù)服務(wù)的創(chuàng)業(yè)公司)。這三類公司的技術(shù)獲取方式、優(yōu)劣勢(shì)與發(fā)展預(yù)期都不盡相同。

計(jì)算機(jī)視覺(jué)技術(shù)在中國(guó)的快速落地,吸引了以商湯、 曠視、 依圖為代表的以算法為核心競(jìng)爭(zhēng)力的 AI 初創(chuàng)公司, 擁有強(qiáng)大數(shù)據(jù)采集及軟件開(kāi)發(fā)能力的互聯(lián)網(wǎng)公司, ??怠⒋笕A、 宇視等深耕安防行業(yè)的公司,以及華為、 平安等科技行業(yè)巨頭。 經(jīng)過(guò)一年多的發(fā)展, 各個(gè)公司根據(jù)自己資源稟賦的不同,企業(yè)戰(zhàn)略出現(xiàn)了分化。

初創(chuàng)企業(yè)在算法與模型訓(xùn)練上占優(yōu);互聯(lián)網(wǎng)企業(yè)則擁有天然的數(shù)據(jù)優(yōu)勢(shì);安防企業(yè)則憑借極強(qiáng)的工程能力加速安防項(xiàng)目落地。后起之秀如深蘭則選擇細(xì)分市場(chǎng)廣泛落地。

互聯(lián)網(wǎng)巨頭利用自己強(qiáng)大的數(shù)據(jù)優(yōu)勢(shì)和豐富的內(nèi)部應(yīng)用場(chǎng)景,提升自身業(yè)務(wù)場(chǎng)景的增值服務(wù), 如阿里巴巴的淘寶拍立淘、騰訊優(yōu)圖在手機(jī) QQ 與微信的應(yīng)用、今日頭條的短視頻甄別等。

AI 頭部初創(chuàng)企業(yè)近年來(lái)融資動(dòng)作頻繁,受到資本市場(chǎng)的青睞,在資金方面暫無(wú)瓶頸, 然而面臨互聯(lián)網(wǎng)巨頭的挑戰(zhàn),商湯等初創(chuàng)企業(yè)或應(yīng)依托已有的獨(dú)立設(shè)計(jì)算法的能力,構(gòu)建平臺(tái)型解決方案,在研發(fā)能力與方案落地速度上取勝。

AI 頭部創(chuàng)業(yè)公司布局思路各異:在商湯、曠視、依圖等頭部企業(yè)看,各家戰(zhàn)略思路差異明顯。

商湯致力于構(gòu)造平臺(tái),專注底層基礎(chǔ)應(yīng)用,力圖在完善平臺(tái)后于其他領(lǐng)域快速落地。曠視則在致力于在安防、金融、零售、汽車、教育等廣泛領(lǐng)域提供軟硬件一體化的解決方案。依圖則表現(xiàn)出對(duì)安防、醫(yī)療兩大領(lǐng)域的專注深耕,依托產(chǎn)品化、工程化能力深入落地。

(2)國(guó)外企業(yè)

美、日等國(guó)視覺(jué)人工智能的發(fā)展已經(jīng)過(guò)了快速增長(zhǎng)階段,進(jìn)入穩(wěn)定增長(zhǎng)期。國(guó)外巨頭一方面利用資源優(yōu)勢(shì)積極進(jìn)行底層架構(gòu)建設(shè),并將技術(shù)廣泛應(yīng)用到已有的產(chǎn)品升級(jí)中,另一方面利用資金優(yōu)勢(shì)大量收購(gòu)優(yōu)秀的技術(shù)和數(shù)據(jù)創(chuàng)業(yè)公司,迅速?gòu)浹a(bǔ)技術(shù)短板、數(shù)據(jù)短板和人才短板。

例如:蘋(píng)果、英特爾、Facebook、谷歌和亞馬遜等互聯(lián)網(wǎng)巨頭沿著與主業(yè)有協(xié)同效應(yīng)的方向并購(gòu)布局,對(duì)象多為圖像識(shí)別、建模。而我國(guó)計(jì)算機(jī)視覺(jué)起步較晚,技術(shù)主要沿襲國(guó)外,產(chǎn)業(yè)發(fā)展仍處于初創(chuàng)期,投融資空間大。

國(guó)內(nèi)視覺(jué)人工智能企業(yè)主要集中于場(chǎng)景應(yīng)用層,以多點(diǎn)垂直化企業(yè)服務(wù)切入,在工控領(lǐng)域的應(yīng)用主要集中在系統(tǒng)集成應(yīng)用,而消費(fèi)領(lǐng)域的應(yīng)用多與人臉識(shí)別、圖像處理相關(guān)。

對(duì)于頭部企業(yè)來(lái)說(shuō),底層算法的同質(zhì)化問(wèn)題嚴(yán)重,因此目前最重要的任務(wù)是迅速將技術(shù)商業(yè)化,落地相關(guān)應(yīng)用場(chǎng)景。商業(yè)壁壘的構(gòu)建除前沿算法之外,也有賴于產(chǎn)品、服務(wù)、市場(chǎng)等綜合建設(shè)。

 

作者:作者:阿旺,著名投資人兼連續(xù)創(chuàng)業(yè)者,會(huì)從自身投資以及創(chuàng)業(yè)經(jīng)歷,不定期輸出各類行業(yè)研究,如您想了解更多關(guān)于創(chuàng)業(yè)以及投資方面的內(nèi)容,歡迎關(guān)注本人公眾號(hào):awangblog

本文由 @阿旺 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 厲害了

    來(lái)自廣東 回復(fù)
  2. 果斷關(guān)注了!期待作者的下一次更新~

    來(lái)自廣東 回復(fù)
    1. 謝謝支持哈

      來(lái)自浙江 回復(fù)
  3. 太棒了,謝謝作者的分享?。?!

    回復(fù)
    1. 謝謝支持,歡迎多多關(guān)注

      回復(fù)
  4. 精彩

    回復(fù)
    1. 感謝支持,希望能夠繼續(xù)關(guān)注,謝謝

      來(lái)自浙江 回復(fù)
  5. 特別棒

    回復(fù)
    1. 感謝支持,我會(huì)繼續(xù)創(chuàng)作優(yōu)秀的作品的

      來(lái)自浙江 回復(fù)
  6. 很精彩

    來(lái)自浙江 回復(fù)
    1. 感謝支持,希望能夠持續(xù)關(guān)注,謝謝

      來(lái)自浙江 回復(fù)