作為AI產(chǎn)品經(jīng)理,該如何考慮公司自研的人臉識(shí)別產(chǎn)品

22 評(píng)論 7483 瀏覽 69 收藏 13 分鐘

當(dāng)前AI浪潮下,人臉識(shí)別是計(jì)算機(jī)視覺(jué)中應(yīng)用最多的技術(shù),身為公司的AI產(chǎn)品經(jīng)理,該如何考慮自研的人臉識(shí)別產(chǎn)品呢?

大家都知道人臉識(shí)別已經(jīng)成為計(jì)算機(jī)視覺(jué)中研究最多,應(yīng)用最多的一項(xiàng)技術(shù),但是真正能夠?qū)⑦@項(xiàng)技術(shù)實(shí)現(xiàn)自研落地并實(shí)現(xiàn)業(yè)務(wù)應(yīng)用的公司可以說(shuō)并不多,只看國(guó)內(nèi)的話,比較厲害的有百度、騰訊、阿里和商湯、曠視、云從、依圖等一批獨(dú)角獸公司。

其他很多公司可能更多的是購(gòu)買的上述公司的技術(shù)服務(wù),或者用一些開(kāi)源的項(xiàng)目,包裝一層外套,對(duì)外號(hào)稱公司實(shí)現(xiàn)有人臉識(shí)別產(chǎn)品,但是說(shuō)實(shí)話其實(shí)這樣做,第一、沒(méi)有自己的核心技術(shù);第二、對(duì)產(chǎn)品的用戶不負(fù)責(zé)。有一天技術(shù)公司自己掌握了業(yè)務(wù)場(chǎng)景需求,就可以提供完整的解決方案,而不需要只賣技術(shù)服務(wù)了,同樣如果開(kāi)源技術(shù)失去維護(hù),使用該技術(shù)的產(chǎn)品將無(wú)法升級(jí)迭代。

在現(xiàn)在的AI浪潮下,如果公司有實(shí)際豐富的應(yīng)用場(chǎng)景,同時(shí)公司又有一定的規(guī)模及技術(shù)能力,建議最好的方式就是自研核心的技術(shù)。那么一個(gè)AI產(chǎn)品經(jīng)理該如何考慮自研的人臉識(shí)別產(chǎn)品?

大致可以從以下幾個(gè)角度考慮:

第一、人臉識(shí)別的方式有哪些?

作為一個(gè)AI產(chǎn)品經(jīng)理首先需要理解人臉識(shí)別技術(shù),人臉識(shí)別從狹義上來(lái)分,主要指的是人臉驗(yàn)證和人臉識(shí)別,人臉驗(yàn)證采用的是1:1的方式,簡(jiǎn)單的理解就是“確定某人是某人”;人臉識(shí)別采用是1:N和1:N+1的方式,1:N指的是從N個(gè)人中找到跟當(dāng)前最像的人、1:N+1指的是從N個(gè)人中找到最像的那個(gè)人,并確定是不是你要找的人。

目前1:1識(shí)別是采用唯一憑證+人臉的方式,首先根據(jù)唯一憑證找到這個(gè)人,再進(jìn)行人臉驗(yàn)證判斷是否是當(dāng)前這個(gè)人,該技術(shù)目前多被采用作實(shí)名制驗(yàn)證,就跟火車上警察叔叔拿著你的身份證驗(yàn)證你是不是本人一樣,其中的唯一憑證可以是身份證、票、賬號(hào)、卡等;1:N和1:N+1的人臉識(shí)別方式提高了用戶體驗(yàn),用戶只需要提供人臉,系統(tǒng)根據(jù)采集到的人臉到庫(kù)里面比對(duì)搜索,找到跟你最像的一批人,1:N一般由人工來(lái)確認(rèn)當(dāng)前人臉是不是這批人中的某一個(gè),該技術(shù)在天網(wǎng)中應(yīng)用最多;1:N+1由系統(tǒng)判斷當(dāng)前采集到的人臉是誰(shuí),實(shí)際上即給出相似度最高的人臉。

第二、弄清楚應(yīng)用場(chǎng)景

理清楚產(chǎn)品的應(yīng)用場(chǎng)景是一個(gè)產(chǎn)品經(jīng)理的基本能力,對(duì)于人臉識(shí)別來(lái)說(shuō),產(chǎn)品經(jīng)理更要考慮清楚具體的應(yīng)用場(chǎng)景,否則無(wú)法跟算法對(duì)接,上面第一點(diǎn)說(shuō)過(guò)人臉識(shí)別有不同的方式,不同的應(yīng)用場(chǎng)景需要使用不同的技術(shù),甚至可以說(shuō)即使是相同的應(yīng)用場(chǎng)景,由于某些技術(shù)瓶頸原因,同樣需要使用不同的技術(shù);因此,算法是需要產(chǎn)品經(jīng)理告訴他提供哪種技術(shù)能力的。

舉例說(shuō)明下:以人臉閘機(jī)為例,現(xiàn)在的火車站以及很多的公園景點(diǎn)都有了人臉識(shí)別閘機(jī),還有一些小區(qū)或者公司也采用了人臉識(shí)別閘機(jī),但是有沒(méi)有考慮過(guò)它們的不同呢?為什么火車站或公園的人臉閘機(jī)需要使用身份證或者票加上人臉一起驗(yàn)證呢?但是一些公司里面的閘機(jī)就不需要了。

原因在于1:N的N的上限問(wèn)題,據(jù)了解,目前N的上限基本沒(méi)有哪家公司能做到超過(guò)10萬(wàn)的,N的上限導(dǎo)致了人臉識(shí)別的準(zhǔn)確率和用戶體驗(yàn)不能兼得;對(duì)于像火車站,公園景點(diǎn)的人流量是遠(yuǎn)超過(guò)10萬(wàn)的,自然無(wú)法用1:N的人臉識(shí)別,而對(duì)于一些公司或小區(qū),N的容量已經(jīng)足夠支撐所有人,所以自然采用1:N的方式來(lái)提供用戶體驗(yàn)。

目前典型的人臉識(shí)別應(yīng)用場(chǎng)景有:人臉閘機(jī)、人臉考勤、人臉簽到簽退、人臉支付、安防人臉識(shí)別等;具體什么場(chǎng)景使用哪種技術(shù),需要產(chǎn)品經(jīng)理詳細(xì)分析,重點(diǎn)在現(xiàn)有的場(chǎng)景條件下怎么獲得準(zhǔn)確率和用戶體驗(yàn)的平衡。

第三、人臉識(shí)別產(chǎn)品的設(shè)計(jì)

了解了人臉識(shí)別的方式、理清楚了人臉識(shí)別的應(yīng)用場(chǎng)景,作為算法工程師需要考慮具體技術(shù)的實(shí)現(xiàn),那作為產(chǎn)品經(jīng)理接下來(lái)就是考慮如何設(shè)計(jì)自己的產(chǎn)品了,在這個(gè)期間,AI產(chǎn)品經(jīng)理一般不同于互聯(lián)網(wǎng)產(chǎn)品經(jīng)理的是AI產(chǎn)品經(jīng)理可能還需要為算法承擔(dān)一部分?jǐn)?shù)據(jù)收集的工作,當(dāng)然如果貴司有專業(yè)的數(shù)據(jù)采集,數(shù)據(jù)標(biāo)注團(tuán)隊(duì),那產(chǎn)品經(jīng)理就可以重點(diǎn)考慮產(chǎn)品的設(shè)計(jì)了。人臉識(shí)別產(chǎn)品一般需要考慮哪些方面呢?

1. 定位人臉識(shí)別服務(wù)是本地還是服務(wù)端

這點(diǎn)很容易理解,簡(jiǎn)單地說(shuō)就是你將人臉庫(kù)放在哪里?是放在本地呢?還是放在服務(wù)端,如果是本地,那算法需要提供的是離線版的SDK服務(wù),如果是服務(wù)端,那就需要提供云端API服務(wù)。

到底是提供SDK還是API服務(wù)可以參考之前的文章《如何做一款SDK產(chǎn)品》里面有部分介紹;

2. 前端頁(yè)面設(shè)計(jì)

這點(diǎn)是給用戶完成人臉識(shí)別的,主要考慮這幾點(diǎn):

第一、識(shí)別前的頁(yè)面是什么樣的?就是一個(gè)攝像頭的啟動(dòng)后的頁(yè)面嗎?還是加一個(gè)人臉框?建議是為了保證人臉識(shí)別的準(zhǔn)確率,還是加一個(gè)人臉框吧;

第二、識(shí)別成功后,返回的頁(yè)面,以公司的1:N人臉考勤為例,人臉識(shí)別成功后,可以告訴給出的信息是“工號(hào):xxx,姓名:xxx,打卡成功”,也可以直接是“打卡成功”,我個(gè)人傾向于給出工號(hào)姓名等詳細(xì)信息,因?yàn)槿四樧R(shí)別也會(huì)出錯(cuò),可能識(shí)別成其他人了,但是對(duì)于系統(tǒng)來(lái)說(shuō)是認(rèn)為識(shí)別成功的,所以這個(gè)時(shí)候用戶看到信息后可以確認(rèn)是不是識(shí)別成自己了,就是自己是不是打卡成功了,否則識(shí)別成功但是識(shí)別成其他人就需要手動(dòng)打卡了;

第三、識(shí)別錯(cuò)誤后,返回的頁(yè)面,這點(diǎn)很重要,盡管所有人都不希望識(shí)別錯(cuò)誤,但是這個(gè)情況是不可避免的,因此,產(chǎn)品經(jīng)理一定要考慮清楚,識(shí)別錯(cuò)誤后的處理措施,常見(jiàn)的處理方式有識(shí)別出錯(cuò)后,可以提示用戶因?yàn)槭裁闯鲥e(cuò)的,可能是光照不夠?還是人臉過(guò)小過(guò)大?或者人臉角度不對(duì)?告訴用戶這些原因可以幫助用戶更好的識(shí)別,另外如果識(shí)別三次依然不對(duì)怎么辦?是不是有應(yīng)對(duì)措施呢?考慮手動(dòng)打卡?還是其他的?這些需要考慮周全。

第四、人臉注冊(cè),這點(diǎn)放到最后說(shuō),是因?yàn)槿四樧?cè)跟人臉識(shí)別是兩個(gè)獨(dú)立的功能,既可以通過(guò)后臺(tái)增加一個(gè)人的注冊(cè)照也可以通過(guò)前端讓用戶完成人臉注冊(cè),比如人臉考勤,產(chǎn)品設(shè)計(jì)時(shí)當(dāng)然不允許用戶在前端注冊(cè),否則不是外部人注冊(cè)了怎么處理,但是如果是人臉識(shí)別訪客系統(tǒng),那就需要在前端增加注冊(cè)的功能,對(duì)于未知的用戶可以完成人臉注冊(cè),方便用戶后續(xù)識(shí)別訪問(wèn)。

3. 后臺(tái)設(shè)計(jì)

這里不再贅述用戶角色、用戶權(quán)限等通用設(shè)計(jì),重點(diǎn)介紹跟人臉識(shí)別相關(guān)的功能設(shè)計(jì):

第一、人臉庫(kù)的創(chuàng)建,考慮兩點(diǎn)批量導(dǎo)入和單個(gè)人臉增加,即人臉注冊(cè)功能;

第二、參數(shù)配置,人臉識(shí)別是需要設(shè)置閾值的,這里當(dāng)然還包括系統(tǒng)的其他參數(shù),多個(gè)人臉庫(kù)是否考慮采用不同的閾值呢?不同庫(kù)中的人臉是否具有不同的權(quán)限等;

第三、數(shù)據(jù)日志,記錄每天的識(shí)別情況,包括識(shí)別成功的記錄和識(shí)別出錯(cuò)的原因,錯(cuò)誤原因需要定期導(dǎo)出分析并提交給算法,進(jìn)一步優(yōu)化算法,如果更詳細(xì)的還可以包括每次識(shí)別的響應(yīng)時(shí)間等。

如果只是搭建一個(gè)人臉識(shí)別產(chǎn)品以上三點(diǎn)基本應(yīng)該就夠了吧。如果是搭建人臉識(shí)別平臺(tái),那后臺(tái)還需要考慮其他功能,比如應(yīng)用管理、數(shù)據(jù)分析等。

第四、產(chǎn)品的迭代優(yōu)化提升

一個(gè)人臉識(shí)別產(chǎn)品基本功能研發(fā)成功并推廣應(yīng)用了,那后面產(chǎn)品經(jīng)理需要關(guān)注的是如何提升產(chǎn)品的性能,很多人會(huì)疑惑這個(gè)應(yīng)該是算法或者研發(fā)考慮的,但是好的產(chǎn)品經(jīng)理應(yīng)該提前自己分析這些問(wèn)題,而不是等工程師們來(lái)提出或解決。

比如人臉識(shí)別卡頓問(wèn)題,產(chǎn)品經(jīng)理是不是需要將這些原因都收集起來(lái),總結(jié)歸納是硬件配置問(wèn)題,還是瀏覽器問(wèn)題,還是客戶端問(wèn)題等,再比如最常見(jiàn)的人臉識(shí)別安全性,如果早期因?yàn)榧夹g(shù)問(wèn)題,沒(méi)有采用活體檢測(cè),那是否需要增加該功能提供安全性,如果早期采用了動(dòng)作活體,那現(xiàn)在是否可以采用靜默活體提供用戶體驗(yàn)?zāi)兀?/p>

這一部分工作雖然很瑣屑,但是關(guān)系到產(chǎn)品是否能夠大面積推廣應(yīng)用,所以產(chǎn)品經(jīng)理如果想要自己負(fù)責(zé)的產(chǎn)品能夠帶來(lái)更多的用戶或者業(yè)務(wù)價(jià)值,那第四部分就必須重點(diǎn)考慮。

以上是分享了作為AI產(chǎn)品經(jīng)理在設(shè)計(jì)人臉識(shí)別產(chǎn)品時(shí)需要重點(diǎn)考慮的幾個(gè)部分,當(dāng)然在設(shè)計(jì)產(chǎn)品的時(shí)候還有很多的細(xì)節(jié)要考慮,這就需要我們產(chǎn)品經(jīng)理多學(xué)習(xí)了,不僅要學(xué)習(xí)產(chǎn)品的設(shè)計(jì),規(guī)劃相關(guān)的知識(shí),還要了解AI視覺(jué)相關(guān)的知識(shí),才能設(shè)計(jì)出更好的產(chǎn)品。

 

本文由 @Eric_d 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

專欄作家

Eric_d,人人都是產(chǎn)品經(jīng)理專欄作家。關(guān)注AI、大數(shù)據(jù)等領(lǐng)域,擅長(zhǎng)需求分析、產(chǎn)品流程和架構(gòu)設(shè)計(jì)等,日常喜歡徒步。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 不分析競(jìng)品嗎?

    來(lái)自北京 回復(fù)
    1. 嗯嗯,競(jìng)品肯定是要分析的,還是要向優(yōu)秀產(chǎn)品學(xué)習(xí)的 ??

      來(lái)自江蘇 回復(fù)
  2. 我就是做這個(gè)方向的產(chǎn)品,不知道您有沒(méi)有想法,我們多一些交流,建立一個(gè)AI產(chǎn)品圈。我的微信939999047

    來(lái)自北京 回復(fù)
  3. 1:n的上限,雖然公司可能沒(méi)有10萬(wàn)員工。但是一個(gè)大型連鎖店的會(huì)員可能會(huì)有10萬(wàn)

    回復(fù)
    1. 其實(shí)10萬(wàn)我認(rèn)為已經(jīng)算是最好的預(yù)估了,但是很可能幾個(gè)大家都沒(méi)還沒(méi)做到;所以目前在shopping mall這樣的場(chǎng)景下實(shí)現(xiàn)會(huì)員、回頭客識(shí)別感覺(jué)難度很大,因?yàn)橐恢艿臅r(shí)間人數(shù)很可能就超過(guò)10萬(wàn)了。

      來(lái)自江蘇 回復(fù)
    2. hhhh,樓主在哪家公司,業(yè)務(wù)很相近呢

      來(lái)自北京 回復(fù)
    3. 哈哈~可以認(rèn)識(shí)下聊呢 ?:oops:

      來(lái)自江蘇 回復(fù)
  4. 1:n 1和1:n感覺(jué)不是很對(duì)呢?其他文章都是寫的1:n和m:n。怎么冒出個(gè)1:n 1呢

    回復(fù)
    1. 其實(shí)現(xiàn)在大家的口頭說(shuō)的1:N都是意指從N個(gè)人中找到“我是誰(shuí)”,但是實(shí)際上1:N更應(yīng)該理解為是從N個(gè)人中找到最相似的幾個(gè)人,比如說(shuō)你的識(shí)別閾值設(shè)定為0.6,則N個(gè)人中跟你相似的可能有5個(gè)人,通常這時(shí)候可能選擇識(shí)別得分最高的,問(wèn)題在于是如果出現(xiàn)兩個(gè)得分一樣的就很難選擇了;1:N+1是可以理解為從N個(gè)人中驗(yàn)證你是不是其中的一個(gè)人,應(yīng)該可以理解為1:N的深入版吧,類似于在黑白名單中確認(rèn)是某一個(gè)人,兩者相似之處在于都要從N個(gè)人中檢索匹配,不同在于1:N是只要找到超過(guò)閾值的人臉就可以了,1:N+1則是要驗(yàn)證是不是N個(gè)人中某一個(gè);個(gè)人感覺(jué)這兩者的界限實(shí)際現(xiàn)在還是比較模糊的。
      M:N的模式我理解的是同時(shí)動(dòng)態(tài)采集M個(gè)人臉在N的人臉庫(kù)中匹配,如果想從N個(gè)人中識(shí)別這M個(gè)人分別是哪一個(gè),則跟1:N+1的區(qū)別就是1和M的區(qū)別;如果是從N個(gè)人中識(shí)別與M個(gè)人每個(gè)人最相似的人,怎類別1:N,區(qū)別還是1和M的區(qū)別。
      以上純屬個(gè)人理解~~~微笑

      來(lái)自江蘇 回復(fù)
  5. 寫的很好!作者加油!多多寫文!希望能可以寫寫車輛和瑕疵方向的文章。謝謝大佬!!

    回復(fù)
  6. 樓主寫的很認(rèn)真,最近對(duì)人工智能的需求場(chǎng)景和產(chǎn)品設(shè)計(jì)很感興趣,受教了。謝謝

    來(lái)自上海 回復(fù)
    1. 感謝閱讀和您的評(píng)論~~

      來(lái)自江蘇 回復(fù)
  7. 寫的很全面,學(xué)習(xí)了。另一方面,我認(rèn)為人工智能產(chǎn)品核心功能的技術(shù),即人臉識(shí)別、語(yǔ)音識(shí)別等只會(huì)掌握在少數(shù)公司的手里。但是他們沒(méi)必要自己把活全都攬起來(lái),做個(gè)平臺(tái)大家一起來(lái)把AI技術(shù)落地應(yīng)該是以后的趨勢(shì),BAT在這方面已經(jīng)做很多了。

    來(lái)自廣東 回復(fù)
    1. 謝謝閱讀,很贊同你的觀點(diǎn),核心技術(shù)的確逐漸都掌握到少數(shù)公司了,唯一的擔(dān)心就是他們是否會(huì)形成生態(tài)壟斷,那樣的話大公司很可能失去業(yè)務(wù)話語(yǔ)權(quán),小公司將失去科技創(chuàng)業(yè)的機(jī)會(huì)。(僅個(gè)人想法),希望可以多多交流~~

      來(lái)自江蘇 回復(fù)
    2. 會(huì)有壟斷,不過(guò)各壟斷者之間也有會(huì)競(jìng)爭(zhēng),就像iOS和Android。未來(lái)AI應(yīng)用開(kāi)發(fā)工具的功能會(huì)越來(lái)越強(qiáng)大,生來(lái)就帶有云計(jì)算,5G這樣的光環(huán),就看開(kāi)發(fā)者怎么突破toB、toG,把人工智能技術(shù)帶給c端用戶。您覺(jué)得呢~

      來(lái)自廣東 回復(fù)
    3. 這點(diǎn)我認(rèn)同,只要不一家獨(dú)大,技術(shù)和生態(tài)才會(huì)良好發(fā)展,以后的AI也一定是技術(shù)更加集成化,功能更加平臺(tái)化、模塊化發(fā)展,才能方便更多人使用

      來(lái)自江蘇 回復(fù)
  8. “比如人臉考勤,產(chǎn)品設(shè)計(jì)時(shí)當(dāng)然不允許用戶在前端注冊(cè),否則不是外部人注冊(cè)了怎么處理”這個(gè)應(yīng)該是不讓外部人注冊(cè)的吧,是不是?

    來(lái)自新疆 回復(fù)
    1. 是的,是的,您理解的是對(duì)的,正常應(yīng)該是不允許外部人注冊(cè)的,沒(méi)說(shuō)清,對(duì)您表示歉意

      來(lái)自江蘇 回復(fù)
  9. 6

    回復(fù)
    1. 謝謝~~

      來(lái)自江蘇 回復(fù)
  10. 簡(jiǎn)單了解,順便根據(jù)您的內(nèi)容做了個(gè)思維導(dǎo)圖

    來(lái)自廣東 回復(fù)
    1. 謝謝閱讀,希望對(duì)您有幫助

      來(lái)自江蘇 回復(fù)