關(guān)于視頻云平臺的思考
本文將從業(yè)務(wù)建模的差異、智能識別的基礎(chǔ)能力和應(yīng)用場景等多個角度,探討為何攝像頭管理與通用物聯(lián)網(wǎng)設(shè)備管理形成兩套系統(tǒng),并展望這一分離如何助力更高效的智能化管理。
從廣義上說,任何看得見的實物都可以作為物聯(lián)網(wǎng)中的【物】,都是人感官的延伸-攝像頭自然延伸了人的視覺。但是為什么各大廠商都將物聯(lián)網(wǎng)平臺和連接攝像頭的平臺分成兩套系統(tǒng)?
阿里云物聯(lián)網(wǎng)平臺中的視頻服務(wù)專門做視頻設(shè)備的接入,而不是完全在設(shè)備管理中操作。另外阿里云還專門針對視頻接入、檢出、分析等功能開發(fā)了另外一套城市視覺引擎平臺。
華為云的物聯(lián)網(wǎng)中不包括攝像頭設(shè)備,而有單獨視頻菜單做攝像頭的接入、管理等。
以下從兩個方面闡述我對之所以分開物聯(lián)網(wǎng)平臺和視頻平臺的理解。
一、業(yè)務(wù)建模無法統(tǒng)一
1. 數(shù)據(jù)格式不同
因為大部分的物聯(lián)網(wǎng)設(shè)備和云端的交互都是通過結(jié)構(gòu)化的數(shù)據(jù)交互,而攝像頭和云端或邊緣側(cè)交互的最基本的數(shù)據(jù)是視頻流,它是非結(jié)構(gòu)化數(shù)據(jù)。
相對于結(jié)構(gòu)化數(shù)據(jù)(即行數(shù)據(jù),存儲在數(shù)據(jù)庫里,可以用二維表結(jié)構(gòu)來邏輯表達實現(xiàn)的數(shù)據(jù))而言,不方便用數(shù)據(jù)庫二維邏輯表來表現(xiàn)的數(shù)據(jù)即稱為非結(jié)構(gòu)化數(shù)據(jù),包括所有格式的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等等。引用于知乎https://zhuanlan.zhihu.com/p/29856645
我認為導(dǎo)致這樣的原因可以歸因于人的視覺是對三維空間的感知,而聽覺、嗅覺、觸覺、味覺的感知結(jié)果都可以通過什么,怎么樣去描述。比如,你描述你看到的東西需要用一篇文章去表達,但是聞到什么就可以說聞到了什么,好的壞的,程度怎么樣去說明。
2. 接入?yún)f(xié)議不同
大部分的物聯(lián)網(wǎng)設(shè)備接入平臺可以概括為HTTP、MQTT、CoaP、SoaP等等,通過對不同協(xié)議進行抽象可以總結(jié)出大體一致的業(yè)務(wù)邏輯,而攝像頭用的協(xié)議是RTSP、GB/T-28181等,這些協(xié)議要求的規(guī)范導(dǎo)致無法同普通設(shè)備延用一樣的抽象邏輯。
比如,
創(chuàng)建攝像頭的時候,RTSP只要視頻流地址即可(地址中包括賬號密碼),而國標(biāo)要求必須有唯一的編碼和密碼兩個字段,頁面必須知道接入?yún)f(xié)議才可以繼續(xù)。
創(chuàng)建一個普通的設(shè)備,用戶不需要在界面上選擇協(xié)議,設(shè)備只要正式接入,后臺變知道該設(shè)備的協(xié)議(也不是所有系統(tǒng)都如是做)。
3. 智能化需求層級不同
大部分的物聯(lián)網(wǎng)設(shè)備通常是對舊的未入網(wǎng)的場景進行改造,比如在井蓋上添加重力傳感器并將產(chǎn)生的數(shù)據(jù)傳到網(wǎng)絡(luò),比如將未入網(wǎng)的酒窖中監(jiān)測溫度的溫度計智能化并將數(shù)據(jù)傳至網(wǎng)絡(luò)。而傳統(tǒng)攝像頭本身就是智能產(chǎn)品,本來就具備將數(shù)據(jù)進行傳輸轉(zhuǎn)換的功能,我們對他的需求是對視頻流的智能分析。
4. 使用場景不同
我理解一般的物聯(lián)網(wǎng)設(shè)備主要做“感知”,而攝像頭是做“識別”,仍舊是視覺和其他感官的區(qū)別所致。
“感知”的應(yīng)用請移步物聯(lián)網(wǎng)產(chǎn)品之架構(gòu)篇http://www.codemsi.com/pd/2709311.html(寫的不太具體和詳細,抽時間補上。)
“識別”是AI攝像頭的基礎(chǔ)能力,更上層的應(yīng)用和行業(yè)相關(guān)。比如在交通中可以用于識別車輛是否違規(guī)行駛,在公安中可以用于逃犯識別,在安防中可以用于明火識別、在辦公行業(yè)可以用于考勤打卡等等。不要小看識別兩個字,每一類目標(biāo),每一種行為都需要大量的真實圖片或行為“喂給”算法才能訓(xùn)練出強健有力、出錯率低的智能算法。
以下分別說說“識別”的基礎(chǔ)能力、應(yīng)用場景。
二、智能識別的基礎(chǔ)能力
1. 人臉識別
我們的眼睛識別到一個人的原理是先理解什么是人,并把這樣的認知存儲到自己腦海里,見到人時便可以馬上識別出他是人。通過攝像頭進行人臉識別也是同樣的過程:首先系統(tǒng)知道什么是人,然后將拍攝到的畫面中的人識別出來。
2. 車輛識別
車輛識別思路類似于人臉識別,只是車輛可能包括汽車、三輪車、兩輪車,而這不同類型的車輛背后算法是有很大差別的。
3. 植物/動物識別
目前看這個多應(yīng)用于2C的場景,比如通過手機給某一種植物拍照,互聯(lián)網(wǎng)便會告訴我們它是什么植物是什么動物。
4. 場景識別
通過對不同領(lǐng)域的生產(chǎn)過程、作業(yè)過程、操作過程進行場景識別,可以在安全領(lǐng)域、公安領(lǐng)域進行危險識別,價值在【防】。
三、基于識別的應(yīng)用場景
1. 人流量分析
人流量的分析基于對人的識別。
我去年清明去了一次泰山,體驗很不友好,人流控制全靠吼,踩踏事件極易發(fā)生,當(dāng)時就在想有沒有什么技術(shù)可以緩解這類問題。通過攝像頭進行人流量分析便是解決方案之一。通過重點點位安裝攝像頭并實時監(jiān)控人流量,將數(shù)據(jù)轉(zhuǎn)換成指導(dǎo)工作人員控制客流量的依據(jù),也可以作為行人選擇路線的決策依據(jù)。
在城市中人流量分析場景更多,比如重點地鐵口、重點商業(yè)區(qū)等等。這樣的應(yīng)用給交通疏導(dǎo)、防止踩踏等提供了有力依據(jù)。
2. 車輛軌跡分析
一個攝像頭可以識別某個區(qū)域內(nèi)的車輛,但大量的攝像頭便可以實現(xiàn)車輛軌跡的分析,車輛軌跡分析基于車輛識別,系統(tǒng)可以根據(jù)不同點位拍攝到的同一輛車和時間而分析出該車輛的行為軌跡。
3. 黑名單車輛管控
如果某車輛在管控范圍內(nèi)有過蓄意破壞行為,可以將該車輛標(biāo)識為黑名單,往后將來往車輛與黑名單逐一對比,黑名單車與當(dāng)前車輛相似度達到一定閾值后產(chǎn)生告警或直接禁止車輛進入管控區(qū)域。
4. 布控犯罪人員
行為軌跡分析是對已經(jīng)發(fā)生的事情進行分析,而布控是對將來發(fā)生的事情進行分析。比如如果發(fā)現(xiàn)一個嫌疑人抱走了兒童,那么可以將此人布控,被布控點位就會對每一個識別到的行人進行比對,如果相似度達到閾值就會報警或者產(chǎn)生其他行為。
所以攝像頭“識別”的應(yīng)用場景很多時候都獨立于普通設(shè)備的應(yīng)用場景,分成兩套系統(tǒng)更經(jīng)濟和實惠。
四、結(jié)語
攝像頭有其特殊性,且不是萬能的,需要結(jié)合各類設(shè)備和大數(shù)據(jù)分析等一同促進世界的智能化?,F(xiàn)在仍舊是智能世界的草莽時代,需要一點點的試錯與探索,路漫漫其修遠兮~
本文由 @娜娜 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!