視頻搜索——視頻平臺、搜索引擎下的功能初探
編輯導(dǎo)語:本文作者從視頻搜索的特點、優(yōu)勢、存在問題和未來發(fā)展等方面,以具體的視頻平臺和搜索引擎為例,對不同平臺中視頻搜索的特點進行了分析,感興趣的小伙伴們一起來看一下吧。
由于筆者即將入職微軟視頻搜索相關(guān)產(chǎn)品經(jīng)理崗位,因此在入職前夕學(xué)習(xí)和整理了視頻搜索的相關(guān)知識(參考了一些大佬的文章,再次表示感謝),且在學(xué)習(xí)過程中發(fā)現(xiàn)有較少文章是聚焦于視頻搜索的,因此作此篇文章,希望與各搜推、視頻相關(guān)pm分享和交流。
本篇將從視頻搜索的基礎(chǔ)知識, 包括其特點、優(yōu)勢、存在問題和未來發(fā)展等入手,隨后通過具體的視頻平臺和搜索引擎中的視頻搜索功能分析,來了解不同平臺中視頻搜索的特點。
一、視頻搜索基礎(chǔ)
搜索的關(guān)鍵是搜索內(nèi)容豐富度和搜索結(jié)果準(zhǔn)確度,其本質(zhì)是“人找物”。搜索基于人的主動性,給用戶其最想要的東西。用戶在搜索的時候大多帶有明確的目的或者相對明確的目的,比如在閱讀APP搜書,用戶觸發(fā)搜索的時候可能知道自己想看哪本;比如在淘寶搜商品,用戶大概知道他想買什么。
搜索的步驟大概分為以下五步:
query—語義理解—召回(retrieval/indexing)—排序(ranking)—返回結(jié)果。
- 用戶觸發(fā)搜索,輸入關(guān)鍵詞。
- 系統(tǒng)根據(jù)用戶輸入的關(guān)鍵詞,進行關(guān)鍵詞的理解,包括分詞、詞根化(在印歐系語言中更常用)。
- 系統(tǒng)根據(jù)結(jié)合用戶的用戶畫像以及系統(tǒng)的搜索數(shù)據(jù)(熱搜、廣告等)找到全部搜索結(jié)果。
- 對全部搜索結(jié)果進行優(yōu)化,排序。
- 將搜索的結(jié)果呈現(xiàn)給用戶。
了解了搜索的基礎(chǔ)知識后,我們再來關(guān)注視頻搜索。我們首先應(yīng)在概念上應(yīng)明確一點,“視頻搜索”的定義與“文字搜索”、“圖片搜索”的定義是不同的,文字、圖片搜索的輸入內(nèi)容是文字和圖片本身,而“視頻搜索”的輸入內(nèi)容并非視頻,而是文字,其結(jié)果才是視頻。
因此,“視頻搜索”本質(zhì)上還是“文字搜索”,或者將“視頻搜索”稱為“搜索視頻”更為合適。
視頻搜索的特殊性大致有以下四點:
- 在技術(shù)實現(xiàn)上難度更大,一些ugc視頻標(biāo)簽的獲取基于對視頻內(nèi)容的nlp、cv深度學(xué)習(xí)訓(xùn)練
- 用戶對視頻搜索內(nèi)容的滿意度是延時反饋,往往體現(xiàn)在點擊內(nèi)容之后的后續(xù)播放過程中
- 應(yīng)注意內(nèi)容版權(quán)的播放控制問題(針對不同人群、地域、時段的控制)
- 需要對短查詢有較強的處理能力,應(yīng)盡量在用戶輸入一到兩個字符時就猜到(適配電視設(shè)備),且應(yīng)考慮方塊鍵盤和線性鍵盤的設(shè)計差異
視頻搜索的優(yōu)點也很突出。對用戶來說,在搜索教學(xué)類、技術(shù)類等方面內(nèi)容時,用戶體驗更好。例如,對于搜索“紅燒肉做法”這一搜索內(nèi)容來說,視頻搜索要優(yōu)于文字搜索和圖片搜索;
對視頻平臺和搜索引擎來說,視頻搜索可以提高長尾流量的曝光度,并且?guī)椭脚_了解用戶的喜好,便于做更精準(zhǔn)的推薦算法。
與此同時,視頻搜索的商業(yè)化空間巨大,我國視頻用戶量為9.27億,用戶基數(shù)龐大。視頻搜索在知識付費、短視頻電商、關(guān)鍵詞搜索點擊付費(廣告主付費)等方面都有其商業(yè)化空間。
不過,視頻搜索仍存在一定的問題:
- 視頻搜索仍然依賴文本檢索,通過關(guān)鍵詞匹配視頻的標(biāo)題、介紹、關(guān)鍵詞、以及字幕信息(OCR)。視頻內(nèi)容的特征難以提取與處理,特別是對于語音、圖像等元素的識別存在很大的困難。
- 視頻搜索效率較低,難以快速定位關(guān)鍵信息,也不方便用戶記錄,存檔(例如,當(dāng)搜索“b站up主何同學(xué)的原名是什么”時,往往沒有專門講解“何同學(xué)的原名是什么”的視頻,因此,獲取這一信息要花費更多的時間。此外,視頻前面包含的貼片廣告及片頭都影響用戶獲取信息的速度)。
- 視頻搜索結(jié)果容易形成APP信息孤島,如何打破APP之間的壁壘,形成更豐富的視頻內(nèi)容池是決定視頻搜索內(nèi)容全面性的關(guān)鍵。
- 學(xué)術(shù)檢索、垂直專業(yè)類、權(quán)威類視頻信息存在短板,當(dāng)下的視頻搜索更多是生活化的檢索,
未來視頻搜索的發(fā)展空間主要體現(xiàn)在以下三點:
- 提升nlp理解能力和算法精準(zhǔn)度,使視頻搜索精準(zhǔn)度提升
- 建立高質(zhì)量、豐富的視頻內(nèi)容儲備池,盡力打破APP壁壘,提供更豐富的內(nèi)容
- 通過用戶主動搜索,帶動長尾流量的精準(zhǔn)覆蓋度
由于視頻搜索功能主要存在于視頻平臺和各搜索引擎當(dāng)中,接下來我們將從具體的視頻搜索功能入手,分析當(dāng)前主流視頻平臺和搜索引擎中視頻搜索功能的特點。
二、視頻平臺搜索功能分析
在視頻平臺部分,我們選取了youtube、抖音兩大視頻平臺的APP版本進行關(guān)于其視頻搜索的分析。我們將從兩大視頻平臺APP的搜索輸入頁和搜索結(jié)果頁分析他們的頁面布局和相關(guān)功能。
1. 視頻平臺搜索輸入頁分析
注:上表內(nèi)標(biāo)黃的為不同平臺之間的差異功能,有興趣的讀者可自行分析這些差異的原因和意圖
在抖音搜索輸入頁,作為二維碼大國,國內(nèi)各個app的標(biāo)配便是掃碼icon。在搜索區(qū)設(shè)置掃碼功能,用戶可以用其掃描花朵,來搜索它為哪種花,顯然,在某種意義上,抖音把掃碼也當(dāng)做了一種搜索形式。
在搜索輸入頁的「猜你想搜」模塊中,我們可以看出,抖音更注重推薦算法的力量,算法和推薦在某些場景會影響用戶的搜索意圖。
往往用戶點擊搜索欄之前想搜的是「如何做宮保雞丁」,但她很容易被熱搜推薦所吸引搜索當(dāng)日熱詞,而忘記了本身的搜索目的。這樣的推薦,雖然的確抓住了用戶心理,提升了點擊量和瀏覽時長,但對用戶來說,反而增加了其搜索的時間成本,也加重了信息繭房的包裹。
而youtube在搜索欄則不做任何推薦,頁面簡單干凈,只展示用戶的歷史搜索,其默認(rèn)用戶打開搜索框即有一定的搜索意圖,沒有再對其進行推薦,這樣不會影響用戶的搜索時間。
但與此同時,不得不承認(rèn),「搜索榜單」和「猜你想搜」的推薦確實是引流的好辦法,用戶可以被輕易地吸引到抖音主推的直播、音樂和品牌板塊,實現(xiàn)其在這些層面的商業(yè)化意圖。
2. 視頻平臺搜索結(jié)果頁分析
對于視頻平臺的搜索結(jié)果頁來說,相比于web搜索引擎頁面,其展示的空間是極其有限的。 因此,youtube和抖音都選擇了隱藏各個篩選條件,用戶需要點擊右上角才能添加篩選條件。
youtube支持的視頻篩選、設(shè)備支持等功能似乎要更完善一些。
首先,因為youtube提供視頻類型較完善,因此youtube支持按視頻、頻道、播放列表等進行篩選,而抖音由于其內(nèi)容大多為短視頻,因此不提供此類篩選條件。
其次,通過對比可以看出,兩個視頻平臺的篩選條件和自身平臺特點緊密相關(guān),抖音作為短視頻平臺,其視頻長度篩選范圍更短(可選1分鐘以內(nèi)的),而youtube作為視頻應(yīng)用界的元老級app,其提供的視頻種類更豐富,功能也更全面,因此其在篩選區(qū)也提供了更完善的篩選服務(wù),包括可以按是否為直播/4K/HD/VR180/3D/HDR視頻進行篩選,也可以挑選含有字幕、已購買的視頻等等。
在搜索內(nèi)容區(qū),抖音提供綜合結(jié)果、視頻結(jié)果等多種結(jié)果頁面;在綜合結(jié)果頁面中,其整體頁面布局更像是搜索引擎,提供大而全的搜索結(jié)果,且針對不同的搜索內(nèi)容可能會有不同的排列布局。
例如搜索“北京疫情”會首先看到疫情防控直播、當(dāng)日新增感染人數(shù)等特制模塊,而搜索“產(chǎn)品經(jīng)理”等內(nèi)容,則會得到相關(guān)視頻、相關(guān)百科、相關(guān)熱榜、相關(guān)直播、相關(guān)店鋪等,其相關(guān)搜索結(jié)果大多數(shù)為字節(jié)系產(chǎn)品(例如頭條百科、抖音直播、抖音電商),可見抖音在搜索方面的商業(yè)化布局。
在抖音搜索的視頻結(jié)果頁面,幾乎所有的空間都留給了視頻,視頻結(jié)果呈2*2排列,并且充分體現(xiàn)了抖音的推薦算法優(yōu)勢,根據(jù)搜索字段推薦「相關(guān)搜索」,并且在點擊視頻返回原搜索頁面后跳出「大家都在搜」,幫助用戶更快地定位滿意的搜索結(jié)果。
同時,「點贊量」作為抖音衡量其短視頻視頻熱度最重要的指標(biāo)之一,也作為搜索結(jié)果展示在視頻封面右下角,用戶可以通過點贊量側(cè)面判斷視頻的熱度。
而youtube提供的搜索結(jié)果頁簡單清晰,單屏只展示單列視頻,每屏可展示3個視頻,處于屏幕中心的視頻會開啟自動預(yù)覽,用戶無需跳轉(zhuǎn)到二級頁面即可看完完整的視頻。
相比于抖音更重視視頻的「點贊量」,youtube顯然認(rèn)為「瀏覽量」更適合作為衡量視頻優(yōu)劣的指標(biāo),因此,youtube在搜索結(jié)果中將視頻「瀏覽量」顯示在了搜索結(jié)果視頻的下方,供用戶參考。
總體來講,對于視頻平臺(app)來說,有限的視頻展示空間使他們不得不折疊其篩選條件,而篩選條件根據(jù)各視頻平臺自身的視頻特點而定。在搜索結(jié)果展示方面,視頻平臺提供了視頻自動預(yù)覽、相關(guān)搜索等功能,同時展示了視頻封面、標(biāo)題、點贊、瀏覽量等相關(guān)信息。
三、搜索引擎視頻搜索分析
在搜索引擎的視頻搜索功能分析部分,我們選取了google、bing國內(nèi)版、bing國際版以及百度進行分析。我們?nèi)匀粫ㄟ^APP的搜索輸入頁和搜索結(jié)果頁分析他們的頁面布局和視頻搜索功能。
1. 搜索引擎搜索輸入頁分析
注:上表內(nèi)標(biāo)黃的為不同平臺之間的差異功能,有興趣的讀者可自行分析這些差異的原因和意圖
從搜索內(nèi)容來看,各個搜索引擎均提供了文字搜索、語音搜索,而只有百度在此之外還提供了圖片搜索。
從頁面整體布局上來看,google的布局最為清爽,僅有一個搜索框和logo組成;而bing國內(nèi)版還設(shè)置了自動背景圖片,并提供背景圖片相關(guān)知識的搜索引導(dǎo);而百度則在搜索框的基礎(chǔ)上提供了搜索榜單,為熱點新聞導(dǎo)流;bing國際版則推薦了豐富的每日圖片、最近首頁封面圖,但此類推薦可能會使得頁面看起來臃腫,而且推薦內(nèi)類別也有一定重復(fù)。
除此之外,bing國內(nèi)版、國外版都針對視頻搜索頁面提供了單獨的搜索頁面,用戶可點擊bing頂部導(dǎo)航欄「搜索」進入。bing國外版的頁面的視頻推薦更豐富,設(shè)計更美觀,點擊推薦視頻可直接跳轉(zhuǎn)到y(tǒng)outube等視頻平臺,但調(diào)研發(fā)現(xiàn)存在一些點擊視頻無法跳轉(zhuǎn)的情況。bing國內(nèi)版的設(shè)計相對簡單,但點擊推薦話題只能跳轉(zhuǎn)到二級搜索頁面,且提供的視頻搜索結(jié)果較少。
在視頻頁進行推薦是具有一定意義的,因為搜索視頻的用戶目的性較其他搜索的目的性較弱,往往用戶來到視頻平臺或搜索引擎只想看熱播劇集或者某一類型的電影,因此此時為用戶推薦該地區(qū)熱門劇集和他喜歡的電影可以提升用戶的滿意度。視頻搜索頁面的設(shè)計也可以參照各大視頻網(wǎng)站的設(shè)計。
2. 搜索引擎搜索結(jié)果頁分析
在搜索引擎視頻搜索結(jié)果頁,各個搜索引擎的頁面設(shè)計差異不大。
頂部基礎(chǔ)功能上,google會優(yōu)先展示搜索結(jié)果數(shù)量和查詢時間,向用戶展示其強大的搜索能力,加強其搜索品牌認(rèn)知。各個搜索引擎也會在頂部提供網(wǎng)頁、圖片、視頻等搜索分頁,以幫助用戶更好地定位其先要的搜索內(nèi)容類型,在這一部分各個搜索引擎也會引入其公司相關(guān)業(yè)務(wù)線產(chǎn)品,比如百度地圖、bing詞典等,為其他業(yè)務(wù)線產(chǎn)品導(dǎo)流。
在搜索框模塊,谷歌和bing仍保留搜索輸入頁已有的文字和語音搜索功能,而百度的語音搜索、圖片搜索卻消失了。
在篩選區(qū),百度的篩選功能最弱,僅支持按推薦關(guān)鍵詞篩選。其他引擎都支持按時長、日期、清晰度、來源搜索;此外bing支持按視頻是否為免費/付費視頻篩選,此功能無疑節(jié)省了許多用戶的時間,減少了用戶的篩選時間成本;而google還支持按是否有可隱藏字幕進行篩選,此篩選功能對聽障用戶極為友好。
在視頻區(qū),各個視頻引擎提供了視頻封面、標(biāo)題、時長、發(fā)布賬號、發(fā)布時間等視頻信息。但在視頻的顯示與排列上,谷歌和百度采取單列排列,每頁展示3-4個視頻,搜索結(jié)果排列清晰,而bing則采取四列排列,每頁展示8個視頻,每個視頻占有空間相對較小。
在搜索結(jié)果視頻上,google和百度搜索有視頻資源優(yōu)勢:由于youtube為google子公司,因此google的搜索結(jié)果中youtube視頻占主流;而由于好看視頻為百度產(chǎn)品線重要成員之一,百度視頻搜索主要也由好看視頻構(gòu)成,兩家大廠通過視頻搜索實現(xiàn)了其相關(guān)視頻網(wǎng)站的引流。
在這一點上,微軟bing搜索由于缺少關(guān)聯(lián)的視頻平臺,因此在視頻內(nèi)容豐富性、相關(guān)商業(yè)化布局、以及視頻搜索精準(zhǔn)度(體現(xiàn)在缺乏視頻深度學(xué)習(xí)(cv、nlp)訓(xùn)練數(shù)據(jù))等方面略遜一籌。
總體來說,對于搜索引擎,其展示空間更豐富,可以支持豐富的篩選功能、搜索推薦和視頻展示。各搜索引擎在設(shè)計時,也可以充分考慮其公司在搜索方面的優(yōu)勢,結(jié)合商業(yè)化布局進行更好的設(shè)計。
本文由 @兩條人PM 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash,基于 CC0 協(xié)議
這個點子有點酷噢!非常期待這個功能的實現(xiàn)了!
作者在文章中提到了點子很不錯,畢竟每個軟件的搜索引擎都有不同的特點
謝謝你呀~
看完之后,雖說都是大差不大,不過不得不說,每個軟件的搜索引擎都各有千秋,很棒。
是的,歡迎持續(xù)關(guān)注呀~
根據(jù)視頻畫面描述搜索視頻片段,現(xiàn)在能做到嗎?
在文章調(diào)研的幾款產(chǎn)品中,暫無產(chǎn)品支持以“視頻”為搜素輸入內(nèi)容的搜索功能
不是視頻,是視頻畫面描述哈哈,比如,搜:王心凌在跳舞,出來的視頻不一定是標(biāo)題帶“王心凌在跳舞”的,而是視頻畫面帶“王心凌在跳舞”的。
據(jù)我所知是可以的,起碼頭條抖音會根據(jù)視頻內(nèi)容進行cv訓(xùn)練,或根據(jù)字幕進行nlp訓(xùn)練,提取標(biāo)簽,這些「視頻內(nèi)」的信息也是可以作為該視頻的標(biāo)簽被搜到的,但是由于訓(xùn)練數(shù)據(jù)是字節(jié)內(nèi)部的,因此大概率只能在其產(chǎn)品內(nèi)部搜到。 這也是我為什么在文中提到,微軟因為缺乏相關(guān)視頻平臺,可能會在訓(xùn)練數(shù)據(jù)方面略遜一籌的原因。
我看愛優(yōu)騰的其中一家已經(jīng)發(fā)表了類似功能的專利了
搜索引擎的設(shè)計很重要,怎么提現(xiàn)出豐富性,相關(guān)性呢
比如google會在搜索結(jié)果最上方展示搜索結(jié)果數(shù)量和查詢時間(找到約 1,120,000 條結(jié)果 ,用時 0.43 秒)體現(xiàn)了豐富性,相關(guān)性的設(shè)計可以在命中關(guān)鍵詞、推薦相關(guān)搜索方面下功夫,具體指標(biāo)可以看召回率、準(zhǔn)確率等等。
學(xué)到了學(xué)到了。很有幫助的一篇文章,感謝作者分享!
感謝你的支持,歡迎持續(xù)關(guān)注呀~