知識圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用
編輯導(dǎo)語:內(nèi)容類產(chǎn)品若想提升用戶體驗,便需要提高內(nèi)容品質(zhì),使用戶能夠方便快捷地獲取內(nèi)容。那么,如何提升內(nèi)容類產(chǎn)品的品質(zhì)?本篇文章里,作者對當(dāng)前內(nèi)容類產(chǎn)品現(xiàn)狀做了簡要闡述,并對知識圖譜如何應(yīng)用于內(nèi)容類產(chǎn)品做了總結(jié),一起來看一下。
一、前言
知識圖譜相信大家已經(jīng)不陌生,已經(jīng)大家比較熟知的一個詞匯了。最早知識圖譜是谷歌為了優(yōu)化搜索引擎提出的一套理論體系。最常見的大家如果搜索“王健林的兒子是誰”,有了知識圖譜的加持,搜索引擎會直接告訴你答案是王思聰,而不是去檢索“王健林的兒子是誰”這句話。
如今的知識圖譜已經(jīng)廣泛應(yīng)用于各種智能場景。例如在金融領(lǐng)域反欺詐的應(yīng)用,最常見的我們發(fā)現(xiàn)兩個不同的信貸客戶使用的竟然是同一個手機(jī)號,發(fā)現(xiàn)這類異常,我們再去進(jìn)一步深挖原因,避免欺詐情況發(fā)生。
在NLP(Natural Language Processing,自然語言處理)中,知識圖譜常用于實體統(tǒng)一。正常的NLP如果沒有特殊配置,計算機(jī)一定是不理解“ICBC”就是指的是“中國工商銀行”。通過知識圖譜將“ICBC”都統(tǒng)一為“中國工商銀行”。
另外通過知識圖譜在指代消解中的應(yīng)用,增加計算機(jī)對于文本理解的準(zhǔn)確率。知識圖譜適用的領(lǐng)域還非常多,在此就不列舉了。
本文主要討論通過知識圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用,提高內(nèi)容類產(chǎn)品的品質(zhì),進(jìn)而提升客戶滿意度與產(chǎn)品的競爭力。
二、我們的痛點
目前處于信息大爆炸的時代,我們每時每刻都接收大量信息。當(dāng)我們在搜索引擎或是內(nèi)容類應(yīng)用去查看信息時,往往會給我們呈現(xiàn)許多與我們不相關(guān)的垃圾信息。有些信息是在內(nèi)容創(chuàng)作階段,通過各種抄襲拼湊而生成文章,最后呈現(xiàn)給用戶結(jié)果雖然很多,但毫無價值,也提升了用戶的檢索成本。
相信大家在日常使用中,也有同感,當(dāng)我們?nèi)ニ阉飨胍男畔r,往往會出來一大堆,信息過于分散,也不成體系。
我們需要有一種平臺,可以給我們提供相對比較純凈、權(quán)威的信息。我們的生活需要高品質(zhì),不論是物質(zhì)生活還是精神生活。信息是我們精神生活的重要組成部分,同樣我們也需要有成體系的、有深度的內(nèi)容出現(xiàn)。
三、目前現(xiàn)狀
目前內(nèi)容類的應(yīng)用很多。幾乎每個領(lǐng)域都有每個領(lǐng)域的核心內(nèi)容供應(yīng)商。比如自己查看產(chǎn)品相關(guān)文章,幾乎不會去使用搜索引擎檢索文章,而是到相應(yīng)的產(chǎn)品網(wǎng)站去查看或檢索內(nèi)容。主要是一種信任感。所以平臺內(nèi)容的品質(zhì)很重要。
通常內(nèi)容創(chuàng)造,主要分為:OGC(Occupationally Generated Content, 職業(yè)生產(chǎn)內(nèi)容)、PGC(Professionally Generated Content,專業(yè)人士輸出內(nèi)容)和UGC(User Generated Content,用戶輸出內(nèi)容)。一般OGC和PGC生成的內(nèi)容品質(zhì)較高,但畢竟人力有限,依賴UGC可以短時間內(nèi)產(chǎn)生大量內(nèi)容,但內(nèi)容的品質(zhì)不能保證,過多的垃圾內(nèi)容,反而會降低內(nèi)容平臺的權(quán)威性。
如何能提高內(nèi)容數(shù)量的同時,又不影響內(nèi)容的品質(zhì),這是內(nèi)容類產(chǎn)品必然要考慮的一個問題。
四、知識圖譜如何應(yīng)用于內(nèi)容類產(chǎn)品
對于內(nèi)容類產(chǎn)品,如果你是內(nèi)容類產(chǎn)品的產(chǎn)品經(jīng)理,需要制定一個關(guān)于你所負(fù)責(zé)的內(nèi)容類產(chǎn)品的“北極星”指標(biāo),你會怎么制定?
是產(chǎn)品的DAU(Daily Active User,日活躍用戶)、MAU(Monthly Active User,月活躍用戶)還是ARPPU(Average Revenue Per Paying User,平均每付費(fèi)用戶貢獻(xiàn)的收入)?
這些指標(biāo)其實都可以人為去干預(yù)。就像是公交車總公司要求提升乘客上座率,結(jié)果公交車分公司為了提升上座率,減少了公交車的座位數(shù),指標(biāo)是達(dá)到了,但沒解決本質(zhì)問題。
好的產(chǎn)品一定不是通過指標(biāo)制定出來的。而是去發(fā)現(xiàn)本質(zhì)的問題,解決最核心的問題。對于內(nèi)容類產(chǎn)品而言,你的內(nèi)容質(zhì)量提升了,用戶在第一時間很方便找出他們需要的信息,覺得產(chǎn)品整個使用過程簡潔流暢,這就可以了。
所以內(nèi)容類產(chǎn)品的“北極星”指標(biāo)應(yīng)該設(shè)定為:提升內(nèi)容品質(zhì),增加優(yōu)質(zhì)內(nèi)容數(shù)量。
內(nèi)容品質(zhì)上去了,瀏覽量自然就上來了。
如何提升內(nèi)容類產(chǎn)品的品質(zhì)?
結(jié)合個人多年實際工作經(jīng)驗,我認(rèn)為最主要有三點:
- 平臺的內(nèi)容不能有重復(fù)。很明顯,用戶到一個平臺中,看到的都是一些重復(fù)的內(nèi)容,肯定對這個平臺印象很差,就很難產(chǎn)生信任,就更不必說去推薦給其他人了。
- 平臺的內(nèi)容不能有明顯的錯誤。內(nèi)容類產(chǎn)品內(nèi)容是其產(chǎn)品最為核心的競爭力。內(nèi)容要確保其權(quán)威性,當(dāng)用戶需要某些信息時,可以很自信地說,來源于XX平臺。這就要求平臺上的內(nèi)容要很精準(zhǔn)。
- 平臺的內(nèi)容要方便獲取。用戶需要某些信息時,平臺可以很快速地響應(yīng)用戶的訴求,節(jié)省用戶信息檢索成本。如何通過知識圖譜實現(xiàn)上述目標(biāo)?
如上圖所示。我們可以按上圖所描述的框架進(jìn)行內(nèi)容類產(chǎn)品知識圖譜的構(gòu)建。
我們知道,一般OGC和PGC的內(nèi)容會有專門的人員進(jìn)行校對和審核,而UGC的內(nèi)容,平臺往往沒有非常多的人力去做這個事情。
目前內(nèi)容類平臺,基于AI(Artificial Intelligence,人工智能)技術(shù),主要是NLP技術(shù),對于內(nèi)容類的應(yīng)用,主要是用于對非法內(nèi)容的審核。而對于內(nèi)容品質(zhì)的管理——不冗余、準(zhǔn)確且易獲取,就需要用到上述的知識圖譜框架來進(jìn)行實現(xiàn)。
首先,我們對用戶發(fā)表的內(nèi)容進(jìn)行數(shù)據(jù)轉(zhuǎn)換與統(tǒng)一,因為用戶輸入的內(nèi)容,可能是文字、聲音或是視頻。根據(jù)不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。
其次,我們對轉(zhuǎn)換與統(tǒng)一好的數(shù)據(jù)進(jìn)行數(shù)據(jù)建模,并進(jìn)行知識抽取。生成基本的知識體系。為后續(xù)的知識融合與計算奠定基礎(chǔ)。
再次,我們進(jìn)行知識融合與計算。這一步是知識圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用關(guān)鍵。在這個步驟中,我們可以發(fā)現(xiàn)平臺內(nèi)冗余的內(nèi)容信息。
例如,某一個用戶發(fā)表的內(nèi)容在介紹月球,有如下知識圖譜信息(使用JSON表示):
{“實體名稱”:”月球”,”實體信息”:[{“英文名稱”:”moon”},{“分類”:”衛(wèi)星”},{“公轉(zhuǎn)周期”:”約27.32天”},]}
如果另一個用戶發(fā)表的內(nèi)容,抽象出來的圖譜信息和上一個用戶的知識圖譜內(nèi)容是一樣的,基本我們可以判斷是一個冗余信息。只不過我們可以通過設(shè)定圖譜的權(quán)重進(jìn)一步為內(nèi)容進(jìn)行打分。
正常情況下,用戶檢索內(nèi)容的時候,更多的是希望獲得答案,比如提問“月亮的公轉(zhuǎn)周期是多少?”,我們只需要給用戶提供結(jié)果“約27.32天”就可以。
另外,在這個知識融合的過程,通過知識圖譜可以發(fā)現(xiàn)異常與錯誤的內(nèi)容。
例如,圖譜中,我們已經(jīng)定義地球是圓的,突然出來用戶的文章,說地球是方的。兩個內(nèi)容,抽象出的“地球-形狀-圓形”與“地球-形狀-方形”,有明顯的不一致。就可以快速發(fā)現(xiàn)異常信息。經(jīng)過人工與是計算機(jī)AI進(jìn)一步進(jìn)行對內(nèi)容的處理,將優(yōu)質(zhì)的信息上浮,使劣質(zhì)的信息下沉或消亡。
最后,就是知識圖譜的最終呈現(xiàn)。
用戶希望在平臺獲得某些內(nèi)容時,我們除了直接為用戶提供其需要的答案外,我們還可以通過知識圖譜將結(jié)果內(nèi)容進(jìn)行關(guān)聯(lián)化展示,使用戶清晰地了解到內(nèi)容以及答案的來龍去脈與因果關(guān)系,在內(nèi)容的廣度和深度上服務(wù)于用戶。
五、小結(jié)
未來的互聯(lián)網(wǎng)會向著元宇宙(Metaverse)方向發(fā)展。在這里,就像是電影《黑客帝國》中所描述的場景,我們會通過腦機(jī)接口,在一個浩瀚的虛擬的時空中進(jìn)行集合。在這個時空里,人將會同計算機(jī)無縫整合,AI也會達(dá)到前所未有的高度。
內(nèi)容,本身就是一個虛擬世界。內(nèi)容平臺,本身也是一個元宇宙的平臺。虛擬的世界,也是世界。內(nèi)容平臺的內(nèi)容,本身也會像是宇宙一樣,浩瀚無邊。
雖然說互聯(lián)網(wǎng)是開放的,但是我們與不能因為開放,而放棄對高品質(zhì)內(nèi)容的追求。正是因為開放,我們更要有一種機(jī)制來維護(hù)這個社區(qū)的健康有序發(fā)展。
而知識圖譜,將會是內(nèi)容平臺中的一種隱形的規(guī)則,確保在內(nèi)容平臺中,每個參與者所提供內(nèi)容的嚴(yán)肅與高品質(zhì)。這也是未來元宇宙健康蓬勃發(fā)展的關(guān)鍵。
#專欄作家#
王佳亮,微信公眾號:佳佳原創(chuàng),人人都是產(chǎn)品經(jīng)理專欄作家。中國計算機(jī)學(xué)會(CCF)會員,專注于互聯(lián)網(wǎng)產(chǎn)品設(shè)計理念分享。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
- 目前還沒評論,等你發(fā)揮!