分析:“昆山反殺案”中微博用戶的情緒傳播
本文筆者將對微博上,“昆山反殺案”事件發(fā)展過程中,用戶的情感變化進(jìn)行分析和通過圖標(biāo)可視化,從中分析出輿論傳播過程中用戶情感傳播特征以及尋找出情感傳染的規(guī)律。
一、摘 要
隨著社交平臺的發(fā)展與普及,微博逐漸成為網(wǎng)民表達(dá)態(tài)度、發(fā)表意見以及進(jìn)行深入互動的重要平臺。
微博用戶社會參與程度不斷加深,其情緒傳染與現(xiàn)實(shí)公共事件有關(guān),而情緒積累與傳染可能引發(fā)大規(guī)模群體事件。因此,有必要對微博情感進(jìn)行分析,判斷用戶情感類型,分析情感傳播特征繼而找尋情感傳染規(guī)律。
本研究對“昆山反殺案”微博進(jìn)行情感分析與可視化,發(fā)現(xiàn):用戶評論的高頻情感詞,尤其是處于中心位置的情感詞集合,反映網(wǎng)絡(luò)輿情事件的主導(dǎo)情感基調(diào),而高頻詞呈現(xiàn)出更加主觀的態(tài)度或觀點(diǎn),能反映用戶對整個事件的自身真實(shí)情緒與主觀性評價。
用戶情感與事件基調(diào)走勢呈一致性,情感傳染呈明顯聚類現(xiàn)象。微博用戶影響力越強(qiáng)其情緒傳染效果越明顯,在一定程度上主導(dǎo)著網(wǎng)絡(luò)輿論的發(fā)展方向。
二、研究背景與問題的提出
據(jù)中國互聯(lián)網(wǎng)報告(CNNIC)統(tǒng)計(jì):截至2018年6月,我國網(wǎng)民規(guī)模達(dá)8.02億,互聯(lián)網(wǎng)普及率為57.7%;2018年上半年新增網(wǎng)民2968萬人,較2017年末增長3.8%;在移動互聯(lián)網(wǎng)市場,微博用戶增長迅速,手機(jī)微博用戶使用率達(dá)40.1%,較2017年末增長2.1個百分點(diǎn),用戶規(guī)模半年增長10.2%。
[1]隨著社交平臺的普及,微博憑借其表達(dá)的公共性、即時性、社交化和內(nèi)容的簡短化,已成為網(wǎng)民最常用于進(jìn)行表達(dá)意見、情感的平臺。微博內(nèi)容中的情感元素也開始受到了越來越多研究者的關(guān)注。
針對微博的情感分析一般是以微博作為數(shù)據(jù)來源,挖掘和分析當(dāng)中的主觀信息以判斷文本內(nèi)容顯示出的情感傾向。
目前,國內(nèi)關(guān)于微博情感分析分類方法是按其粒度劃分為粗粒度和細(xì)粒度情感分析兩大類。粗粒度的情感分析主要是基于篇章級和句子級,而且在分析過程中僅考慮情感詞,并未考慮評價對象及其屬性的情感;細(xì)粒度的情感分析一般指詞匯級情感分析[2],對情感進(jìn)行分類是細(xì)粒度情感分析的重要方面之一。
學(xué)者們利用眾多角度和方法對微博上的情感進(jìn)行細(xì)粒度地分類,形成了各種“情感詞庫”。
- 潘明慧和牛耘基于詞典的規(guī)則識別微博所表達(dá)的喜、哀、怒、懼、惡、驚六種情緒[3];
- 王志濤等在40萬條新浪微博數(shù)據(jù)中對新詞進(jìn)行挖掘和情感識別,構(gòu)建了新情感詞詞典,擴(kuò)充了已有的情感詞資源[4];
- 張珊等將目光轉(zhuǎn)向其他表達(dá)情感的情感元素的詞典構(gòu)建上,利用微博中的表情圖片并結(jié)合情感詞語的方法構(gòu)建了中文微博情感語料庫[5];
- 無獨(dú)有偶,王遠(yuǎn)文等將表情情感詞典反作用于對應(yīng)的微博文本,重新度量其情感詞的傾向值,改進(jìn)現(xiàn)有的情感詞典[6];
- 敦欣卉等在對微博進(jìn)行細(xì)粒度分類時將情感分成八個類別[7],同時還有不少學(xué)者以“喜怒哀樂”為基礎(chǔ)對情感做了細(xì)致分類,不斷提高對情感分類的科學(xué)性和豐富性。
除此之外,互聯(lián)網(wǎng)平臺的交互性和開放性,使這些情緒大規(guī)模傳染成為可能。
學(xué)者們提供大量的證據(jù)說明人類傾向于模仿周圍人的面部表情、語言表達(dá)、動作及行為,在這一過程中,主體的情緒體驗(yàn)會受到自身面部表情以及其他非語言線索影響[8]。在社交網(wǎng)絡(luò)上,人們接觸帶有情感傾向內(nèi)容時,會對情感產(chǎn)生反饋,如共鳴、強(qiáng)化或者分歧等。
現(xiàn)有的研究表明Facebook、twitter兩大國外主流社交平臺都存在情緒傳染現(xiàn)象:例如Kramer等通過檢查Facebook狀態(tài)更新來研究大規(guī)模情緒感染現(xiàn)象,發(fā)現(xiàn)在用戶發(fā)布帶有情感傾向的新動態(tài)后,他們的朋友更有可能發(fā)布帶有相同情緒的內(nèi)容。張少群[9]等對十萬多個twitter用戶情緒與時間序列進(jìn)行分析,驗(yàn)證了在twitter平臺用戶們的情緒既會被熟人的情緒所傳染,也會被非熟人的情緒所傳染[10]。
快樂、悲傷、抑郁等基本情緒傳染現(xiàn)象也受到學(xué)者們關(guān)注,不同情緒的喚起與傳染特征也有所不同。
以“快樂”這一情緒為例,當(dāng)內(nèi)外刺激滿足個體需要時,個體就會產(chǎn)生積極的情緒[11]。而同性之間更容易察覺出對方的快樂,而在情緒發(fā)生傳染時,女性的快樂程度比男性要低,而處在其社交網(wǎng)絡(luò)中心的人快樂程度要比處于社交網(wǎng)絡(luò)中心邊緣的人群要高[12]。
“孤獨(dú)感”是學(xué)者們關(guān)注較多的情緒之一,有分析表明:孤獨(dú)情緒往往產(chǎn)生在集群中,朋友越少的人往往越感到孤獨(dú),而女性受到孤獨(dú)情緒傳染比例和程度均比男性要高[13]。
學(xué)者對比發(fā)現(xiàn):抑郁、孤獨(dú)和憤怒等負(fù)向情緒比愉快、興奮等正向情緒更容易傳播[14],徐翔等對今日頭條帖子及評論進(jìn)行分析,發(fā)現(xiàn)內(nèi)疚、驚駭、失望、哀痛、遺憾、悲傷等負(fù)面情緒傳播效果較好,而帶有同情、喜愛、贊揚(yáng)、安心、快樂等情感傳染效果較差[15]。
盡管當(dāng)下關(guān)于微博情感分析的研究不少,但大部分研究都將“情感分類模型”?和“情緒傳染機(jī)制”作為研究目標(biāo),旨在提高微博當(dāng)中情感詞的提取效率和準(zhǔn)確度,以及對微博情感的時序變化作出描述,在對特定的情感或情緒在公共事件中的喚起、傳播機(jī)制的研究仍然存在一定的空白。
基于以上研究,我們提出:
- 微博用戶情感是如何分布的?高頻情感詞出現(xiàn)的原因?情感詞情感基調(diào)與事件本身的關(guān)系是什么?
- 微博用戶情緒是如何傳播的?是廣播式傳播還是病毒式傳播?
- 微博用戶情緒傳染是否具有某種規(guī)律?情緒是否有聚類現(xiàn)象?相同情感是否會收到同樣的情感回饋?強(qiáng)影響力微博用戶是否具有更強(qiáng)的情感傳染力?
三、研究思路與方法
2018年8月27日,劉海龍醉酒駕駛寶馬轎車強(qiáng)行闖入非機(jī)動車道,與正常騎自行車的于海明險些碰擦,雙方遂發(fā)生爭執(zhí)。劉海龍持刀砍向于海明,隨后被于海明奪刀并追砍,劉海龍經(jīng)搶救無效死亡。
該事件視頻在微博曝光后,引起了全網(wǎng)民的關(guān)注與討論,基于樸素的正義感,多數(shù)民眾本能地支持于海明,也有一些法律界人士從法理角度論證于海明“殺人”行為的非正當(dāng)性。
與此同時,有不少網(wǎng)民對劉海龍的涉黑背景卻曾被昆山市授予“見義勇為獎”等表達(dá)了對政府公信力的質(zhì)疑,網(wǎng)民復(fù)雜情緒不斷擴(kuò)展。9月1日,昆山警方和檢察機(jī)關(guān)相繼發(fā)出通報,稱于海明行為屬正當(dāng)防衛(wèi),無需承擔(dān)刑事責(zé)任,網(wǎng)民又形成一致“叫好” 的聲音。
“昆山反殺案”發(fā)生與審理過程經(jīng)歷了一個完整生命周期,集合了網(wǎng)民“惡”、“喜”、“厭”、“好”等多種情緒,能夠真實(shí)還原網(wǎng)民的情緒反應(yīng)。
本研究以 “昆山反殺案”微博為數(shù)據(jù)基礎(chǔ),基于詞典匹配的情感分析方法,即通過匹配情感詞典,確定給定文本中積極情感詞和消極情感詞比例,或?qū)Σ煌榫w類別(如高興、傷心、憤怒、喜悅等)進(jìn)行加總,從而判定給定文本的基本情感, 并對情感類型進(jìn)行判斷和識別[16],進(jìn)而考察情緒傳播的特征與規(guī)律。
本文主要結(jié)合了以下兩種研究方法來開展研究工作,具體包括:
- 網(wǎng)絡(luò)科學(xué)方法:將微博系統(tǒng)中用戶轉(zhuǎn)發(fā)關(guān)系抽象成網(wǎng)絡(luò)科學(xué)中的節(jié)點(diǎn)和連邊,進(jìn)而構(gòu)建用戶情感傳染網(wǎng)絡(luò)以及單條微博的傳播級聯(lián)樹,這種方式的好處在于使得我們能夠透過顯現(xiàn)看本質(zhì),通過對具體實(shí)際網(wǎng)絡(luò)的拓?fù)湫再|(zhì)分析來得到情緒傳播的規(guī)律。
- 情感挖掘方法與技術(shù):本文使用Python語言中Pandas框架進(jìn)行數(shù)據(jù)的分析和處理,并使用基于情感詞典的方法來分析情感,以及使用Matplotlib和Pyecharts這兩種繪圖庫對分析的結(jié)果進(jìn)行可視化,并基于Anaconda軟件中的Spyder進(jìn)行代碼的編寫和調(diào)試。
四、數(shù)據(jù)處理過程
1. 情感分析流程
本文使用大連理工大學(xué)中文情感詞匯本體庫[17]來進(jìn)行情感分析。
中文情感詞匯本體的情感分類體系是在國外比較有影響力的Ekman的6大類情感分類體系基礎(chǔ)上構(gòu)建?;贓kman,詞匯本體加入情感類別“好”對褒義情感進(jìn)行更細(xì)致的劃分。最終詞匯本體中的情感共分為7大類21小類(見表1)。
本研究使用 “樂、好、怒、哀、懼、惡、驚”這7類情感作為本研究情感類別。為更準(zhǔn)確計(jì)算每類情感的強(qiáng)度,我們構(gòu)建了微博表情符號字典,考慮到否定詞和程度副詞對情感的影響,也構(gòu)建了否定詞和程度副詞字典,為便于情感計(jì)算,將其賦予一定的權(quán)重。
使用Snownlp對句子進(jìn)行斷句,jieba包對語句進(jìn)行分詞,結(jié)合所構(gòu)建的情感字典,得到微博用戶對該事件細(xì)粒度情感分析。同時對分詞后的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),挖掘出對此案件的基本情感傾向和強(qiáng)度。(見圖1)
2. 數(shù)據(jù)處理過程
2.1 數(shù)據(jù)預(yù)處理
首先,通過數(shù)據(jù)分析,發(fā)現(xiàn)原微博用戶昵稱字段始終顯示根節(jié)點(diǎn)用戶而不是轉(zhuǎn)發(fā)用戶上家。于是,根據(jù)轉(zhuǎn)發(fā)微博字段中是否含有表達(dá)式“//@用戶名:評論內(nèi)容”來判斷是一級轉(zhuǎn)發(fā)還是多級轉(zhuǎn)發(fā);若不含有該表達(dá)式,則認(rèn)為是一級轉(zhuǎn)發(fā),即直接從原微博用戶轉(zhuǎn)發(fā);若含有或含有多個該表達(dá)式,則取第一個表達(dá)式中用戶作為上級節(jié)點(diǎn)用戶。
處理數(shù)據(jù)新增字段:上級用戶昵稱,上級用戶評論內(nèi)容,轉(zhuǎn)發(fā)用戶評論內(nèi)容。
其次,對數(shù)據(jù)清洗,清洗規(guī)則為:刪除與目標(biāo)內(nèi)容無關(guān)微博(含投票機(jī)制,格式錯誤,關(guān)鍵字段有缺失值的微博)。最后,對上級用戶評論內(nèi)容和轉(zhuǎn)發(fā)用戶評論內(nèi)容使用Snownlp和jieba進(jìn)行分句和分詞。
2.2 微博細(xì)粒度情感計(jì)算
對微博數(shù)據(jù)中上級用戶評論內(nèi)容和轉(zhuǎn)發(fā)用戶評論內(nèi)容兩字段文本內(nèi)容進(jìn)行分句和分詞,通過已建立的情感詞典、程度副詞字典和否定詞字典,可快速、精準(zhǔn)計(jì)算出情感傾向。
本研究每條微博用Item1、Item2、…、Itemn表示,一條微博中往往具有多個情感詞和修飾副詞,每個情感詞得分計(jì)算公式:
其中Ei為某類情感詞組合的得分,Oi代表情感詞前面否定詞的個數(shù),ai代表情感組合中程度副詞的強(qiáng)度,Pi為情感詞的情感強(qiáng)度。最后,我們?nèi)∽畲笄楦性~組合得分的情感類別作為該條微博的情感傾向。
五、研究發(fā)現(xiàn)與結(jié)果
1. 微博用戶情感分布
事件所涉及的情感詞數(shù)量繁多、分布雜亂,且有些詞語呈中性不具有具體情感,也有許多詞語表達(dá)了同種情感。
因此,本研究按大連理工大學(xué)中文情感詞匯本體庫建立的情感分類體系對情感類型進(jìn)行統(tǒng)計(jì)和整理。與此同時,通過對數(shù)據(jù)集中上級用戶評論內(nèi)容和轉(zhuǎn)發(fā)用戶評論內(nèi)容兩字段情感計(jì)算,得到情感轉(zhuǎn)發(fā)數(shù)據(jù)集,重點(diǎn)關(guān)注轉(zhuǎn)發(fā)用戶評論內(nèi)容情感(見圖2)。
從圖中可以看出在該數(shù)據(jù)中主要是好(12.63%),惡(3.76%)和樂(3.39%)比例最大,其中好的情感詞包括“點(diǎn)贊”、“棒”、“鼓掌”等;惡的情感詞包括“活該”、“該死”、“可惡”等;樂的情感詞包括“大快人心”、“普天同慶”、“笑cry”等。
78%的數(shù)據(jù)不具有情感是因?yàn)樵谠摂?shù)據(jù)中用戶只產(chǎn)生了轉(zhuǎn)發(fā)行為并未進(jìn)行評論,微博系統(tǒng)將該用戶評論內(nèi)容字段自動設(shè)置為“轉(zhuǎn)發(fā)微博”,不具有情感成分。此數(shù)據(jù)顯示:微博用戶對該事件呈現(xiàn)出好、惡對立的情感,并以好為主要情感基調(diào)。
除此之外,情感詞在一定程度上能反映事件發(fā)展變化,高頻詞主要來源于對事件描述性文本或單純新聞性廣播,以及政務(wù)微博,高頻詞反映微博用戶情緒類型,更能從微觀體現(xiàn)用戶個人態(tài)度[18]。
我們對轉(zhuǎn)發(fā)用戶評論字段進(jìn)行高頻詞統(tǒng)計(jì),圖3為“昆山反殺案”事件高頻情感詞可視化,如“[good]”、“[贊]”、“大快人心”、“[鼓掌]”、“喜大普奔”、“普天同慶”等,其中帶有“[]”是微博表情符號。這些高頻詞更能反映用戶自身態(tài)度及一些隱藏情緒。
“昆山反殺案”關(guān)鍵爭議點(diǎn)是對于海明“殺人”行為性質(zhì)的認(rèn)定。多數(shù)民眾基于樸素正義感,認(rèn)為于海明行為屬正當(dāng)防衛(wèi),于是輿論一邊倒認(rèn)為于海明無罪。昆山警方和檢察機(jī)關(guān)通報于海明行為為正當(dāng)防衛(wèi)。至此,民意得到法理的支持,輿情與司法在熱點(diǎn)事件上達(dá)成了共識。
通過上述分析發(fā)現(xiàn):社交網(wǎng)絡(luò)用戶的高頻情感詞,尤其是處于中心位置的情感詞集合,反映網(wǎng)絡(luò)輿情主導(dǎo)情感基調(diào),而高頻詞呈現(xiàn)更加主觀態(tài)度或觀點(diǎn),能反映用戶對整個事件的自身真實(shí)情緒與主觀評價。
2. 情感傳播特征
信息傳播方式分為廣播式傳播和病毒式傳播,前者指由單個父節(jié)點(diǎn)主導(dǎo)大規(guī)模傳播,如新聞機(jī)構(gòu)、政府等大眾傳播。后者指單個父節(jié)點(diǎn)引發(fā)多層分支傳播,其中每個節(jié)點(diǎn)僅影響少數(shù)節(jié)點(diǎn),如HIV病毒、流感病毒等人際傳播(見圖4)。
信息傳播一般都融合了廣播式傳播和病毒式傳播,不屬于任一單一傳播方式。
“結(jié)構(gòu)性病毒式傳播特征(Structural Virality)”[19]是用來衡量信息傳播結(jié)構(gòu)性擴(kuò)散程度。
該特征指一條信息傳遞到所有末端節(jié)點(diǎn)的平均步數(shù)。簡而言之,一條信息如果只是被“廣播式傳播”,則該信息的結(jié)構(gòu)性擴(kuò)散度很低;如果信息經(jīng)過了多級轉(zhuǎn)發(fā),則信息的結(jié)構(gòu)性擴(kuò)散度較高。
為了更好展示結(jié)構(gòu)性病毒式指標(biāo),我們對社交網(wǎng)絡(luò)中的模體進(jìn)行刻畫,x軸從左到右依次是廣播式傳播至病毒式傳播過渡,y軸是模體的數(shù)量。發(fā)現(xiàn)在昆山反殺案事件中主要是廣播式傳播,即微博中的新聞性廣播用戶、政府官方機(jī)構(gòu)用戶及微博認(rèn)證用戶等在該事件傳播過程中占主導(dǎo)地位(見圖5)。
“昆山反殺案”事件是典型的熱點(diǎn)司法案件,在以往此類案件中,司法機(jī)關(guān)為緩解輿論壓力,常采用拖延戰(zhàn)術(shù),存在著不及時回應(yīng)輿論,不公開細(xì)節(jié)等問題,以期能分散輿論注意力,等待輿論熱度將下來,再審理案件。
但長時間拖延一方面會給各種猜疑和謠言提供空間,讓熱點(diǎn)案事件成為謠言的集散地,在輿論持續(xù)發(fā)酵下,甚至派生出其他社會問題,傳播主體的異質(zhì)性加強(qiáng),病毒式傳播會越加明顯。
通過查看微博內(nèi)容,發(fā)現(xiàn)在該案件傳播過程中,其主要傳播與引導(dǎo)主體為權(quán)威新聞機(jī)構(gòu)用戶與政府官方微博平臺,這主要因?yàn)槔ド焦病z察機(jī)關(guān)“短平快”做法,從案件發(fā)生到得出結(jié)論不過幾天時間,既不給輿論過度炒作、發(fā)酵的時間,也及時地向社會發(fā)布案件細(xì)節(jié),其傳播的結(jié)構(gòu)性擴(kuò)散程度被大大降低了。
3. 情感傳染規(guī)律
3.1 用戶情感與事件基調(diào)走勢呈一致性
通過分析不同時段情感走勢,發(fā)現(xiàn)在8月28日至8月31日案件判斷未公布之前,主導(dǎo)情感為“好”和“惡”。在案件公布當(dāng)天,好的情感出現(xiàn)了爆發(fā)式傳播,并占據(jù)主導(dǎo)地位,其次是樂的情感,而惡情感逐漸緩慢衰弱(見圖6)。這說明用戶情感表達(dá)與事件發(fā)展基調(diào)呈一致性。
3.2 情感傳染呈明顯聚類現(xiàn)象?
在網(wǎng)絡(luò)科學(xué)中,圖(Graph)提供了一種用抽象點(diǎn)和線表示各種實(shí)際網(wǎng)絡(luò)的統(tǒng)一方法,也成為目前研究復(fù)雜網(wǎng)絡(luò)的共同語言[20]。
圖的類型有四種:無權(quán)無向圖、無權(quán)有向圖、加權(quán)有向圖、加權(quán)無向圖。
本研究使用加權(quán)有向圖來構(gòu)建情感傳染網(wǎng)絡(luò),其中有向邊是指存在一條從頂點(diǎn)指向頂點(diǎn)的邊并不意味著存在一條頂點(diǎn)指向頂點(diǎn)的邊。對于有向邊,頂點(diǎn)是始點(diǎn),頂點(diǎn)是終點(diǎn)。
邊權(quán)是指:網(wǎng)絡(luò)中每條邊都附有相應(yīng)的權(quán)值,以表示相應(yīng)兩個節(jié)點(diǎn)之間的聯(lián)系強(qiáng)度。
本研究將上級用戶情感和轉(zhuǎn)發(fā)用戶情感分別作為網(wǎng)絡(luò)始點(diǎn)和終點(diǎn),統(tǒng)計(jì)不同類型始點(diǎn)和終點(diǎn)構(gòu)成的節(jié)點(diǎn)對數(shù)目來做為對應(yīng)邊權(quán)重,為清楚表示情感在傳播中是否具有聚類現(xiàn)象,我們采用熱力圖方式進(jìn)行展示(見圖7)。其中y軸是始點(diǎn),x軸是終點(diǎn),顏色條表示權(quán)重,顏色越深,權(quán)重越大。相比其他情感,好、樂和惡的顏色呈現(xiàn)明顯聚類現(xiàn)象。
我們重點(diǎn)分析“好”、“惡”和“樂”這三類情感的聚類情況(見圖8),發(fā)現(xiàn)好的情感傾向聚集好,其次是樂和惡;惡的情感傾向聚集好,其次是惡和樂;樂的情感傾向聚集好,其次是樂和惡。
其中,子節(jié)點(diǎn)大小表示傳遞的傾向性,子節(jié)點(diǎn)越大,傾向性越強(qiáng)。社交平臺中,情感是對特定話題與情境進(jìn)行互動的根本動因[21],人們接觸帶有情感傾向內(nèi)容時,會對情感產(chǎn)生反饋,如共鳴、強(qiáng)化或者分歧等。
在用戶發(fā)布帶有情感傾向動態(tài)后,尤其是強(qiáng)影響力用戶,關(guān)注他們的用戶更有可能發(fā)布帶有相同情緒內(nèi)容。社交的選擇性使得人們在互聯(lián)網(wǎng)上產(chǎn)生了相近或者相反的情緒體驗(yàn)與表達(dá),由此就呈現(xiàn)了情感聚類的狀態(tài),“昆山反殺案”事件的情感傳播特征也恰好印證了情感聚類的規(guī)律。
而數(shù)據(jù)中出現(xiàn)惡的情緒能夠帶來好回復(fù)這一特殊情況,通過查看微博內(nèi)容,發(fā)現(xiàn)網(wǎng)民惡情緒主要對劉海龍涉黑背景及其以強(qiáng)欺弱的厭惡與憤怒,而作為弱者的于海明則得到了網(wǎng)民的廣泛同情,在面對劉海龍被反殺這一事件時,大部分網(wǎng)民反饋是“大快人心”的好情緒。
3.3 微博用戶影響力越強(qiáng)其情緒傳染效果越明顯
如果把一個節(jié)點(diǎn)看做一個網(wǎng)頁,那么節(jié)點(diǎn)間信息傳播可以看做網(wǎng)頁中的連接,很多學(xué)者據(jù)此提出,對節(jié)點(diǎn)影響力測量可以通過PageRank算法來實(shí)現(xiàn)。PageRank算法考慮整體網(wǎng)絡(luò)結(jié)構(gòu):一個節(jié)點(diǎn)的重要性并非只與其連入節(jié)點(diǎn)數(shù)目決定,還要由這些連入節(jié)點(diǎn)在網(wǎng)絡(luò)結(jié)構(gòu)中的重要性決定。
隨機(jī)選取一個根微博用戶(鳳凰網(wǎng)視頻),通過該根微博用戶旗下轉(zhuǎn)發(fā)數(shù)據(jù)構(gòu)建轉(zhuǎn)發(fā)級聯(lián)網(wǎng)絡(luò),計(jì)算該網(wǎng)絡(luò)中每個節(jié)點(diǎn)PageRank值,選取三個不同影響力節(jié)點(diǎn)并可視化該網(wǎng)絡(luò)中以這三個節(jié)點(diǎn)為中心的情感級聯(lián)網(wǎng)絡(luò)(圖9)。
從左到右,根節(jié)點(diǎn)(“鳳凰網(wǎng)視頻”、“投資輿情”和“科技圣斗士”)影響力依次降低,情感聚類效果依次減弱。查看數(shù)據(jù),發(fā)現(xiàn):“投資輿情”和“科技圣斗士”等小簇根節(jié)點(diǎn)用戶屬于非新聞?wù)惽揖哂幸欢ㄓ绊懥Φ男”娒襟w。
由此可見,在傳播情感過程中影響力越強(qiáng)的微博用戶對情感傳染貢獻(xiàn)力越高,情感聚類現(xiàn)象越明顯,對于“昆山反殺案”此種突發(fā)新聞事件,新聞類微博用戶影響力遠(yuǎn)大于小眾媒體用戶。
六、討論與結(jié)論
信息傳播的直接效果是獲取知識,繼而產(chǎn)生態(tài)度,而對人們態(tài)度的測量和分析是預(yù)測其后續(xù)行為的重要變量[22]。
微博是人們獲取信息,發(fā)表態(tài)度與情感的重要平臺。本研究以“昆山反殺案”為例,對微博用戶情感進(jìn)行挖掘及可視化,進(jìn)而探究其情感分布、傳播特征與情感傳染規(guī)律。
研究發(fā)現(xiàn):微博用戶情感詞集反映事件情感基調(diào)?!袄ド椒礆浮鼻楦薪?jīng)歷了一個完整生命周期,宣判前用戶情緒以“惡”和“好”為主;宣判后“好”情感呈爆發(fā)式增長,一方面說明網(wǎng)民情感與事件情感基調(diào)相一致,另一方面說明用戶情感與事件情感走勢呈一致性。
除此之外,對高頻情感詞的統(tǒng)計(jì)與分析能從微觀體現(xiàn)用戶個人態(tài)度及一些隱藏情緒。與以往社交網(wǎng)絡(luò)病毒式情感傳播特征不同,“昆山反殺案”主要呈廣播式傳播。
這與相關(guān)部門“短平快”的處理方式密切相關(guān),此種方式減少了事件發(fā)酵時間,大大降低了情感傳播結(jié)構(gòu)性擴(kuò)散程度。
1974年,Everitt[22]提出的聚類定義為:數(shù)據(jù)被劃分成許多類簇,同一類簇內(nèi)實(shí)體較相似,不同類簇之間實(shí)體不相似。聚類是以某種相似性度量為基礎(chǔ),將擁有相似特征樣本元素歸為一類的過程或狀態(tài)。
在該事件中,發(fā)現(xiàn)好的情感傾向聚集好,其次是樂和惡;惡的情感傾向聚集好,其次是惡和樂;樂的情感傾向聚集好,其次是樂和惡,情感傳染大體呈明顯聚類現(xiàn)象?;ヂ?lián)網(wǎng)環(huán)境下,強(qiáng)影響力微博用戶對情感傳染貢獻(xiàn)力越強(qiáng),情感聚類現(xiàn)象越明顯。
此外,對于突發(fā)性新聞事件,新聞類微博用戶影響力遠(yuǎn)高于小眾媒體用戶。
雖然本研究只分析了“昆山反殺案”單個案例,但仍然具有一定普適性,一方面該事件是典型司法案件,微博平臺混合了用戶較多情緒,情緒的復(fù)雜為研究提供了廣泛的數(shù)據(jù)空間;另一方面,該事件情感周期比較完整,能夠較為真實(shí)全面反應(yīng)用戶的情感變化。
當(dāng)然,本研究的情感分析并不全面,未來研究可以細(xì)化微博用戶的類別,從更多層面詳細(xì)探討不同類別社交網(wǎng)絡(luò)用戶情感傳播與情緒傳染問題,分析不同類別用戶情感在不同社交網(wǎng)絡(luò)特征。
附錄一
表1:中文情感詞匯本體庫的情感分類
圖1 微博情感分析流程圖
圖2 轉(zhuǎn)發(fā)用戶評論情感分布
圖3 轉(zhuǎn)發(fā)用戶評論內(nèi)容的高頻詞可視化
圖4 廣播式傳播和病毒式傳播(引用文獻(xiàn)[27])
圖5 《昆山反殺案》中結(jié)構(gòu)性病毒式指標(biāo)的分布
圖6?各時間段的情感類型分布
圖7 情感傳染網(wǎng)絡(luò)的熱力圖
圖8 情感傳播中的聚類情況
圖9 不同影響力的根節(jié)點(diǎn)用戶的聚類情
附錄二
參考文獻(xiàn):
[1]中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報告.[EB/OL]
[2]敦欣卉, 張?jiān)魄? 楊鎧西. 基于微博的細(xì)粒度情感分析[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2017, 1(7):61-72.
[3]潘明慧, 牛耘. 基于多線索混合詞典的微博情緒識別[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2014(9):28-32.
[4]王志濤, 於志文, 郭斌,等. 基于詞典和規(guī)則集的中文微博情感分析[J]. 計(jì)算機(jī)工程與應(yīng)用唯一官方網(wǎng)站, 2015, 51(8):218-225.
[5]敦欣卉, 張?jiān)魄? 楊鎧西. 基于微博的細(xì)粒度情感分析[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2017, 1(7):61-72.
[6]王文遠(yuǎn), 王大玲, 馮時, et al. 一種面向情感分析的微博表情情感詞典構(gòu)建及應(yīng)用[J]. 計(jì)算機(jī)與數(shù)字工程, 2012, 40(11).
[7]敦欣卉, 張?jiān)魄? 楊鎧西. 基于微博的細(xì)粒度情感分析[J]. 數(shù)據(jù)分析與知識發(fā)現(xiàn), 2017, 1(7):61-72.
[8]王瀟, 李文忠, 杜建剛. 情緒感染理論研究述評[J]. 心理科學(xué)進(jìn)展, 2010, 18(8):1236-1245.
[9]Kramer A D I . The spread of emotion via facebook.[C]// Sigchi Conference on Human Factors in Computing Systems. ACM, 2012.
[10]張少群, 魏晶晶, 廖祥文, et al. Twitter中的情緒傳染現(xiàn)象[J]. 山東大學(xué)學(xué)報(理學(xué)版), 2016(1):71-76.
[11]孫惠君. 休閑與積極情緒的產(chǎn)生[J]. 黑龍江教育學(xué)院學(xué)報, 2008, 27(8):78-81.
[12]Fowler J, Christakis N: Dynamic spread of happiness in a large social network: longitudinal analysis over 20 years in the Framingham heart study. BMJ 2008, 337:a2338.
[13]Cacioppo J T , Fowler J H , Christakis N A . Alone in the Crowd: The Structure and Spread of Loneliness in a Large Social Network[J]. Social Science Electronic Publishing, 2009, 97(6):977-91.
[14]熊熙, 喬少杰, 吳濤, et al. 基于時空特征的社交網(wǎng)絡(luò)情緒傳播分析與預(yù)測模型[J]. 自動化學(xué)報, 2018, 44(12).
[15]徐翔,陽恬. 網(wǎng)絡(luò)社會中的“情緒逆差”——網(wǎng)絡(luò)表達(dá)與傳播中的情緒偏向及其張力結(jié)構(gòu)[J]. 北京郵電大學(xué)學(xué)報(社會科學(xué)版), 2018, 20(2).
[16]張倫,王成軍,許小可.計(jì)算傳播學(xué)導(dǎo)論[M].北京:北京師范大學(xué)出版社,2018:47-48.
[17] 徐琳宏, 林鴻飛, 潘宇, 等. 情感詞匯本體的構(gòu)造[J]. 情報學(xué)報, 2008, 27(2): 180-185.
[18]紀(jì)雪梅. 特定事件情境下中文微博用戶情感挖掘與傳播研究[D]. 南開大學(xué), 2014.
[19]Goel S, Anderson A, Hofman J, et al. The structural virality of online diffusion[J]. Management Science, 2015, 62(1): 180-196.
[20]蔣曉麗, 何飛. 互動儀式理論視域下網(wǎng)絡(luò)話題事件的情感傳播研究[J]. 湘潭大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2016, 40(2):120-123.
[21] 汪小帆, 李翔, 陳關(guān)榮. 網(wǎng)絡(luò)科學(xué)導(dǎo)論[M]. 高等教育出版社, 2012.
[22](R·A·巴倫,D·伯恩 著,黃敏兒,王飛雪等譯.社會心理學(xué):華東師范大學(xué)出版社,2004)
[23]Everitt Brian. Cluster Analysis [M]. New York: Wiley, 2011.
文章基礎(chǔ)數(shù)據(jù)來源:新浪微熱點(diǎn)大數(shù)據(jù)研究院
本文由 @數(shù)據(jù)鍋 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于CC0協(xié)議。
- 目前還沒評論,等你發(fā)揮!