【干貨】從社交媒體傳播和文本挖掘角度解讀《歡樂頌2》

52 評(píng)論 42632 瀏覽 162 收藏 37 分鐘

作為數(shù)據(jù)分析愛好者,本文作者將想從數(shù)據(jù)的角度去解讀《歡樂頌2》這部熱播劇的方方面面,包括輿情傳播、網(wǎng)絡(luò)口碑、人物社交網(wǎng)絡(luò)分析及,以及小說內(nèi)容的文本分析。

5月11日,讓眾多安迪粉期待已久的《歡樂頌》第二季終于播出。相比首季,《歡樂頌2》在造型和場景上顯得更為精致時(shí)尚,且其中每個(gè)角色的造型卻都是遵從的其身份和背景,并不突兀。

正所謂“外行看熱鬧,內(nèi)行看門道”,作為數(shù)據(jù)分析愛好者的筆者,自然想從數(shù)據(jù)的角度去解讀這部熱播劇的方方面面,包括輿情傳播、網(wǎng)絡(luò)口碑、人物社交網(wǎng)絡(luò)分析,以及小說內(nèi)容的文本分析。

以下是筆者在這篇文章想要著重分析的內(nèi)容:

  • 這部分在互聯(lián)網(wǎng)上的輿情傳播如何?包括該劇的全網(wǎng)傳播趨勢、關(guān)注人群畫像,及網(wǎng)絡(luò)營銷手法。
  • 和大獲成功的第一部相比,第二部的口碑如何?主要涉及本劇豆瓣影評(píng)的文本分析。
  • 對(duì)第一、二季的小說文本分析。主要涉及關(guān)鍵詞提取、主要人物的社交網(wǎng)絡(luò)關(guān)系及關(guān)聯(lián)詞分析等。

在筆者進(jìn)行分析的過程中,會(huì)用到一些常用的(大)數(shù)據(jù)分析工具,以及環(huán)環(huán)相扣的數(shù)據(jù)分析討論,雖然對(duì)于常規(guī)的數(shù)據(jù)運(yùn)營并無直接的幫助,但“他山之石,可以攻玉”,分析的思路卻可以作為參考,以期應(yīng)用到其他實(shí)際的場景中。

1?《歡樂頌2》的大數(shù)據(jù)輿情分析

在第一部分中,筆者選取了2017.05.07~2017.05.29期間關(guān)于《歡樂頌2》的全網(wǎng)輿情數(shù)據(jù)作為數(shù)據(jù)分析對(duì)象,利用新浪微輿情的“信息監(jiān)測”和“全網(wǎng)事件分析”作為數(shù)據(jù)采集、數(shù)據(jù)分析和可視化的工具。

以下分別從《歡樂頌2》的全網(wǎng)傳播概況及傳播趨勢兩方面進(jìn)行分析。

1.1《歡樂頌2》的全網(wǎng)傳播概況

(1)全網(wǎng)傳播走勢

上圖是《歡樂頌2》在這段時(shí)間內(nèi)信息傳播走勢圖,自開播之日起,該劇的全網(wǎng)聲量出現(xiàn)了明顯的提升,而且里面出現(xiàn)了幾個(gè)信息傳播的“波峰”,說明當(dāng)日全網(wǎng)關(guān)于該劇的討論(包括媒體和網(wǎng)民個(gè)體)較多。尤其需要注意的是,本劇開播當(dāng)日(5-11)的波峰峰值是該時(shí)間段內(nèi)最大的一個(gè),這是不是一個(gè)巧合呢?不要急,筆者會(huì)在后面為各位小伙伴解開謎底。

(2)全網(wǎng)正負(fù)面信息占比

從上圖中可以看到,這段時(shí)間內(nèi),全網(wǎng)關(guān)于《歡樂頌2》的信息量有5,564,016條,其中負(fù)面信息的占比達(dá)到152,315條,占到總信息量的2.74%。

同時(shí),在總體上,負(fù)面信息隨著時(shí)間的推移又不斷增長的趨勢。

結(jié)合二者來看,如此這般的負(fù)面信息占比和發(fā)展情形對(duì)于該劇來說不太有利,說明全網(wǎng)關(guān)于該劇的負(fù)面口碑評(píng)價(jià)比較顯著,需要引起制片方的重視,筆者會(huì)在接下來的分析中,探明到底出現(xiàn)了哪些負(fù)面口碑,以及它們出現(xiàn)的原因。

(3)全網(wǎng)關(guān)注度來源

因?yàn)樵谟耙晞〉膫鞑ヂ暳恐?,微博這塊占據(jù)較大的比重,所以筆者在排除微博這一信息來源后,對(duì)余下的信息來源TOP10進(jìn)行了統(tǒng)計(jì),如下圖所示:

從上圖可以看出,除開微博外,微信、今日頭條這兩大社會(huì)化媒體平臺(tái)上關(guān)于本劇的信息量貢獻(xiàn)最多,尤其微信在近日推出了「微信實(shí)驗(yàn)室」,通過新增加的“搜一搜”和“看一看”這兩個(gè)入口,使用戶能夠主動(dòng)搜索關(guān)鍵詞,能夠?yàn)g覽熱點(diǎn)資訊、好友關(guān)注的資訊以及自己感興趣的文章,這樣的動(dòng)作加上數(shù)年的優(yōu)質(zhì)內(nèi)容沉淀,使得微信在社會(huì)化媒體內(nèi)容生產(chǎn)方面的重要性日漸突出。

(4)全網(wǎng)信息地域分布

有點(diǎn)意外,全網(wǎng)關(guān)注度(關(guān)于這部劇的全網(wǎng)信息量)排名榜首的是江蘇,竟然不是北京和上海這兩大年輕白領(lǐng)云集的現(xiàn)代化的都市,尤其是上海,關(guān)于本劇的信息量分布在TOP10中墊底,難道上海的網(wǎng)民和媒體絕大部分都棄劇了?或者說是本劇的口碑極差?

對(duì)于此種疑問,筆者將會(huì)在第二部分進(jìn)行分析。

1.2 人群畫像

因?yàn)殛P(guān)于本劇的探討,微博(主要是新浪微博)占據(jù)大頭,所以筆者選取該平臺(tái)上的人群作為分析對(duì)象。

(1)? 性別分布

毫無疑問,女生是該劇的忠實(shí)擁簇,他們對(duì)該劇的狂熱絕對(duì)超過男生。

(2)? 年齡分布

從下圖中可以看出,19-34這個(gè)年齡區(qū)間占據(jù)關(guān)注人群的70%左右,也就是說青年群體對(duì)該劇很感興趣。

(3)? 興趣圖譜

下圖給出了關(guān)注該劇的人群的興趣標(biāo)簽TOP5,可以看出,這部分人群比較追星,熱愛生活,都是一些極具年輕人特質(zhì)的興趣愛好。

(4)用戶情感狀態(tài)

根據(jù)關(guān)注《歡樂頌2》的微博用戶給自己打的情感類別標(biāo)簽,可以得知此類用戶的情感狀態(tài)分布情況:

由此可以看到,大部分用戶(80.75%)處于情感空白/開窗期(“單身”和“求交往”狀態(tài)),再次是“戀愛中”,結(jié)合前面的年齡分布,說明關(guān)注人群大都是未婚青年。

(5)用戶學(xué)歷分布

毫無疑問,這類都市情感劇的受眾以受過高等教育的人群為主,因?yàn)樵搫≈v述的是高學(xué)歷白領(lǐng)在大城市工作生活和戀愛的故事。

(6)用戶城市類型

有點(diǎn)出乎意料的是,4線及以下城市的關(guān)注人群所占比重最高,為30.26%,其次是2線和3線城市,而一線城市的關(guān)注人群則僅為14.41%,難道是一線城市的人群對(duì)本劇比較挑剔?

結(jié)合前面的信息地域分布,關(guān)注《歡樂頌2》的主體是一群熱愛生活、熱衷于追星的高學(xué)歷青年女性,她們生活在一線城市開外,情感狀態(tài)多為單身。

1.3 《歡樂頌2》開播當(dāng)日的營銷宣傳分析

在前面提及的全網(wǎng)傳播趨勢中,筆者提到了該劇在開播當(dāng)日就出現(xiàn)明顯的聲量高峰,很明顯,這絕非偶依然。

從前面的信息來源分布可以得知,該劇絕大部分的聲量都來源于微博,尤其是新浪微博。為此,筆者單獨(dú)調(diào)出5-11的微博信息趨勢數(shù)據(jù)。

從上圖可以看到,新浪微博上關(guān)于該劇的信息量大體上是呈現(xiàn)上升趨勢的。在當(dāng)日的23時(shí)左右達(dá)到高峰,而且這種增長趨勢很有節(jié)奏感—從工作時(shí)間段9:00開始,聲量隨時(shí)間的推移不斷上漲。

為了進(jìn)一步發(fā)現(xiàn)其中的傳播規(guī)律,筆者利用新浪微輿情的“信息監(jiān)測”模塊對(duì)其中有影響力的微博進(jìn)行了進(jìn)一步的搜尋和排查,也就是發(fā)現(xiàn)其中轉(zhuǎn)發(fā)次數(shù)較多的微博,以及順藤摸瓜,發(fā)現(xiàn)傳播源頭。

經(jīng)過逐步地抽絲剝繭,筆者發(fā)現(xiàn)了其中轉(zhuǎn)發(fā)量較多的幾條微博,也就是傳播源頭,主要是《歡樂頌2》的幾位主演的微博賬號(hào)和一些跟該劇有關(guān)的微博話題。從實(shí)際效果來看,《歡樂頌2》的幾位主演——?jiǎng)?、王凱、楊紫等人在新浪微博上的影響力較高,粉絲數(shù)量龐大,主動(dòng)轉(zhuǎn)發(fā)積極,使得對(duì)劇集宣傳的效果也相對(duì)較好。

除了主創(chuàng)人員的主動(dòng)推廣外,《歡樂頌2》的推廣營銷方式也是豐富多樣。在微博推廣上,《歡樂頌2》的宣傳物料準(zhǔn)備充足,預(yù)告片、小花絮、主題曲MV等一應(yīng)俱全;宣傳矩陣搭建完整,不僅注意與微博官方賬號(hào)“新浪娛樂”、“新浪電視”、“東方衛(wèi)視番茄臺(tái)”和”@微博電視劇“等)、廣告品牌等多方聯(lián)動(dòng),而且KOL輿論引導(dǎo)投入巨大,還邀請(qǐng)其他明星助力宣傳。

然而,從上面的傳播效果來看,媒體大號(hào)的傳播效果沒有明星個(gè)人的微博賬號(hào)傳播效力大,那么,其中的原因又是什么呢?我們接著往下看。

1.4?微博傳播效果分析

為了深入了解媒體大號(hào)和明星個(gè)人微博傳播特點(diǎn)和規(guī)律,筆者特地找了5-11當(dāng)天粉絲互動(dòng)量較大的2條微博—分別為@微博電視劇和劉濤的個(gè)人微博賬號(hào)@劉濤tamia,它們的轉(zhuǎn)發(fā)評(píng)論幾近一致,方便在同等條件下發(fā)現(xiàn)其中的傳播規(guī)律。

將這兩條微博的轉(zhuǎn)發(fā)傳播關(guān)系數(shù)據(jù)導(dǎo)出,制成能夠清晰反映傳播路徑的可視化“力導(dǎo)向傳播圖“:

上圖是@微博電視劇關(guān)于《歡樂頌2》的營銷微博的傳播路徑圖,其中紫色“簇群“的中心就是賬號(hào)@微博電視劇,除了它自己帶來的轉(zhuǎn)發(fā)傳播(也就是紫色簇群區(qū)域內(nèi)的小圓點(diǎn))之外,周圍還有一些次級(jí)傳播中心,比如“十三點(diǎn)半的kings”、“影視大米FAN”、“吳侃侃kkw”這樣營銷性質(zhì)很強(qiáng)的自媒體賬號(hào)進(jìn)行協(xié)助宣傳,顯然這是宣傳方砸錢買的流量,不是自帶的。

而下面劉濤的該條微博就呈現(xiàn)出明顯的“中心化”特點(diǎn),也就是除了劉濤個(gè)人微博賬號(hào)以外,就沒有特別明顯的次級(jí)傳播中心,絕大部分的傳播都來自于劉濤的賬號(hào)粉絲。

由此,結(jié)論不言自明:

明星個(gè)人微博的傳播較媒體大號(hào)而言更有效力,因?yàn)槊餍且蚱鋫€(gè)人魅力,吸聚的粉絲多,發(fā)的微博貼近生活,跟粉絲之間有較強(qiáng)的互動(dòng)關(guān)系,而且他們的粉絲團(tuán)體也會(huì)不遺余力的去散播此類消息,所以傳播效力更強(qiáng)一些。相比之下,微博大號(hào)因?yàn)樽陨淼臓I銷屬性,除非有利益驅(qū)動(dòng),粉絲才會(huì)主動(dòng)參與互動(dòng),一般而言不會(huì)太強(qiáng),更有甚者,會(huì)發(fā)動(dòng)水軍進(jìn)行操作,通過不正當(dāng)?shù)氖侄我灾\取利益。

好了,上面是關(guān)于《歡樂頌2》的大數(shù)據(jù)輿情傳播分析,下面會(huì)進(jìn)入到另一個(gè)板塊——對(duì)該劇的口碑(主要是豆瓣影評(píng))和小說文本進(jìn)行文本挖掘,期待發(fā)現(xiàn)一些更有趣的內(nèi)容。

2 《歡樂頌2》的豆瓣口碑分析和小說文本分析

一般來說,對(duì)于文本的深入挖掘往往能實(shí)現(xiàn)“知其然并知其所以然”的效力,因?yàn)槲谋静幌駭?shù)字那般空洞和抽象,內(nèi)容往往能直接揭示出原因。

這部分的數(shù)據(jù)主要有:

  • 《歡樂頌》第一季和第二季的豆瓣影評(píng)
  • 《歡樂頌》第一季和第二季對(duì)應(yīng)的原著小說,《歡樂頌2》的劇集將把后兩季的小說內(nèi)容進(jìn)行打包拍攝,所以第二、第三季的小說內(nèi)容都會(huì)出現(xiàn)在《歡樂頌2》的劇情里

豆瓣電影是中國最大與最權(quán)威的電影分享與評(píng)論社區(qū),收錄了百萬條影片和影人的資料,有2500多家電影院加盟,更匯聚了數(shù)千萬熱愛電影的人,因而這里關(guān)于影視劇的評(píng)論具有一定的代表性和公信力,可以在很大程度上反映一部影視劇作品的口碑狀況。所以,筆者抓取豆瓣上《歡樂頌》一二季的影評(píng)作為口碑分析的依據(jù)。

2.1《歡樂頌》一、二季的總體口碑對(duì)比分析

(1)評(píng)價(jià)星級(jí)

從總評(píng)分來看,《歡樂頌》第二季要明顯遜色于第一季,前者拿到了7.3的高分,而后者僅獲得了5.2的評(píng)分。

從第一季和第二季的評(píng)價(jià)星級(jí)占比可以看出,出現(xiàn)第二季總評(píng)分低于第一季的原因在于:第二季在中高分區(qū)間“4星”和“3星”中的占比要小于第一季,而在低分區(qū)間“2星”和“1星”中的比重要高于第一季。

(2)《歡樂頌2》的豆瓣影評(píng)情感傾向分析

由于第一季的口碑要好于第二季,所以筆者接下來著重分析一下第二季的豆瓣影評(píng)的“情感傾向”。

這里的“情感傾向”是以一個(gè)介于0~1之間的“情感極性值”來表征—如果某條評(píng)論的情感極性值越接近于0,說明它的負(fù)面情感傾向越明顯,越接近于1,說明它的正面情感傾向越明顯,而取值在0.5左右徘徊,這說明這種情感傾向不明顯,是為“中性”。筆者將情感傾向值的取值區(qū)間0~1細(xì)分為3個(gè)子區(qū)間,分別對(duì)應(yīng)不同的情感傾向:

豆瓣影評(píng)具有獨(dú)特的語言風(fēng)格—反諷,貶義褒用,不像商品評(píng)論那般直白外露,它的語義往往含蓄且幽默。所以在分析之前,筆者找到大量有標(biāo)注的豆瓣影評(píng)語料,利用機(jī)器學(xué)習(xí)進(jìn)行情感語義模型訓(xùn)練,以期達(dá)到良好的情感正負(fù)面判斷效果。初步結(jié)果如下:

經(jīng)情感傾向標(biāo)簽映射處理,得到如下結(jié)果:

從上圖可以看到,第一季和第二季的情感傾向的最大差異在于正負(fù)面情感的比重不同:第一季的評(píng)論正負(fù)面情感占比旗鼓相當(dāng),而第二季的負(fù)面情感明顯占據(jù)主導(dǎo)地位,正面占比大幅壓縮,這也是本劇豆瓣評(píng)分不高的原因之一。

再看一下情感傾向隨時(shí)間發(fā)展的走勢情況,筆者選取的分析時(shí)間段是3.31~5.22,也就是該劇播出前一個(gè)多月和播出后一段時(shí)間的情感傾向走勢。這里采用的是情感傾向值累加的數(shù)值,越高說明口碑評(píng)價(jià)越好,這也兼顧了評(píng)論數(shù)量上的增減情況(豆油愿意參與評(píng)分,哪怕是負(fù)面評(píng)分,也說明對(duì)本劇有一定的關(guān)注度)。由此得到下圖:

可以看出,在本劇播出次日,情感傾向值達(dá)到高峰,隨后一路下降,結(jié)合這段時(shí)間內(nèi)的總體情感傾向占比可知,豆油們對(duì)于該劇播出后的劇集的關(guān)注度和口碑評(píng)價(jià)都呈現(xiàn)出下降的趨勢。

那么,究竟是什么原因讓廣大豆油們對(duì)該劇如此嫌棄呢?請(qǐng)接著往下看。

(3)《歡樂頌》一、二季豆瓣評(píng)論內(nèi)容的關(guān)鍵詞對(duì)比分析

以下是關(guān)于《歡樂頌》一、二季豆瓣評(píng)論文本的關(guān)鍵詞對(duì)比分析,可以在這張直觀的可視化效果圖上看到“豆油”們對(duì)《歡樂頌》一二季方方面面的評(píng)價(jià)。

上圖中,對(duì)于一二季的評(píng)論文本分別按照“高提及率(Frequent)”和“低提及率(Infrequent)”進(jìn)行了劃分。上圖以橫縱軸的“Average”進(jìn)行切分,則可以分為4個(gè)象限,右上角的為2類文本提及率皆高的詞匯,左下角為二者提及率皆低的詞匯。左上和右下僅是二者之一高提及率的詞匯。

另外,藍(lán)色點(diǎn)陣代表的詞匯屬于對(duì)《歡樂頌》第一季的評(píng)價(jià),黃色點(diǎn)陣所代表的的詞匯屬于對(duì)《歡樂頌》第二季的評(píng)價(jià),右上角的象限二者的評(píng)語趨于重合。

在右邊的TOP Terms(重點(diǎn)關(guān)鍵詞匯)一欄中可以看到,對(duì)于第一季的評(píng)論,豆油們主要提到了該劇的cast/卡司(?演員陣容強(qiáng)大)、山影(山東影視制作有限公司,該劇的出品方)、(看該?。┩2幌聛?、(人物形象)豐滿,以及關(guān)于安迪和奇點(diǎn)(魏渭)的情感主線的探討,但沒有出現(xiàn)明顯的負(fù)面評(píng)價(jià),甚至以褒贊為主。

而第二季里,很多豆油拿第一季和第二季進(jìn)行對(duì)比,認(rèn)為本劇和第一季沒得比,還有就是本劇里的插曲太多,好似一個(gè)MV大集合(“MV”、“mv”、“歌曲”、“就唱”),正如某位豆油的評(píng)論所說“一開始就狂配bgm,而且感覺和劇情并不搭嘎,什么咖喱歌一股鄉(xiāng)村風(fēng)”。。。值得玩味的是,也有都有拿本劇和同一時(shí)間段的《白鹿原》做對(duì)比,兩部劇均包含對(duì)時(shí)代環(huán)境和個(gè)體發(fā)展的探討,但在格局、視野以及最終呈現(xiàn)方式上都有較大不同。

點(diǎn)擊其中的關(guān)鍵詞,看到關(guān)于這些關(guān)鍵詞的評(píng)論詳情(語句經(jīng)過分詞和去停用詞)。

總之,豆油們關(guān)于第二季的吐槽很多。

由此,筆者想進(jìn)一步看看豆油們到底還有哪些關(guān)于該劇的槽點(diǎn)。

(4)第二季的典型意見挖掘?qū)Ρ确治?/strong>

將經(jīng)預(yù)處理得到的5000條典型評(píng)論進(jìn)行文本聚類,每一個(gè)文本聚類“簇群”都會(huì)有一個(gè)中心語句,也就是該“簇群”的典型意見,所以這種文本處理也叫做“典型意見挖掘”,用來從海量的文本里發(fā)掘主要的觀點(diǎn)或意見。

經(jīng)筆者處理,5000條評(píng)論被劃分為300多個(gè)成分占比不一的“話題簇群”,筆者僅選取其中占比TOP10的典型意見進(jìn)行展示。

從上表可以看出,豆油們關(guān)于本劇的典型意見多為負(fù)面,集中在以下幾個(gè)方面:

  • 比第一部差,主要詬病的地方在于本劇的劇情、編劇和演員演技,以及硬生生的人物專屬插曲/配樂亂入
  • 三觀不正,被吐槽為“高配版小時(shí)代”,倡導(dǎo)“紙醉金迷”的富人價(jià)值觀
  • 對(duì)本劇中的個(gè)別角色及其主演的喜好,如邱瑩瑩和趙啟平及其扮演者

除此之外,本劇廣告植入太多也是很多豆油吐槽的地方,本劇為了配合植入廣告,角色人物的吃穿用度多處設(shè)定明顯違和,甚至有豆油表示“《歡樂頌1》是在劇情里插播恰到好處的廣告,而《歡樂頌2》是在硬生生的廣告里插播劇情……”

(5)“五美”人物點(diǎn)評(píng)詞云

綜合豆油們關(guān)于《歡樂頌》第一季和第二季關(guān)于劇中“五美”的評(píng)論,筆者制作出安迪、曲筱綃、樊勝美、關(guān)雎爾和邱瑩瑩的個(gè)性化評(píng)論關(guān)鍵詞詞云。

不消筆者多說,小伙伴們就能看出這些人物關(guān)鍵詞詞云,主要反映了豆油們對(duì)于“五美”的人物印象及其主要的關(guān)聯(lián)人物。對(duì)于這五個(gè)人的性格特征,由上述關(guān)鍵詞詞云可以總結(jié)為:

  • 外冷內(nèi)熱、氣場強(qiáng)大的冰山御姐——安迪
  • 古靈精怪、魅力超群的小妖精——曲筱綃
  • 虛榮拜金、獨(dú)立自強(qiáng)的驕傲女王——樊勝美
  • 文靜內(nèi)斂、一團(tuán)和氣的優(yōu)質(zhì)女孩——關(guān)雎爾
  • 單純可愛、精力充沛的元?dú)馍倥瘳摤?/li>

2.2 《歡樂頌》一、二季的小說文本分析

(1)一、二季的小說文本關(guān)鍵詞對(duì)比

此處,對(duì)于小說文本的關(guān)鍵詞提取,筆者沒采取一般文本分析時(shí)所采用的詞頻統(tǒng)計(jì),而采用的是TF-IDF(term frequency–inverse document frequency)關(guān)鍵詞統(tǒng)計(jì)方法,從而更有效的提取文本中的關(guān)鍵信息。詳情可以參閱《以<大秦帝國之崛起>為例,來談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。

以下是《歡樂頌》一二季原著小說的關(guān)鍵詞TOP20。

可以看出,一二季小說文本的關(guān)鍵詞絕大部分是其中的主要人物,而主要人物的總體順序(對(duì)于小說而言是人物的重要性)變動(dòng)不大,個(gè)別人物出現(xiàn)重要性的“位移”:

  • 安迪、曲筱綃和樊勝美是一二季中妥妥的一號(hào)、二號(hào)和三號(hào)女主人公;
  • 包奕凡在第二季的重要性有所提升,而魏渭的重要性則呈現(xiàn)下降的趨勢;
  • 電視劇第二季中出現(xiàn)的謝濱(也就是電視劇中的音樂達(dá)人謝童)、舒展和陳家康也出現(xiàn)在小說二三季的關(guān)鍵詞TOP20中,不過排名較為靠后。

這也說明,小說和劇本在人設(shè)上保持有連貫性,沒有明顯大的變動(dòng)。

(2)一、二季劇中人物社交網(wǎng)絡(luò)分析

通過設(shè)置人物詞典,筆者從中提取出《歡樂頌》一二季對(duì)應(yīng)小說文本的人物社交關(guān)系圖譜,用來發(fā)現(xiàn)2部電視劇中人物關(guān)系的特征。

在人物社交網(wǎng)絡(luò)中,每個(gè)節(jié)點(diǎn)代表一個(gè)人物,線條代表人物之間的關(guān)系,線條顏色的人物節(jié)點(diǎn)代表他們之間有著較為頻繁的交往(或友或敵)。節(jié)點(diǎn)及其代表人物字體的大小表征的是“Betweenness Centrality (中介性核心性)”,該詞學(xué)術(shù)的說法是“兩個(gè)非鄰接的成員間的相互作用依賴于網(wǎng)絡(luò)中的其他成員,特別是位于兩成員之間路徑上的那些成員,他們對(duì)這兩個(gè)非鄰接成員的相互作用具有某種控制和制約作用“,說人話就是—字體大的人物具有更大的人際關(guān)系影響,能接觸和影響的人物較多,而在小說中出現(xiàn)次數(shù)多的未必就是這類人物,這里的存在感需要以人脈和人際影響力作為基石。詳情可參看《以<大秦帝國之崛起>為例,來談大數(shù)據(jù)輿情分析和文本挖掘》的第三部分。

從上圖可以看出,第一季中的安迪和幾個(gè)主要人物都有很強(qiáng)的人際聯(lián)系,他們之間的連線較粗,而譚宗明、曲筱綃、樊勝美等人的人脈資源豐富,或者是他們?nèi)穗H交往/應(yīng)酬較多。

在第二季的人物社交網(wǎng)絡(luò)中,則呈現(xiàn)出“去中心化”的趨勢,除了成為愛人的包奕凡外,第一主角安迪與其他人的交往沒之前那么密切了。按照劇情發(fā)展,他們之間迎來了情感的新可能,卻也面臨來自身世及包家內(nèi)部帶來的新困擾,加之后媽魏太太的不斷責(zé)難,這樣也不久難理解安迪和其他人的交往較第一季要少了,自身麻煩不斷,所以無暇顧及。

當(dāng)然,第二季的人物情感脈絡(luò)也很清晰了,即使有攪局者的出現(xiàn)(魏渭、舒展、陳家康等),固定的CP組合也沒有出現(xiàn)變化,如安迪-包奕凡、邱瑩瑩-應(yīng)勤,曲筱綃-趙啟平,樊勝美-王柏川,以及關(guān)雎爾-謝濱(謝童)。

(3)小說文本的人物關(guān)聯(lián)詞分析

在最后,筆者把《歡樂頌》小說1、2、3季合并,經(jīng)過文本預(yù)處理后,再進(jìn)行小說文本的詞向量訓(xùn)練,將這些詞匯映射到向量空間,變成一個(gè)個(gè)詞向量(Word Vector),以使這些詞匯在便于被計(jì)算機(jī)識(shí)別和分析的同時(shí),還具有語義上的相關(guān)性,而不僅僅是基于詞匯之間的共現(xiàn)關(guān)系。

由于篇幅原因,筆者僅涉及跟“五美”相關(guān)的關(guān)聯(lián)詞分析,各呈現(xiàn)TOP10的關(guān)聯(lián)詞,由此發(fā)現(xiàn)跟主設(shè)人物相關(guān)的詞匯,發(fā)掘人物深層次的特點(diǎn)。

從上面“五美”的TOP10關(guān)聯(lián)詞可以得到兩類關(guān)聯(lián)詞:

第一類詞是跟主設(shè)關(guān)系密切的人物,如魏渭、包奕凡之于安迪,趙啟平、劉歆華之于曲筱綃等,這些都符合大家對(duì)于電視劇的認(rèn)知。

另一類是反映人物行為的詞匯。如安迪和曲筱綃,二人常用的通信工具都有電話,其他三人只用手機(jī)進(jìn)行通訊。而電話一般指固定電話,設(shè)在辦公室,較為正式,領(lǐng)導(dǎo)或是管理層用的比較多;而手機(jī)具有便攜性,無論室內(nèi)和外出都用的多。

安迪、曲筱綃和樊勝美的關(guān)聯(lián)詞里有涉及“昨晚”,再對(duì)照小說原本,三人都有很多晚上交際應(yīng)酬的場景。

此外,在樊勝美、關(guān)雎爾和邱瑩瑩的關(guān)聯(lián)詞里,都出現(xiàn)了“連忙”一詞,有“立即”、“馬上”的意思,也就是經(jīng)常會(huì)出現(xiàn)倉促、手忙腳亂的情形。

字字珠璣間,折射出“五美”所處的社會(huì)階層和自身心態(tài)。

結(jié)語

雖然分析下來,《歡樂頌2》在劇情和各種細(xì)節(jié)上多有瑕疵,加之違和感很強(qiáng)的硬廣植入,所以它的口碑遠(yuǎn)不及第一季。然而,《歡樂頌2》還是較好的繼承了第一季典型的人物設(shè)定,很多觀眾能夠通過“五美”看到自己或者身邊人的影子,雖是小說,但也緊密觀照當(dāng)下現(xiàn)實(shí),擁有一種天然的熟悉感和代入感,更能引發(fā)劇集和觀眾之間的情感共鳴,甚至還被許多都市白領(lǐng)奉為生存指南和戀愛擇偶教科書。

或許,像很多毀譽(yù)參半的影視劇那樣,關(guān)于它們的評(píng)判本來就是模棱兩可的,不能立即蓋棺定論:

譽(yù)滿天下,未必不為爛片;謗滿天下,未必不為佳劇~

那么,看完本文或本劇的小伙伴,你覺得呢?

ps:筆者寫完這篇文章的時(shí)候,第二季還一集沒看哦,有對(duì)劇情誤讀的地方還請(qǐng)資深劇迷見諒哦,哈哈哈。

參考資料及工具:

  1. 新浪微輿情:“全網(wǎng)事件分析”、“信息監(jiān)測”及“微博傳播效果分析”模塊(數(shù)據(jù)采集、數(shù)據(jù)分析和數(shù)據(jù)可視化呈現(xiàn))
  2. 微指數(shù)、微博數(shù)據(jù)中心冰鑒用戶洞察平臺(tái)(人物畫像)
  3. 《歡樂頌》1、2、3季的小說原著(文本數(shù)據(jù))
  4. 《歡樂頌1》和《歡樂頌2》的豆瓣影評(píng)(評(píng)分?jǐn)?shù)據(jù)和文本數(shù)據(jù))
  5. Python,jieba分詞、snownlp、gensim、tagul(文本分詞、情感分析、詞向量和詞云制作)

#專欄作家#

蘇格蘭折耳喵,微信公眾號(hào):運(yùn)營喵是怎樣煉成的,人人都是產(chǎn)品經(jīng)理專欄作家。數(shù)據(jù)分析愛好者,擅長數(shù)據(jù)分析和可視化表達(dá),喜歡研究各種跟數(shù)據(jù)相關(guān)的東東。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 感謝大神分享!想要請(qǐng)問一下對(duì)文中提到的江蘇討論熱度居首位的原因怎么看呀?

    來自寧夏 回復(fù)
  2. 可以隨意用新浪微輿情的人好幸福

    來自廣東 回復(fù)
  3. 真的好棒!

    來自浙江 回復(fù)
  4. 為什么文章點(diǎn)進(jìn)去,過幾秒就沒了啊

    回復(fù)
    1. 哪個(gè)文章???

      回復(fù)
  5. 好厲害,產(chǎn)品新人一枚,以后跟著你學(xué)習(xí) ??

    來自廣東 回復(fù)
    1. 哈哈,共勉 ??

      來自上海 回復(fù)
  6. 太厲害了。可是找不到微博數(shù)據(jù)中心冰鑒用戶洞察平臺(tái)。。。

    來自北京 回復(fù)
    1. 內(nèi)部數(shù)據(jù),目前不對(duì)外的

      來自上海 回復(fù)
  7. 前輩,要做數(shù)據(jù)分析,從零開始該怎么做?

    來自北京 回復(fù)
    1. 培養(yǎng)興趣和愛好,了解你想做數(shù)據(jù)分析的場景,以問題驅(qū)動(dòng)學(xué)習(xí)~

      來自上海 回復(fù)
  8. 簡直666

    來自上海 回復(fù)
  9. 剛想發(fā)言,又一想還是算了逼格太低。

    回復(fù)
    1. 說吧,說吧??????

      回復(fù)
  10. 還有一點(diǎn)穩(wěn)重提到受眾多半是本科以上,原因應(yīng)該是大學(xué)生空閑時(shí)間比較多,??苹蛘咂渌泄潭ǖ纳盍?xí)慣。
    、

    來自陜西 回復(fù)
    1. 嗯,還有四線城市關(guān)注人群占據(jù)主流,原因在于他們時(shí)間多,不像一線城市的小年輕這么忙碌

      回復(fù)
  11. 文章很棒,學(xué)習(xí)了。大佬 ?? ??

    來自陜西 回復(fù)
  12. 請(qǐng)問用什么軟件做的文本分析呢?

    來自北京 回復(fù)
    1. Python,文章末尾有寫的,你再仔細(xì)看看 ??

      來自上海 回復(fù)
    2. 啊不好意思,沒注意 ?? 趕快去研究下 哈哈

      來自北京 回復(fù)
  13. 不明覺厲

    來自北京 回復(fù)
  14. 目測樓主屬于年薪不下40w的,如果我說的不對(duì),請(qǐng)憑你的這篇文章找一個(gè)吧!超級(jí)贊! ??

    來自北京 回復(fù)
    1. 恭喜你~你還真說錯(cuò)了,目前窮人一枚,沒有這么多。。。

      來自上海 回復(fù)
    2. 哈哈,樓主謙虛!能加個(gè)維信好友嗎,我現(xiàn)在搜狗做產(chǎn)品,交流下,算是半個(gè)同行~

      來自北京 回復(fù)
    3. g18818233178,一起切磋

      來自上海 回復(fù)
  15. 牛人,馬住,仔細(xì)學(xué)習(xí)~

    來自浙江 回復(fù)
  16. 很牛的分析文章。

    回復(fù)
    1. ??

      回復(fù)
  17. 厲害??

    回復(fù)
  18. 說實(shí)話微信新加的看一看功能內(nèi)容離優(yōu)質(zhì)二字還有很長的距離

    來自廣東 回復(fù)
    1. 是的,但某些干貨文章還是可以期待一下的

      回復(fù)
  19. 看不懂,不過先get一下,學(xué)習(xí)一下數(shù)據(jù)分析的思維

    來自江蘇 回復(fù)
    1. 嗯,隔行不隔理

      回復(fù)
  20. 只能說太厲害了,馬住好文! :mrgreen:

    來自廣東 回復(fù)
    1. ??

      來自上海 回復(fù)
  21. 請(qǐng)問作者在哪找到那么多有標(biāo)注的情感標(biāo)簽

    回復(fù)
    1. 豆瓣上爬取的,采用眾包形式的人工標(biāo)注

      回復(fù)
  22. 數(shù)據(jù)分析的典范之作??!

    來自福建 回復(fù)
    1. 閑來寫寫,謝謝夸贊~??

      回復(fù)
  23. 一集沒看。表示滋瓷

    來自廣東 回復(fù)
    1. ??

      來自上海 回復(fù)
  24. 樓主厲害,一集沒看都感謝,佩服佩服

    來自北京 回復(fù)
    1. ??

      來自上海 回復(fù)
  25. 一線城市的年輕人上班都忙死了,哪里有這么多時(shí)間追劇…….

    來自浙江 回復(fù)
    1. 我就是”一線城市忙死了”的其中之一,一集沒看,雖然抽空寫了這篇文章。。。

      來自上海 回復(fù)
    2. 同感,想著攢到周末和假期看,但依然沒時(shí)間。。。

      來自上海 回復(fù)
  26. 你寫這篇文章,真心下了蠻多功夫??! 寫了多久???

    來自湖南 回復(fù)
    1. 梳理思路,收集數(shù)據(jù),可視化和成文,一周吧

      來自上海 回復(fù)
    2. 數(shù)據(jù)分析,你果然是專家! 能否推薦一本數(shù)據(jù)分析入門的書啊?

      來自湖南 回復(fù)
    3. 我會(huì)的這些都不是書上學(xué)來的,野路子,多看博客多思考吧

      來自上海 回復(fù)