張學(xué)友是“逃犯克星”?貝葉斯公式告訴你真相

5 評論 9092 瀏覽 27 收藏 12 分鐘

每個演唱會抓到逃犯的比例是比較接近的,張學(xué)友的演唱會有何不同呢?為何張學(xué)友成為了“逃犯克星”呢?一起來了解一下貝葉斯公式,讓它來告訴你真相。

01

為什么張學(xué)友的每場演唱會都有逃犯落網(wǎng)?

先看看“學(xué)友·經(jīng)典世界巡回演唱會”的“顯赫戰(zhàn)功”:

  • 4月7日南昌站首個逃犯在現(xiàn)場落網(wǎng)。
  • 5月5日贛州演唱會開場安檢的過程中,警方通過人臉識別技術(shù),成功抓獲一名網(wǎng)上逃犯。
  • 5月20日嘉興演唱會安檢時,發(fā)現(xiàn)逃犯一名,隨后被警方逮捕。
  • 6月9日金華演唱會,兩名逃犯落網(wǎng)。
  • 7月6日呼和浩特,警方抓獲冒雨前來觀看演唱會的全國在逃人員王某某。
  • 7月8日洛陽演唱會,早在5月份就期待滿滿的洛陽警方成功拿下“七殺”。
  • 9月21日遂寧演唱會,第一場就抓到了10余名違法犯罪人員。
  • 9月28日石家莊演唱會,現(xiàn)場三名逃犯落網(wǎng)。
  • 9月30日咸陽警方成功抓獲5名逃犯。

幾乎每場演唱會都會有逃犯落網(wǎng),“歌神”張學(xué)友怎樣看待自己“逃犯克星”的稱號呢?

連續(xù)九場,場場有逃犯被抓,真實的原因到底是什么呢?

02

先讓我們跳開,來看一個影院中的貝葉斯推理。

(下面案例的英文出處:Brandon Rohrer)

你前往影院排隊觀影,前面有個小伙伴,長發(fā)披肩,衣著中性,如:上圖,請問Ta是女士的概率有多大?

情況A:

我在《生命、宇宙以及任何事情的終極答案》中介紹過類似的計算方法。

如上圖,是一種視覺化的貝葉斯計算法,在《統(tǒng)計學(xué)關(guān)我什么事》一書中有詳細(xì)解釋。

請注意上面綠色和黃色兩個長方形:

  1. “面積”的概念在貝葉斯概率的計算中,起著重要的作用。
  2. 事件的可能性,由綠色和黃色兩種構(gòu)成。二者各自的概率,體現(xiàn)為長方形的寬度。例如上圖中,是假設(shè)男女比例是1:1。
  3. 長方形的高度,是指“可能世界”的可能構(gòu)成。例如上圖,綠色長方形指女性的可能世界,進而該可能世界,是由“一半長發(fā)+一半短發(fā)”的假設(shè)比例構(gòu)成。

了解了面積法,開始計算,步驟如下:

  • 第一步:首先假定影院中男女各占一半,100個人中,50個男人,50個女人。貝葉斯計算的特點,就是可以主觀預(yù)測,毛估估一下。
  • 第二步:假設(shè)女人中,一半為長發(fā),余下的25人為短發(fā)。而男人中,48位為短發(fā),兩位為長發(fā)。這同樣是基于常識和主觀預(yù)測的毛估估。
  • 第三步:由此可以計算,有25個長發(fā)女人和2位長發(fā)男人。
  • 第四步:所以,Ta是女士的可能性為“25/(25+2)=92.6%”。

情況B:

現(xiàn)在讓我們增加一個新的信息,你現(xiàn)在排隊是在準(zhǔn)備進入男士休息室。依靠這個額外的信息,僅采用常識和背景知識即可完成判斷Ta更可能是男性,無需思考。但是,貝葉斯推理則能以數(shù)學(xué)實現(xiàn)形式,做出更加精確的預(yù)測。

其意義在于,在某些你無法很簡單靠常識和直覺來做出量化判斷的時候,你就需要精確的算法了。

所以讓我們繼續(xù)用貝葉斯來計算如下:

如上圖,還是采用面積計算法我們開始推理:

  • 第一步:100個人在男士休息室外排隊,我們主觀猜測毛估估一下,其中98名為男士,有2位陪同的女士。如上圖中的綠色長方形,因為女性極少,所以該長方形很“瘦”。
  • 第二步:假設(shè)女人中,一半為長發(fā),一半為短發(fā)。而男人中每50人里有兩位為長發(fā)。和上面的情形一樣,這同樣是基于常識和主觀預(yù)測的毛估估。我們注意到,盡管男性長發(fā)的比例很低,但是由于人群基數(shù)較大,所以下面計算男性長發(fā)人數(shù)的(深黃色那個)長方形很“胖”,有4個之多。
  • 第三步:按照以上的假設(shè),短發(fā)男士有94人,長發(fā)為4人。而兩位女士則一個長發(fā)一個短發(fā)。即,長發(fā)人士里有4男1女。
  • 第四步:Ta是女士的可能性為20%。

這里涉及了兩個個關(guān)于概率的概念:

  1. 先驗概率:是指根據(jù)以往經(jīng)驗和分析得到的概率,它往往作為”由因求果”問題中的”因”出現(xiàn)的概率。例如:上面長頭發(fā)是男是女的案例里,開始根據(jù)常識,假設(shè)人群整體性別比例為1:1。
  2. 后驗概率:是指在得到“結(jié)果”的信息后重新修正的概率,是“執(zhí)果尋因”問題中的”果”。

由于知道了是在男士休息室前的排隊,根據(jù)此信息,將人群男女比例調(diào)整為98:2。

該過程稱為“貝葉斯推理”,貝葉斯推理可以總結(jié)為:通過觀察行動(信息),將先驗概率通過貝葉斯更新,轉(zhuǎn)換為后驗概率。

貝葉斯算法之所以在人工智能時代大放異彩,是因為其具有學(xué)習(xí)功能。貝葉斯推理中,修改過的“各個類別的后驗概率”,已經(jīng)使用了所有的信息。也就是說我們可以將其看作“從信息中學(xué)習(xí)到的結(jié)果”。貝葉斯推理正是具備了“收集信息并自動變聰明”的功能。

03

張學(xué)友演唱會抓逃犯,和貝葉斯計算有什么關(guān)系呢?

最近幾年,攝像頭、人臉識別、聯(lián)網(wǎng)技術(shù)大規(guī)模使用,是導(dǎo)致逃犯被抓的首因。簡單來說,每個演唱會抓到逃犯的比例應(yīng)該是比較接近的。

張學(xué)友的演唱會有何不同呢?

不全面分析如下:

  • 原因1:張學(xué)友的男性歌迷較多,從抓捕照片看,基本為男性逃犯,好像只有一位女性。因為男性人群的基數(shù)更大,所以張學(xué)友演唱會上出現(xiàn)逃犯的概率更大。
  • 原因2:演唱會規(guī)模較大。因為整體人數(shù)基數(shù)越大,男性歌迷人數(shù)更多,有逃犯的可能性越大。
  • 原因3:年齡段分布較廣。
  • 原因4:階層分布較廣。
  • 原因5:演唱會基本都在二三四線城市。

以上原因3、4、5,可能令歌迷與逃犯的人群重合度更高。也就是說,因為年齡分布、階層分布、城市分布的原因,即使是在同樣數(shù)量的男性歌迷中,出現(xiàn)逃犯的概率更大。

概括而言,因為:

  • 更大的人群基數(shù);
  • 更高的男性比例;
  • 更高的逃犯比例。

導(dǎo)致了張學(xué)友演唱會上出現(xiàn)逃犯的數(shù)量較多。

根據(jù)以上5點信息,我們通過貝葉斯推理,會有類似上面“男士休息室”的信息更新。有興趣的話,可以通過“面積法”計算一下。

所以,在張學(xué)友的演唱會上,出現(xiàn)疑犯的“后驗概率”更高。

04

懸念在于,為什么逃犯愿意鋌而走險去看張學(xué)友的演唱會?

上面分析后驗概率,計算的其實是張學(xué)友歌迷中包括逃犯的比例。但是這個比例再高,如果逃犯不來現(xiàn)場,也沒用。

下面我們用決策樹分析法,計算逃犯愿意冒險主動來到現(xiàn)場的可能性。我沒有更多別的演唱會是否有逃犯被抓的數(shù)據(jù),簡單用決策樹分析如下。

在尋常情況下,逃犯決定是否去看演唱會,會進行下圖思考:

所以一般演唱會,逃犯冒險去看的概率為10%。但是,張學(xué)友不是一般人啊,他人品正,沒緋聞,歌唱得蕩氣回腸,容易令英雄豪杰們產(chǎn)生共鳴。作為靈魂型歌手,張學(xué)友令逃犯歌迷更愿意冒險。

逃犯們每天東躲西藏,日子壓抑。又如《肖申克的救贖》里所言,每個罪犯都覺得自己無罪。腦海里浮現(xiàn)出張學(xué)友的歌曲,“有故事的人”不禁感慨萬千,非理性指數(shù)大幅上升。

于是,逃犯冒險去看張學(xué)友演唱會的概率為30%。這樣,逃犯出現(xiàn)在張學(xué)友演唱會上的主動可能性,對比一般演唱會,一下變成了三倍。

加之前面提及的較高的逃犯比例之“后驗概率”,二者相乘,令逃犯出現(xiàn)在張學(xué)友演唱會上的數(shù)量較多。

在技術(shù)手段的幫助下(該類逃犯對科技進步估計不足,也拉低了理性的比例),張學(xué)友的演唱會變成了逃犯放飛自我的舞臺。

“你陪了我多少年,花開花落,一路上起起跌跌?!?/p>

那天晚上,亡命天涯的大哥,在最后的四大天王的歌聲中,勾起了年少往事,飛蛾撲火般慷慨赴約,哪怕最終身陷牢籠。

 

作者:老喻在加,公眾號:孤獨大腦(ID:lonelybrain)

本文由 @老喻在加 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖作者提供

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 看到評論發(fā)現(xiàn)大家前面都看不懂我就放心了

    來自浙江 回復(fù)
  2. 收集信息變聰明的算法,想當(dāng)年在課堂上被貝葉斯折磨的死去活來,現(xiàn)在給你一句話讓我重新認(rèn)識了貝葉斯

    回復(fù)
    1. 1

      回復(fù)
  3. 草,看不懂

    回復(fù)
  4. 看不下去分析,跳過看后面了

    回復(fù)