大數(shù)據(jù)時(shí)代下看Amazon是如何處理隱私問題的

0 評(píng)論 16495 瀏覽 0 收藏 15 分鐘

在訪問Amazon電商網(wǎng)站時(shí)總會(huì)看到這樣的提示,對(duì)于互聯(lián)網(wǎng)用戶來說,應(yīng)該已經(jīng)非常熟悉這樣的推薦了吧。Amazon是通過所謂協(xié)同過濾(collaborative filtering)的技術(shù),來實(shí)現(xiàn)這一商品推薦功能的。

協(xié)同過濾是根據(jù)商品的購(gòu)買記錄加上網(wǎng)站訪問記錄等行為數(shù)據(jù),對(duì)用戶間愛好的相似度進(jìn)行自動(dòng)計(jì)算,從而實(shí)現(xiàn)商品推薦的。在這個(gè)過程中,商品本身的內(nèi)容是無(wú)關(guān)的,而只是基于購(gòu)買記錄和行為記錄,從某個(gè)用戶與其他用戶間愛好的相似度來計(jì)算出要推薦的商品,這正是這一機(jī)制的關(guān)鍵所在。因此,系統(tǒng)可能會(huì)推薦出乍看之下和用戶的愛好無(wú)關(guān)的出乎意料的商品,但反過來說,這也可能會(huì)為用戶帶來意想不到的發(fā)現(xiàn)(serendipity)。

所謂serendipity,是指能夠意外帶來好運(yùn)的能力,這個(gè)詞是由英國(guó)小說家霍勒斯·沃波爾(Horace Walpole,1717-1797)于1754年造出來的,其辭源來自童話故事《錫蘭國(guó)三王子》(The Three Princes ofSerendip,Elizabeth Jamison Hodges著)。在Web領(lǐng)域中,指的是用戶通過搜索引擎和推薦系統(tǒng)發(fā)現(xiàn)了出乎意料的商品。

從結(jié)果上來說,用戶將自己的購(gòu)買記錄和行為記錄等信息交給Amazon,同時(shí)得以享受到像Serendipity這樣的好處。

Amazon于2011年9月28日發(fā)布的平板電腦KindleFire中,提供了一項(xiàng)非常有意思的服務(wù)。 該平板電腦采用Android操作系統(tǒng),售價(jià)只有199美元,比iPad要便宜,它上面繼承了Amazon自行開發(fā)的新瀏覽器Amazon Silk。之所以要自行開發(fā)一款瀏覽器,是為了在硬件性能低于PC的移動(dòng)設(shè)備上實(shí)現(xiàn)更快速的網(wǎng)頁(yè)瀏覽。

為了彌補(bǔ)硬件性能的不足,Amazon采取了下列對(duì)策。

(1) 在瀏覽器的后臺(tái)利用Amazon自己的云計(jì)算服務(wù)EC2,事先對(duì)視頻、圖片等數(shù)據(jù)量較大的內(nèi)容進(jìn)行壓縮等處理,將優(yōu)化后的數(shù)據(jù)傳送給終端。這種方式被Amazon稱為Split Browser,通過將負(fù)荷較高的處理轉(zhuǎn)移到云端執(zhí)行,可以比由終端直接執(zhí)行實(shí)現(xiàn)更加快速的內(nèi)容處理,還可以延長(zhǎng)電池的續(xù)航時(shí)間。

(2) 基于內(nèi)容瀏覽記錄,通過機(jī)器學(xué)習(xí)找出用戶的Web瀏覽模式,從而判斷出用戶接下來可能要訪問的頁(yè)面,并事先在云端進(jìn)行緩存。通過這一機(jī)制,頁(yè)面加載的時(shí)間得以大幅縮短。

Amazon開發(fā)的新瀏覽器所采用的上述機(jī)制,充分利用了該公司在云計(jì)算方面的優(yōu)勢(shì),實(shí)現(xiàn)了Web瀏覽的高速化,這一點(diǎn)非常有意思。然而,從另一個(gè)角度來說,也有一些人認(rèn)為這樣做有侵犯用戶隱私之嫌。

也就是說,用戶使用Kindle Fire瀏覽網(wǎng)站時(shí),在真正連接用戶所指定的網(wǎng)頁(yè)之前,首先要連接到Amazon的云計(jì)算服務(wù)。用戶在瀏覽網(wǎng)站期間,與Amazon云服務(wù)之間的連接會(huì)被一直保持,Amazon會(huì)對(duì)用戶在Web上的行為,如訪問的網(wǎng)站URL、IP地址、MAC地址等信息進(jìn)行記錄,并保存最長(zhǎng)30天。

根據(jù)Amazon的解釋,對(duì)于這些數(shù)據(jù)的記錄,是“為了解決和診斷瀏覽器的技術(shù)問題”,用戶數(shù)據(jù)在保存和使用時(shí)不會(huì)與用戶個(gè)人身份產(chǎn)生關(guān)聯(lián)。

此外,用戶還可以在使用云計(jì)算平臺(tái)的Cloud模式和不連接到云端直接訪問網(wǎng)頁(yè)的Off-cloud 模式之間進(jìn)行選擇。不過,如果選擇了Off-cloud模式,用戶便無(wú)法享受到Silk所提供的對(duì)網(wǎng)頁(yè)內(nèi)容傳輸?shù)膬?yōu)化、加速等好處。

對(duì)于由Silk瀏覽器所引發(fā)的隱私問題,美國(guó)國(guó)會(huì)也立即做出了反應(yīng)。在Kindle Fire發(fā)布的約兩周后,眾議院議員、國(guó)會(huì)兩黨隱私權(quán)預(yù)備會(huì)議聯(lián)合主席、民主黨人Edward Markey,向Amazon的CEO 杰夫·貝佐斯提出了公開質(zhì)詢,要求對(duì)Silk的隱私問題做出解釋。

Markey議員提出了下列4個(gè)問題,要求Amazon在3周之內(nèi)做出回答。

(1) Amazon對(duì)Kindle Fire的用戶收集了哪些信息?

(2) Amazon準(zhǔn)備如何利用這些信息?Amazon是否計(jì)劃將這些客戶信息以出售、租賃或其他形式交給其他企業(yè)來進(jìn)行利用?如果有,那么Amazon計(jì)劃對(duì)哪些企業(yè)提供這些信息?

(3) Amazon準(zhǔn)備采用何種方法向KindleFire以及Silk用戶告知公司的隱私權(quán)政策?如果存在相應(yīng)的政策,請(qǐng)?zhí)峁┻m用于Kindle Fire的隱私權(quán)政策條款。

(4) 假設(shè)Amazon準(zhǔn)備對(duì)用戶的互聯(lián)網(wǎng)瀏覽習(xí)慣相關(guān)信息進(jìn)行收集,那么用戶是否可以通過主動(dòng)許可(Opt-in)的方式同意并加入這一數(shù)據(jù)共享計(jì)劃?

對(duì)于Markey議員所提出的大部分問題,Amazon在其公開的“Amazon Silk使用協(xié)議”1(圖表6-1)和FAQ(圖表6-2)中都已經(jīng)涉及到了,因此并未造成很大的混亂。不過,這一質(zhì)詢的確引發(fā)了人們對(duì)于為用戶提供便利所必需的數(shù)據(jù)收集與隱私權(quán)兩者之間關(guān)系的關(guān)注。

Amazon隱私權(quán)問題

1.隱私權(quán)信息 通過Amazon Silk收集的可識(shí)別個(gè)人身份的信息,適用Amazon.com隱私權(quán)公告,該公告內(nèi)容為本協(xié)議的一部分。 Amazon Silk通過利用Amazon云計(jì)算服務(wù)來優(yōu)化和加速網(wǎng)頁(yè)內(nèi)容的傳輸。因此,正如為您提供Web訪問服務(wù)的大多數(shù)互聯(lián)網(wǎng)服務(wù)提供商(ISP)或類似服務(wù)一樣,您使用Amazon Silk所訪問的網(wǎng)頁(yè)內(nèi)容會(huì)經(jīng)過我們的服務(wù)器,并可能被緩存下來以提高后續(xù)頁(yè)面的加載速度。

對(duì)于安全連接(SSL)網(wǎng)頁(yè)的請(qǐng)求,Amazon Silk會(huì)讓您的計(jì)算機(jī)直接連接到原始服務(wù)器,而并不會(huì)經(jīng)過Amazon的服務(wù)器。

Amazon Silk會(huì)暫時(shí)性地記錄其所提供的頁(yè)面的網(wǎng)址(URL)。我們不會(huì)將這些URL與您的身份關(guān)聯(lián)起來,通常也不會(huì)將這些信息保存超過30天。 您也可以選擇讓Amazon Silk工作在基本模式或Off-cloud模式下。Off-cloud模式可以讓您的計(jì)算機(jī)直接訪問目標(biāo)網(wǎng)頁(yè),而不經(jīng)過我們的服務(wù)器。在Off-cloud模式下,Amazon Silk依然能夠提供快速的瀏覽體驗(yàn),但它不會(huì)利用Amazon云計(jì)算服務(wù)來加速網(wǎng)頁(yè)內(nèi)容的傳輸。

如果您在Kindle設(shè)備上使用Amazon Silk,您的設(shè)備可能會(huì)將崩潰報(bào)告發(fā)送給Amazon。這些報(bào)告可能會(huì)包含可識(shí)別身份的信息,如IP地址或MAC地址。我們會(huì)使用這些崩潰報(bào)告對(duì)瀏覽器進(jìn)行故障診斷以改進(jìn)其性能。

您在Amazon Silk的地址欄中所輸入的文字會(huì)被發(fā)送給默認(rèn)的搜索引擎。初始的默認(rèn)搜索引擎是由Amazon Silk設(shè)置的,將來我們可能會(huì)在不事先通知您的情況下修改默認(rèn)搜索引擎設(shè)置。如果您愿意的話,也可以將其他搜索引擎用作默認(rèn)搜索引擎。發(fā)送給所選默認(rèn)搜索引擎的信息,應(yīng)適用該搜索引擎的隱私權(quán)政策。

來源:節(jié)選自http://www.amazon.com/gp/help/customer/display.html?nodeId=200775270中“1.Privacy Information”一節(jié),中文翻譯出自譯者。

Amazon Silk的FAQ(常見問題)

關(guān)于隱私權(quán)

Q. Amazon是否會(huì)跟蹤我的互聯(lián)網(wǎng)瀏覽記錄?

A. Amazon Silk會(huì)臨時(shí)性地記錄您所訪問的URL。記錄的URL信息是作為一個(gè)整體來歸總的,這些URL不會(huì)和您個(gè)人身份產(chǎn)生關(guān)聯(lián)。URL的保存期限最長(zhǎng)為30天。這些歸總的信息,可以幫助Amazon Silk提高網(wǎng)頁(yè)加載速度。

Kindle Fire可能會(huì)向Amazon發(fā)送崩潰報(bào)告。這些報(bào)告中可能會(huì)包含可識(shí)別身份的信息,如IP地址和MAC地址,但這些信息僅用于技術(shù)上的問題診斷,不會(huì)與您的瀏覽記錄產(chǎn)生關(guān)聯(lián)。詳細(xì)信息請(qǐng)參見“Amazon Silk使用協(xié)議”。

Q. Amazon會(huì)收集哪些數(shù)據(jù)?能否簡(jiǎn)要介紹一下,通過收集這些數(shù)據(jù),如何能夠?qū)崿F(xiàn)快速的網(wǎng)頁(yè)瀏覽?

A. 舉個(gè)例子,我們有一個(gè)叫做智能推送(Smart Push)的功能,它會(huì)對(duì)所有用戶的網(wǎng)頁(yè)加載過程(從統(tǒng)計(jì)學(xué)上)進(jìn)行監(jiān)控。例如,通過收集用戶發(fā)送的數(shù)據(jù),我們發(fā)現(xiàn)某個(gè)網(wǎng)頁(yè)中名為logo.png的文件最近被加載了10萬(wàn)次。在這種情況下,Silk的后臺(tái)服務(wù)器會(huì)在遇到對(duì)該網(wǎng)頁(yè)的其他請(qǐng)求時(shí),在網(wǎng)站的HTML文件返回之前,事先將這個(gè)logo圖片推送給客戶端。

為了實(shí)現(xiàn)快速的網(wǎng)頁(yè)瀏覽,我們還有一種稱為預(yù)測(cè)渲染(Predictive Rendering)的優(yōu)化手段。例如,假設(shè)在某個(gè)非常流行的新聞網(wǎng)站上,大多數(shù)訪問者接下來都會(huì)點(diǎn)擊“商業(yè)”這個(gè)鏈接。在這種情況下,可以在主頁(yè)加載完畢之后,事先將一些靜態(tài)網(wǎng)頁(yè)元素(JavaScript、CSS、圖片等)推送給客戶端。如果訪問該新聞網(wǎng)站的用戶,接下來真的點(diǎn)擊了“商業(yè)”鏈接,我們自然會(huì)收到來自客戶端的HTML頁(yè)面請(qǐng)求,但其實(shí)大多數(shù)靜態(tài)的可緩存元素,在這個(gè)時(shí)候已經(jīng)存在于用戶的Kindle Fire上,并可以立即顯示出來。

Q. 這是不是意味著Amazon會(huì)在云端服務(wù)器上緩存我所瀏覽的內(nèi)容?

A. 正如提供Web訪問服務(wù)的ISP或其他類似服務(wù)一樣,在Cloud模式下,使用Amazon Silk所瀏覽的網(wǎng)頁(yè)內(nèi)容,會(huì)經(jīng)過我們的服務(wù)器。這些信息中的一部分會(huì)被緩存下來,目的是為了改善后續(xù)網(wǎng)頁(yè)的加載性能,幫助Silk提升網(wǎng)頁(yè)瀏覽速度。網(wǎng)站擁有者可使用緩存報(bào)頭來指定哪些內(nèi)容可以被緩存。Silk通過追蹤這些報(bào)頭,僅對(duì)網(wǎng)站擁有者認(rèn)為合適的信息進(jìn)行緩存。

Q. Amazon會(huì)將歸總的瀏覽數(shù)據(jù)出售給第三方嗎?

A. 不會(huì)??蛻粜畔⑹俏覀儤I(yè)務(wù)非常重要的一部分,也是對(duì)客戶體驗(yàn)與未來創(chuàng)新的重要推動(dòng)力。我們不會(huì)向他人出售這些信息,將來也沒有計(jì)劃要出售這些信息。

Q. 如果我不希望我的互聯(lián)網(wǎng)請(qǐng)求經(jīng)過Amazon的云服務(wù)器,應(yīng)該如何做?如何才能關(guān)閉利用云服務(wù)的瀏覽加速功能?

A. 我們提供了用于關(guān)閉云加速功能的選項(xiàng),在Amazon Silk的設(shè)置菜單中,取消“加速頁(yè)面載入”選項(xiàng)即可。在Off-cloud模式下,網(wǎng)頁(yè)不會(huì)經(jīng)過Amazon的云服務(wù)器,而是直接傳送到用戶的終端上,用戶可以無(wú)負(fù)擔(dān)地進(jìn)行瀏覽。在設(shè)置畫面重新啟用這個(gè)選項(xiàng),就可以隨時(shí)重新開啟云加速瀏覽功能。

Q. 對(duì)于安全https連接是如何處理的?

A. 在AmazonSilk中,SSL請(qǐng)求不會(huì)經(jīng)過Amazon云服務(wù)器,而是由Kindle Fire直接向原始服務(wù)器發(fā)送網(wǎng)頁(yè)請(qǐng)求。

Q. Silk中有其他擴(kuò)展安全功能嗎?

A. 在使用Cloud模式時(shí),可以選擇對(duì)Kindle Fire與Silk的加速服務(wù)器之間的所有Web通訊進(jìn)行SSL加密。 要使用這個(gè)功能,可以觸摸設(shè)置菜單中的“加密選項(xiàng)”復(fù)選框。請(qǐng)注意,使用SSL可能會(huì)降低頁(yè)面的加載速度。

還需要注意的是,只有經(jīng)過Silk加速服務(wù)器的Web通訊才能享受這一功能所帶來的加密保護(hù),而其他的情況下,例如關(guān)閉云加速功能時(shí),Silk便無(wú)法提供加密功能。此外,即便開啟了云加速功能,某些情況下如果不經(jīng)過Silk服務(wù)器的加載效率更高,Silk會(huì)自動(dòng)更改路由,直接向網(wǎng)站發(fā)送請(qǐng)求。在這樣的情況下,加密功能也不起作用。

本文截選自《大數(shù)據(jù)的沖擊》

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!