follow人,還是follow內(nèi)容
天下大勢(shì),合久必分,分久必合。自從有了網(wǎng)站,數(shù)字信息就開始多了起來,直到我們擁有搜索引擎之前,這些信息都沒有被很好地組織。自從有了feed流這個(gè)概念,信息突然又瞬間地膨脹了起來,在我們找到一個(gè)合適的工具之前,這些信息都沒法被很好地推送到合適的人面前。一直以來,人們從沒停止過要把各種如毛細(xì)血管般的流信息整合到一起。特別是一些已經(jīng)遠(yuǎn)在墻外的優(yōu)秀網(wǎng)站,做出了很多很好的解決方案,facebook之類的SNS網(wǎng)站試圖通過現(xiàn)實(shí)朋友的關(guān)系來組織feed流,無所不包的friendfeed企圖把所有的feed信息都?xì)w于一處(國(guó)內(nèi)類似的有今年張教主寫的kanrss),這兩年成為新貴的twitter則使得流信息的產(chǎn)生更容易,接收更便捷,follow即所得。
上述對(duì)信息的解決方案都是通過follow人來實(shí)現(xiàn),而follow內(nèi)容無疑是另一條可行的路徑。關(guān)于內(nèi)容的分類組織已經(jīng)有很多年的研究與實(shí)踐,在鄭昀的這篇關(guān)于Topic Engine的博客中有很詳細(xì)的綜述,而對(duì)這些分類內(nèi)容的follow,以得到一個(gè)類別的信息更新,就我所知,還并不多見。比較知名的如google資訊與google快訊,前者屬于對(duì)內(nèi)容的分類組織,后者則屬于對(duì)分類內(nèi)容的訂閱或者說follow。依托于google強(qiáng)大的搜索能力,信息的新穎性及廣闊性很有保證,但由于產(chǎn)品的定位并非要作一個(gè)詳細(xì)的內(nèi)容分類,所以分類比較粗糙,只是一些如門戶網(wǎng)站般的粗分類別而已。
最近上線的cutt.com則希望把這種分類信息推送做到極致,這是一家號(hào)稱以語義網(wǎng)技術(shù)作為其底層分析引擎的公司。它的上線,首先要感謝國(guó)家,否則也許我們能早幾個(gè)月看見它。因?yàn)楣任臈澋慕榻B,我得以在早期就對(duì)這個(gè)有著很大野心但目前還不甚成熟的信息組織引擎有一定的使用體驗(yàn)。這是一個(gè)很有想法的新生兒,但現(xiàn)在有些地方也還不太成熟。
產(chǎn)品與交互方面:
一個(gè)由工程師主導(dǎo)的公司容易做出讓人拍案叫絕的創(chuàng)意產(chǎn)品,卻也容易暴露一些產(chǎn)品設(shè)計(jì)與交互上的毛病,這也許是因?yàn)槁斆鞯墓こ處焸兛偸呛茈y讓自己處身在大多數(shù)不知情用戶的處境里。
cutt很好的一點(diǎn)是用戶使用零成本,任何一個(gè)用戶打開即可用,無需要注冊(cè),也無需進(jìn)行任何信息填寫。我在匿名狀態(tài)下就能進(jìn)行大部分的操作,沒有注冊(cè)沒有登錄情況下收藏的文章居然還能保存,很激動(dòng)人心吧!但是可怕的事情來了,一旦我登錄上去,會(huì)發(fā)現(xiàn)我之前以為已經(jīng)記錄下來的所有數(shù)據(jù)都不見了。好吧,我也許原以為它會(huì)自動(dòng)地把匿名信息自動(dòng)導(dǎo)入到我的帳號(hào)中。但后來想想,如果它這樣做了,我肯定會(huì)更恐懼的。其實(shí)我的意思是:我沒有得到任何提示的情況下,我不知道我剛剛還在的數(shù)據(jù)到哪去了。對(duì)于普通用戶,可能還有一個(gè)困擾就是換個(gè)瀏覽器,這些數(shù)據(jù)也沒了,用戶不會(huì)覺得自己有錯(cuò),他們只會(huì)認(rèn)為是你們把他們的數(shù)據(jù)弄丟了。同樣的情況是我寫的文章反饋,寫完后同樣無影無蹤,雖然我知道cutt的數(shù)據(jù)庫(kù)中肯定還有記錄,但大多用戶同樣會(huì)認(rèn)為你把TA的數(shù)據(jù)弄丟了。雖然我不是做產(chǎn)品的,但我覺得這里有一個(gè)原則:用戶貢獻(xiàn)的數(shù)據(jù)TA一定還能找回來,否則后果絕不僅是TA不再愿意貢獻(xiàn)那么簡(jiǎn)單。
另外就是內(nèi)容方面的,由于是一個(gè)新生兒,內(nèi)容頻道還不足夠完善,比如攝影器材方面的內(nèi)容也沒有,因?yàn)槲易罱P(guān)注這個(gè),所以一下就看到了這個(gè),但估計(jì)其它方面的頻道還是有缺失。再比如,我發(fā)現(xiàn)cutt不喜歡娛樂,因?yàn)楹芏鄪蕵钒婷娑歼€是空的:)。以內(nèi)容為主打的網(wǎng)站的其中一個(gè)核心競(jìng)爭(zhēng)力就是信息的更新速度,而cutt的信息更新的速度還有待提高,我晚上十點(diǎn)鐘時(shí)看到的最新文章還是下午五點(diǎn)多的,不知道是受制于爬蟲還是算法的處理速度。另外,展現(xiàn)方式也許還可以改進(jìn),簡(jiǎn)潔是一種方式,但如果僅僅只是以新聞作為主要載體的話,加入一些具有視覺力的元素可能會(huì)更吸引人。
技術(shù)方面:
預(yù)覽:我很喜歡cutt的文章預(yù)覽功能,這樣我就不用點(diǎn)過去等整個(gè)頁面加載了。但我不知道還能不能進(jìn)行進(jìn)一步的過濾,采用文本摘要技術(shù),把主要內(nèi)容以幾句話就傳遞出來。對(duì)于現(xiàn)在快餐型的社會(huì)消費(fèi)習(xí)慣,這無疑是一個(gè)很有競(jìng)爭(zhēng)力的feature。我甚至考慮過由人來對(duì)這些摘要信息進(jìn)行抽取,這也是群體智能的一部分。
來源:據(jù)我的觀察,現(xiàn)在的cutt仍然以網(wǎng)頁這種非結(jié)構(gòu)化信息為主,來源也主要是一些大中型的門戶或資訊網(wǎng)站。實(shí)際上在現(xiàn)在這個(gè)mashup的年代,網(wǎng)絡(luò)上的RSS源很多,如果能充分利用博客及一些web2.0網(wǎng)站輸出的RSS半結(jié)構(gòu)化信息,信息的來源肯定會(huì)更豐富,可分析性肯定更強(qiáng)。當(dāng)然我估計(jì)cutt肯定也有這方面的內(nèi)容,只是還沒有更多的放出來。
google reader:曾經(jīng)我是一個(gè)google reader的重度用戶,幾乎每天必看,也訂閱了大量感興趣或半感興趣的rss源,并煞有其事地把它們歸類為算法、網(wǎng)絡(luò)、科學(xué)、IT資訊、業(yè)余等等頻道。但后來我已經(jīng)越來越少地去看它,任由那1000+的未讀永遠(yuǎn)地停留在左上角。究其原因,是因?yàn)閒ollow的內(nèi)容是死的,而follow的人是活的,是有感情因素在里面的,所以如果一個(gè)人沒有更多的時(shí)間,TA會(huì)更傾向于刷自己的微薄,而非冷冰冰的內(nèi)容。但信息的需求還是有的,所以我現(xiàn)在更多地在消費(fèi)經(jīng)過朋友過濾的信息。如果一個(gè)算法能有更好的過濾能力,我還是很樂意去使用的,特別是個(gè)性化的信息推薦。因?yàn)橛燕復(fù)扑]是給所有人的,而非專屬你自己,而這方面,機(jī)器可以做的更好。
個(gè)性化信息推薦:雖然cutt現(xiàn)在還沒有,但我知道將來肯定會(huì)有,現(xiàn)在只不過是要度過一個(gè)用戶信息的冷啟動(dòng)期,貢獻(xiàn)越多,收獲越多。但信息個(gè)性化是一個(gè)比信息組織難的多的課題,除了考慮內(nèi)容的語義與關(guān)系,現(xiàn)在再加進(jìn)一層比內(nèi)容要復(fù)雜得多的人的因素,解決好這個(gè)問題,任重而道遠(yuǎn)。
思想層面:
最后來點(diǎn)虛的。
集體智能的利用:不單是利用用戶隱式的反饋數(shù)據(jù)加以社會(huì)化的推薦那么簡(jiǎn)單,它更重要地還包括用戶顯式地、自愿地貢獻(xiàn)的內(nèi)容。比如wikipedia的客觀權(quán)威性居然來自于無數(shù)個(gè)網(wǎng)民自發(fā)的編輯行動(dòng),再比如語義網(wǎng)的標(biāo)桿freebase的構(gòu)建也是有賴于大量的志愿者對(duì)它的貢獻(xiàn)。完全依靠用戶的積極性顯然不行,特別是在國(guó)內(nèi)互聯(lián)網(wǎng)環(huán)境中人們往往更樂于索取而非貢獻(xiàn),怎么能讓用戶快快樂樂地貢獻(xiàn)自己的智慧是一個(gè)很難的設(shè)計(jì)問題。從另一個(gè)角度來思考,這個(gè)問題其實(shí)也并非那么地困難,我們簡(jiǎn)單地估計(jì)一下之前紅透半邊天的“開心農(nóng)場(chǎng)”,有多少個(gè)網(wǎng)民在那上面花費(fèi)了多少的時(shí)間,折合成被耗費(fèi)的智慧時(shí)間,這該是多么龐大的一個(gè)數(shù)字!如果,我們?cè)谝粋€(gè)如此盛行的游戲中盛載了一定的智慧任務(wù),而用戶能在玩耍游戲的過程中就能幫助我們解決一個(gè)又一個(gè)的機(jī)器不能解決的智慧難題,這該是多么的激動(dòng)人心??!
事實(shí)上,在過去的日子里,已經(jīng)有人作過這樣的嘗試,像我上述所提及的一類游戲有其名為Game ith a purpose,就是希望能透過游戲的方式,讓人去解決一些人本身看來顯而易見,但目前的機(jī)器學(xué)習(xí)方法仍然無法做好的問題,比如圖片內(nèi)容識(shí)別的問題。到目前為止,關(guān)于這種思想最著名的一個(gè)案例應(yīng)該就是 reCAPTCHA,這個(gè)游戲曾經(jīng)成功地幫助人們解決了印刷物掃描成電子物時(shí)某些內(nèi)容無法識(shí)別的問題。這樣的一種以人作為驅(qū)動(dòng)的計(jì)算思想,國(guó)內(nèi)有人譯之為“人本計(jì)算”。
這個(gè)留待以后再專門論述。
來源:http://www.wentrue.net/blog/?p=995
- 目前還沒評(píng)論,等你發(fā)揮!