AI和大數(shù)據(jù)襲來,卻增加創(chuàng)業(yè)者顛覆科技巨頭的難度
隨著人工智能能和大數(shù)據(jù)的熱潮來臨,帶來了更所的科技創(chuàng)新的機遇與前景,但與此同時,也增加了初創(chuàng)者們顛覆大公司的機會……
新的一周,Google公開了一項在AI領域的破紀錄研究成果。該項研究成果揭示了一個重要的信息。傳統(tǒng)上我們認為,日益依賴消費者和社會經(jīng)濟的科技公司特征是創(chuàng)新和反壟斷的——這也是小企業(yè)可以顛覆大公司的機會所在。然而當科技公司之間的競爭依賴于通過大數(shù)據(jù)進行的機器學習之時,小公司顛覆巨頭的道路將會變得更加艱難。
Google周一發(fā)布了他們與Carnegie Mellon大學一項不菲的合作。雙方的圖像識別實驗室在兩個月里整合了50個強大的圖形處理器,并使用了一個前所未有的3億張標記圖像(其他實驗室大部分都只使用百萬量級的圖片標準集合)。這個實驗的目的在于測試是否可以通過給計算機更大量的數(shù)據(jù),而不是通過調(diào)整算法來提高機器對圖片的識別率。
答案是可以。
Google和CMU的研究人員使用規(guī)模龐大的新數(shù)據(jù)集對一套標準的圖像處理系統(tǒng)進行訓練之后,發(fā)現(xiàn)系統(tǒng)在數(shù)項標準測試中得到了新的高分——這些測試目的在于在評估軟件解讀圖片的能力,比如識別照片中的物體。在他們輸入的數(shù)據(jù)量和圖像識別算法的準確性之間有著清晰的關系。這些發(fā)現(xiàn)在某種程度上解答了一個在人工智能學界流傳的問題,即即是否可以從現(xiàn)有的算法中獲得大量的數(shù)據(jù),從而進一步獲得更多的數(shù)據(jù)。
數(shù)據(jù)越多能產(chǎn)生更多的性能。這表明,像谷歌、Facebook或微軟這樣的數(shù)據(jù)豐富的科技巨頭,可能會有更大的好處。
圖像處理系統(tǒng)基于谷歌包含3億張圖片的巨大數(shù)據(jù)集進行學習,這并未產(chǎn)生巨大的好處——從100萬張圖片到3億張圖片,系統(tǒng)識別對象能力的得分僅僅提升了3個百分點——但論文作者表示,他們認為可以通過調(diào)整軟件更好地適應超大型數(shù)據(jù)集來擴大這種優(yōu)勢。
即便事實證明情況并非如此,但在科技行業(yè)當中,很小的優(yōu)勢也可能造成重要影響。比如,就自動駕駛汽車視覺技術(shù)的準確性來說,每一點增益都是至關重要的;而對一款能夠創(chuàng)收數(shù)十億美元的產(chǎn)品而言,小小的效率提升將能產(chǎn)生滾雪球效應。
在科技公司眼中,囤積數(shù)據(jù)已經(jīng)成為一種防御性策略。
谷歌、微軟和其他公司都開放了大量的軟件,甚至是硬件設計,但是對于這些工具的使用卻沒有那么大的自由。科技公司確實發(fā)布了數(shù)據(jù):去年,谷歌發(fā)布了一個龐大的數(shù)據(jù)集,從超過700萬的YouTube視頻中提取出來,而Salesforce則開放了一個從維基百科中提取的數(shù)據(jù),以幫助算法處理語言。
但是,人工智能發(fā)展實驗室的合作伙伴、勞倫斯伯克利國家實驗室的訪問研究員盧克德Oliveira說,(正如你所預料的那樣)這樣的發(fā)布通常不會給潛在的競爭對手提供太多的價值。他說:“這些數(shù)據(jù)從來都不是真正對產(chǎn)品市場地位至關重要的數(shù)據(jù)集?!?/p>
谷歌和CMU的研究人員表示,他們想要他們的最新研究成果,即他們所說的“海量數(shù)據(jù)”的價值,以促進更大的、谷歌規(guī)模的、開放的圖像數(shù)據(jù)集的創(chuàng)建。他們寫道:“我們真誠的希望是,這能激勵愿景社區(qū)不要低估數(shù)據(jù),并在構(gòu)建更大數(shù)據(jù)集的過程中共同努力。”CMU的Abhinav Gupta說,一個選擇是與普通的視覺數(shù)據(jù)基金會合作,這是一個由Facebook和微軟贊助的非營利組織,它已經(jīng)發(fā)布了開放的圖像數(shù)據(jù)集。
與此同時,數(shù)據(jù)量小的公司想要在數(shù)據(jù)競爭中生存下來,他們需要自己的算法變得更聰明和更有創(chuàng)意。Jeremy Achin是初創(chuàng)公司DataRobot的首席執(zhí)行官,他猜測,隨著機器學習變得對越來越多的公司和行業(yè)舉足輕重,一種見于保險行業(yè)的模式可能在更大范圍內(nèi)流行起來,即眾多小保險公司(認真地)把各自數(shù)據(jù)“拼”到一起,以使其風險預測能夠匹敵那些規(guī)模更大的競爭對手。
讓機器學習不再那么渴求數(shù)據(jù),這方面的進步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟學;優(yōu)步去年就收購了一家從事相關研究的公司。但現(xiàn)在,后者仍然有可能試著避開人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢。
Fast.ai是一家致力于讓機器學習變得更容易的公司,其聯(lián)合創(chuàng)始人蕾切爾·托馬斯(RachelThomas)表示,初創(chuàng)公司可以在由互聯(lián)網(wǎng)巨頭把持的領域之外找到應用機器學習技術(shù)的地方,就比如說農(nóng)業(yè)?!拔也淮_信這些巨頭公司一定在所有領域占據(jù)著優(yōu)勢,在很多特定領域中,根本沒有人在收集數(shù)據(jù),”她如是說。即便是人工智能領域的巨頭也有盲點。
#專欄作家#
肥寒,微信公眾號:chanpingdog,人人都是產(chǎn)品經(jīng)理專欄作家。九年產(chǎn)品經(jīng)理。做過數(shù)字閱讀,電商,社區(qū),目前致力于在線教育。
本文翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
原文地址:https://www.wired.com/story/ai-and-enormous-data-could-make-tech-giants-harder-to-topple/
- 目前還沒評論,等你發(fā)揮!