人類(lèi)也許高估了20年后發(fā)生的事
到底什么是人工智能?人工智能不能做什么?為什么接下來(lái)20年人工智能不會(huì)有一個(gè)巨大的加速發(fā)展?
三年前, 開(kāi)啟了人工智能時(shí)代,“它能做的事越來(lái)越多,幾乎所有的事都可以做”,這是一種普遍的看法。
但是任何時(shí)候,如果一個(gè)事物當(dāng)所有人都覺(jué)得它能做時(shí),都有兩個(gè)可能性:一是這個(gè)事確實(shí)太厲害了;再一個(gè)可能也發(fā)展到頭了。
因?yàn)樗腥硕伎吹降氖拢t利未必還能繼續(xù)存在。這時(shí)恰是需要一個(gè)冷靜的思考。換個(gè)角度來(lái)看,就是人工智能不能做什么。
一、 回歸問(wèn)題本源:人工智能不能做什么
很多時(shí)候當(dāng)一條路走不通,最簡(jiǎn)單的辦法就是直接回到原點(diǎn),問(wèn)題就清楚了。
人工智能基于計(jì)算機(jī),人工智能的極限取決于計(jì)算機(jī)的極限,計(jì)算機(jī)的極限取決于計(jì)算的極限。
什么能算以及不能算要搞清楚。這種本源問(wèn)題反而是我們很多人忙忙碌碌不會(huì)思考的,而這決定了你做事大方向的對(duì)和錯(cuò)。
1. 圖靈的思考:計(jì)算和機(jī)械運(yùn)動(dòng)的關(guān)系
計(jì)算機(jī)科學(xué)之父是艾倫?麥席森?圖靈,那么,他的老師是誰(shuí)?他的想法又是從哪來(lái)的?有兩個(gè)人對(duì)圖靈在計(jì)算機(jī)發(fā)展上提供最大幫助,我們稱(chēng)之為精神導(dǎo)師。
分別是馮諾伊曼(著名匈牙利裔美籍?dāng)?shù)學(xué)家、計(jì)算機(jī)科學(xué)家、物理學(xué)家和化學(xué)家,曾執(zhí)教于普林斯頓大學(xué))和希爾伯特(二十世紀(jì)上半葉德國(guó)乃至全世界最偉大的數(shù)學(xué)家之一)。
馮諾伊曼當(dāng)時(shí)寫(xiě)了一本書(shū)對(duì)圖靈很有啟發(fā),圖靈給出了一個(gè)很難證實(shí)但是覺(jué)得對(duì)的一個(gè)看法,就是人的意識(shí)。
人的意識(shí)是由不確定性決定的,但是計(jì)算機(jī)和更早期的牛頓力學(xué),以及可預(yù)測(cè)的機(jī)械運(yùn)動(dòng)有關(guān)。
這是圖靈當(dāng)時(shí)朦朧的想法,就是人的意識(shí)是由不確定決定,計(jì)算等價(jià)于機(jī)械運(yùn)動(dòng)。這確定了什么可以計(jì)算,什么不可以計(jì)算,他覺(jué)得邊界劃分就清楚了。
希爾伯特在1900年巴黎數(shù)學(xué)家大會(huì)上提出了23個(gè)最重要的問(wèn)題,就是著名的”希爾伯特23個(gè)問(wèn)題”。其中三問(wèn)是他自問(wèn)的,分別是:
① 數(shù)學(xué)是完備的嗎?
完備是說(shuō)數(shù)學(xué)能夠涵蓋我們?nèi)魏我鉀Q的問(wèn)題嗎?你可以感覺(jué)到不能,數(shù)學(xué)家哥德?tīng)栆苍C明不能。
② 數(shù)學(xué)是一致的嗎?
什么叫一致?
舉例來(lái)說(shuō),今天3+5等于8,明天算下來(lái)3+5還等于8。
但是物理學(xué)是一致的嗎?不是!今天量出來(lái)的尺寸和明天量出來(lái)的是不一樣的。今天燒開(kāi)這一壺水是99.8度,明天可能是100.1度。
物理學(xué)是不一致的,而數(shù)學(xué)是一致的!
③ 數(shù)學(xué)是可驗(yàn)證的嗎?
物理學(xué)可以驗(yàn)證,數(shù)學(xué)可以驗(yàn)證嗎?不知道!
希爾伯特23個(gè)問(wèn)題中第10個(gè)問(wèn)題就是關(guān)于該問(wèn)題,里面講了一個(gè)特例。
有任意多未知數(shù)的方程,各個(gè)未知數(shù)可以變,有各種各樣的結(jié)果,是一個(gè)不確定的方程。
你是否能有無(wú)數(shù)解,或者是否有一種方法在有限時(shí)間內(nèi)可以判定該方程有無(wú)數(shù)解,無(wú)限的時(shí)間判定對(duì)我們?nèi)粘I顩](méi)有意義。
舉例來(lái)說(shuō):
X2+y2=z2有整數(shù)解。
X2+y2=z2是否有整數(shù)解,不知道!直到后來(lái)有英國(guó)數(shù)學(xué)家證明沒(méi)有整數(shù)解,這個(gè)過(guò)程花了幾百年的時(shí)間。
那么,我隨便給你一個(gè)方程有沒(méi)有整數(shù)解?不知道!可能有,也可能沒(méi)有。先不說(shuō)找到整數(shù)解,有沒(méi)有一個(gè)辦法能夠判定這件事有沒(méi)有解,這就是希爾伯特第十問(wèn)題。
直到上世紀(jì)七十年代,前蘇聯(lián)有數(shù)學(xué)家證明說(shuō)不可判定。對(duì)這個(gè)問(wèn)題,沒(méi)有人能夠在有限的步驟內(nèi)知道它到底有解還是沒(méi)解。
你要是連它有沒(méi)有解都不知道,你就一定解不出來(lái)。
數(shù)學(xué)不是萬(wàn)能的,計(jì)算機(jī)就不是萬(wàn)能的,人工智能也不是萬(wàn)能的,這是我們的出發(fā)點(diǎn)。
圖靈當(dāng)時(shí)雖然不知道這個(gè)問(wèn)題的答案,但他的直覺(jué)是應(yīng)該很多數(shù)學(xué)問(wèn)題我們不知道有沒(méi)有答案,于是他就用一個(gè)特殊的機(jī)械裝置把數(shù)學(xué)問(wèn)題一分為二,這個(gè)裝置就是圖靈機(jī)。
(圖靈機(jī))
計(jì)算機(jī)是圖靈機(jī)的一種,更新后的裝置。該裝置能夠在有限時(shí)間內(nèi)判斷哪一類(lèi)問(wèn)題能夠在有限的步驟內(nèi)計(jì)算出來(lái)。
但是還有很多數(shù)學(xué)問(wèn)題通過(guò)這樣的裝置在有限步驟內(nèi)是解決不了的。
在計(jì)算機(jī)科學(xué)和數(shù)學(xué)上有一個(gè)新的概念,叫計(jì)算機(jī)可解決的問(wèn)題,還有大量的是不可以計(jì)算的。
今天的計(jì)算機(jī)甭管多復(fù)雜,從數(shù)學(xué)上就等價(jià)于圖靈機(jī)。甭管深度學(xué)習(xí)還是云計(jì)算,等效于這樣一個(gè)簡(jiǎn)單的機(jī)械裝置。
這個(gè)簡(jiǎn)單玩意兒完不成的事,“太湖之光”超級(jí)計(jì)算機(jī)用上再聰明的算法也完不成,這是從本源上來(lái)講。
2. 透過(guò)世界問(wèn)題看人工智能問(wèn)題
我們把世界的問(wèn)題進(jìn)行劃分,中間有一類(lèi)叫數(shù)學(xué)問(wèn)題。剛才講數(shù)學(xué)不是完備的,有一些問(wèn)題不是數(shù)學(xué)問(wèn)題。
數(shù)學(xué)問(wèn)題中有一些叫做可判定問(wèn)題,我知道它有解或者沒(méi)解,但還不知道解在哪。
例如,你出一道難題問(wèn)你的兒子,兒子做不出來(lái)。問(wèn)題的答案是有的,但是他做不出來(lái),這就是可判定問(wèn)題。
里面有一個(gè)很小的集合是有答案問(wèn)題,你知道有沒(méi)有答案之后才能找到答案。
可判定問(wèn)題是知道有沒(méi)有答案,有一些數(shù)學(xué)問(wèn)題不知道有沒(méi)有答案。
圖靈裝置把有答案問(wèn)題又一分為二,里面很小的一部分叫做可計(jì)算問(wèn)題。
可計(jì)算問(wèn)題對(duì)于圖靈來(lái)說(shuō)是指有限步內(nèi)可以計(jì)算,有限步也可能會(huì)有很長(zhǎng)時(shí)間,到宇宙毀滅了還沒(méi)有算完也叫有限步,只要不是無(wú)限步就是有限步。
(世界問(wèn)題的分類(lèi))
在工程上,如果刷門(mén)禁卡,你識(shí)別一秒鐘把門(mén)打開(kāi)了這是有意義的,算了三天才放你進(jìn)去就沒(méi)有意義,這類(lèi)問(wèn)題叫做工程可解決問(wèn)題。
算三天就是工程上不可解決問(wèn)題。工程上可解決問(wèn)題里面很小一部分是我們今天討論的人工智能問(wèn)題。
我們討論人工智能,首先要清楚它的邊界在哪,清楚邊界才知道什么事需要由人工智能解決。
在講人工智能能干什么以前,我先說(shuō)它不能干什么,我們不要把原本不需要用人工智能解決的問(wèn)題去用人工智能解決。
二、人工智能到底是什么
未來(lái)十年人工智能是什么樣的,20年后發(fā)生什么事很難有人預(yù)測(cè)出來(lái)。人們常常會(huì)高估三五年內(nèi)發(fā)生的事,低估十年后發(fā)生的事。
比如有人覺(jué)得無(wú)人駕駛汽車(chē)會(huì)馬上上路,你是高估了這件事。
1. 未來(lái)10年:整個(gè)城市是一個(gè)大“機(jī)器人”
某漫畫(huà)家畫(huà)了一個(gè)漫畫(huà),世界上所有的東西都連起來(lái)了,花盆都連起來(lái)了?;ㄅ铻槭裁匆B起來(lái)呢?因?yàn)橐獫菜?/p>
前一陣子看到國(guó)家新出用水說(shuō)明,看了農(nóng)業(yè)用水量達(dá)到62%,以后農(nóng)業(yè)要用滴灌(降低用水浪費(fèi))。
新疆只能用滴管,否則全揮發(fā)了。每一株植物都跟互聯(lián)網(wǎng)連起來(lái)了,這是比較大膽的一個(gè)假設(shè),未來(lái)可能就是這樣。
假如這是(上海)徐家匯附近某地區(qū),信息的流動(dòng)全畫(huà)上去就是密密麻麻的樣子,類(lèi)似于地球電磁場(chǎng)。密密麻麻帶來(lái)的好處就是萬(wàn)物互聯(lián)。
萬(wàn)物互聯(lián)之后,馬上就有出現(xiàn)一個(gè)緊迫的問(wèn)題。
坦率來(lái)講,現(xiàn)在的4G恐怕是不夠用的。為什么5G這件事能成?5G來(lái)了之后網(wǎng)速更快。針對(duì)當(dāng)下需求,目前的網(wǎng)速是足夠的。
要上5G只有一個(gè)可能性,就是我突然上網(wǎng)的設(shè)備數(shù)量要增加10倍、100倍才行。
什么時(shí)候增加10倍、100倍?如果一株植物要上網(wǎng)的話,這個(gè)事就大了,所以這是有可能的。
這么密集的網(wǎng)絡(luò)就是說(shuō)數(shù)據(jù)量太大了,人工處理不了,需要借助人工智能,這是很重要的一個(gè)原因。
當(dāng)我們的城市是密密麻麻數(shù)據(jù),現(xiàn)有的單一計(jì)算機(jī),或者說(shuō)一個(gè)公司的數(shù)據(jù)中心很難完成這樣的功能。
我們需要超級(jí)的分布在全市或者全國(guó)的計(jì)算設(shè)施,已經(jīng)不僅僅是計(jì)算機(jī)了,這里面的程序也很復(fù)雜,所以需要智能。
2. 人工智能(機(jī)器智能)的本質(zhì)
那么,什么是人工智能,確切講什么是機(jī)器智能?
人工智能屬于可計(jì)算問(wèn)題,它跟我們?nèi)祟?lèi)的智能是沒(méi)有關(guān)系的。
那么,如何判斷機(jī)器是否有智能的標(biāo)準(zhǔn)呢?因此,能不能做這樣一個(gè)客觀的判斷方法,這就是圖靈測(cè)試。
如果在屏幕背后有一個(gè)智能機(jī)器,另外一個(gè)屏幕背后有一個(gè)人,我問(wèn)一個(gè)問(wèn)題讓他們回答,天為什么是藍(lán)顏色的。
然后讓你們判斷哪個(gè)問(wèn)題是機(jī)器回答的,哪個(gè)問(wèn)題是人回答的。當(dāng)判斷不清楚的時(shí)候,這時(shí)候我就說(shuō)機(jī)器和人有同等的值。
因?yàn)樗堑葍r(jià)基礎(chǔ)上的定義,并不是說(shuō)機(jī)器需要像我們?nèi)诉@樣思考,這是人工智能的本質(zhì)。
3. 人工智能的理解誤區(qū)
提到人工智能,大家有時(shí)候就想到腦科學(xué),是不是把認(rèn)知思維搞清楚了,人工智能就能做的比別人好?不是這樣的。
人工智能是從結(jié)果上判定是否與人一樣好,不是從做事方式上來(lái)判定。
舉個(gè)例子,前兩年慕課公開(kāi)課很流行。美國(guó)一所學(xué)校大量使用計(jì)算機(jī)教學(xué),課上常常有TA,TA有些時(shí)候到課堂上幫助教授答疑。
這所大學(xué)會(huì)評(píng)全校最好的10個(gè)TA,有一年評(píng)了一個(gè)TA,就叫他約翰吧。但是沒(méi)有人知道約翰其實(shí)是一個(gè)機(jī)器人,大家并沒(méi)有見(jiàn)到他,這是十個(gè)最好的TA之一。
TA做的事情是一個(gè)限定問(wèn)題。比如說(shuō)就輔導(dǎo)宏觀經(jīng)濟(jì)學(xué)這一門(mén)課,約翰做的不比人做的差。
也就是說(shuō),宏觀經(jīng)濟(jì)學(xué)這門(mén)課方面,約翰和人具有同樣的智能,但是它未必是像人一樣思考。這是幫助我們理解人工智能的一個(gè)很重要的特點(diǎn)。
三、人工智能的歷史發(fā)展階段
第一階段:傳統(tǒng)人工智能
人工智能是1956年提出來(lái)的。美國(guó)一所私立大學(xué)10個(gè)教授思考機(jī)器智能的問(wèn)題。
這10個(gè)科學(xué)家后來(lái)得了五個(gè)圖靈獎(jiǎng),還有一個(gè)諾貝爾獎(jiǎng)。他們當(dāng)時(shí)就在想怎么讓計(jì)算機(jī)能夠有人的智能,那時(shí)候是人工智能一個(gè)初期階段。
當(dāng)時(shí),大家的思維方式有點(diǎn)像今天中國(guó)說(shuō)的“民間科學(xué)家”,什么意思呢?人類(lèi)認(rèn)識(shí)一個(gè)事物的時(shí)候,一開(kāi)始都是一個(gè)直覺(jué)。
舉例:鳥(niǎo)飛派 vs 空氣動(dòng)力學(xué)派
大家看《全球科技通史》里面會(huì)看到人類(lèi)對(duì)飛行的認(rèn)識(shí),最早的時(shí)候就是模仿鳥(niǎo)飛,后來(lái)才知道要搞出空氣動(dòng)力學(xué)的一套理論。
今天飛機(jī)飛的方式和鳥(niǎo)是完全不同的,但是從效果上來(lái)講比鳥(niǎo)飛得快。人工智能一開(kāi)始也是這樣的,大家一開(kāi)始都讓它模仿人。
舉例:猴子摘香蕉
學(xué)過(guò)人工智能課的人可能知道一個(gè)經(jīng)典問(wèn)題叫猴子摘香蕉。天花板上放一個(gè)香蕉猴子夠不著,房間里面有可移動(dòng)的桌子、椅子。猴子通過(guò)移動(dòng)桌子,把椅子再放上去把香蕉摘了。
人工智能開(kāi)始做這件事時(shí),先讓它有猴子的智能可能不難,但是有人的智能就比較難了。
科學(xué)家們搞了十幾年搞不下去了,其中有一個(gè)人馬文?明斯基開(kāi)始反思這個(gè)問(wèn)題為什么解決不了。他就找到一個(gè)反例告訴大家說(shuō)我們這些人都走錯(cuò)了路。
什么反例子呢?就是兩句英文話:
① The pen was in the box;② The box was in the pen。
在英語(yǔ)里pen三個(gè)英文字母還有另外一個(gè)含義就是小孩兒玩的圍欄,你要把pen理解成圍欄第二句話就解釋通了。
這件事對(duì)人來(lái)說(shuō)不難理解,但是對(duì)計(jì)算機(jī)就非常費(fèi)解,無(wú)法判定這個(gè)時(shí)候pen是鋼筆還是圍欄,為什么呢?原因很簡(jiǎn)單。
第一,我們知道小東西要放在大的東西里,你是怎么知道的?這是常識(shí)。
第二,如何判定鋼筆有多大?我一說(shuō)鋼筆你們馬上就能想到多大,你不會(huì)想到汽車(chē)這么大。
計(jì)算機(jī)怎么知道鋼筆多大?即使讓它像人類(lèi)似的那樣分析語(yǔ)法,分析語(yǔ)義等等也得不到這種知識(shí)。
今天發(fā)現(xiàn)計(jì)算機(jī)能夠做一些特別難的事情,例如下圍棋等等做的比人好多了。
Google其實(shí)后來(lái)不再開(kāi)發(fā)AlphaGo了,覺(jué)得已經(jīng)跟人類(lèi)差距太大了。相當(dāng)于一個(gè)專(zhuān)業(yè)選手跟業(yè)余選手下圍棋,你沒(méi)有辦法下圍棋了。
但是你讓今天最好的機(jī)器人上街打一瓶醬油,你們家3歲孩子都可以干這件事,它卻干不了。人工智能開(kāi)始的定義是有特定范圍,不能拿最不擅長(zhǎng)的比人擅長(zhǎng)的。
比如,一個(gè)很簡(jiǎn)單的人類(lèi)常識(shí),計(jì)算機(jī)是做不到的。
再舉個(gè)例子,大家覺(jué)得今天的大江無(wú)人機(jī)很厲害,但是你讓無(wú)人機(jī)像蒼蠅一樣飛就飛不了。
蒼蠅大概有10萬(wàn)個(gè)神經(jīng)元,但是無(wú)人機(jī)不到能干這么多事。這是人工智能的缺陷。
這就是我為什么在開(kāi)始的時(shí)候講計(jì)算機(jī)的邊界。你讓計(jì)算機(jī)去模擬一只蒼蠅很困難,說(shuō)明你走模擬這條路走錯(cuò)路了,我們要找一條別的路。
第二階段:數(shù)據(jù)驅(qū)動(dòng)
那么人工智能開(kāi)始進(jìn)入第二階段,即以數(shù)據(jù)驅(qū)動(dòng)的人工智能解決方案,提出者是萊德里克.賈里尼克。
1972年,賈里尼克到IBM 華生實(shí)驗(yàn)室做學(xué)術(shù)休假,無(wú)意中接觸了語(yǔ)音識(shí)別實(shí)驗(yàn)室,兩年后他選擇了留在IBM。
在那里,賈里尼克組建了陣容空前絕后強(qiáng)大的研究隊(duì)伍。IBM從六十年代開(kāi)始做一些語(yǔ)言識(shí)別,但是都不成功,到七十年代讓賈里尼克負(fù)責(zé)語(yǔ)言識(shí)別等課題研究。
因?yàn)橘Z里尼克是一個(gè)通信專(zhuān)家,所以他不把語(yǔ)音識(shí)別問(wèn)題當(dāng)做人工智能問(wèn)題,而是當(dāng)成通信問(wèn)題。
其實(shí)又把語(yǔ)音識(shí)別問(wèn)題拉回到原點(diǎn),看看通信是什么。我把意思表達(dá)給你,你來(lái)理解我的信息。
我把想法在腦子里變成一串文字,這叫做信息的編碼。
編碼信息通過(guò)聲音說(shuō)出來(lái),然后耳蝸把接收到的信息解碼還原成電信號(hào),電信號(hào)通過(guò)接收者大腦進(jìn)行解碼,接收者就知道對(duì)方的傳遞信息,這是信息解碼的過(guò)程,是標(biāo)準(zhǔn)的通信的模型。
既然是標(biāo)準(zhǔn)的通信模型,就可以用通信的方式解決它。他用信源編碼和信道編碼兩個(gè)模型來(lái)描述語(yǔ)音識(shí)別問(wèn)題。
如果要把數(shù)學(xué)模型的參數(shù)算清楚就要用大量的數(shù)據(jù)去算。為什么這事在IBM能做成了呢?因?yàn)槿澜绠?dāng)時(shí)只有IBM有數(shù)據(jù)。
IBM是商用機(jī)器公司,它是為各大公司提供計(jì)算機(jī),大公司之間用計(jì)算機(jī)發(fā)電傳,發(fā)傳真。因此,IBM擁有大量商業(yè)電傳文本,所以它做成這個(gè)事了。
換了一個(gè)思維方式解決問(wèn)題以后得到了什么結(jié)果呢?在整個(gè)六七十年代,語(yǔ)音識(shí)別能識(shí)別十個(gè)數(shù)字,再加上幾個(gè)簡(jiǎn)單的英文單詞。
IBM最早想做一個(gè)語(yǔ)音控制的計(jì)算機(jī),能夠?qū)崿F(xiàn)自動(dòng)接線系統(tǒng),連接、斷開(kāi)、轉(zhuǎn)接、付費(fèi)等等。
但是,當(dāng)時(shí)識(shí)別不超過(guò)100個(gè)英文單詞,錯(cuò)誤率30%,沒(méi)有辦法用。
轉(zhuǎn)換思路,用數(shù)據(jù)驅(qū)動(dòng)方法解決問(wèn)題能識(shí)別22000個(gè)英文單詞,錯(cuò)誤率從30%到下降到10%,就在短短幾年間實(shí)現(xiàn)。
這就是工作方法和思維方式的重要性,思維方式常常比技術(shù)本身更重要。你沿著原來(lái)的老路用技術(shù)再走,也走不到前面去,就是一個(gè)死胡同。
但是當(dāng)時(shí)的數(shù)據(jù)也僅僅只能解決語(yǔ)音識(shí)別的問(wèn)題,不能解決圖像處理問(wèn)題,圖像處理問(wèn)題數(shù)據(jù)的絕對(duì)數(shù)量是語(yǔ)音識(shí)別的100倍。
所以當(dāng)時(shí)是不可能的。后來(lái),賈里尼克手下一個(gè)人提出機(jī)器翻譯的模型,這個(gè)人叫彼德?布朗(Peter F. Brown)。
當(dāng)時(shí)英語(yǔ)的翻譯思路是走得通的,但是由于沒(méi)有數(shù)據(jù),翻譯效果不好。
在沒(méi)有互聯(lián)網(wǎng)的情況下,世界上能找到的數(shù)據(jù)只有2個(gè),一是各個(gè)國(guó)家都有的圣經(jīng),另一個(gè)是聯(lián)合國(guó)幾個(gè)官方語(yǔ)言之間的文件數(shù)據(jù),數(shù)據(jù)都非常少。彼德?布朗的模型在當(dāng)時(shí)沒(méi)有得不到很好的結(jié)果。
很有意思的是彼德?布朗的論文是今天做機(jī)器翻譯引用最多的論文,引用的高峰不是在九十年代剛剛發(fā)表論文的時(shí)候,而是在2000年以后當(dāng)數(shù)據(jù)量大的時(shí)候。
那么,彼德?布朗是什么人呢?世界上最牛的投資基金叫文藝復(fù)興,彼德?布朗原來(lái)是文藝復(fù)興科技公司IT總監(jiān),現(xiàn)在擔(dān)任文藝復(fù)興的副總。
所以他后來(lái)就去預(yù)測(cè)股票了。由于缺乏數(shù)據(jù),因此八九十年代人工智能進(jìn)入了低谷。
到了2004年、2005年,人們看到一點(diǎn)曙光了。最先讓大家覺(jué)得很興奮的事機(jī)器翻譯的水平基本上可以達(dá)到人的水平了。
Google有一個(gè)團(tuán)隊(duì)參加了美國(guó)國(guó)家標(biāo)準(zhǔn)化和技術(shù)研究所的測(cè)評(píng),相當(dāng)于中國(guó)標(biāo)準(zhǔn)化局的一次評(píng)測(cè)。
這一次評(píng)比的結(jié)果贏的是Google,跟第二名大概差5個(gè)百分點(diǎn)。
全世界科學(xué)家努力一年大概能提高0.5%,提高5%差不多10年。今天技術(shù)相差十年你們倆不在一個(gè)水準(zhǔn),差一代。
Google是第二個(gè)做這個(gè)事情的公司,憑什么一下子成為世界第一,而且是遠(yuǎn)遠(yuǎn)的第一名呢?
原因也很簡(jiǎn)單,Google把原來(lái)世界上做機(jī)器翻譯最好的一個(gè)科學(xué)家請(qǐng)到了Google去。
為什么跳個(gè)槽,結(jié)果就提高了5個(gè)百分點(diǎn)呢?因?yàn)樗昧藙e人一萬(wàn)倍的數(shù)據(jù),就這么簡(jiǎn)單的一件事,算法沒(méi)有變。
這就是為什么叫數(shù)據(jù)驅(qū)動(dòng)的方法,也就是在這之后深度學(xué)習(xí)開(kāi)始慢慢熱門(mén)起來(lái)了。
基礎(chǔ)的算法在七十年代已經(jīng)奠定了,現(xiàn)在用了當(dāng)年一萬(wàn)倍的計(jì)算資源,但是怎么用這些計(jì)算資源是一個(gè)本事。
我講這些想是想告訴大家人工智能和我們?nèi)四X的智能完全無(wú)關(guān),是一種基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)方法。
如同鳥(niǎo)是振動(dòng)翅膀來(lái)飛行,飛機(jī)是不振動(dòng)翅膀飛行,實(shí)際上飛機(jī)飛行跟鳥(niǎo)類(lèi)飛行沒(méi)有太大關(guān)系。
飛機(jī)飛上天是人類(lèi)對(duì)空氣動(dòng)力學(xué)的研究,而不是對(duì)鳥(niǎo)類(lèi)的飛行進(jìn)行研究。
今天了解人工智能是思考怎么讓計(jì)算機(jī)這些鋼鐵等材料組成的盒子在回答問(wèn)題的時(shí)候能超過(guò)人,而不是說(shuō)研究人腦的結(jié)構(gòu)。
有一個(gè)簡(jiǎn)單的方法判定人工智能是真還是假。如果說(shuō)這個(gè)人工智能和認(rèn)知科學(xué)有很深的關(guān)系,這是騙你的。
如同說(shuō)發(fā)明了一個(gè)飛機(jī),翅膀是可以振動(dòng)的,是一樣的道理。如果跟你講有數(shù)據(jù)驅(qū)動(dòng)的,數(shù)學(xué)模型怎么好基本上是真的。
四、人工智能發(fā)展的好消息和消息
人工智能發(fā)展到今天,好消息是說(shuō)它得到了全世界的認(rèn)可,LeCun、Hinton、Bengio得到了圖靈獎(jiǎng)。
壞消息是說(shuō)從人類(lèi)找到數(shù)據(jù)驅(qū)動(dòng)方向的時(shí)候,人工智能用光了40年技術(shù)積累的紅利,之所以今天有這個(gè)結(jié)果,是40年前的人在給你栽樹(shù), 40年前栽的樹(shù)在今天開(kāi)花結(jié)果了。
大家不要覺(jué)得人工智能突然發(fā)展這么快,會(huì)不會(huì)接下來(lái)20年又有一個(gè)巨大的加速?我告訴你不會(huì)的。
為什么?因?yàn)?0年后產(chǎn)生巨大加速的事情,可以在今天的學(xué)術(shù)界預(yù)測(cè)。今天學(xué)術(shù)界所做的一些研究課題沒(méi)有太多新的。
當(dāng)今的科學(xué)家們比較努力,人數(shù)也多,大概也要20年才能積累出一個(gè)讓人感覺(jué)非常興奮、非常驚喜的理論基礎(chǔ)。
好的是什么呢?因?yàn)檫@40年的成果在一些領(lǐng)域被證實(shí)了可以開(kāi)花結(jié)果。
AlphaGo用它下棋可以用,彼德?布朗用它可以在股票上掙大錢(qián),現(xiàn)在包括無(wú)人駕駛汽車(chē),語(yǔ)音識(shí)別、機(jī)器翻譯、醫(yī)學(xué)影像識(shí)別,人臉識(shí)別等都做的很好。這些成果證明這項(xiàng)技術(shù)已經(jīng)成熟到了我們可以把它們用到各行各業(yè)去。
任何一次技術(shù)革命,掌握核心技術(shù)的可能是2%的人,但是剩下來(lái)得有無(wú)限應(yīng)用它的可能性。
五、人工智能的發(fā)展水平
1. 弱人工智能
比如美圖秀秀,這是一個(gè)非常好的人工智能的應(yīng)用,雖然你沒(méi)有覺(jué)得它很聰明,其實(shí)它在圖像處理方面蠻聰明的。
華為手機(jī)(P20以上)里面加入了很多圖像識(shí)別功能,不僅是人臉識(shí)別,還能識(shí)別各種各樣的物體。大部分人可能關(guān)注的是華為手機(jī)把顏色調(diào)的很亮麗,把人照的年輕一點(diǎn)。
你們?cè)敢獾脑?,還可以測(cè)試華為手機(jī)目標(biāo)識(shí)別的功能。比如,你們?nèi)ィㄉ虾#╆懠易?,用華為手機(jī)照一張大樓(低處往上拍攝),然后保存原文件,大概40M大小。
然后你查看照片發(fā)現(xiàn)樓是直的,這是不對(duì)的。因?yàn)閺南峦峡磻?yīng)該有一個(gè)傾斜角度,說(shuō)明手機(jī)做了大量目標(biāo)識(shí)別和后處理工作。
這其實(shí)就是人工智能的應(yīng)用,雖然你可能不覺(jué)得那么聰明。
2. 強(qiáng)人工智能
你們常想到的聰明的人工智能,例如人工智能下棋或者給你看病,這就是第二層發(fā)展水平強(qiáng)人工智能。
①理解自然語(yǔ)言(比速記員要好,能夠回答問(wèn)題、寫(xiě)作)
例如做速記,今天科大訊飛的語(yǔ)音識(shí)別和人對(duì)講話內(nèi)容做處理已經(jīng)差不了太多。當(dāng)然里面有一個(gè)原因是科大訊飛的語(yǔ)言庫(kù)資料比較大。
②病(已經(jīng)達(dá)到了醫(yī)生的平均水平)
人工智能看病診斷能達(dá)到醫(yī)生的平均水平,疑難病癥可以達(dá)到專(zhuān)家水平。為什么呢?因?yàn)獒t(yī)生看病在某種程度上來(lái)講就是人肉大數(shù)據(jù),必須見(jiàn)到足夠多的病例水平才足夠高。
③開(kāi)車(chē)(絕大多數(shù)時(shí)間比人做得好)
人工智能駕駛絕大部分時(shí)候做的都比人好。在無(wú)人駕駛汽車(chē)方面Google是唯一梯隊(duì)的公司,現(xiàn)在基本上經(jīng)過(guò)測(cè)試能夠做到每7000英里左右干預(yù)一次。
你從中國(guó)最北邊開(kāi)到最南邊,或者從最東邊開(kāi)到最西邊一個(gè)來(lái)回干預(yù)一次就夠了。
3. 超人工智能,是否存在?
一直有科幻片在探索超人工智能是不是存在的。其實(shí)超人工智能存在有否,與你們的生活關(guān)系不大。
我問(wèn)大家一個(gè)問(wèn)題,鬼存在不存在?有人相信鬼存在,也有人不相信。
不管鬼是否存在,你們都不擔(dān)心鬼的存在對(duì)不對(duì)?例如你們?nèi)サ侥硞€(gè)恐怖地區(qū),你們是怕鬼還是怕恐怖分子?答案很顯然。
很多人現(xiàn)在寫(xiě)文章,說(shuō)將來(lái)人工智能發(fā)展下去不得了了,人類(lèi)活不下去了。這種擔(dān)心就是等于怕鬼。我們擔(dān)心的不是鬼,而是背后的人裝神弄鬼!
所以超人工智能不可怕,可怕的是應(yīng)用人工智能控制你的生活以及無(wú)形中已經(jīng)改變你生活的人,這些才是可怕的。
今天對(duì)人工智能有所擔(dān)心,不是人工智能本身,而是人工智能背后開(kāi)發(fā)程序的公司和個(gè)人。
六、機(jī)器智能(人工智能)的三大支柱
1. 摩爾定律
今天的手機(jī)和十年前的手機(jī)速度差了100倍。因此華為手機(jī)才能夠做到實(shí)時(shí)處理圖像信息。計(jì)算機(jī)的速度如果不夠快,我問(wèn)了內(nèi)部的一些人,三四十張合成一張。這就是摩爾定律的作用。
2. 數(shù)據(jù)
多50%,多一倍、兩倍、十倍不一定有結(jié)果,多一萬(wàn)倍就會(huì)有結(jié)果了。
3. 數(shù)學(xué)模型
之前提到計(jì)算機(jī)能解決的是數(shù)學(xué)問(wèn)題。你如果想用人工智能解決問(wèn)題,就需要能夠?qū)λ⑵饠?shù)學(xué)模型。
復(fù)旦下面一家人工智能研究所大概有三撥人。第一撥人是學(xué)MBA的,他們到客戶那里了解客戶業(yè)務(wù)邏輯;第二撥人是學(xué)數(shù)學(xué)的,根據(jù)業(yè)務(wù)邏輯搭建出數(shù)學(xué)模型;第三撥人是學(xué)計(jì)算機(jī)的,把數(shù)學(xué)模型變成計(jì)算機(jī)算法。
七、人工智能發(fā)展的三種態(tài)度
大家在做人工智能的時(shí)候有三種態(tài)度,分別是模擬人,取代人,超越人。
1. 模擬人
模擬人就是說(shuō)原來(lái)人能做的一些事由它來(lái)做,有人就談到服務(wù)機(jī)器人。但我個(gè)人未必覺(jué)得是一個(gè)很好的思路,為什么呢?
舉個(gè)簡(jiǎn)單例子,比如說(shuō)養(yǎng)老機(jī)器人,家里老人是想跟機(jī)器人聊天還是想跟兒女聊天呢。
又比如生病了,你是希望機(jī)器人給你送藥打針還是護(hù)士來(lái)跟你說(shuō)兩句話?也許這個(gè)領(lǐng)域恰恰是人更合適的。
人工智能并非能解決所有問(wèn)題,有時(shí)候要分清這個(gè)問(wèn)題。當(dāng)大家都涌到加州淘金,賣(mài)水的人掙著了錢(qián)。
加州很有名的礦泉水公司當(dāng)年就靠賣(mài)水發(fā)家起來(lái)了。還有一家牛仔褲公司也在淘金時(shí)期發(fā)展起來(lái)。
2. 趕上人
人工智能在很多事上很容易趕上人。比如說(shuō)天為什么是藍(lán)的可能比你想的還清楚。
我家里有一個(gè)對(duì)話機(jī)器人。有一次在家里和朋友聊天聊到amazon,機(jī)器人馬上問(wèn)“你們是不是要買(mǎi)東西”?家人逗它說(shuō)要買(mǎi)東西。
后來(lái)它說(shuō)“高爾夫球好像快沒(méi)了,是不是還要買(mǎi)”?他說(shuō)那就買(mǎi)吧!
它接著問(wèn)“是不是還買(mǎi)上次那個(gè)牌子”?我們說(shuō)是的。
幾天之后,商品就寄過(guò)來(lái)了。
你在FACEBOOK上點(diǎn)贊達(dá)到100次,它會(huì)比你家人都了解你的需求,點(diǎn)到200次可能比你自己還了解自己。這些事是人工智能可以完全解決的。
3. 超越人
某些事情,例如無(wú)人駕駛汽車(chē),包括一些疾病的診斷,我個(gè)人覺(jué)得人工智能會(huì)比人做的更好。
疾病診斷誤診、漏診其實(shí)是蠻多的,有些時(shí)候比我們想象的要大得多。
假設(shè)你是放射科的專(zhuān)家看片子的,看片子可能就會(huì)漏掉很多的細(xì)節(jié)。機(jī)器做這件事是非常穩(wěn)定的事。
八、把握機(jī)遇抓住未來(lái)
今天講了很多計(jì)算機(jī)和人的邊界。要用不同的方式去看待計(jì)算機(jī)的智能,千萬(wàn)不要跟人等價(jià)。它的感知世界和人是不一樣的。
關(guān)于人和計(jì)算機(jī)的智能區(qū)別,邁克爾?喬丹教授(美國(guó)人工智能專(zhuān)家)提到計(jì)算機(jī)的智能是網(wǎng)絡(luò)行為,人是個(gè)體行為。
它獲得的智能是網(wǎng)絡(luò)判斷的結(jié)果,不是單個(gè)計(jì)算機(jī)的智能。這是計(jì)算機(jī)和人的智能的差別。
當(dāng)然這也帶來(lái)一個(gè)風(fēng)險(xiǎn),一旦出錯(cuò)就不是一個(gè)人出錯(cuò),可能導(dǎo)致整個(gè)社會(huì)系統(tǒng)的癱瘓!
我們的主題叫超級(jí)智能時(shí)代,在這個(gè)時(shí)代還有很多細(xì)分領(lǐng)域有人工智能應(yīng)用的機(jī)會(huì),就看你們?cè)趺窗盐漳兀?/p>
如果你相信未來(lái)20年是一個(gè)還不錯(cuò)的發(fā)展機(jī)會(huì),你就會(huì)采用不同的人生態(tài)度和不同的做事方式來(lái)抓住未來(lái),也希望每個(gè)人都抓住未來(lái)。
謝謝大家!
*文章為作者獨(dú)立觀點(diǎn),不代表筆記俠立場(chǎng)。
內(nèi)容來(lái)源:4月20日-21日,在交大安泰EMBA承辦的“互聯(lián)網(wǎng)+訓(xùn)練營(yíng)”第9期上,智能搜索科學(xué)家、《全球科技通史》作者吳軍進(jìn)行了以“回歸本源看人工智能本質(zhì)與發(fā)展”為主題的精彩演講,筆記俠經(jīng)講者和主辦方審閱發(fā)布。
來(lái)源:https://mp.weixin.qq.com/s/SBB77-dNkmAKTB1yLsVgAQ
本文由@筆記俠 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplah,基于CC0協(xié)議
深入淺出 很好理解 模仿人-趕上人-超越人
猴子摘香蕉的問(wèn)題,機(jī)器人可能只要伸出手臂或輕輕一跳就能摘到香蕉,但是因?yàn)槟7氯?,卻要搬來(lái)桌子和椅子,不是很可笑嗎?真正有智能的機(jī)器人應(yīng)該具備自己分析問(wèn)題,解決問(wèn)題的能力,而不是僅僅模仿人類(lèi)的行為和思考,他是機(jī)器人不是人,讓機(jī)器人模仿人,這或許從根本來(lái)說(shuō)就是一條錯(cuò)誤的路。
作者很用心,文章很好很精彩
勾股定理不就是整數(shù)解嗎,說(shuō)什么呢
很好 謝謝你