知識(shí)圖譜如何讓“人工智能”更智能?
本文將帶讀者一起探討兩個(gè)話題——人工智能不智能的點(diǎn)在哪里,基于知識(shí)圖譜的認(rèn)知智能怎么就變得智能了。
一、為什么人人都談?wù)摰娜斯ぶ悄苁遣恢悄艿模?/h2>
1. 自動(dòng)駕駛這個(gè)行業(yè)所存在的問(wèn)題
我們一起先來(lái)聊聊自動(dòng)駕駛這個(gè)話題,先說(shuō)下結(jié)論,無(wú)論是自動(dòng)駕駛、機(jī)器人還是人工智能的任何領(lǐng)域都高度依賴于歷史的數(shù)據(jù),并且只能完成單項(xiàng)或者部分多項(xiàng)的協(xié)同任務(wù),全部處于弱人工智能的階段。
(1)產(chǎn)業(yè)及技術(shù)
從自動(dòng)駕駛的產(chǎn)業(yè)鏈的體系中我們可以看到,這個(gè)行業(yè)大概會(huì)有3部分組成,感知端-客戶端-云端。
- 感知端:時(shí)刻通過(guò)高精度的傳感器及視覺(jué)設(shè)備感知定位所處的環(huán)境,根據(jù)環(huán)境做出決策,提取相關(guān)的數(shù)據(jù),自動(dòng)駕駛高度依賴各式的傳感器,而多傳感器融合的問(wèn)題一直未解決;
- 客戶端:主要包含操作系統(tǒng)及硬件平臺(tái),通過(guò)算法及底層芯片實(shí)時(shí)處理前端的數(shù)據(jù),滿足自動(dòng)駕駛實(shí)時(shí)可靠性的需求,芯片處理及時(shí)延的問(wèn)題也暫未解決,這個(gè)問(wèn)題有望在5G的時(shí)代解決;
- 云端:主要用來(lái)存儲(chǔ)模擬高精度地圖繪制,為決策提供依據(jù);
(2)自動(dòng)駕駛等級(jí)
而在行業(yè)里面大家把自動(dòng)駕駛分為5個(gè)級(jí)別L0-L5,而目前為止即使像谷歌和百度這樣的頭部公司,重金砸到了自動(dòng)駕駛這個(gè)領(lǐng)域,目前也只能處在L3的級(jí)別,而其他研究自動(dòng)駕駛的公司處在L2階段。
而且有部分人認(rèn)為自動(dòng)駕駛要達(dá)到L5這個(gè)級(jí)別是不可能的,因?yàn)槿斯ぶ悄苡肋h(yuǎn)處理不了意外,而意外是歷史數(shù)據(jù)包含不了的。
(3)用戶使用(不安全)
2016年,特斯拉因自動(dòng)駕駛未識(shí)別白色汽車導(dǎo)致駕駛事故;2016年的uber自動(dòng)駕駛?cè)蚴桌詣?dòng)駕駛死亡事件;這樣的事件還有很多,對(duì)用戶來(lái)講自動(dòng)駕駛,至少現(xiàn)在它是不安全的。
所以單從目前的人工智能來(lái)說(shuō),數(shù)據(jù)-技術(shù)-應(yīng)用都或多或少出現(xiàn)了很多問(wèn)題,而過(guò)度依賴歷史的數(shù)據(jù)這個(gè)人工智能最大的問(wèn)題。
2. 現(xiàn)階段的人工智能是什么水平?
AI項(xiàng)目投入:企業(yè)在AI項(xiàng)目上的投入是反應(yīng)AI價(jià)值的一個(gè)維度,相比于制造和互聯(lián)網(wǎng)行業(yè),金融行業(yè)在AI上的投入最大。
成熟度:從技術(shù)及業(yè)務(wù)成熟度的角度分析,單拿金融行業(yè)來(lái)說(shuō),反欺詐、生物識(shí)別驗(yàn)證、智能客服這3項(xiàng)是在金融行業(yè)已成熟落地的場(chǎng)景,相比如其他行業(yè)應(yīng)用最為成熟,其中金融行業(yè)最大的一點(diǎn)得益于金融行業(yè)在線化的數(shù)據(jù),這也是AI可以快速落地的前提條件。
市場(chǎng)角度:從市場(chǎng)的角度來(lái)看,人工智能行業(yè)按照平臺(tái)及市場(chǎng)的劃分,已經(jīng)形成頭部及垂直行業(yè)的企業(yè),不同角度的競(jìng)爭(zhēng)及協(xié)作角度將快速促進(jìn)這個(gè)行業(yè)的大力發(fā)展。
二、基于認(rèn)知計(jì)算的知識(shí)圖譜會(huì)變得智能嗎?
1. 結(jié)論是正面的
直接給出結(jié)論:是的,而且是質(zhì)的改變,知識(shí)圖譜開始不再過(guò)分依賴于已有的歷史數(shù)據(jù)了,比如精準(zhǔn)營(yíng)銷,以前的精準(zhǔn)營(yíng)銷服務(wù),是基于已知數(shù)據(jù)做的,而實(shí)際情況往往獲取不到那么多的數(shù)據(jù)來(lái)進(jìn)行分析,而圖譜開始利用知識(shí)推理來(lái)猜測(cè)用戶的喜好。還有一點(diǎn),圖譜開始破壞人和機(jī)器反事實(shí)的狀態(tài)了(這一點(diǎn)在后續(xù)的文章中再闡述)。
(1)數(shù)據(jù)、信息、知識(shí)、智慧
為了更好的了解知識(shí)圖譜這項(xiàng)技術(shù),我們先得知道數(shù)據(jù)、信息、知識(shí)、智慧這4個(gè)詞的含義,它們之接的關(guān)系像一個(gè)金字塔一樣,數(shù)據(jù)是形成信息、知識(shí)和智能的原材料,數(shù)據(jù)的量非常大,信息的量要小一些;
舉個(gè)例子,我們?nèi)撕腿酥苯拥南嗵?,從陌生人開始接觸對(duì)方這個(gè)人的言談和舉止都可以當(dāng)做數(shù)據(jù),但是當(dāng)過(guò)一段時(shí)間后,你會(huì)對(duì)這個(gè)人有個(gè)鮮明的標(biāo)簽,比如這個(gè)人很努力,很靠譜,努力和靠譜就是信息了,所以數(shù)據(jù)是非指向性、非結(jié)構(gòu)性的,信息是有指向性和結(jié)構(gòu)性的;
而知識(shí)是在信息基礎(chǔ)之上,那些被人們廣泛接受并且成為共識(shí)的東西,而智慧其實(shí)是使用知識(shí)的這個(gè)人利用知識(shí)解決了某項(xiàng)問(wèn)題就說(shuō)這個(gè)人很有智慧。
從某種意義上來(lái)說(shuō),知識(shí)圖譜是人工智能變的更加智能的必經(jīng)階段。
(2)從AI技術(shù)的方向去看知識(shí)圖譜
從目前2019的技術(shù)成熟度來(lái)看,這項(xiàng)技術(shù)很快就會(huì)成為行業(yè)熱點(diǎn),而且對(duì)圖譜技術(shù)的投資也會(huì)加大。
2. 舉例
我們以一個(gè)智能問(wèn)答的例子作為切入,基于知識(shí)圖譜的智能問(wèn)答應(yīng)該是什么樣子的。
(1)智能問(wèn)答新趨勢(shì)
目前智能問(wèn)答這個(gè)領(lǐng)域大概經(jīng)歷了3個(gè)階段,從傳統(tǒng)的數(shù)據(jù)庫(kù)檢索到信息檢索也就是智能客服類的機(jī)器人,再到以知識(shí)圖譜建設(shè)為主知識(shí)型的問(wèn)答機(jī)器人。
(2)從用戶角度出發(fā)
而所有的無(wú)論是現(xiàn)在行業(yè)里聽到的實(shí)體機(jī)器人、在線客服、智能語(yǔ)音導(dǎo)航、外呼這些新名詞最終都可以歸結(jié)為問(wèn)答這個(gè)領(lǐng)域,而最主要對(duì)問(wèn)答對(duì)象起到的不外乎客戶維系以及客戶提升這兩方面的作用。
(3)技術(shù)組成
一個(gè)完整的問(wèn)答系統(tǒng),離不開的底層技術(shù),包括NLP、ASR、TTS,而知識(shí)圖譜在知識(shí)庫(kù)構(gòu)建及問(wèn)答中才剛剛發(fā)揮作用。
智能外呼 智能X導(dǎo)航 智能質(zhì)檢
(4)智能服務(wù)機(jī)器人
實(shí)體機(jī)器人智能問(wèn)答系統(tǒng)通過(guò)智能硬件作為載體實(shí)現(xiàn)真實(shí)的銀行業(yè)務(wù)場(chǎng)景。
智能機(jī)器人與線上政務(wù)結(jié)合
(5)知識(shí)圖譜與智能知識(shí)庫(kù)
在知識(shí)庫(kù)構(gòu)建層面,目前主要還是以FAQ為主,未來(lái)基于知識(shí)圖譜技術(shù)的知識(shí)庫(kù)構(gòu)建將發(fā)揮重要的作用。
(6)基于深度學(xué)習(xí)的圖譜問(wèn)答構(gòu)成
主要會(huì)有兩個(gè)方面,一種是利用深度學(xué)習(xí)對(duì)傳統(tǒng)的方法進(jìn)行改進(jìn),另一種就是基于深度學(xué)習(xí)端到端的問(wèn)答構(gòu)建。
框架算法設(shè)計(jì):
利用LSTM進(jìn)行實(shí)體模塊兒識(shí)別,對(duì)傳統(tǒng)的實(shí)體識(shí)別及關(guān)系映射進(jìn)行改進(jìn):
基于深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)
端到端的深度學(xué)習(xí)問(wèn)答模型,將問(wèn)題和知識(shí)庫(kù)中的信息均轉(zhuǎn)化為向量表示,通過(guò)向量間的相似度計(jì)算方式完成用戶問(wèn)題與知識(shí)庫(kù)答案的匹配,進(jìn)一步提升了問(wèn)答的準(zhǔn)確性。
最終問(wèn)答的整體技術(shù)架構(gòu)是基于多策略的統(tǒng)一問(wèn)答,讓問(wèn)答更精準(zhǔn),問(wèn)題覆蓋更廣。
整體的工作流程:從問(wèn)題輸入意圖識(shí)別再到答案融合與生成。
回到現(xiàn)實(shí),對(duì)于企業(yè)來(lái)說(shuō),無(wú)論是現(xiàn)在熱議的新冠疫情還是本身技術(shù)發(fā)展階段帶來(lái)的一系列問(wèn)題,對(duì)企業(yè)來(lái)說(shuō)都蘊(yùn)含著“?!焙汀皺C(jī)”,而在此次社會(huì)問(wèn)題出現(xiàn)的時(shí)候,我想會(huì)加速催化產(chǎn)業(yè)的重組及技術(shù)的創(chuàng)新,政府也會(huì)在人工智能、5G這些高新技術(shù)上加大投資,我想未來(lái)是可期的。
對(duì)個(gè)人而言,我蠻喜歡羅胖跨年演講中的一句話,疫情也好金融危機(jī)也罷,這就是我輩要解決的問(wèn)題,“直面現(xiàn)實(shí),躬身入局”。
本文由 @哥就是農(nóng)村來(lái)的?原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自Unsplash,基于CC0協(xié)議
我也想要下其中幾張清晰的圖片,方便加您微信嗎
你好,最后一張:工作流程圖 看不清,請(qǐng)問(wèn)可以發(fā)高清圖嗎?謝謝~
可以的,加下我微信jfy139943,單獨(dú)發(fā)你