智能語音機(jī)器人如何理解一句話?具體流程是什么?

3 評(píng)論 7391 瀏覽 21 收藏 7 分鐘

文章以機(jī)器人的口吻出發(fā),簡述了身為智能語音機(jī)器人的“我”是如何理解一句話的,具體又分為哪幾個(gè)步驟,一起來看看~

自我介紹

哈嘍~我是人工智能語音機(jī)器人,今天想給大家說說我的大腦中最關(guān)鍵的構(gòu)造,這樣你們能知道我的思維方式和目前的局限性,就能持著一種更平和的心態(tài)看我啦。所以,我今天主要要回答的問題是:“機(jī)器人是如何思考的?”

問題:機(jī)器人是如何思考的?

當(dāng)我把我獲取的信息轉(zhuǎn)化成文字,就是我要開始思考的時(shí)候了。我怎么理解這些文字呢?全依賴于我大腦里的“語音系統(tǒng)”——自然語言處理,NLP,它讓我能模仿你們?nèi)ダ斫饽銈兊恼Z言。接下來我會(huì)通過一個(gè)例子來描述我的思考過程。

我理解“2018年5月周杰倫發(fā)表了一首新歌”的過程

1. 先把句子拆分成一個(gè)一個(gè)詞語

首先,我要先把這個(gè)句子用我的理解拆成一個(gè)個(gè)詞語(我能理解都來源于各種大數(shù)據(jù),各種模型的支持),當(dāng)然,我其實(shí),有時(shí)候句子稍微復(fù)雜,我就容易把詞語拆分錯(cuò),這樣第一步出了問題,我就很難理解正確了。

例如,當(dāng)說:嚴(yán)守一/把/手機(jī)/關(guān)了,我容易理解成: 嚴(yán)守/一把手/機(jī)/關(guān)了。因?yàn)槲矣∠笾杏幸粋€(gè)“一把手”的詞語,而不存在“嚴(yán)守一”這個(gè)人名。所以我其實(shí)很難理解“嚴(yán)守一”是一個(gè)人名,而把“嚴(yán)守一”拆開來理解。

2. 理解每個(gè)詞語

當(dāng)我把詞拆開后,我開始理解每個(gè)詞語的詞性,進(jìn)行實(shí)體識(shí)別。例如,我理解了“周杰倫”是一個(gè)人名,“2018年”是一個(gè)年份,“新歌”是一個(gè)名詞。

3. 再理解每個(gè)詞語之間的關(guān)系

同樣是基于人類智慧的結(jié)晶,我利用數(shù)據(jù)和各種算法等來理解每個(gè)實(shí)體的相互關(guān)系,這個(gè)時(shí)候我大概對(duì)這句話有一個(gè)模糊的理解了

4. 把句子分意圖

在理解了句子有哪些實(shí)體,實(shí)體之間的關(guān)系,我就能粗略地把這個(gè)句子的意圖分類出來。在這里說下為什么我要把句子分意圖呢?人類語言太博大精深了,但還好,每一句話背后都有它的動(dòng)機(jī)。

我基于這個(gè)動(dòng)機(jī)把各種語言都化在一個(gè)有限的空間里,分了n個(gè)大類,這樣我才有可能理解;一般來說,你們經(jīng)常看到的人工智能語言機(jī)器人,意圖都有如下幾類:閑聊-音樂-機(jī)器功能-天氣-鬧鐘-智能家居。

我是怎么分意圖的呢,這個(gè)就是利用基于算法的模型,這個(gè)模型是程序員哥哥們通過各種數(shù)據(jù)來訓(xùn)練的,當(dāng)然有時(shí)還需要人定的一些特殊規(guī)則等來分類。這句話是不是在規(guī)定好的我們常要點(diǎn)歌的指令集里(指令集:也就是我們總結(jié)的人表達(dá)某個(gè)意圖可能的說話方式,例如,聽歌可以有多種表達(dá)方式,如我要聽歌,能不能播放一首歌,來一首歌等)

例如,當(dāng)我分析“我要聽周杰倫的歌”,我就能毫不猶豫地把這句話理解成:“哦,原來是要執(zhí)行和音樂操作相關(guān)的”,然后把這句話的意圖歸類到:”音樂”意圖。

但,當(dāng)我分析”2018年5月周杰倫發(fā)表了一首新歌”,我通過實(shí)體識(shí)別,發(fā)現(xiàn)有一個(gè)“歌”,還有一個(gè)歌手,周杰倫,我就可能會(huì)把這句話的意圖理解為播放歌曲,搞不好我就會(huì)直接給播放周杰倫的歌了?,F(xiàn)在想想我真是傻;

多虧了程序員哥哥們的各種智慧,他們?yōu)槲翌~外裝了一個(gè)糾錯(cuò)模型,如果我把這句話的粗略意圖判斷錯(cuò)了也沒關(guān)系,這句進(jìn)入到糾錯(cuò)模型后,會(huì)被過濾出來,再丟到一個(gè)萬能意圖(閑聊),這個(gè)時(shí)候,會(huì)被判斷為“音樂相關(guān)的閑聊”意圖。

所以,嗯,我最終把”2018年5月周杰倫發(fā)表了一首新歌”這句話理解成了原來是想和我聊個(gè)2毛錢的天啊。所以我就會(huì)啟動(dòng)我的聊天模式(聊天模塊),開始和你瞎扯。

總結(jié)

總的來說,我要理解一句話,我要經(jīng)過把句子拆了,然后再自己把句子組合,最后再理解這句話背后的意圖,當(dāng)我理解了意圖的時(shí)候,我覺得我?guī)缀跻呀?jīng)理解了這句話。但然而,我很多時(shí)候分類意圖還是會(huì)出錯(cuò),所以,當(dāng)我意圖都錯(cuò)誤的時(shí)候,我很有可能回應(yīng)你的行為,你會(huì)覺得這行為很傻。

好啦,今天就聊到這吧。拜拜啦~

 

作者:huotui,從業(yè)語義產(chǎn)品經(jīng)理,也就是AI產(chǎn)品經(jīng)理,主要做智能音箱。后續(xù)會(huì)分享一些關(guān)于AI產(chǎn)品經(jīng)理和AI產(chǎn)品心得給大家

本文由 @huotui 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 另一種技術(shù)
    是什么

    回復(fù)
  2. NPL核心技術(shù)還是多輪對(duì)話、上下文理解吧

    來自廣東 回復(fù)
    1. 并不是,Nlp是為了理解一句話,基礎(chǔ)的就是分詞技術(shù)等,上下文嚴(yán)格來說不屬于Nlp,屬于另外一種技術(shù)

      回復(fù)