中文字幕亚洲黄片，国产精品久久午夜夜伦鲁鲁，亚洲片在线观看天堂，日本中文字幕www，日本中文字幕爆乳，在线播放AV一区，丰满熟妇午夜无码视频观看，自慰喷水免费观看www久久

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

AI同傳PK人類同傳，這或許是兩個職業(yè)

智能相對論

2018-04-16

1 評論 3076 瀏覽 3 收藏

14 分鐘

隨著AI技術(shù)的發(fā)展，其漸漸被運用到我們生活中的許多領(lǐng)域，如今也進入了同聲翻譯行業(yè)。那么AI同傳是否能代替到真人同傳呢？來看本文作者為我們詳細分析。

人工智能又又又摔了個跟頭。

今年的博鰲亞洲論壇上，第一次出現(xiàn)了AI同傳。值得注意的是，這是博鰲論壇創(chuàng)辦17年首次采用人工智能同傳技術(shù)。

然而，在如此重要的場合，現(xiàn)場配備的騰訊AI同傳卻掉了鏈子——詞匯翻譯不準確、重復(fù)、短語誤用等“烏龍”引來各方“嘲笑”。

人們總是把AI跟人類職位對立起來，各種“取代論”層出不窮。博鰲論壇會議前，就出現(xiàn)了許許多多的“取代論新聞”引起了各界關(guān)注。最終，AI同傳“翻車”，引來外界一片唏噓。

然而，就目前來看，AI同傳前路未明，太早將其與人類同傳對立起來實在是“杞人憂天”。除了取代，AI同傳其實有更好的路。

? 圖為AI同傳內(nèi)容

?一、AI同傳進階之路：變智能問題為數(shù)據(jù)問題

很多人都覺得人工智能如果要處理自然語言，就必須理解自然語言。實質(zhì)上，AI翻譯靠的是數(shù)字，更準確地來說，是統(tǒng)計。AI同傳出錯，并不是“智能”不夠，實質(zhì)上，是數(shù)據(jù)和模型出了問題。

1.AI同傳還需要理解力

首先，AI同傳要去理解場景。

在博鰲論壇上，會議現(xiàn)場專業(yè)度高、覆蓋度廣，AI對特殊場景的理解還不夠。場景對于語義具有至關(guān)重要的影響，相同的一句話在不同的場景里有不同的意思。

舉個例子，“好 ”這個字在百度漢語顯示有多種語義，既可以表示稱贊，也可以表示狀態(tài)，還可以表達問好……諸如此類，語義的表達和理解都要結(jié)合具體的場景。在具體的句子中，這種語義與情景的結(jié)合就更為緊密，更需要機器理解學(xué)習(xí)。

其次，AI要理解口語的模糊邏輯。

口語翻譯是不會百分百傳譯的，根據(jù) AIIC（國際會議口譯員協(xié)會）的規(guī)定，同傳譯員只要翻譯出演講者內(nèi)容的80%就已經(jīng)算是合格了（90 %~100 %的“同傳”幾乎是不可能的）。這意味著AI工作量減少嗎？當然不，正是這種模糊的東西使得AI同傳更加困難。

除此之外，口語沒有標點符號來標志句子，缺少了必要的聲調(diào)和停頓，就很容易造成句子的歧義。而模糊的指令極有可能出現(xiàn)的是滿屏的錯碼。

2.隱馬爾可夫模型（HMM）解決統(tǒng)計數(shù)據(jù)之外的語言問題

然而，在參考騰訊AI同傳的失誤后，我們發(fā)現(xiàn)：僅僅增加數(shù)據(jù)量還是不夠的，在現(xiàn)實生活中，我們也會遇到零概率或者統(tǒng)計量不足的問題。比如一個漢語的語言模型，就足足達到20萬這個量級。

曾有人做過這樣一個假設(shè)，如果刨掉互聯(lián)網(wǎng)上的垃圾數(shù)據(jù)，互聯(lián)網(wǎng)中將會有100億個有意義的中文網(wǎng)頁，這還是相當高估的一個數(shù)據(jù)，每個網(wǎng)頁平均1000詞，那么，即使將互聯(lián)網(wǎng)上上所有中文內(nèi)容用作訓(xùn)練，依然只有1013。

為了解決數(shù)據(jù)量的問題，我們提出了隱馬爾可夫模型（HMM）。實際應(yīng)用中，我們可以把HMM看作一個黑箱子，這個黑箱子可以利用比較簡潔的數(shù)據(jù)，處理后得出：

每個時刻對應(yīng)的狀態(tài)序列
混合分布的均值和方差矩陣
混合分布的權(quán)重矩陣
狀態(tài)間轉(zhuǎn)移概率矩陣

看起來可能比較復(fù)雜，簡單點說：這個模型可以通過可觀察的數(shù)據(jù)而發(fā)現(xiàn)這個數(shù)據(jù)域外的狀態(tài)，即隱含狀態(tài)。也就是說，我們可以憑借一句話，來探索出這句話后的隱含的意思，從而解決一些微妙的語義問題。

如上圖所示，這個模型能夠通過你提供的可以明顯觀察的句子，推斷出一個人隱含的心情狀態(tài)（開心OR難過），并得到最后的行為判斷（宅、購物、社交），即通過已知推斷出未知。

而如何優(yōu)化這個模型，得到最優(yōu)隱含狀態(tài)？人們提出了許多解決問題的算法，?包括前向算法、Viterbi算法和Baum-Welch算法。此中奧妙，難以盡述。

但不能否認的是，在深度學(xué)習(xí)的基礎(chǔ)上，數(shù)據(jù)+模型就能很好地打造出一款A(yù)I同傳翻譯，數(shù)據(jù)越大，神經(jīng)網(wǎng)絡(luò)更好。即使翻譯結(jié)果不盡如人意，但只要建設(shè)足夠大的數(shù)據(jù)庫，建立更好的模型，打磨算法，AI同傳很快就會有更大的提升。

?二、NLP金字塔頂端反哺底端：打造高質(zhì)量AI同傳

除了增加數(shù)據(jù)庫和打磨數(shù)據(jù)模型，AI同傳還可以從哪些方面提升呢？我們不妨借鑒一下其它的技術(shù)。

下圖中，這四個方面代表了人們在 NLP 領(lǐng)域的一些進步。用金字塔形來表示這四個技術(shù)之間的關(guān)系，難度是逐級上升的。

目前，聊天機器人和閱讀理解這一塊兒已經(jīng)取得了很大的突破。而AI閱讀理解技術(shù)的進步不止是NLP的高階進化，還有一層意義是，科學(xué)之間是相通的，技術(shù)之間可以互相借鑒，金字塔頂端技術(shù)可以反哺底端。

在自然語言處理上，人區(qū)別于AI的點在于人有先驗知識，即人們在聽到某個字時，會自然地聯(lián)想到后一個字，或者會被一個詞觸發(fā)了一句話的聯(lián)想。

比如，我們聽到“中”，既有可能想到“國”，也可能想到“間”。但是AI“聯(lián)想”的詞卻依靠數(shù)據(jù)，它說“北”，如果輸入的數(shù)據(jù)不變，那后面跟的就是“京”。

?智能相對論行業(yè)分析師顏璇曾經(jīng)在《AI在閱讀理解領(lǐng)域開始“跑分”，這個“人類好幫手”還能去哪炫技》一文中總結(jié)了AI閱讀理解的技術(shù)層面，我們或許可以從中得到閱讀理解技術(shù)反哺AI同傳的方法。

AI閱讀理解技術(shù)的流程如下：Embedding Layer（相當于是人的詞匯級的閱讀知識）→Encoding Layer（相當于人通覽全文）→Matching Layer（相當于帶著問題讀段落）→Self-Matching Layer（相當于人再讀一遍進行驗證）→Answer Pointer Layer（相當于人綜合線索定位答題）。

綜合來看，閱讀更偏向的是 Multi-turn，即做完一次輸入輸出后，要把結(jié)果作為下輪輸入的一部分繼續(xù)輸出，系統(tǒng)在運作時需要考慮上下文；而翻譯，則是 Single-turn，一句話進一句話出。

合理利用后，機器翻譯即使現(xiàn)在是 Single-turn，將來也有可能是 Multi-turn；AI同傳現(xiàn)在沒用到上下文背景，將來也有可能結(jié)合上下文做到翻譯質(zhì)量更佳。

如今，創(chuàng)作還是人工智能正在摸索的領(lǐng)域，而一旦這個領(lǐng)域有了突破，將一些技術(shù)應(yīng)用到AI同傳里，我們或許可以達到翻譯的最高境界——”信、達、雅”。

三、在未來，AI不會擠占人類同聲傳譯員的空間

AI同傳會取代人類翻譯嗎？當然不會。先不說語言本身的復(fù)雜，我們可以來看看同傳的實際應(yīng)用場景。

在實際工作中，不論是口譯還是直接對話都需要同傳來完成，不會有被服務(wù)方只聘用其中的一個職能。也就是說，AI同傳不僅要學(xué)會翻譯，還要學(xué)會聊天。而在這一塊兒，機器還有很大的進步空間。

那么，AI同傳的用處在哪里呢？

1.AI共享同傳，僅針對普通人的市場

人們出國旅游，常常會遇到語言溝通問題，然而，并不是每個人都配得起一個專業(yè)的口語翻譯。這時候，如果一個可穿戴設(shè)備亦或者一部手機就能為你同聲傳譯，想必會減少很多人的出國成本。

隨身攜帶一位專屬的同聲傳譯，是不是覺得很酷呢？

智能硬件一直是AI的狂熱地帶，就在去年，微軟和華為合作，在 Mate 10 手機中嵌入了微軟的神經(jīng)網(wǎng)絡(luò)機器翻譯，可以算得上是在終端運行神經(jīng)網(wǎng)絡(luò)機器翻譯的第一例。

如果AI同傳的硬件設(shè)備出世，更可能的商業(yè)模式是出租或者共享，即按需求進行租用，有一個專門的技術(shù)公司負責租賃，正如共享單車一樣，我們的使用費會降到極低。

而這類AI的應(yīng)用場景并不在復(fù)雜的會議現(xiàn)場，而是日常生活、出外旅游等，語料庫的建設(shè)也會更加簡單。

如此，AI同傳只是更加惠民而已，卻不會取代在某個特殊場景比如金融會議、醫(yī)療會議等更加專業(yè)的人類同傳。

將AI同傳與硬件設(shè)備相結(jié)合，創(chuàng)造切實可用的語音接口，還可以在很大程度上提高用戶在移動終端、可穿戴、智能家居、智能汽車等智能設(shè)備的體驗，真正在交互層面實現(xiàn)智能時代的人機結(jié)合。

2.AI同傳成為同聲翻譯的考官

同聲傳譯需求量成倍增加，但是合格的同聲傳譯的數(shù)量卻增長非常緩慢。據(jù)了解，現(xiàn)實市場上能夠十句話翻譯出十句的同傳譯員寥寥無幾。同時，擁有高級口譯資格證書的人并不一定能勝任同聲翻譯，同聲翻譯還需要進行專業(yè)的技能訓(xùn)練，而有些合格的同聲翻譯人員也并不一定有口譯證書。

目前，我國還沒有一個固定的機構(gòu)來負責同聲翻譯的相關(guān)事宜，也沒有一套統(tǒng)一的標準對同聲翻譯的工作進行考評。

面對這樣的困境，我們或許可以在AI同傳上開個腦洞。

人們可以利用AI數(shù)字化、標準化等特點，以數(shù)據(jù)庫為依托，將AI訓(xùn)練成單一功能性的考核機器，針對不同的應(yīng)用場景，對同聲傳譯員進行考核和評級，從而規(guī)范人才市場。

這里或許可以參考駕駛培訓(xùn)機器人：駕培機器人包含了高精度GPS導(dǎo)航技術(shù)、慣性技術(shù)和虛擬傳感技術(shù)、視頻檢測、數(shù)據(jù)處理、無線傳輸、指紋身份識別等高新技術(shù)，能夠精確記錄、判斷駕駛?cè)瞬倏v駕駛機動車的真實能力。

同理，AI同傳也可以在各種場景里，去觀察、判斷考生的翻譯能力，以及考生對翻譯規(guī)則的熟悉、理解程度。這個系統(tǒng)可以減少考試員的勞動強度和人為因素，確保考試公平、公正，考核方法科學(xué)準確。

簡單來講，我們的目標是通過智能機器，使考核自動化，選撥或者是訓(xùn)練真正的人才，而并非取代人類的翻譯能力。

更有意思的是，在考核過程中，AI又能不斷吸收新養(yǎng)分，增加口語類文本語料庫，何樂而不為呢？

【完】

作者：顏璇（關(guān)注AI醫(yī)療等），微信公眾號：智能相對論

本文由 @顏璇原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自 Pexels，基于 CC0 協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App