生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

3 評(píng)論 2151 瀏覽 3 收藏 17 分鐘

大模型發(fā)展到現(xiàn)在,在各個(gè)領(lǐng)域的應(yīng)用已經(jīng)很強(qiáng)了。人類(lèi)夢(mèng)想的強(qiáng)人工智能,是不是已經(jīng)來(lái)到了?看懂現(xiàn)在,展望未來(lái),或許可以從回顧歷史開(kāi)始。

一轉(zhuǎn)眼已經(jīng)到了2024年的4月,不知道屏幕前的各位是否安好,距離大語(yǔ)言模型,或者說(shuō)GPT,被很多人熟知已經(jīng)過(guò)了一年半。

作為互聯(lián)網(wǎng)從業(yè)者,第一次給我?guī)?lái)震撼并非是chatGPT,而是在更早之前使用Github Copilot;

一個(gè)可以幫助開(kāi)發(fā)者自動(dòng)寫(xiě)代碼的工具

一個(gè)「聰明」的代碼助手

生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

關(guān)于自動(dòng)寫(xiě)代碼的工具,也就是代碼輔助,其實(shí)開(kāi)發(fā)者的編輯器一直都有;

給非開(kāi)發(fā)者的小伙伴舉個(gè)例子:就像上圖,編輯器會(huì)根據(jù)你當(dāng)前的輸入給出代碼的提示,此類(lèi)提示都是語(yǔ)法的提示,機(jī)器其實(shí)并不知道你究竟要寫(xiě)什么代碼,只是在匹配在字典中提前做好映射關(guān)系的字段,就像輸入“今天”,輸入法推薦,“今天很開(kāi)心”一樣,輸入法并不知道這句話什么意思。

同時(shí)是代碼提示,為什么Github Copilot可以給我一種震驚的感覺(jué)呢?

Copilot仿佛能夠看懂我的代碼,并給出他的建議,而不是語(yǔ)法上的提示,就像真的有一個(gè)程序員在幫我寫(xiě)代碼。

生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

這種感覺(jué)就像:你想拿掃把來(lái)掃地,結(jié)果掃把自己動(dòng)起來(lái)了,而且還知道具體怎么掃,而你需要的只是,確定一下。

這是一種非常的震撼的感覺(jué)。

而Github Copilot這個(gè)工具的背后,就是微軟與openAI公司合作開(kāi)發(fā)的一款人工智能工具,這款產(chǎn)品正是基于生成式AI GPT3.0進(jìn)行實(shí)現(xiàn)。

如果AI都能“看懂”代碼,并可以編寫(xiě)代碼,距離直接看懂人類(lèi)的語(yǔ)言還遠(yuǎn)嗎?

我們?nèi)祟?lèi)一直以來(lái)的夢(mèng)想強(qiáng)人工智能(AGI),是不是已經(jīng)來(lái)到了我們的身邊?人工智能正在如何改變我們的生活?它將把我們帶向何方?

看懂現(xiàn)在,展望未來(lái),或許可以從回顧歷史開(kāi)始。

古老的夢(mèng)想

人工智能的起源可以追溯到神話、哲思、想象。

早在機(jī)器人(robot)的概念被大眾所知曉之前,人類(lèi)世界就有了很多關(guān)于自動(dòng)機(jī)械的想象,多被稱(chēng)為“automaton”,該詞最早起源于亞里士多德的《物理學(xué)》。

大約在2500年前的古希臘神話中,人類(lèi)歷史上出現(xiàn)了一個(gè)行走的機(jī)器人,據(jù)《荷馬史詩(shī)》描述,那是一個(gè)叫做塔洛斯的銅制巨人,保護(hù)克里特島免受外來(lái)入侵。

生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

除了古希臘羅馬文化,其他文明也不乏對(duì)人工智能的探索,猶太人傳說(shuō)中存在有生命的泥人,印度傳說(shuō)中守護(hù)佛祖舍利子的機(jī)器人武士,雖然這些似乎都和現(xiàn)在我們理解的人工智能不相關(guān),但是總是能夠看到人類(lèi)嘗試模擬、創(chuàng)造人類(lèi)的夢(mèng)想。

這樣的超級(jí)智能的機(jī)器,依舊是更多的存在于想象而不是現(xiàn)實(shí),至少目前是如此。

而我們今天的主角AI,作為計(jì)算機(jī)科學(xué)的一個(gè)分支,一個(gè)短短70年的歷史的學(xué)科,似乎讓這一切有了可能性。

經(jīng)典人工智能時(shí)代

1956年,4位AI鼻祖麥卡錫(John McCarthy)、明斯基(Marvin Minsky)、羅切斯特(Nathaniel Rochester)和香農(nóng)(Claude Shannon)一起寫(xiě)一份提案,人工智能(artificial intelligence)一詞正式亮相。

人們開(kāi)始研究機(jī)器是否可以模擬人類(lèi)的認(rèn)知、學(xué)習(xí)過(guò)程,用邏輯推理與現(xiàn)有信息來(lái)解決問(wèn)題,并做出決定?

1957年,AI的第一個(gè)研究方向確定了:符號(hào)主義(symbolists),后來(lái)我們稱(chēng)之為:經(jīng)典人工智能。

符號(hào)主義源于數(shù)理邏輯、基于邏輯表達(dá)式,用數(shù)學(xué)和物理中的邏輯符號(hào)來(lái)表達(dá)思維的形成,最終產(chǎn)生人一樣的推理與決策;

簡(jiǎn)單來(lái)說(shuō):如果我們把這個(gè)世界所有的問(wèn)題都告訴AI,AI就能幫助人類(lèi)解決問(wèn)題了。比如:

看到紅燈 = 停下;看到綠燈 = 通過(guò);禁止停車(chē)的標(biāo)志 = 禁止停車(chē);

任何形式化的符號(hào)問(wèn)題都可以被此程序解決,理想情況下機(jī)器將知道了所有“符號(hào)”在物理世界的含義。在這樣的原理的基礎(chǔ)上,通用問(wèn)題解決器(General Problem Solver)誕生了,后面也被稱(chēng)為專(zhuān)家系統(tǒng)

其原理其實(shí)非常簡(jiǎn)單:內(nèi)部包含一個(gè)巨量的知識(shí)庫(kù),就像“專(zhuān)家的腦袋”,以及推理引擎,用戶理解人類(lèi)語(yǔ)言的技術(shù)從知識(shí)庫(kù)中尋找最可能的問(wèn)題的答案。

在接下來(lái)的20年中,專(zhuān)家系統(tǒng)逐漸被全世界接受,并且在知識(shí)庫(kù)、知識(shí)工程領(lǐng)域發(fā)揮了巨大的威力

但是,它能夠被稱(chēng)得上是人工智能嗎?

很顯然這樣的邏輯匹配距離我們?nèi)祟?lèi)期望的人工智能還相差甚遠(yuǎn),通用問(wèn)題解決器看似智能, 但實(shí)際上他們只是盲目地進(jìn)行模式匹配。

并且還存在一些難以解決的問(wèn)題,專(zhuān)家系統(tǒng)維護(hù)費(fèi)用很高,它們難以升級(jí),難以使用,脆弱(當(dāng)輸入異常時(shí)會(huì)出現(xiàn)莫名其妙的錯(cuò)誤),專(zhuān)家系統(tǒng)的實(shí)用性?xún)H僅局限于某些特定的場(chǎng)景

1980年,美國(guó)哲學(xué)家約翰.瑟爾提出了一個(gè)思想實(shí)驗(yàn)《中文房間》:

當(dāng)有人說(shuō)恭喜發(fā)財(cái)?shù)臅r(shí)候,我們就從這本書(shū)找到了對(duì)應(yīng)的答案,謝謝,再反饋給對(duì)方

生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

一個(gè)對(duì)中文一竅不通,只說(shuō)英語(yǔ)的人關(guān)在一間只有一個(gè)開(kāi)口的封閉房間中。房間里有一本用英文寫(xiě)成的手冊(cè),指示該如何處理收到的中文訊息及如何以中文相應(yīng)地回復(fù)。房外的人不斷向房間內(nèi)遞進(jìn)用中文寫(xiě)成的問(wèn)題。房?jī)?nèi)的人便按照手冊(cè)的說(shuō)明,查找合適的指示,將相應(yīng)的中文字符組合成對(duì)問(wèn)題的解答,并將答案遞出房間。

盡管房里的人可以以假亂真,讓房外的人以為他說(shuō)中文,但事實(shí)上他根本不懂中文,就像通用問(wèn)題解決器,他并不知道人類(lèi)的語(yǔ)言究竟是什么意思。

雖然這似乎與”人工智能“差距還很大,但是為人工智能的發(fā)展作出重要貢獻(xiàn),專(zhuān)家系統(tǒng)的成功開(kāi)發(fā)與應(yīng)用,為實(shí)現(xiàn)人工智能聯(lián)系實(shí)際走向應(yīng)用具有重要意義。

機(jī)器學(xué)習(xí)時(shí)代

在專(zhuān)家系統(tǒng)大放異彩的時(shí)候,另一個(gè)在2000年左右大放異彩的技術(shù)已經(jīng)出現(xiàn),機(jī)器學(xué)習(xí)(Machine Learming)。

1952年,阿瑟·薩繆爾在IBM公司工作時(shí)研制了一個(gè)西洋跳棋程序,這個(gè)程序具有“學(xué)習(xí)能力”,它可以通過(guò)大量棋局的對(duì)弈,越來(lái)越會(huì)下跳棋;并且程序很快就下贏了薩繆爾自己。

該程序推翻了一直以來(lái)人類(lèi)的傳統(tǒng)認(rèn)知:計(jì)算機(jī)不可能超越人類(lèi)。

關(guān)于機(jī)器學(xué)習(xí)后來(lái)也有了準(zhǔn)確的定義:在不直接針對(duì)問(wèn)題進(jìn)行編程的情況下,賦予計(jì)算機(jī)學(xué)習(xí)能力的研究領(lǐng)域。

但是為什么在2000年之前的幾十年的時(shí)間里面,機(jī)器學(xué)習(xí)這一概念一直被專(zhuān)家系統(tǒng)遮掩了光明呢?

因?yàn)闄C(jī)器學(xué)習(xí)需要巨量的知識(shí)來(lái)進(jìn)行學(xué)習(xí),在互聯(lián)時(shí)代還不夠發(fā)放的時(shí)候,想獲取大量的數(shù)據(jù)并非易事,比如讓機(jī)器學(xué)習(xí)識(shí)別小狗,就需要巨量的小狗的照片。然而到了20世紀(jì)90年年代,隨著互聯(lián)網(wǎng)時(shí)代的到來(lái)了,爆炸式增加的數(shù)據(jù),讓機(jī)器學(xué)習(xí)獲得了充足的養(yǎng)料。

隨后我們迎來(lái)了AI的機(jī)器學(xué)習(xí)的發(fā)展浪潮,以及一些震驚世界的標(biāo)志性的事件

  • 1997年IBM的深藍(lán)在世界象棋領(lǐng)域擊敗了冠軍卡斯帕洛夫
  • 2016年AlphaGo在圍棋領(lǐng)域擊敗了排名世界第一的柯潔

在2000年以后,機(jī)器學(xué)習(xí)不斷發(fā)展,開(kāi)始出現(xiàn)了很多分支、有監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、集成學(xué)習(xí),機(jī)器學(xué)習(xí)伴隨移動(dòng)互聯(lián)網(wǎng)滲透到到我生活中

比如使用有監(jiān)督學(xué)習(xí)+無(wú)監(jiān)督學(xué)習(xí),可以實(shí)現(xiàn)了讓我們每個(gè)人受益的推薦系統(tǒng),比如網(wǎng)易云的每日推薦音樂(lè)、抖音的推薦、淘寶的推薦,這些都可以算作機(jī)器學(xué)習(xí)的范疇,他們?cè)诖诡?lèi)領(lǐng)域做到了比用戶更加了解自用戶己。

既然AI已經(jīng)存在這么多年,并且對(duì)我們每個(gè)人都存在深遠(yuǎn)的影響,為什么似乎我們以前沒(méi)有學(xué)習(xí)AI的焦慮呢?

我覺(jué)得原因主要是:機(jī)器學(xué)習(xí)的人工智能,只能在垂類(lèi)訓(xùn)練與發(fā)揮能力,比如做推薦、做分析,并非通用性的人工智能。

并且稍微深入了解,大家都知道一點(diǎn),就是本質(zhì)上,他并不知道人類(lèi)世界,依舊是機(jī)器,我們依舊可以使用機(jī)器的運(yùn)作邏輯去解釋他。

直到大語(yǔ)言模型的到來(lái)。

大型語(yǔ)言模型

2018年,OpenAI發(fā)布了第一個(gè)代號(hào)為“ChatGPT的生成預(yù)訓(xùn)練變換器模型”,這是一種新型的深度學(xué)習(xí)模型。

深度學(xué)習(xí)起源于1943年,由美國(guó)神經(jīng)科學(xué)家麥卡洛克提出神經(jīng)元的數(shù)學(xué)模型,參數(shù)越大,代表神經(jīng)元越多,比如GPT-3的相當(dāng)于人腦中1750億的神經(jīng)元。

2019年,GPT-2發(fā)布,擁有1.5億參數(shù)(參數(shù)可以理解為知識(shí)量),已經(jīng)可以做到配流暢的生成文本、一定程度的理解上下文。

2020年,GPT-3發(fā)布,擁有1750億參數(shù),在文本生成、創(chuàng)作、代碼生成多個(gè)領(lǐng)域展現(xiàn)出驚人的實(shí)力,在巨量數(shù)據(jù)以及技術(shù)優(yōu)化下,GPT-3開(kāi)始涌現(xiàn)出“智慧”,它似乎形成了智慧。

2022年11月底,OpenAI發(fā)布了GPT 3.5模型驅(qū)動(dòng)的ChatGPT。

5天之后,該網(wǎng)站注冊(cè)用戶超過(guò)100萬(wàn)。

生成式人工智能「1」- 神話與幻想的實(shí)現(xiàn)

眾所周知,早些時(shí)候注冊(cè)GPT并不是簡(jiǎn)單的事情,我們使用國(guó)內(nèi)科技愛(ài)好者搭建的鏡像網(wǎng)站,和chatGPT聊了很多,只是當(dāng)時(shí)我沒(méi)有意識(shí)到,一個(gè)能聽(tīng)懂人類(lèi)的語(yǔ)言,感知人類(lèi)的情緒,并能夠提出建議的AI是一種什么樣的存在。

直到2023年2月,chatGPT開(kāi)始出圈,開(kāi)放API接口能力,讓大家都可以基于GPT做應(yīng)用、發(fā)布更強(qiáng)的GPT4、多模態(tài)能力、文生圖能力。

那一個(gè)月我感到非常焦慮,因?yàn)槲彝蝗灰庾R(shí)到了我這身處人類(lèi)歷史的一個(gè)里程碑,大語(yǔ)言模型讓人類(lèi)一直以來(lái)追求的真正的通用型人工智能不再遙不可及,遠(yuǎn)在幾千年前的神話故事有了發(fā)生在人類(lèi)世界的可能性。

《創(chuàng)造亞當(dāng)》時(shí)刻來(lái)了,上帝創(chuàng)造了亞當(dāng),人類(lèi)創(chuàng)造了AI。

雖然他還存在很多限制,比如模型本身不能聯(lián)網(wǎng)、記憶是有限的、偶爾會(huì)瞎回答,但是他也表現(xiàn)出了類(lèi)似人類(lèi)的智能,它理解你文字的含義,滿足你的各種需求。

這樣的人工智能的想象空間實(shí)在是太大了,隨著更多資源的投入,生成式人工智能將會(huì)在未來(lái)幾年得到超快速的發(fā)展,以及逐漸在我們生活中出現(xiàn)。

我們國(guó)內(nèi)相應(yīng)也出現(xiàn)了很多生成式人工智能,比如在側(cè)重?cái)?shù)理領(lǐng)域的文心一言、多模態(tài)領(lǐng)域表現(xiàn)出色的通義千問(wèn)、自然語(yǔ)言理解出色的云雀大模型、2000K長(zhǎng)文的KimiChat、各項(xiàng)評(píng)分不俗的智譜清言。

雖然與美國(guó)有些差距,但是在大模型這個(gè)領(lǐng)域我們依舊走在前沿,互聯(lián)網(wǎng)公司的大語(yǔ)言模型,將會(huì)逐漸賦能各家App,由該技術(shù)支撐的AI助手會(huì)逐漸走到每一個(gè)消費(fèi)者的面前。

大語(yǔ)言模型對(duì)于我們所生活的世界的改造已經(jīng)在發(fā)生,并且呈現(xiàn)不可阻擋之勢(shì)。

身處時(shí)代洪流之中的我們

每當(dāng)新的先進(jìn)技術(shù)的出現(xiàn),一些工作就會(huì)消失,就業(yè)市場(chǎng)也會(huì)發(fā)生改變。

當(dāng)鬧鈴出現(xiàn)的時(shí)候,那些專(zhuān)門(mén)敲門(mén)提醒人們起床的工作消失了。

當(dāng)計(jì)算器出現(xiàn)的時(shí)候,專(zhuān)門(mén)計(jì)算的人就會(huì)失業(yè)。

這并非壞事,我們工作中重復(fù)、骯臟、沉悶、危險(xiǎn)或者困難的某些部分,未來(lái)都很有可能自動(dòng)化;我們將更加專(zhuān)注我們工作的本質(zhì),例如創(chuàng)造力、解決問(wèn)題、同理心、領(lǐng)導(dǎo)力。

如果說(shuō)工業(yè)革命為人類(lèi)創(chuàng)造了工業(yè)化的工作,那么生成式人工智能革命將使我們從這些工作中獲得解放與自由。這是對(duì)未來(lái)的范式徹底改變。

我們每個(gè)人都會(huì)變成自己的創(chuàng)意工作室,你的愿景和實(shí)現(xiàn)之間的障礙將消失,復(fù)雜的寫(xiě)作、繪畫(huà)、音樂(lè)、電影和其他形式的創(chuàng)意制作工具將會(huì)被簡(jiǎn)化并觸手可及,人類(lèi)將從消費(fèi)者轉(zhuǎn)換為創(chuàng)造者。

那我們現(xiàn)在應(yīng)該怎么做呢?

  • 主動(dòng)學(xué)習(xí)、擁抱生成式AI,讓AI成為你的最佳助手
  • 增強(qiáng)個(gè)人獨(dú)特的情感、創(chuàng)造力、交流能力,這是任何AI都無(wú)法模仿的

最后

讓更多人、更多組織可以從生成式AI中收益,是本系列文章的初衷;學(xué)會(huì)運(yùn)用AI,與AI和諧共處也是我們共同面臨的挑戰(zhàn),在接下來(lái)的系列文章中,我會(huì)使用通俗易懂的語(yǔ)言,與大家?guī)ьI(lǐng)大家學(xué)習(xí)與了解提示詞工程、插件、知識(shí)庫(kù)、agent,普通人也可以在很短的時(shí)間內(nèi)學(xué)習(xí)與使用AI,我們一起走到時(shí)代的前沿。

本文由 @狗阿木的產(chǎn)品日志 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 寫(xiě)得太好啦!讀的津津有味

    來(lái)自廣東 回復(fù)
    1. 哈哈哈,謝謝夸張呀,記得關(guān)注,這是系列文章~

      來(lái)自安徽 回復(fù)
    2. 謝謝夸獎(jiǎng),打錯(cuò)字了

      來(lái)自安徽 回復(fù)