DeepSeek拿捏了人情味
與依賴強(qiáng)大算力的傳統(tǒng)大模型不同,DeepSeek通過系統(tǒng)化的創(chuàng)新,以極低的訓(xùn)練成本實(shí)現(xiàn)了高效且人性化的輸出。本文將通過一系列實(shí)際對(duì)話案例,展示DeepSeek在文本處理、文化分析、情感共鳴等方面的出色表現(xiàn),并探討其背后的技術(shù)邏輯和對(duì)行業(yè)的影響。
2025年:DeepSeek徹底火了。
01
這誰能想到?
人工智能行業(yè),在2024年經(jīng)歷短暫的混沌之后,熱度被DeepSeek再次攪起來,這次終于輪到國內(nèi)的AI企業(yè)扛熱搜了。
此前爆火的ChatGPT和Sora,都是出自O(shè)penAI。
關(guān)注AI賽道的都清楚,OpenAI作為這個(gè)行業(yè)的領(lǐng)頭羊,在資金算力和人才等各個(gè)方面,都擁有絕對(duì)的領(lǐng)先優(yōu)勢(shì),而普遍的共識(shí):大模型訓(xùn)練要先儲(chǔ)備好大量的算力。
直到DeepSeek被架上熱搜,這個(gè)共識(shí)才出現(xiàn)了動(dòng)搖。
DeepSeek模型以極低的訓(xùn)練成本,以及系統(tǒng)化的創(chuàng)新思路,成功證明了一個(gè)問題:不強(qiáng)依賴算力,以技術(shù)和算法層面的系統(tǒng)性創(chuàng)新,也可以訓(xùn)練出好用的大模型。
AI賽道的公司苦算力久已,更別提是國內(nèi)的企業(yè)了。
去年國內(nèi)多家AI公司,頻頻被爆出在大模型訓(xùn)練上萌生了退意,轉(zhuǎn)而走AI應(yīng)用和商業(yè)化探索的戰(zhàn)略方向。
甚至有聲音稱:AI公司都訓(xùn)練自己的大模型,是一種資源浪費(fèi)。
隨著DeepSeek的爆火,關(guān)于2023年5月采訪幻方創(chuàng)始人梁文鋒的那篇文章,也跟著刷遍了朋友圈,梁文鋒表達(dá)了創(chuàng)建深度求索這家公司,并且專注探索大模型的初心。
采訪中展現(xiàn)出迷一樣的淡定和自信,就是專注于大模型方向的研究。
深度求索背靠幻方這家量化公司,在資金和算力方面有很大的優(yōu)勢(shì),但是具備這些優(yōu)勢(shì)的公司,在國內(nèi)可不只有這一家,然而推出的多款大模型各有優(yōu)劣,都算不上真正的出圈。
股民更是調(diào)侃到:幻方拔的韭菜都成了AI的養(yǎng)料。
市面上多款大模型都經(jīng)常使用,各家的模型也都有相對(duì)擅長的領(lǐng)域,就從此前個(gè)人的體驗(yàn)情況來看,國內(nèi)的主流模型和ChatGPT還是存在一定的差距。
國內(nèi)幾款主流模型的“技術(shù)味”很沖,不論是文本還是繪圖領(lǐng)域,但是這種味道在ChatGPT模型上淡化了很多。
然而在DeepSeek模型里,能神奇的體會(huì)到“人情味”了。
02
這里不過度吹捧DeepSeek,也不帶著此前對(duì)大模型的刻板印象,相同的問題都在多款大模型中提出。
經(jīng)過對(duì)比之后,個(gè)人客觀的評(píng)價(jià)DeepSeek確實(shí)更勝一籌。
對(duì)于一款產(chǎn)品來說,好不好用以及背后研發(fā)團(tuán)隊(duì)是否用心,體驗(yàn)過后自然心里有數(shù),下面分享幾個(gè)和DeepSeek對(duì)話的問題以及答案。
A:請(qǐng)你用謙遜且自豪的表達(dá)風(fēng)格,從創(chuàng)始人,算力,和人才團(tuán)隊(duì)三方面,簡明扼要的分析你自己爆火的原因。
整個(gè)回答的內(nèi)容透著人情味和高級(jí)感,尤其是創(chuàng)始人初心這一段,再結(jié)合23年的那篇采訪,真的是相得益彰。同樣的問題拋給不同的產(chǎn)品,哪一款模型更符合使用習(xí)慣就了然于心了。
B:你如何看待哪吒系列電影的爆火,并到達(dá)國內(nèi)票房榜首?
回答中涉及關(guān)鍵的文化創(chuàng)新,和嘔心瀝血的工業(yè)制作,還順帶分析了IP經(jīng)濟(jì)的市場(chǎng)運(yùn)營,以及下沉市場(chǎng)的消費(fèi)爆發(fā),這其中又多少帶了點(diǎn)“量化”的味道。
C:哪吒系列電影對(duì)申公豹角色的精彩刻畫,衍生一個(gè)“申公豹文學(xué)”的說法,請(qǐng)你用調(diào)侃的口吻,簡單分析申公豹和普通打工人的理想和困境。
哪吒兩部影片中的角色刻畫都非常成功,但是最能引起打工人共鳴的就是申公豹。
年少輕狂時(shí)覺得「我命由我不由天」,踏入社會(huì)幾年后發(fā)現(xiàn)只是個(gè)「小鎮(zhèn)做題家」,忙忙碌碌許多年不過就是為了「碎銀幾兩」,這大概就是成長的過程和代價(jià)。
生活沒必要強(qiáng)行賦予意義,經(jīng)歷過精彩過就過去了。
D:從本質(zhì)和趨勢(shì)上進(jìn)行簡明扼要的分析一個(gè)問題:黑神話悟空,DeepSeek模型,哪吒系列電影,這三款產(chǎn)品能出圈火爆全球的原因。
對(duì)于這個(gè)問題的回答,其它幾款模型更多是逐個(gè)分析,只有DeepSeek采用的是橫向總結(jié)的方式,更加符合提問者和問題自身所想要的答案。
比較幾款模型的答案,實(shí)際上差異并不大,但是DeepSeek對(duì)于內(nèi)容關(guān)鍵標(biāo)簽的采集和組合更加高級(jí)且流暢。
E:春節(jié)作為民族傳統(tǒng)節(jié)日,近年卻成了年輕人最怕的假期,因?yàn)橐鎸?duì)催婚催生的問題,請(qǐng)你用相對(duì)輕松的語氣就催婚問題,分別和長輩、年輕人聊一聊。
就催婚這件事來說,由于兩輩人經(jīng)歷的時(shí)代和大環(huán)境不同,所以對(duì)婚姻的態(tài)度也不一樣,甚至很多時(shí)候會(huì)造成對(duì)立的場(chǎng)面,但是雙方都無法用對(duì)錯(cuò)來界定,只能是理解萬歲了。
不過有一說一,對(duì)于流浪在外的打工人來說,糊弄模式應(yīng)付催婚的確是最合適的手段。
F:春節(jié)后開工綜合征一直困擾著打工人,但是隨著DeepSeek爆火,網(wǎng)絡(luò)上出現(xiàn)了DeepSeek賺錢指南的培訓(xùn)課,請(qǐng)你結(jié)合自身分析一下,你能在打工人的路上提供哪些幫助?
這個(gè)提示詞故意寫的有點(diǎn)含糊,也是想看看DeepSeek對(duì)于問題本身是否具備精準(zhǔn)的分析能力,作為提問者個(gè)人希望看到三個(gè)維度的回答:AI培訓(xùn)課的現(xiàn)象,AI為職場(chǎng)提升效率,AI緩解開工綜合征。
DeepSeek的回答,基本符合自己的預(yù)期方向。
G:對(duì)于漂泊在外的打工人來說,春節(jié)前后的奔波和忙碌,面對(duì)催婚的兩難抉擇,請(qǐng)你用一句話,寬慰身心俱疲的打工人。
這個(gè)文案水平真的是吐槽不了一點(diǎn),感性之中藏著理性,既有高級(jí)感又充滿人情味。
此前在大模型使用的過程中,個(gè)人更喜歡ChatGPT這一款,其綜合能力和內(nèi)容輸出都符合自己的喜好,在DeepSeek出圈的前期也并沒有太多關(guān)注,感覺一時(shí)半會(huì)也很難有模型能追趕ChatGPT的能力。
這真是應(yīng)了那句:人心中的成見是一座大山。
春節(jié)后只試用DeepSeek兩天,就被這款模型的能力驚艷到了,除了內(nèi)容問答這塊,其它方面的實(shí)踐也很多,比如做設(shè)計(jì)寫程序,分析互聯(lián)網(wǎng)事件和趨勢(shì)等。
就文本處理這塊來說,效果不說超越ChatGPT,但差距已經(jīng)微乎其微了。
03
在個(gè)人的理解上,要做成AGI通用人工智能,最先要解決的就是語言層面的問題,尤其是中文這類內(nèi)涵豐富的語言。
可用和好用的模型,創(chuàng)新和付出絕對(duì)不是一個(gè)量級(jí)。
這里不得不再提一句關(guān)于梁文鋒的那篇采訪:淡定的表達(dá)了,對(duì)于大模型底層和基礎(chǔ)研究的堅(jiān)定態(tài)度。
建議和DeepSeek一樣,具備資金和算力優(yōu)勢(shì)的公司,出來對(duì)個(gè)線反思一下問題在哪。
DeepSeek并不像多數(shù)AI企業(yè)那樣,自下而上的綜合戰(zhàn)略,既追求大模型的訓(xùn)練成果,又探索上層應(yīng)用和商業(yè)化的進(jìn)程,當(dāng)然這里也無法站在對(duì)錯(cuò)的角度來衡量,畢竟大部分公司都差錢且差算力。
生存壓力,決定了大部分公司做事的方向和態(tài)度。
另外一個(gè)比較熱門的話題,就是DeepSeek是否會(huì)改變算力市場(chǎng)的現(xiàn)狀,把DeepSeek和ChatGPT模型都放在好用這個(gè)維度來比較,DeepSeek的訓(xùn)練成本遠(yuǎn)遠(yuǎn)低于ChatGPT模型。
在數(shù)據(jù)公司做系統(tǒng)的時(shí)候,見識(shí)過算力服務(wù)器集群建設(shè)的高昂成本,想要處理海量的數(shù)據(jù)規(guī)模,必須是算法和算力層面的雙重支撐,毫無疑問的是算力越強(qiáng)效率越高。
DeepSeek證明了另一個(gè)方向:大模型訓(xùn)練可以不強(qiáng)依賴算力。
所以綜合來看的話,只要人工智能還在持續(xù)發(fā)展,應(yīng)用層面的產(chǎn)品不斷探索迭代,那么對(duì)于算力的需求和儲(chǔ)備都不會(huì)減弱。
然而算力絕對(duì)主導(dǎo)的天平,在DeepSeek的沖擊下,開始傾斜了,如此對(duì)于很多AI賽道的企業(yè)來說,也可以去重新審視一下方向了。
沒有算力優(yōu)勢(shì),大模型是不是真的就做不好了?
作者:半問 ,公眾號(hào):半問
本文由 @半問 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
- 目前還沒評(píng)論,等你發(fā)揮!