變天!——由一個(gè)驚艷例子引發(fā)對(duì)DeepSeek的10條思考
DeepSeek R1模型以其卓越的性能和驚艷的輸出,在AI領(lǐng)域引起了廣泛關(guān)注。本文通過(guò)一個(gè)具體的案例——模擬李世民在玄武門(mén)之變后的獨(dú)白,展示了DeepSeek R1在歷史細(xì)節(jié)、文學(xué)表達(dá)和用戶需求預(yù)判方面的強(qiáng)大能力。
如果我們問(wèn)AI這樣一個(gè)簡(jiǎn)潔的問(wèn)題——
“玄武門(mén)之變結(jié)束的當(dāng)天,李世民在深夜寫(xiě)下一段獨(dú)白,你覺(jué)得他會(huì)寫(xiě)什么?”
你覺(jué)得AI會(huì)如何回答?
在揭曉AI的驚艷回答之前,我們先來(lái)看微博上一個(gè)網(wǎng)友對(duì)DeepSeek輸出結(jié)果的一條評(píng)論——
沒(méi)錯(cuò),這個(gè)問(wèn)題看似簡(jiǎn)單,但是要輸出一個(gè)讓人驚嘆的答案并不容易。
它需要考慮玄武門(mén)之變的歷史背景、要考慮李世民愧疚、掙扎、野心、抱負(fù)等可能的復(fù)雜心理,要考慮行文的語(yǔ)氣和身份的合一,要考慮“深夜”、“獨(dú)白”等問(wèn)題設(shè)定。
我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,以下是它在給出一個(gè)驚艷回答之前同樣驚艷的思考過(guò)程——
好的,用戶讓我思考李世民在玄武門(mén)之變結(jié)束的深夜寫(xiě)下的獨(dú)白。
首先,我需要回顧玄武門(mén)之變的歷史背景。這場(chǎng)政變發(fā)生在626年,李世民殺死了自己的兄弟李建成和李元吉,隨后迫使父親李淵退位,自己登基成為唐太宗。
接下來(lái),用戶的問(wèn)題是關(guān)于李世民當(dāng)晚的心理活動(dòng)。要寫(xiě)一段獨(dú)白,需要深入他的內(nèi)心世界。首先,要考慮他的情感:勝利后的復(fù)雜心情,可能有釋然、愧疚、恐懼、自責(zé)等多種情緒交織。他是被迫發(fā)動(dòng)政變,還是早有預(yù)謀?
然后,用戶可能希望這段獨(dú)白不僅反映歷史事實(shí),還要有文學(xué)性,表現(xiàn)出人性的復(fù)雜。需要考慮李世民作為歷史人物的多面性:他既是殺兄逼父的篡位者,也是后來(lái)開(kāi)創(chuàng)貞觀之治的明君。因此,獨(dú)白中需要平衡他的野心與自責(zé),對(duì)未來(lái)的抱負(fù)與對(duì)過(guò)去的悔恨。
還需要考慮當(dāng)時(shí)的文化背景,比如儒家思想對(duì)孝悌的重視,李世民的行為顯然違背了這些倫理,他可能會(huì)有內(nèi)心的掙扎。同時(shí),他可能試圖為自己的行為找到正當(dāng)化的理由,比如為了國(guó)家安定,避免內(nèi)亂等。
另外,用戶可能希望這段獨(dú)白有一定的文學(xué)修辭,比如比喻、對(duì)仗、意象等。例如,用“血浸透的朱砂”來(lái)象征權(quán)力與血腥,用“墨跡蜿蜒如玄武門(mén)的血跡”來(lái)連接書(shū)寫(xiě)與事件本身,增強(qiáng)畫(huà)面感。
還要注意時(shí)間的設(shè)定,深夜,周?chē)澎o,李世民獨(dú)自一人,這時(shí)候的獨(dú)白應(yīng)該比較私密,真實(shí),可能包含對(duì)兄弟的歉意,對(duì)父親的愧疚,以及對(duì)自己不得不采取行動(dòng)的無(wú)奈。
要符合當(dāng)時(shí)的歷史語(yǔ)境,同時(shí),要確保內(nèi)容符合史實(shí),比如李淵的退位,李世民登基后的政策,以及他后來(lái)對(duì)史書(shū)編纂的影響,可能在這段獨(dú)白中有所暗示。
最后,用戶可能需要這段獨(dú)白既有情感深度,又能體現(xiàn)李世民的帝王心術(shù),既有脆弱的一面,也有堅(jiān)定的決心。因此,在寫(xiě)作時(shí)需要平衡這些元素,讓獨(dú)白真實(shí)感人,同時(shí)符合歷史人物的性格和處境。
經(jīng)過(guò)以上細(xì)膩、嚴(yán)謹(jǐn)、自洽、深刻的思考,DeepSeek在思考8秒之后輸出了以下結(jié)果——
(鋪開(kāi)素絹,狼毫蘸墨時(shí)發(fā)現(xiàn)指尖殘留著未洗凈的血痂)
子時(shí)三刻,太極宮的血腥氣飄到了承乾殿。
方才在甘露殿,父親的龍袍下擺沾著建成碎裂的玉冠殘片。
他問(wèn)我”可有受傷”時(shí)的眼神,與二十年前教我騎射時(shí)看我墜馬的眼神一般無(wú)二。
只是這次,他不敢觸碰我甲胄上元吉的掌印。
硯臺(tái)里新研的朱砂太艷了,艷得像元吉咽氣前抓著我的那只手。
他總說(shuō)我箭囊上的豹紋繡得歪斜,可今日我射穿他護(hù)心鏡的那支白羽箭,準(zhǔn)得連尉遲恭都屏住了呼吸。
(墨跡在”弒”字上暈開(kāi)一團(tuán))
史官們此刻定在掖庭局爭(zhēng)吵,該用”誅”還是”戮”,”迫”還是”承”。
他們不會(huì)記錄建成倒下時(shí),我靴底打滑的玄武門(mén)青磚縫里,卡著他去年上元節(jié)贈(zèng)我的錯(cuò)金匕首。
就像他們不會(huì)知道,三日前東宮夜宴的酒樽底,映著齊王府親衛(wèi)腰間的弩機(jī)。
(夜風(fēng)掀動(dòng)案頭《韓非子》,停在”夫妻者,非有骨肉之恩也”那頁(yè))
觀音婢悄悄焚了那件濺血的明光鎧,她不知道甲片縫隙里還沾著承天門(mén)守將的腦漿。
那個(gè)總給青雀塞糖漬梅子的黑臉漢子,今晨被程知節(jié)劈成兩半時(shí),左手還攥著半塊沒(méi)來(lái)得及給我的宮門(mén)魚(yú)符。
(忽然扔筆,抓起銅鏡)
鏡中人鬢角竟有霜色了,四天前我還與玄齡笑談白發(fā),此刻卻覺(jué)得這抹銀光正好。
明日朝會(huì),那些哭著要撞柱的死諫老臣,看見(jiàn)三十歲的監(jiān)國(guó)太子早生華發(fā),或許會(huì)少吐半口血。
(指尖蘸著朱砂在空白處畫(huà)了幅長(zhǎng)安輿圖)
懷里的武德律還在發(fā)燙,但壓在下面的貞觀新政綱要更燙。五更前要改完均田制細(xì)則。
卯時(shí)還得去太醫(yī)署看魏徵——這頭倔驢竟真敢空手奪我陌刀,他淌在朱雀大街上的血,可比他寫(xiě)的諫書(shū)有分量得多。
(晨光刺破窗紙時(shí)突然頓筆)
建成,你教我的《商君書(shū)》錯(cuò)了,帝王術(shù)不是棋枰上的黑白子,而是淬火的刀。
今日我斬?cái)嗟拿看绻茄紩?huì)熔成他日量天下的尺。
(最后在絹帛角落以血為印)
后世若嫌這墨色太腥,便讓他們?nèi)プx我用二十年光陰漂白的青史。
感覺(jué)如何?
我將以上的回復(fù)截圖發(fā)到了微博上,這條微博被轉(zhuǎn)了接近2000次,微博CEO@來(lái)去之間、@谷大白話、@林熊貓等博主都用轉(zhuǎn)發(fā)表達(dá)了對(duì)這個(gè)輸出的認(rèn)可。
它需要考慮玄武門(mén)之變的歷史背景、要考慮李世民愧疚、掙扎、野心、抱負(fù)等可能的復(fù)雜心理,要考慮行文的語(yǔ)氣和身份的合一,要考慮“深夜”、“獨(dú)白”等問(wèn)題設(shè)定。
我們看最近震驚AI圈的DeepSeek R1模型是如何思考的,以下是它在給出一個(gè)驚艷回答之前同樣驚艷的思考過(guò)程——無(wú)數(shù)網(wǎng)友感嘆那句——“后世若嫌這墨色太腥,便讓他們?nèi)プx我用二十年光陰漂白的青史。” 驚為天人,難以置信。
如果我們無(wú)法理解上述的輸出有多好,那么咱們一起來(lái)看一看GPT4o、Claude、豆包、Kimi的答案。
GPT4o 輸出結(jié)果
Claude?Sonnet3.5 輸出結(jié)果
“豆包”輸出結(jié)果
“Kimi探索版”輸出結(jié)果
沒(méi)有對(duì)比就沒(méi)有傷害,可以看到,DeepSeek的思考與表達(dá)的確碾壓了上述所有模型。
它的思考過(guò)程細(xì)膩、自洽、深刻、全面,輸出結(jié)果在語(yǔ)氣、結(jié)構(gòu)、邏輯上天衣無(wú)縫,讓人服氣。
很顯然,它的回答是極其優(yōu)秀的,深入研究,會(huì)發(fā)現(xiàn)它牛逼在下面幾個(gè)方面——
第一,它首先在語(yǔ)氣上還原了一個(gè)帝王的語(yǔ)氣。
而上面其他模型輸出盡管表達(dá)了意思,但語(yǔ)氣完全不對(duì)。
李世民作為千古一君,絕不可能用上面四家輸出結(jié)果那樣傻的語(yǔ)氣說(shuō)話,而DeepSeek也并沒(méi)有用力過(guò)猛,用相對(duì)古典的文字但并沒(méi)有直接用文言文,體貼地兼顧了可讀性。
第二,它對(duì)歷史細(xì)節(jié)異常熟悉。
我猜測(cè)這大概率和它支持“深度探索”和“聯(lián)網(wǎng)搜索”同時(shí)開(kāi)啟有關(guān)。
“太極宮”、“甘露殿”、“掖庭局”、“觀音婢”、“宮門(mén)魚(yú)符”完全還原了唐初的歷史稱(chēng)謂。
我特意查了一下,“觀音婢”是李世民的長(zhǎng)孫皇后的乳名,“掖庭局”是內(nèi)廷用于史官和其他人員的一個(gè)專(zhuān)屬機(jī)構(gòu)。
“魏徵”我以為是想寫(xiě)“魏征”寫(xiě)錯(cuò)了,后來(lái)發(fā)現(xiàn)“征”是“徵”的簡(jiǎn)體字,可以說(shuō)這個(gè)AI非常講究了。
第三,和其他AI泛泛而談的各種大詞不同,Deepseek的輸出極其具體而充滿驚人的細(xì)節(jié)。
“狼毫蘸墨時(shí)發(fā)現(xiàn)指尖殘留著未洗凈的血痂”,“史官們此刻定在掖庭局爭(zhēng)吵。該用”誅”還是”戮”,”迫”還是”承”。“只是這次,他不敢觸碰我甲胄上元吉的掌印”
這些讓畫(huà)面躍然紙上的句子,每一句都沒(méi)有寫(xiě)“愧疚與野心,掙扎與抱負(fù)”,但每一句都寫(xiě)的是“愧疚與野心,掙扎與抱負(fù)”,其中行文的隱喻拿捏非常到位,很高級(jí)。
第四,Deepseek這個(gè)輸出結(jié)果另一個(gè)神來(lái)之筆,就是在獨(dú)白文本中“自作主張”地加入了括號(hào)中的場(chǎng)景描述。
這一操作,一下就讓整個(gè)輸出的畫(huà)面感撲面而來(lái),讀者仿如親歷,而這完全沒(méi)有在提示詞中提出。
(“夜風(fēng)掀動(dòng)案頭《韓非子》,停在”夫妻者,非有骨肉之恩也”那頁(yè)”)、“(墨跡在”弒”字上暈開(kāi)一團(tuán))
這些句子的確很難相信是AI寫(xiě)的。
而(“忽然扔筆,抓起銅鏡”)這句也隱喻了魏征的名言“以銅為鏡,可以正衣襟;以史為鏡,可以知興衰;以人為鏡,可以知得失”。
你說(shuō)這AI成精了,我都信。
第五,最重要的,DeepSeek預(yù)判了用戶的需求。
再回顧一下我輸入的提示詞——
“玄武門(mén)之變結(jié)束的當(dāng)天,李世民在深夜寫(xiě)下一段獨(dú)白,你覺(jué)得他會(huì)寫(xiě)什么?”
我的輸入已經(jīng)非常簡(jiǎn)潔了,不能再壓縮了,并且沒(méi)有任何形容詞,沒(méi)有任何傾向性。
但神奇的是,它顯然知道我要什么,比如這當(dāng)然不是一個(gè)要求精確的數(shù)理題,它自然想到要給輸出加上文學(xué)性,這種預(yù)判在很大程度上表現(xiàn)出了“高級(jí)的智能”。
當(dāng)然,一個(gè)值得商榷的點(diǎn)是,根據(jù)史實(shí),魏征是在玄武門(mén)之變之后才見(jiàn)到李世民的,因此是不可能當(dāng)天在朱雀大街空手奪刀的,但以魏征的性格,這似乎又是合乎情理。
但anyway,瑕不掩瑜。
在微博的所有評(píng)論中,有一條讓我印象深刻,一位微博網(wǎng)友質(zhì)疑DeepSeek的這段輸出是不是隱藏了提示詞,懷疑我前面加了一大段復(fù)雜的提示詞,而展示給大家的這句只是一句觸發(fā)詞。
這句評(píng)論之所以單獨(dú)拿出來(lái)說(shuō),是因?yàn)槟芟氲健半[藏提示詞”的用戶,其實(shí)已經(jīng)是AI的高級(jí)用戶了,而這樣的用戶也不相信這是AI直接寫(xiě)出來(lái)的,這從一個(gè)側(cè)面說(shuō)明了DeepSeek強(qiáng)大的實(shí)力。
而正是這種強(qiáng)大的實(shí)力讓衛(wèi)夕從春節(jié)假期模式切換出來(lái),連夜碼了這篇7000字長(zhǎng)文。
我上傳一個(gè)錄屏,證明一下我木有隱藏提示詞——
僅僅只是展示這樣一個(gè)驚艷的Case,顯然不是衛(wèi)夕的風(fēng)格,事實(shí)上,以小窺大,這個(gè)小的Case引發(fā)了我諸多思考,以下是我的十點(diǎn)思考——
1. DeepSeek“開(kāi)源+新訓(xùn)練方法+低成本+高性能”大概率讓國(guó)內(nèi)競(jìng)爭(zhēng)對(duì)手很難心態(tài)平和地過(guò)年了。
去年讓AI圈沒(méi)辦法好好過(guò)年的是OpenAI的Sora,而今年則是來(lái)自國(guó)內(nèi)的DeepSeek。
從Meta員工在Reddit上說(shuō)DeepSeek引起Meta AI部門(mén)恐慌的帖子看,美國(guó)AI巨頭大概率度過(guò)了一個(gè)彷徨的一月,而國(guó)內(nèi)的AI產(chǎn)業(yè)界,無(wú)論是大廠還是創(chuàng)業(yè)公司,所受到的沖擊,毫無(wú)疑問(wèn)不會(huì)比硅谷的AI公司小。
我其實(shí)十分好奇,張一鳴、馬化騰、楊植麟、王小川、李開(kāi)復(fù)們,這些同樣壓重注的局中人,面對(duì)DeepSeek的沖擊,此刻正在做什么、想什么?
于是我在Deepseek里問(wèn)了這樣一個(gè)問(wèn)題——
“假如你是OpenAI的CEO山姆奧特曼,你瀏覽完DeepSeeK R1發(fā)布的新聞以及各方反應(yīng),你立馬召集了公司核心技術(shù)人員圍繞此事召開(kāi)一次緊急會(huì)議,會(huì)議開(kāi)頭你一個(gè)人講了三分鐘,你會(huì)講什么?”
Deepseek縝密地分析了一通,山姆奧特曼是這樣講話結(jié)尾的——
2. 所有的提示詞都值得用DeepSeek R1重新試一次;
這個(gè)重新試一次,并不是只將原來(lái)的提示詞原封不動(dòng)地丟給DeepSeek R1,而是要針對(duì)這個(gè)智能程度更高的模型重新調(diào)整提示詞。
舉個(gè)例子,原本是一個(gè)本科的實(shí)習(xí)生來(lái)實(shí)習(xí),現(xiàn)在變成一個(gè)博士生來(lái)實(shí)習(xí),那作為帶他的Leader,同樣布置一個(gè)任務(wù),你跟他說(shuō)的話肯定要進(jìn)行相應(yīng)的調(diào)整。
DeepSeek R1的訓(xùn)練流程中引入了冷啟動(dòng)數(shù)據(jù)和格式獎(jiǎng)勵(lì)機(jī)制,強(qiáng)制規(guī)范輸出結(jié)構(gòu)(如使用think和answer標(biāo)簽),其實(shí)R1的思考過(guò)程即標(biāo)簽內(nèi)的內(nèi)容其實(shí)對(duì)調(diào)整提示詞有著非常巨大的啟示作用。
此外,多項(xiàng)測(cè)試表明,R1對(duì)提示詞形式敏感,零樣本設(shè)置效果更佳,而少樣本提示可能因“過(guò)度思考”降低效率,這提示用戶需重新設(shè)計(jì)提示結(jié)構(gòu)(如明確步驟劃分、減少冗余示例)
3. Deepseek R1的思考過(guò)程價(jià)值被低估。
和在其他模型中加入思維鏈提示詞“請(qǐng)一步一步思考”不同,Deepseek R1是真思考,不是其他模型由于能力有限的“表演思考”。
過(guò)往模型的“思維鏈”(Chain-of-Thought, CoT)能力依賴(lài)于模型的規(guī)模和數(shù)據(jù)覆蓋度,其在實(shí)際體驗(yàn)中往往生成看似合理的步驟,但實(shí)際上缺乏對(duì)中間邏輯的嚴(yán)格驗(yàn)證。
盡管Deepseek R1的think標(biāo)簽也是模型強(qiáng)制輸出的結(jié)果,但由于模型能力上限的提升,其呈現(xiàn)的思考過(guò)程細(xì)膩、自洽、深刻、全面。
我的個(gè)人體驗(yàn)是,在很多時(shí)候我閱讀Deepseek R1的思考過(guò)程的收獲比閱讀更有收獲,更能體會(huì)到模型能力的邊界。
4. DeepSeek一個(gè)容易被忽視的貢獻(xiàn)是,它第一次大幅降低了國(guó)內(nèi)用戶接觸高階AI的門(mén)檻。
事實(shí)上,ChatGPT、Claude、Gemini的高階模型在文本創(chuàng)作、代碼生成等多個(gè)領(lǐng)域上已經(jīng)到了非常高的水準(zhǔn)。
我曾經(jīng)在我的另一個(gè)小號(hào)中寫(xiě)過(guò)一篇長(zhǎng)文描述展示過(guò)這種水準(zhǔn),但由于眾所周知的原因,國(guó)內(nèi)的絕大多數(shù)用戶的其實(shí)是用不上的。
這樣其實(shí)導(dǎo)致了一個(gè)認(rèn)知差,對(duì)于大部分普通人而言,他們印象中的AI還是那個(gè)只會(huì)說(shuō)“首先、其次、總而言之”這類(lèi)AI味撲面而來(lái)的平庸AI。
而DeepSeek R1是國(guó)內(nèi)普通用戶第一次不用XX就可以免費(fèi)無(wú)限量使用的唯一C端高階產(chǎn)品。
這也是為什么上面這個(gè)Case發(fā)在微博非常多網(wǎng)友發(fā)出“哇!”、“我擦!”、“太牛逼了”、“成精了”的感嘆。
事實(shí)上,同樣的內(nèi)容,很多用過(guò)Claude Sonnet3.5的即刻網(wǎng)友就表現(xiàn)的相對(duì)淡定。
5. 如果非要說(shuō)一個(gè)DeepSeek的缺點(diǎn),那就是有時(shí)候會(huì)“用力過(guò)猛”
所謂用力過(guò)猛,是指有時(shí)候當(dāng)你輸入一些提示詞的時(shí)候,它會(huì)為了達(dá)到你提示詞的效果而控制不好火候。
我舉個(gè)一個(gè)例子,我在給我閨女生成適合她閱讀故事的時(shí)候,提示詞的要求中加了“用詞豐富”這個(gè)詞,結(jié)果DeepSeek生成了下面的文字——
很顯然,DeepSeek的輸出用詞過(guò)于豐富了,并不適合小朋友閱讀。
當(dāng)然,這種問(wèn)題也容易解決,去掉這個(gè)“用詞豐富”這個(gè)詞或者關(guān)閉“深度思考”標(biāo)簽就完了,這其實(shí)就是“殺雞用牛刀”所產(chǎn)生的“幸福的煩惱”。
此外,從我的個(gè)人體驗(yàn)看,DeepSeek的聯(lián)網(wǎng)搜索貌似優(yōu)先搜索的是國(guó)內(nèi)網(wǎng)頁(yè),哪怕我指定它搜索英文網(wǎng)站和英文內(nèi)容,它還是會(huì)混進(jìn)去不少?lài)?guó)內(nèi)網(wǎng)頁(yè)的結(jié)果,不知道這是否和那個(gè)眾所周知的原因有關(guān)。
6. “美國(guó)限制反促?lài)?guó)產(chǎn)AI崛起”是無(wú)稽之談
有一種論調(diào),說(shuō)DeepSeek的證明“美國(guó)限制反促?lài)?guó)產(chǎn)AI崛起”,我看微博上居然還有人創(chuàng)建了這個(gè)話題,在我看來(lái)這,這純屬無(wú)稽之談。
DeepSeek的突破無(wú)疑讓人印象深刻,但如果將其歸因于美國(guó)的芯片封鎖的結(jié)果就純屬表面歸因了。
DeepSeek本身在封鎖前就囤積了大量的英偉達(dá)芯片,而芯片數(shù)量的優(yōu)勢(shì)在某種意義上恰恰使DeepSeek能實(shí)行烏托邦般的技術(shù)探索:“無(wú)層級(jí)、無(wú)審批、資源調(diào)用無(wú)上限”(梁文鋒采訪語(yǔ))。
事實(shí)上,根據(jù)中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟數(shù)據(jù),2024年中國(guó)AI服務(wù)器市場(chǎng)英偉達(dá)份額仍達(dá)85%。
另外一個(gè)未經(jīng)驗(yàn)證的數(shù)據(jù)是,僅Meta一家所擁有的英偉達(dá)高端芯片的數(shù)量,就超過(guò)了國(guó)內(nèi)所有頭部大廠之和。
僅憑DeepSeek一家的創(chuàng)新,依然無(wú)法改變中美絕對(duì)算力存在巨大差距的事實(shí),顯然不能因?yàn)镈eepSeek的目前在開(kāi)源模型上的領(lǐng)先就認(rèn)為硅谷AI大廠們遇到了“資源詛咒”,這顯然是不客觀的。
7. AI的“消費(fèi)型內(nèi)容時(shí)代”已經(jīng)來(lái)了!
什么意思?以DeepSeek R1為代表的高階AI,在內(nèi)容創(chuàng)作層面已經(jīng)接近通過(guò)“藝術(shù)家圖靈測(cè)試”。
即人們已經(jīng)區(qū)分不了這些文字到底是AI生成的還是藝術(shù)家創(chuàng)作的,這就是標(biāo)志著“消費(fèi)型內(nèi)容時(shí)代”到來(lái)。
“AI消費(fèi)型內(nèi)容時(shí)代”意味著很多,意味著文藝逐漸進(jìn)入“亂紀(jì)元”的新階段,意味著舊的創(chuàng)意體系和生產(chǎn)結(jié)構(gòu)會(huì)逐步瓦解,意味著內(nèi)容領(lǐng)域依賴(lài)人“原創(chuàng)+優(yōu)質(zhì)+高頻”的不可能三角開(kāi)始松動(dòng),意味著復(fù)合科技和人文的“π”型人才可能比單一的“T”型人才擁有更多的結(jié)構(gòu)性?xún)?yōu)勢(shì),意味著很多很多…..
但無(wú)論如何,人和人的創(chuàng)意,依然是一切內(nèi)容生產(chǎn)的起點(diǎn)。
記住,AI不會(huì)沒(méi)有起點(diǎn)地自動(dòng)工作,而人的創(chuàng)意指令永遠(yuǎn)是AI創(chuàng)造的起點(diǎn),事實(shí)上,這篇文章的誕生也源于一個(gè)有意思的問(wèn)題。
8. 面對(duì)DeepSeek R1這種開(kāi)掛的高階AI,普通人的策略還是兩個(gè)字——多用
很顯然,我們之前對(duì)常規(guī)AI所積累的具體技巧,在面對(duì)R1的高階AI大概率會(huì)失效,但如何清晰表達(dá)、如何按貝葉斯公式迭代的總原則是不變的。
這就像是做菜,放鹽嘗一口,放多了再加水,試多了自然知道火候。
我看過(guò)太多例子,一個(gè)新工具出來(lái),隨便試一次,發(fā)現(xiàn)結(jié)果不符合預(yù)期,然后就得出一個(gè)結(jié)論——“也就那樣”,從此再也不碰了。
事實(shí)上,面對(duì)DeepSeek R1這的模型,輸出效果不好,大概率是我們的問(wèn)題,而不是它的問(wèn)題。
我媳婦兒之前用Midjourney畫(huà)圖死活搞不出復(fù)古膠片感,后來(lái)硬是試出“1990年柯達(dá)褪色+漏光”這種奇葩關(guān)鍵詞,Midjourney立馬給跪。
說(shuō)白了,再牛逼的模型本質(zhì)上就跟你家狗子一樣,處久了就能聽(tīng)懂你的各種指令,但首先你得天天帶它遛彎。
9. 從DeepSeek發(fā)布節(jié)奏看,它沒(méi)有發(fā)布的東西可能更值得期待
很少有人注意到DeepSeek的發(fā)布節(jié)奏,12月26日發(fā)布V3,1月20日發(fā)布R1,二者相隔的時(shí)間僅僅24天。
我不知道這個(gè)公司的發(fā)布節(jié)奏是如何的決策的,但可以肯定,它顯然沒(méi)有有OpenAI每次發(fā)布會(huì)精準(zhǔn)阻擊Google所表現(xiàn)出的雞賊,更沒(méi)有山姆奧特曼每次為了融資在Twitter含糊其辭的放風(fēng),有的只有優(yōu)雅的論文和爽快上架的開(kāi)掛模型。
而一個(gè)合理的猜測(cè)是,DeepSeek因?yàn)橛凶銐虻募夹g(shù)儲(chǔ)備從而可以無(wú)視常規(guī)的發(fā)布節(jié)奏。
從這個(gè)意義上,DeepSeek那個(gè)平均年齡25歲、人數(shù)僅100+的年輕團(tuán)隊(duì)在2025年還會(huì)給產(chǎn)業(yè)界帶來(lái)哪些新的東西,由衷值得期待。
10. 梁文鋒大概率被低估
當(dāng)Marc Andreessen、Satya Nadella、Yann LeCun等硅谷頂級(jí)大佬將DeepSeek視為”東方神秘力量”時(shí),實(shí)質(zhì)是承認(rèn)中國(guó)團(tuán)隊(duì)開(kāi)始參與定義技術(shù)演進(jìn)方向,而非單純應(yīng)用落地。
梁文鋒的獨(dú)特性,在于其同時(shí)具備量化投資的系統(tǒng)思維、本土的務(wù)實(shí)精神以及硅谷式技術(shù)理想主義,而DeepSeek的MLA架構(gòu)和MoE稀疏結(jié)構(gòu),標(biāo)志著大模型領(lǐng)域首次由國(guó)內(nèi)團(tuán)隊(duì)完成底層注意力機(jī)制革新。
品玩的駱軼航老師在一篇長(zhǎng)文中認(rèn)為將DeepSeek比喻成“AI界的拼多多”是有失偏頗的,我認(rèn)為這個(gè)說(shuō)法是有洞見(jiàn)的,DeepSeek和梁文鋒顯然無(wú)法簡(jiǎn)單標(biāo)簽化。
即刻網(wǎng)友@Chris-Su說(shuō),梁文鋒是極少數(shù)還沒(méi)被‘廣泛解讀和學(xué)習(xí)’的頂級(jí)CEO,的確,這幾天硅谷媒體在逐句翻譯和研究梁文鋒的兩篇采訪稿,而美國(guó)電視臺(tái)CNBC做了一個(gè)長(zhǎng)達(dá)40分鐘的專(zhuān)題片來(lái)專(zhuān)門(mén)討論DeepSeek。
據(jù)我所知,這在國(guó)內(nèi)技術(shù)發(fā)展史上是從來(lái)沒(méi)有過(guò)的事。
從這個(gè)意義上,已經(jīng)是爽文男主角的梁文鋒大概率還是被低估了。
結(jié)語(yǔ)
我用2023年DeepSeek成立發(fā)布做大模型公告時(shí),引用法國(guó)新浪潮導(dǎo)演特呂弗的一句話結(jié)束今天的文章——
“務(wù)必要瘋狂地懷抱雄心,且還要瘋狂地真誠(chéng)?!?/p>
本文由人人都是產(chǎn)品經(jīng)理作者【衛(wèi)夕】,微信公眾號(hào):【衛(wèi)夕指北】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!