第一批DeepSeek開發(fā)者,已經(jīng)開始逃離了

1 評論 1970 瀏覽 4 收藏 21 分鐘

作為一款備受矚目的國產(chǎn)大模型,DeepSeek憑借其強(qiáng)大的推理能力和高性價(jià)比,吸引了眾多開發(fā)者的關(guān)注并迅速獲得市場認(rèn)可。然而,隨著用戶量的激增和服務(wù)器的過載,DeepSeek在服務(wù)穩(wěn)定性上出現(xiàn)了問題,導(dǎo)致部分早期開發(fā)者開始轉(zhuǎn)向其他平臺。這篇文章,我們來看下當(dāng)下第一批DeepSeek開發(fā)者的反饋。

在DeepSeek服務(wù)繁忙的回復(fù)背后,不只是普通用戶的焦急等待,當(dāng)API接口響應(yīng)突破臨界閾值,DeepSeek開發(fā)者的世界,也出現(xiàn)了持續(xù)震蕩的蝴蝶效應(yīng)。

1月30日,接入DeepSeek的base北京的AI開發(fā)者林森,突然收到程序后臺報(bào)警,還沒來得及為DeepSeek的出圈高興幾天,林森的程序便因?yàn)闊o法調(diào)用DeepSeek,后臺被迫癱瘓了3天。

一開始,林森以為這是因?yàn)樵贒eepSeek的賬戶余額不足導(dǎo)致的。直到2月3日春節(jié)假期過后返工,他終于接到了DeepSeek暫停API充值的通知。此時(shí),盡管賬戶內(nèi)余額充足,他也無法再調(diào)用DeepSeek了。

林森接到后臺通知的第三天,DeepSeek官方于2月6日正式對外發(fā)布公告,宣布暫停API服務(wù)充值。近半個(gè)月過去,截至2月19日,DeepSeek開放平臺的API充值服務(wù)仍未恢復(fù)正常。

注:DeepSeek開發(fā)者平臺仍未恢復(fù)充值圖源:字母榜截圖

在意識到后臺癱瘓是由于DeepSeek服務(wù)器過載,而自己作為開發(fā)者,長達(dá)數(shù)天,卻沒有收到任何提前告知,更沒有任何售后維護(hù)服務(wù)時(shí),林森有種“被拋棄”的感覺。

“就像家門口有一家小店,你是老顧客,辦了卡,一直和老板相處很好。突然有一天,小店被評為米其林餐廳,老板把老顧客拋在一邊,之前辦的卡也不認(rèn)了?!绷稚稳莸?。

作為2023年7月開始部署DeepSeek的第一批開發(fā)者,林森為DeepSeek的出圈感到振奮,但如今,為了維持運(yùn)轉(zhuǎn),他只能切換至ChatGPT,畢竟“ChatGPT雖然貴一點(diǎn),但至少穩(wěn)定。”

當(dāng)DeepSeek從口口相傳的小店變成網(wǎng)紅打卡的米其林餐廳,更多和林森一樣調(diào)用無門的開發(fā)者們,紛紛開始逃離DeepSeek。

2024年6月,小窗AI問答機(jī)在產(chǎn)品早期階段就接入了DeepSeek V2,讓小窗合伙人婁池頗為驚艷的是,那個(gè)時(shí)間點(diǎn),DeepSeek是唯一能全文背誦《岳陽樓記》不會(huì)出錯(cuò)的大模型。因此,團(tuán)隊(duì)用DeepSeek承擔(dān)了產(chǎn)品最核心的功能角色之一。

但對于開發(fā)者而言,DeepSeek雖好,穩(wěn)定性卻始終有所欠缺。

婁池告訴字母榜(ID:wujicaijing),春節(jié)期間,不僅是C端用戶訪問繁忙,開發(fā)者們也時(shí)常無法調(diào)用DeepSeek,團(tuán)隊(duì)決定選擇幾個(gè)已經(jīng)接入DeepSeek的大模型平臺同時(shí)調(diào)用。

畢竟,“現(xiàn)在已經(jīng)有幾十個(gè)平臺有滿血版DeepSeek R1了?!庇眠@些大模型平臺的R1,配合Agent和Prompt,也能滿足用戶的需求。

為了爭搶DeepSeek外溢而出的開發(fā)者群體,有頭部云廠商開始面向開發(fā)者頻頻舉辦活動(dòng),“參與活動(dòng)就免費(fèi)送算力,如果不大批量調(diào)用,小開發(fā)者幾乎能免費(fèi)使用?!币讟?biāo)AI技術(shù)總監(jiān)楊惠超表示。

不過,DeepSeek熱度當(dāng)前,在第一批開發(fā)者們出逃之際,更多開發(fā)者仍在蜂擁而至,希望蹭到前者的流量紅利。

郗鑒創(chuàng)業(yè)的項(xiàng)目,是通過調(diào)用DeepSeek的API來進(jìn)行角色扮演的AI陪伴APP,2月2日上線首周就獲得了約3000名的活躍用戶。

盡管有用戶反饋DeepSeek的API調(diào)用時(shí)有報(bào)錯(cuò),但已經(jīng)有60%的用戶希望郗鑒盡快推出安卓版。在郗鑒的社交媒體后臺,每天都有至少幾十個(gè)用戶私信要下載鏈接,“搭建在DeepSeek上的AI陪伴平臺”,無疑成了APP出圈的新標(biāo)簽。

經(jīng)字母榜統(tǒng)計(jì),在DeepSeek官網(wǎng)內(nèi)收錄的接入DeepSeek的各類APP名單,2025年前APP名單僅有182行,如今已經(jīng)擴(kuò)展到了488行。

一面是DeepSeek成為“國產(chǎn)之光”爆火出圈,7天涌入1億用戶,另一面,則是第一批部署在DeepSeek上的開發(fā)者,正因?yàn)檫^載人流導(dǎo)致的服務(wù)繁忙,而紛紛轉(zhuǎn)投其他大模型。

對開發(fā)者而言,長時(shí)間的服務(wù)異常不再是簡單的故障,而演變成為代碼世界和商業(yè)邏輯間的裂縫,他們被迫在遷移成本下進(jìn)行生存演算,無論是涌入,還是逃出,開發(fā)者們都需要面對DeepSeek爆火帶來的余震。

01

春節(jié)期間小程序后臺被迫癱瘓三天后,至大年初六,為了保證程序正常運(yùn)轉(zhuǎn)的林森,離開已經(jīng)部署一年多的DeepSeek,轉(zhuǎn)回了ChatGPT。

即使API調(diào)用價(jià)格高了近10倍,但此時(shí)保證服務(wù)的穩(wěn)定,成了優(yōu)先級更高的選項(xiàng)。

值得注意的是,開發(fā)者離開DeepSeek轉(zhuǎn)向其他大模型,并不如用戶在APP內(nèi)切換調(diào)用模型一般輕松?!安煌拇笳Z言模型,甚至是同一個(gè)語言模型的不同版本,對于提示詞的反饋結(jié)果都有細(xì)微的差別。”即便林森仍在持續(xù)調(diào)用ChatGPT,將所有關(guān)鍵節(jié)點(diǎn)從DeepSeek遷移ChatGPT,并保證穩(wěn)定且高質(zhì)量的內(nèi)容反饋,仍然花了他半天多的時(shí)間。

切換這個(gè)動(dòng)作本身也許只需要兩秒鐘,但“更多開發(fā)者,換一個(gè)新模型要花上一個(gè)星期反復(fù)調(diào)整提示詞,并重復(fù)測試。”林森告訴字母榜,

在林森這樣的小開發(fā)者們看來,DeepSeek服務(wù)器不足可以理解,只是如果能提前通知,能避免許多損失,無論是時(shí)間成本,還是APP維護(hù)成本。

畢竟,“登錄DeepSeek開發(fā)者后臺需要手機(jī)號注冊,只需要一個(gè)短信,就可以提前告知開發(fā)者?!比缃瘢@些損失將由曾在DeepSeek默默無名時(shí)就開始支持他們的開發(fā)者自己承擔(dān)。

當(dāng)開發(fā)者和某個(gè)大模型平臺深度耦合,穩(wěn)定性無疑成了不必宣之于口的契約,一個(gè)頻繁波動(dòng)的服務(wù)接口,足以讓開發(fā)者重新審視對平臺的忠誠度。

就在去年,林森在調(diào)用Mistral大模型(法國頭部大模型公司)時(shí),因?yàn)镸istral賬單系統(tǒng)錯(cuò)誤而重復(fù)付費(fèi),在他發(fā)出郵件后,Mistral不到1小時(shí)就糾正了問題,并附上了100歐元的代金券作為賠償。這樣的應(yīng)對,也讓林森產(chǎn)生了更多信任。如今,他也將一部分服務(wù)遷回到了Mistral。

易標(biāo)AI技術(shù)總監(jiān)楊惠超則在DeepSeek V3 版本發(fā)布之后,就開始醞釀一場逃離。

不用DeepSeek來寫詩或者吐槽,如果用DeepSeek來寫標(biāo)書呢?負(fù)責(zé)公司內(nèi)AI標(biāo)書項(xiàng)目的楊惠超,在DeepSeek推出V3版本后已經(jīng)著手尋找替代方案。對他來說,在標(biāo)書這樣的專業(yè)領(lǐng)域,“DeepSeek穩(wěn)定性越來越不足。”

DeepSeek R1版本火出圈的推理能力,并不吸引楊惠超。畢竟,“作為開發(fā)者,軟件主要的推理能力是靠程序和算法,并不是太依靠模型的基礎(chǔ)能力。底層即便用最老的GPT 3.5,依靠算法糾正都可以產(chǎn)出一個(gè)很好的結(jié)果,模型只要回復(fù)答案穩(wěn)定就可以?!?/p>

在實(shí)際調(diào)用過程中,DeepSeek在楊惠超眼中,似乎更像是一個(gè)聰明卻會(huì)偷懶的“好學(xué)生”。

升級V3版本后,楊惠超發(fā)現(xiàn),DeepSeek對一些復(fù)雜問題有了更高的回答成功率,但穩(wěn)定性卻也攀升到了難以接受的程度,“現(xiàn)在問10條問題,至少有一條輸出不穩(wěn)定,在要求生成的內(nèi)容之外,DeepSeek往往喜歡自由發(fā)揮,額外生成和問題無關(guān)的內(nèi)容?!?/p>

比如,標(biāo)書內(nèi)不允許出現(xiàn)錯(cuò)誤字符,同時(shí),大模型返回的結(jié)果,開發(fā)者們往往指定用Json 結(jié)構(gòu)(用指令每次調(diào)用大模型使得穩(wěn)定返回固定字段)去輸出數(shù)據(jù),便于后續(xù)函數(shù)調(diào)用,但出現(xiàn)錯(cuò)誤或者不準(zhǔn)確,都會(huì)導(dǎo)致后續(xù)調(diào)用失敗。

“DeepSeek R1,或許相對此前的V3版本,推理能力提升了很多,但是穩(wěn)定性達(dá)不到商業(yè)化的水準(zhǔn)?!痹贎生產(chǎn)力Mark賬號內(nèi),楊惠超提到。

圖注:DeepSeek V3生成過程中出現(xiàn)亂碼圖源:@生產(chǎn)力Mark賬號

作為2024年初,DeepSeek-coder時(shí)期就加入的第一批用戶,楊惠超并不否認(rèn)DeepSeek是一個(gè)好學(xué)生,只是如今,為了保證生成標(biāo)書的質(zhì)量和穩(wěn)定性,楊惠超只能將目光轉(zhuǎn)向國內(nèi)其他更偏B端用戶的大模型企業(yè)。

畢竟,曾經(jīng)被稱為AI界拼多多的DeepSeek,正是憑借著性價(jià)比的標(biāo)簽,迅速聚集起一批中小AI開發(fā)者。但現(xiàn)在想直接穩(wěn)定地調(diào)用DeepSeek,就必須進(jìn)行本地部署。“部署一個(gè) DeepSeek R1,需要 30萬 ~ 40 萬元的成本,如果用線上的 API計(jì)算,30萬元我一輩子都用不完?!?/p>

既不夠便宜,又不夠穩(wěn)定,調(diào)用無門的楊惠超們,正在批量離開DeepSeek。

02

曾經(jīng),林森們是第一批堅(jiān)定選擇DeepSeek的人。

2024年6月份,林森在開發(fā)自己的AI 小程序少年聽世界時(shí),曾經(jīng)對比了當(dāng)時(shí)國內(nèi)外幾十家大模型平臺。他需要用大模型每天處理數(shù)千條新聞,并且篩選、排序,找出適合青少年聽的科技、自然新聞,并且對新聞文字進(jìn)行處理。

這不僅要求大模型聰明,還得便宜。

涉及到每天數(shù)千條的新聞處理,對token的消耗極大,對獨(dú)立開發(fā)者的林森來說,ChatGPT模型很貴,只適合處理核心環(huán)節(jié),對大量文本的快速篩選和分析,還要靠別的價(jià)格更低的大模型做支持。

同時(shí),無論是國外的Mistral、Gemini ,還是ChatGPT,調(diào)用都很繁瑣:你需要在國外有一個(gè)具體的服務(wù)器,還要做中繼站,同時(shí)需要用國外的信用卡購買token。

林森便是通過英國朋友的信用卡,才能在ChatGPT賬戶完成充值。而一旦服務(wù)器在海外,API 響應(yīng)速度也會(huì)有所延遲,這都讓林森將目光投向國內(nèi),尋找一款ChatGPT平替。

DeepSeek讓林森頗為驚艷?!爱?dāng)時(shí)DeepSeek并不是最有名的,但卻是反饋?zhàn)罘€(wěn)定的。”以每10秒請求一次API調(diào)用為例,其他國內(nèi)大模型100次內(nèi)可能有30%的時(shí)候,不返回任何內(nèi)容,但DeepSeek次次返回,并都能維持不遜色ChatGPT和BAT們大模型平臺的回復(fù)質(zhì)量。

而相比起ChatGPT和BAT們的大模型API調(diào)用價(jià)格來說,DeepSeek真的太便宜了。

林森將大量新聞閱讀和初步分析的工作交給DeepSeek后,發(fā)現(xiàn)DeepSeek的調(diào)用成本10倍低于ChatGPT。經(jīng)過指令優(yōu)化后,每天調(diào)用DeepSeek的成本低到2-3元,“可能跟 ChatGPT相比,它不是最好的,但DeepSeek的價(jià)格是極低的,對于我的項(xiàng)目來講,它的性價(jià)比非常高?!?/p>

圖注:林森用大模型收錄新聞并分析(左) 最終呈現(xiàn)在少年聽世界小程序(右)圖源:林森提供

性價(jià)比,成了開發(fā)者們選擇DeepSeek的首要原因。2023年,楊惠超一開始將公司的AI項(xiàng)目從ChatGPT 切換到了Mistral,主要便是為了控制成本。隨后2024 年 5月份DeepSeek推出V2版本,將API打到了2元每百萬token,這無疑是對其他大模型廠商的降維打擊,這也成了楊惠超將公司做AI標(biāo)書工具的項(xiàng)目切換到DeepSeek的緣起。

同時(shí),經(jīng)過測試后,楊惠超發(fā)現(xiàn),國內(nèi)早已靠云服務(wù)在B端吃下市場的BAT們,“平臺太重了”。

對于易標(biāo)AI這樣的初創(chuàng)公司來說,如果選擇BAT,會(huì)面臨云服務(wù)的捆綁消費(fèi)。對于只是簡單調(diào)用大模型服務(wù)的楊惠超來說,無疑DeepSeek的 API 調(diào)用更加省事。

在遷移成本上,DeepSeek也勝了一籌。

無論是林森還是楊惠超,初始的APP開發(fā)都是基于OpenAI 的接口形式,如果切換到BAT們的大模型平臺,都要把底層重新開發(fā)一遍。但DeepSeek兼容 OpenAI like接口,切換大模型只需要修改平臺地址,“1分鐘無痛切換?!?/p>

小窗AI問答機(jī)正式銷售的第一天就搭載了DeepSeek,并將5個(gè)核心角色中語文和作文指導(dǎo)的角色交給了DeepSeek進(jìn)行構(gòu)建。

作為合伙人,婁池也在去年6月就被DeepSeek驚艷到?!癉eepSeek在中文理解上能力很棒,是那個(gè)時(shí)間點(diǎn)唯一全文背誦《岳陽樓記》不會(huì)出錯(cuò)的大模型?!眾涑馗嬖V字母榜,相比起其他大模型中規(guī)中矩、班味十足的文檔式輸出,用DeepSeek教孩子寫作文,往往贏在了寫作的想象力上。

在社交媒體風(fēng)靡用DeepSeek寫詩、寫科幻小說之前,DeepSeek的華麗文風(fēng),就讓小窗AI團(tuán)隊(duì)眼前一亮。

對于開發(fā)者們來說,他們?nèi)栽谄诖鼶eepSeek恢復(fù)調(diào)用,眼下無論是遷移到BAT們部署了滿血版DeepSeek R1的平臺,還是轉(zhuǎn)向其他大模型廠商,都似乎是“菀菀類卿”。

03

但競爭對手正在努力追平DeepSeek深度推理的出圈特長。

國內(nèi),近期百度、騰訊都陸續(xù)在自研大模型中加入深度思考能力;國外,OpenAI也在2月緊急上新“Deep Research”,把推理大模型的思考能力用于聯(lián)網(wǎng)搜索,并將對Pro、Plus和Team用戶開放。谷歌人工智能實(shí)驗(yàn)室(Google DeepMind)也在2月發(fā)布了Gemini 2.0模型系列,其中2.0 Flash Thinking實(shí)驗(yàn)版本則是一款增強(qiáng)推理能力的模型。

值得關(guān)注的是,DeepSeek仍然以文本閱讀為主,但不管是ChatGPT還是Gemini 2.0,在支持深度思考之余,都已經(jīng)將推理能力引入多模態(tài),支持視頻、語音、文檔、圖片等多種輸入模態(tài)。

對DeepSeek來說,在追趕多模態(tài)之余,更大的挑戰(zhàn)還來自競爭對手在價(jià)格上的逼近。

在云平臺部署側(cè),一眾頭部云廠商都選擇接入DeepSeek,一邊分食流量,一邊靠云服務(wù)綁定客戶。對DeepSeek大模型的調(diào)用,某種程度上甚至成了綁定企業(yè)云服務(wù)的“贈(zèng)品”。

百度創(chuàng)始人李彥宏近期提出,在大語言模型領(lǐng)域,“每12個(gè)月,推理成本就可以降低90%以上?!?/p>

在推理成本下降的趨勢下,BAT們的API調(diào)用價(jià)格持續(xù)走低已成必然,DeepSeek的性價(jià)比優(yōu)勢,正在迎來大廠新一輪價(jià)格戰(zhàn)的壓力。

不過,大模型API價(jià)格戰(zhàn)只是起步,面向開發(fā)者,大模型廠商們還拼起了服務(wù)。

林森接觸過大大小小眾多的大模型平臺,讓他印象深刻的是,某科技大廠會(huì)有專門的客戶經(jīng)理進(jìn)行對接,無論是不穩(wěn)定還是出現(xiàn)技術(shù)問題,都會(huì)主動(dòng)和開發(fā)者聯(lián)系。

而盡管作為一個(gè)開源的大模型平臺,目標(biāo)是為開發(fā)者提供更普惠的AI支持,DeepSeek甚至在官網(wǎng)沒有面向開發(fā)者出具發(fā)票的入口。

“每次API充值完,不像其他大模型平臺一樣可以直接在后臺開發(fā)票,DeepSeek需要繞到官網(wǎng)外,添加客服企業(yè)微信開具發(fā)票?!睏罨莩嬖V字母榜,無論是價(jià)格還是服務(wù),DeepSeek“性價(jià)比”的標(biāo)簽,似乎都有點(diǎn)立不穩(wěn)了。

某頭部大廠AI產(chǎn)品經(jīng)理告訴字母榜,有的互聯(lián)網(wǎng)公司leader堅(jiān)持用DeepSeek替換原有大模型,完全不管替換模型重新調(diào)整Prompt所耗費(fèi)的時(shí)間。同時(shí),即便滿血版的DeepSeek R1,也有不少通用能力如?Function calling等并不支持。

相比起用云服務(wù)跑通了B端服務(wù)場景的BAT們,在便捷度上,DeepSeek仍然差著AI大廠一截。

只是DeepSeek的流量效應(yīng)暫未褪去,趕潮人依然眾多。

有部分公司宣稱接入DeepSeek,只是開始調(diào)用API,充值了幾百塊。有的公司公告部署了DeepSeek模型,但其實(shí)只是讓員工看了看B站教程,下載了一鍵安裝包。在這波DeepSeek熱潮里,泥沙俱下,魚龍混雜。

潮水終將褪去,但DeepSeek要做的功課顯然更多了。

撰文:馬舒葉 編輯:趙晉杰

本文由人人都是產(chǎn)品經(jīng)理作者【字母榜】,微信公眾號:【字母榜】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 雖然第一批deepseek創(chuàng)始者已經(jīng)跑路,但現(xiàn)在deepseek依然被很多人熟知且運(yùn)用

    來自中國 回復(fù)