嗯,我從「文心一言」發(fā)布會(huì)回來了

0 評(píng)論 3759 瀏覽 0 收藏 9 分鐘

昨天,百度正式發(fā)布了AI產(chǎn)品「文心一言」。據(jù)說發(fā)布會(huì)現(xiàn)場是錄播,網(wǎng)上看直播的觀眾也超過了百萬級(jí)別。但市場的反應(yīng)不一:有股價(jià)跳水的,有V我50的,真實(shí)的情況,我們看看作者自己的親身經(jīng)歷。

從我家到百度科技園,我單程需要跨越 66 公里,花費(fèi) 3 個(gè)小時(shí)。去現(xiàn)場參加發(fā)布會(huì)絕對(duì)不是第一時(shí)間領(lǐng)略「文心一言」魅力的最佳方案。

實(shí)際上,在現(xiàn)場可以看到的內(nèi)容,和直播的內(nèi)容基本一致。在現(xiàn)場能看到的也是錄屏演示,沒有額外「加餐」。

當(dāng)我回到家安頓下來再打開電腦,已經(jīng)有少量真實(shí)截圖,以及一個(gè)簡單的評(píng)測出來了。實(shí)際上,今晚開始確實(shí)有一批媒體會(huì)首先拿到邀請(qǐng)碼,推出相對(duì)簡單的評(píng)測。而未來幾天,預(yù)計(jì)會(huì)有更多人拿到邀請(qǐng)碼,相信也會(huì)有更深度的評(píng)測出現(xiàn)。

我觀察到一個(gè)挺有意思的現(xiàn)象,有一兩個(gè)微博上的娛樂營銷號(hào),在發(fā)布會(huì)剛結(jié)束,就發(fā)布了相信是來自「文心一言」的截圖。另一些則是濫竽充數(shù),比如我看到有個(gè)博主說是「文心一言」的截圖,實(shí)際上來自另一款產(chǎn)品「寫作貓」。

這提醒了一個(gè)之前我沒有注意到的可能,就是對(duì) AI 聊天畫面造假。例如有一張 ChatGPT 的問答,展示了它可以正確識(shí)別「文心一言邀請(qǐng)碼:KFCV50」這個(gè)段子的含義。然而我實(shí)際拿去測試了 GPT-3.5、GPT-4 和必應(yīng),結(jié)果是不論是否聯(lián)網(wǎng),圖里的回答都不可復(fù)現(xiàn)。

從技術(shù)上,對(duì)網(wǎng)頁截圖造假非常容易,只要打開瀏覽器的 F12 開發(fā)者工具就可以修改相應(yīng)段落,不需要 P 圖。作為對(duì)應(yīng),「文心一言」的界面樣式在發(fā)布會(huì)上已經(jīng)公布,而其真實(shí)的界面截圖都帶有唯一的浮水印。

差評(píng)做的評(píng)測也許是第一個(gè)完整的「文心一言」評(píng)測,其中測試了發(fā)布會(huì)沒提到的編程功能,以及以表格方式呈現(xiàn)結(jié)果。這說明「文心一言」的相關(guān)「涌現(xiàn)」能力其實(shí)已經(jīng)展露,但因?yàn)樗懔Σ罹鄶[在那里,不能預(yù)期它發(fā)揮跟 ChatGPT 一樣穩(wěn)定,出現(xiàn)不可控結(jié)果是完全有可能的。

在 ChatGPT 以及新必應(yīng)搜索剛剛引起社會(huì)關(guān)注時(shí),很多關(guān)于它「發(fā)瘋」或出現(xiàn)滑稽結(jié)果的報(bào)道,一度讓人懷疑它的實(shí)際能力。但當(dāng)大家逐漸用上之后,有些擔(dān)心自然而然地消失了。我覺得,一個(gè)對(duì)讀者有意義的評(píng)測,或許不應(yīng)該聚焦于如何讓生成式 AI 突破禁錮或「發(fā)瘋」,而是看它可不可以完成一些實(shí)際任務(wù),可以真正作為生產(chǎn)力工具使用。

至少目前已經(jīng)可以證明:這次發(fā)布的「文心一言」并不害怕真機(jī)評(píng)測。在發(fā)布會(huì)使用預(yù)錄視頻,或許只是想讓發(fā)布會(huì)的流程更順暢一些。

整場活動(dòng)大多都是演講,講的內(nèi)容或多或少之前都有線索可循。像我昨天預(yù)測的可能會(huì)用到百度自家的知識(shí)圖譜,結(jié)果今天發(fā)現(xiàn)果然如此,官方說法叫「知識(shí)增強(qiáng)」。而所有的發(fā)言其實(shí)都圍繞著一個(gè)目的,就是「預(yù)期管理」。

鑒于 OpenAI 的技術(shù)實(shí)力即使在硅谷范圍里也是遙遙領(lǐng)先,沒有任何理由要求「文心一言」剛發(fā)布就趕上乃至超越 ChatGPT。整場發(fā)布會(huì)的很多地方都希望大家能真實(shí)認(rèn)識(shí)到這一點(diǎn),正如我昨天所說:「跟 ChatGPT 比了不行是意料之中的,如果有地方勝出,那就是意外收獲?!?/p>

另一個(gè)需要「管理」的預(yù)期,或許是「文心一言」的響應(yīng)速度。預(yù)錄視頻可以說明兩個(gè)問題:

  1. 「文心」大模型拆分 token(可以理解為不可拆分的最小生成單位)的方法可能和 GPT 不同。當(dāng)你留心觀察 ChatGPT 輸出答案的動(dòng)畫時(shí),可以發(fā)現(xiàn)它是一兩個(gè)詞這么往外「蹦」字,實(shí)際上代表了 token 在被消耗。而「文心一言」輸出答案則是非常流暢地從頭輸出到尾,這可能因?yàn)樗x擇了獲得全部回答之后才展現(xiàn)出來,也可能就是拆 token 的方法不一樣,單個(gè) token 意味著更長的字符串。
  2. 響應(yīng)速度肯定是理想狀態(tài),實(shí)際使用可能會(huì)慢一些?,F(xiàn)在「文心一言」就沒幾個(gè)人用,即使過幾天估計(jì)也只是小范圍測試,所以這段時(shí)間的響應(yīng)都會(huì)很快。但不要忘記生成式 AI 時(shí)時(shí)刻刻都在消耗算力。今天下午,或許是因?yàn)檫M(jìn)不去「一言」就轉(zhuǎn)而測試「一格」的緣故,生成圖片的工具「文心一格」排隊(duì)速度比平時(shí)肉眼可見的減慢,似乎涌進(jìn)了更多的用戶。所以等輪到你用「文心一言」的時(shí)候,也有可能對(duì)百度的算力會(huì)提出一些挑戰(zhàn)。不過,百度本身有云服務(wù),而且曾經(jīng)服務(wù)過春晚這種超大型并發(fā),所以也或許到時(shí)候會(huì)優(yōu)化得比現(xiàn)在好很多。

所以,隨著發(fā)布會(huì)的進(jìn)行,百度股價(jià)跌一點(diǎn)是完全在預(yù)期之中的,甚至可以說「小跌算漲」。發(fā)布會(huì)采用錄播可能進(jìn)一步把當(dāng)天的股價(jià)壓了點(diǎn),但「文心一言」其實(shí)并不害怕就這樣接受實(shí)測。所以稍給一點(diǎn)時(shí)間,股價(jià)就有漲回來的空間。

美股開盤后,百度 ADR 走勢如下 ↓

最后,你問我能不能拿到邀請(qǐng)碼也做個(gè)評(píng)測?

我哪知道?。ㄎ⑿Γ?/p>

題圖:使用「文心一言」作畫時(shí),它會(huì)讓你精準(zhǔn)給出 prompt,舉的例子是「幫我畫一枝晶瑩剔透的牡丹花」。我用「文心一格」畫了這個(gè) prompt。

專欄作家

書航,微信公眾號(hào):航通社 (ID:lifeissohappy),人人都是產(chǎn)品經(jīng)理專欄作家。提供全原創(chuàng)科技新聞和觀點(diǎn)。為您呈現(xiàn)文字有力、觀點(diǎn)鮮明、打動(dòng)人心的文章。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖使用「文心一言」作畫時(shí),它會(huì)讓你精準(zhǔn)給出 prompt,舉的例子是「幫我畫一枝晶瑩剔透的牡丹花」。我用「文心一格」畫了這個(gè) prompt。

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!