国精品午夜福利视频不卡麻豆，漂亮人妻被侵犯中出字幕，亚洲日本乱码字幕综合，亚洲精品国产原创电影在线，国产999免费观看，无码国产69精品久久久久，特级A级黄片手机免费在线，亚洲无码一级片免费在线播放

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線(xiàn)下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門(mén)專(zhuān)項(xiàng)技能課

1300+專(zhuān)題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專(zhuān)業(yè)技能直播

會(huì)員專(zhuān)屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

GPT-4變笨加劇，被曝緩存歷史回復(fù)：一個(gè)笑話(huà)講八百遍，讓換新的也不聽(tīng)

量子位

2023-11-02

0 評(píng)論 1602 瀏覽 0 收藏

9 分鐘

最近，有網(wǎng)友提出了質(zhì)疑，他認(rèn)為OpenAI會(huì)緩存歷史回復(fù)，并且讓GPT-4直接復(fù)述以前生成過(guò)的答案。那么，這個(gè)質(zhì)疑是否真的成立？一起來(lái)看看本文的分享。

有網(wǎng)友找到了GPT-4變“笨”的又一證據(jù)。

他質(zhì)疑：

OpenAI會(huì)緩存歷史回復(fù)，讓GPT-4直接復(fù)述以前生成過(guò)的答案。

最明顯的例子就是講笑話(huà)。

證據(jù)顯示，即使他將模型的temperature值調(diào)高，GPT-4仍重復(fù)同一個(gè)“科學(xué)家與原子”的回答。

就是那個(gè)“為什么科學(xué)家不信任原子？因?yàn)槿f(wàn)物都是由它們編造/構(gòu)造（make up）出來(lái)的”的冷笑話(huà)。

在此，按理說(shuō)temperature值越大，模型越容易生成一些意想不到的詞，不該重復(fù)同一個(gè)笑話(huà)了。

不止如此，即使咱們不動(dòng)參數(shù)，換一個(gè)措辭，強(qiáng)調(diào)讓它講一個(gè)新的、不同的笑話(huà)，也無(wú)濟(jì)于事。

發(fā)現(xiàn)者表示：

這說(shuō)明GPT-4不僅使用緩存，還是聚類(lèi)查詢(xún)而非精準(zhǔn)匹配某個(gè)提問(wèn)。

這樣的好處不言而喻，回復(fù)速度可以更快。

不過(guò)既然高價(jià)買(mǎi)了會(huì)員，享受的只是這樣的緩存檢索服務(wù)，誰(shuí)心里也不爽。

還有人看完后的心情是：

如果真這樣的話(huà)，我們一直用GPT-4來(lái)評(píng)價(jià)其他大模型的回答是不是不太公平？

當(dāng)然，也有人不認(rèn)為這是外部緩存的結(jié)果，可能模型本身答案的重復(fù)性就有這么高：

此前已有研究表明ChatGPT在講笑話(huà)時(shí)，90%的情況下都會(huì)重復(fù)同樣的25個(gè)。

具體怎么說(shuō)？

證據(jù)實(shí)錘GPT-4用緩存回復(fù)

不僅是忽略temperature值，這位網(wǎng)友還發(fā)現(xiàn)：

更改模型的top_p值也沒(méi)用，GPT-4就跟那一個(gè)笑話(huà)干上了。

（top_p：用來(lái)控制模型返回結(jié)果的真實(shí)性，想要更準(zhǔn)確和基于事實(shí)的答案就把值調(diào)低，想要多樣化的答案就調(diào)高）

唯一的破解辦法是把隨機(jī)性參數(shù)n拉高，這樣我們就可以獲得“非緩存”的答案，得到一個(gè)新笑話(huà)。

不過(guò)，它的“代價(jià)”是回復(fù)速度變慢，畢竟生成新內(nèi)容會(huì)帶來(lái)一定延遲。

值得一提的是，還有人似乎在本地模型上也發(fā)現(xiàn)了類(lèi)似現(xiàn)象。

有人表示：截圖中的“prefix-match hit” （前綴匹配命中）似乎可以證明確實(shí)是用的緩存。

那么問(wèn)題就來(lái)了，大模型到底是如何緩存我們的聊天信息的呢？

好問(wèn)題，從開(kāi)頭展現(xiàn)的第二個(gè)例子來(lái)看，顯然是進(jìn)行了某種“聚類(lèi)”操作，但具體如何應(yīng)用于深度多輪對(duì)話(huà)咱不知道。

姑且不論這個(gè)問(wèn)題，倒是有人看到這里，想起來(lái)ChatGPT那句“您的數(shù)據(jù)存在我們這兒，但一旦聊天結(jié)束對(duì)話(huà)內(nèi)容就會(huì)被刪除”的聲明，恍然大悟。

這不禁讓一些人開(kāi)始擔(dān)憂(yōu)數(shù)據(jù)安全問(wèn)題：

這是否意味著我們發(fā)起的聊天內(nèi)容仍然保存在他們的數(shù)據(jù)庫(kù)中？

當(dāng)然，有人分析這個(gè)擔(dān)憂(yōu)可能過(guò)慮了：

也許只是我們的查詢(xún)embedding和回答緩存被存下來(lái)了。

因此，就像發(fā)現(xiàn)者本人說(shuō)的：

緩存這個(gè)操作本身我不太擔(dān)心。

我擔(dān)心的是OpenAI這樣簡(jiǎn)單粗暴地匯總我們的問(wèn)題進(jìn)行回答，毫不關(guān)心temperature等設(shè)置，直接聚合明顯有不同含義的提示，這樣影響很不好，可能“廢掉”許多（基于GPT-4的）應(yīng)用。