ChatGPT vs. Microsoft Copilot vs. Gemini,到底哪個(gè)好?

0 評(píng)論 2551 瀏覽 0 收藏 9 分鐘

在過去一年里,AI工具的出現(xiàn)一定程度上改變了我們的工作和生活方式,那么,這些AI工具,誰更靠譜?不妨來看看本文的一個(gè)測(cè)評(píng)結(jié)果。

人工智能(AI)在過去的一年里徹底改變了我們的工作和娛樂方式,幾乎任何人都能夠編寫代碼、創(chuàng)造藝術(shù)甚至進(jìn)行投資。

不管是對(duì)于專業(yè)還是業(yè)余的使用者,生成式AI工具,如ChatGPT,給我們提供了從簡(jiǎn)單提示到創(chuàng)建高質(zhì)量?jī)?nèi)容的高級(jí)能力。

隨著Microsoft將GPT-4添加到Bing并將其更名為Copilot,OpenAI為ChatGPT增加了新功能,以及Bard被整合進(jìn)谷歌生態(tài)系統(tǒng)并重新品牌為Gemini,AI工具的更新迭代越來越快了。

那么:Microsoft Copilot Pro 與 OpenAI的ChatGPT Plus以及谷歌的Gemini:你認(rèn)為哪個(gè)值得你每月花20刀?我測(cè)試了這三個(gè)AI chatbot,一起來看看結(jié)果。

測(cè)試ChatGPT、Microsoft Copilot、Gemini。

首先我用了一個(gè)簡(jiǎn)單的邏輯問題來對(duì)比:

我今天有5個(gè)橙子,上周我吃了3個(gè)橙子。我還剩下多少個(gè)橙子?

答案應(yīng)該是五個(gè),因?yàn)槲疑现艹粤硕嗌賯€(gè)橙子并不影響我今天有多少個(gè)橙子,可以用這個(gè)來測(cè)試一下三個(gè)AI工具的邏輯能力。

一、首先是ChatGPT測(cè)試

ChatGPT于2022年11月發(fā)布。自發(fā)布開始,這款A(yù)I chatbot迅速獲得了超過1億用戶,僅網(wǎng)站每月就有18億訪問者。也一直是輿論的焦點(diǎn),幾乎每個(gè)新的AI工具發(fā)布出來都聲稱“遠(yuǎn)超 ChatGPT ”,ChatGPT儼然已成為行業(yè)的標(biāo)桿。

我?guī)缀趺刻於荚谑褂肅hatGPT,幫我解決了很多棘手的問題。

ChatGPT 3.5的結(jié)果:

ChatGPT 3.5 給出了一個(gè)錯(cuò)誤的答案

二、ChatGPT 4.0

ChatGPT 4.0 給出了正確的答案

ChatGPT 4.0 正確理解了問題的完整上下文并給出了正確答案。免費(fèi)的3.5版本的邏輯能力確實(shí)不如4.0。GPT-4據(jù)說擁有超過100萬億條數(shù)據(jù);GPT-3.5有1750億條數(shù)據(jù)。更多的數(shù)據(jù)本質(zhì)上意味著模型是基于更多數(shù)據(jù)進(jìn)行訓(xùn)練的,這使得它更有可能準(zhǔn)確地回答問題,減少錯(cuò)誤的可能性。

如果用GPT的話,更推薦使用4.0版本,不管是在功能上還是在回答的結(jié)果質(zhì)量上都甩ChatGPT3.5好幾條街。不過需要注意的是ChatGPT有條數(shù)限制是三個(gè)小時(shí)40條,如果超出了這個(gè)條數(shù)就需要等。

目前GPT4(ChatGPT Plus)賬號(hào)支持的功能還包括:海量插件 實(shí)時(shí)聯(lián)網(wǎng) 語音對(duì)話 圖片識(shí)別 文件上傳 數(shù)據(jù)分析能力 繪圖功能 代碼解析功能 自定義指令。

三、Microsoft Copilot 測(cè)試

接下來,我們來測(cè)試一下Microsoft Copilot(原名Bing chat),它其實(shí)相當(dāng)于免費(fèi)的低配版ChatGPT 4.0,已經(jīng)把ChatGPT整合進(jìn)了它的新Bing模型中。

與ChatGPT 3.5 相比,Copilot可以聯(lián)網(wǎng)來提供更當(dāng)前的信息并附帶信息來源。另外,Copilot由GPT-4驅(qū)動(dòng),是OpenAI的LLM,并且可以完全免費(fèi)使用。美中不足的是,一次對(duì)話中只能有五個(gè)回答,并且每個(gè)提示最多只能輸入2000個(gè)字符。

Copilot的精確對(duì)話風(fēng)格準(zhǔn)確回答了問題

Copilot的用戶界面不如ChatGPT那樣直觀,但它也比較易于導(dǎo)航,Bing Chat可以聯(lián)網(wǎng),可以得到比ChatGPT 3.5更新的結(jié)果,但我發(fā)現(xiàn)它比起ChatGPT更容易卡頓,有時(shí)候會(huì)漏掉一些指令。

如果你喜歡有更多的視覺特性,可以選擇Copilot。

通過對(duì)平臺(tái)的一系列升級(jí),Microsoft在Copilot中添加了視覺特性。當(dāng)問Copilot問題的時(shí)候,比如我問它”Tasmanian devil是什么?”,它給我的回復(fù)是一個(gè)信息卡片,包括照片、壽命、飲食等,這比起一大堆文字更容易讓人理解。

Copilot的回復(fù)

它還可以生成圖片,你只需要給它一個(gè)指令,就可以得到四張圖像。

Microsoft Copilot可以選擇不同的對(duì)話風(fēng)格,包括Creative、Balanced和Precise,這些風(fēng)格都會(huì)影響溝通交流的對(duì)話風(fēng)格。

Creative風(fēng)格的回復(fù)結(jié)果

Balanced風(fēng)格的回復(fù)結(jié)果

但是很明顯,Microsoft Copilot中的Balanced和Creative對(duì)話風(fēng)格的邏輯能力更弱一些,都沒有準(zhǔn)確回答我的問題。

最后,讓我們來看看谷歌的Gemini,以前的Bard,它使用了不同的LLM,并在過去幾個(gè)月中進(jìn)行了大力升級(jí)。

如果你想要一個(gè)快速、幾乎無限制的體驗(yàn),你可以試試Gemini。

現(xiàn)在 Gemini 相較于Bard有了巨大的改進(jìn)。Gemini 的回答速度很快,并且可以根據(jù)深入的溝通給出更加精確的答案,它的響應(yīng)速度比ChatGPT Plus慢,比Copilot要快。

Bard 的回答:

Bard 的回答

Gemini準(zhǔn)確地回答了問題,說明它的邏輯能力還是很不錯(cuò)的。

而在此之前的Bard版本的答案是剩下2個(gè)橘子,由此可見Gemini的更新在邏輯上的進(jìn)步很大。

Gemini沒有回應(yīng)數(shù)量的限制。你可以與谷歌的Gemini進(jìn)行長(zhǎng)時(shí)間的對(duì)話,而Bing和ChatGPT 4.0 都有條數(shù)的限制。

如果你想要完整的谷歌體驗(yàn),可以選擇Gemini。

谷歌還將更多的視覺元素納入了Gemini平臺(tái),比目前在Copilot上可用的要多。用戶還可以使用Gemini生成圖像,可以通過與谷歌鏡頭的整合上傳照片,并享受Kayak、OpenTable、Instacart和Wolfram Alpha插件。

另外,Extensions將廣泛的谷歌應(yīng)用程序整合進(jìn)了Gemini,Gemini現(xiàn)在正在逐漸增強(qiáng)完整的谷歌體驗(yàn)。Gemini用戶只需要在Gemini的對(duì)話框@對(duì)應(yīng)的谷歌工具,比如谷歌工作區(qū)、YouTube、谷歌地圖、谷歌航班和谷歌酒店等,從而享受更加個(gè)性化的體驗(yàn)。

調(diào)用谷歌maps

本文由 @AI魔法學(xué)園 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!