測評國內(nèi)主流6大智能問答軟件到底哪個最好用?
隨著科技的飛速發(fā)展,智能問答軟件已成為我們?nèi)粘I钪胁豢苫蛉钡囊徊糠帧1疚膶κ忻嫔狭笾髁鲉柎疖浖M行全面測評,探討它們各自的優(yōu)勢與不足,為您的選擇提供有力參考。
ChatGPT的出現(xiàn)引爆了智能問答市場,切切實實的改變了我們的生活和工作,賦能于各個行業(yè),帶來了技術(shù)和產(chǎn)業(yè)的變革,國產(chǎn)的大廠也紛紛跟進,做自己的智能問答平臺,如百度的文心一言、字節(jié)的豆包、騰訊的Kimi、阿里的通義千問、科大訊飛的訊飛星火、昆侖萬維的天工。
之前我也是科學上網(wǎng)用ChatGPT,還開了4.0的會員,但是自從國內(nèi)有了智能問答軟件,我就很少用ChatGPT了,今天我們就來全面測評一下,市面上這6大主流問答軟件到底哪個最好用?
一、總覽
備注:表格用AI生成的
二、功能
1. 文心一言
問心一言,主菜單包含對話、發(fā)現(xiàn)、發(fā)布(帖子、對話分享、創(chuàng)建智能體)、通知、我的。
對話,分為助手和最近,主要展示智能問答。
發(fā)現(xiàn),分為智能體和社區(qū),展示各種豐富的智能體,社區(qū)一個用戶互相交流AI生成的地方。
發(fā)布,主要是發(fā)布帖子、分享對話和創(chuàng)建智能體,基本都是智能問答的變體,沒有更加多樣的功能。
通知,主要展示發(fā)布帖子收獲的點贊、關(guān)注和評論。
2. 豆包
豆包,一進來是智能問答頁面,點擊返回,將回到主菜單,主菜單包含對話、發(fā)現(xiàn)、創(chuàng)建、通知、我的。
對話,展示最近的智能問答對話和一些常用的智能體。
發(fā)現(xiàn),針對不同場景的智能體,并且點擊創(chuàng)建可以自定義智能體,基本都是智能問答的變體,沒有更加多樣的功能。
通知應該就是展示一些系統(tǒng)通知或者一些需要時間模型生成的完成通知。
3. Kimi
Kimi,主菜單只有一個智能問答,智能體也隱藏在側(cè)邊欄,而且手機端不能自定義創(chuàng)建智能體,有微信的味道了,怎么簡潔怎么來。
4. 通義千問
通義千問, 主菜單包含助手(智能問答)、工具、角色、巴黎2024。
助手,主要功能是智能問答,但多了奧運信息和每日新鮮事。
工具,其實就是不同類型的智能體,不同的是官方為了鼓勵用戶創(chuàng)建不同類型的智能體,用一百萬作為激勵,還會提供一些雅思口語、托??谡Z等專業(yè)智能體。
角色,創(chuàng)建不同的角色,可以給它對話聊天,官網(wǎng)還提供打造專屬角色,如東方神話-十二生肖系列,通過抽卡的方式抽取不同有趣的角色。
巴黎2024,官方主推的智能體,如全民舞臺,可以導入視頻,視頻中人物可以替換成自定義的人物;追星星的AI,關(guān)愛孤獨癥兒童的AI繪本,可自定義主題,生成AI繪本。
5. 訊飛星火
訊飛星火的主菜單有對話、智能體、空間、我的。
對話,包含星火對話、語音暢聊、日常提醒助手和一些智能體,智能體包括數(shù)學答疑助手、星火合同助手、訊飛曉醫(yī)、訊飛公文、訊飛繪文、曉知、訊飛翻譯機、訊飛智文、寫作助手。
針對這些智能體,訊飛不只是一個輸入框簡單的智能問答,它針對了這些場景,進行深度的挖掘,做成了一個個小程序一樣。
比如訊飛繪文,簡直是自媒體工作者的福音,里面有選題庫、靈感庫,可以直接找到最熱最火的選題,然后生成文章,并且提供AI配圖,在線編輯完成后可以一鍵同步到百家號、微信公眾號、頭條號,而且還提供數(shù)據(jù)看板功能,可對這三個平臺的用戶量、閱讀數(shù)、總收益進行直觀的查看分析。
還有訊飛錄音筆,這個屬于科大訊飛的優(yōu)勢了,支持AI錄音、同聲傳譯,開會、出國旅游必備,識別準確率還是挺高的!
智能體,包含星火應用和應用廣場,很豐富,移動端就可支持自定義創(chuàng)建智能體。
空間,里面可保存文檔、圖片、音視頻,不管是AI生成的還是自己手機上傳的,都可以在這里統(tǒng)一查看和管理。
我的,包含自己創(chuàng)建的待辦、實時信息流、我的聲音、我的智能體。
6. 天工
天工的主菜單有主頁和我的,但是主頁又分成了對話、搜索、音樂、智能體四個子模塊。
對話、智能體,主要功能有智能問答和一些常用的智能體,主要分為創(chuàng)作、職場助手、圖像、高考助力、校色效率、生活娛樂、研究分析、其他,里面主題還是蠻豐富的,移動端不能自定義智能體,需要通過網(wǎng)頁端。
搜索,功能和交互類似百度,搜索框+信息流,但好的就是解決過濾掉了廣告,搜索分為簡潔、增強、研究。
簡潔模式就是第一條回答是通過AI,AI會簡單的進行回答,然后會將回答相對較好的網(wǎng)頁答案給展示出來,增強模式會參考更多的內(nèi)容,利用AI將答案進行拆解整理分析處理,展示大綱、思維導圖,還可以直接將內(nèi)容生成ppt,最后顯示參考的相關(guān)網(wǎng)頁內(nèi)容。研究相比增強來說,內(nèi)容整理更加專業(yè),也去掉了參考的相關(guān)網(wǎng)頁內(nèi)容。
這個搜索給好評,我發(fā)現(xiàn)真的,自從有了智能問答之后,很少會用百度了,百度廣告是真多!!
音樂,這個是天工創(chuàng)新的點,有別于其他智能問答app的,而且還專門開發(fā)了微信小程序天工AI寫歌,可以根據(jù)一些關(guān)鍵詞,選擇對應的曲風,就可以快速的生成一首歌曲,我以《自由》為主題,一套詞,會生成兩種曲風的歌,詞說實話寫的還湊合,比較直白簡單粗暴,曲的話我覺得還不錯,有前奏、間奏、主歌、副歌,前奏是女生獨唱,主歌換成了男生,曲子動感也不單調(diào),樂器的使用也很豐富。
三、智能問答能力
1. 文字回答
1)語境辨析
問題:張三打了李四一巴掌,李四對張三說:”你是不是沒吃飯”,李四說這句話含義是?
答案:表達張三打的輕了
從標準答案上看,文心一言回答的最好,敢于給出自己的答案,并且更接近人的分析,豆包、訊飛星火、Kimi、通義千問、天工只是分析,不給答案,讓用戶自己分析。
2)數(shù)學運算
問題:用5個1怎么計算得到6?
答案:(1+1)*(1+1+1)=6
從標準答案上看,文心一言和訊飛星火答案準確,其他都回答錯誤,文心一言和訊飛星火從回答的簡潔和理解相對容易得角度上,文心一言較好,訊飛星火感覺把簡單的問題復雜化了。
3)腦筋急轉(zhuǎn)彎
問題:爸媽結(jié)婚了,為什么不邀請我去參加婚禮?
答案:那個時候你還沒出生,怎么可能邀請你。
這個問題就是腦筋急轉(zhuǎn)彎,文心一言和豆包知道這是個腦筋急轉(zhuǎn)彎,因此直接給出了答案,更像人的反應。而訊飛星火、Kimi、通義千問、天工理解成了正常的問題,針對不同的場景給出了分析,不能說不對,只是說沒有理解這個問題的本質(zhì)。
4)實時熱點
問題:美國最新的總統(tǒng)最有可能是誰?
答案:結(jié)合熱點分析民主黨的哈里斯和共和黨的特朗普支持現(xiàn)狀,以及提到退出競選的拜登。
除了天工、訊飛星火,其他回答的都回答的相對正確,因為是不確定的一件事,AI只會給到分析,不會給到一個確切的答案,文心一言分析回答相對比較全面,豆包次之,最有意思的我覺得是Kimi,會結(jié)合國外的預測模型和博彩網(wǎng)站的賠率,來側(cè)面反應勝率高低。
5)和自己產(chǎn)品有關(guān)的問題
問題:百度的文心一言、字節(jié)的豆包、騰訊的Kimi、阿里的通義千問、科大訊飛的訊飛星火、昆侖萬維的天工哪個能力最強?
答案:正確的分析出各自的優(yōu)勢即可。
這個問題下,要批評一下天工和訊飛星火,讓你全面介紹呢,不是讓你借此宣傳自己產(chǎn)品呢,其他的回答的都還不錯,還是文心一言介紹的相對比較全面,挺有意思的是Kimi,哈哈,我狠起來連自己都批評【但在信息檢索測試中,引用的文章發(fā)布時間有些雜亂,包含較早的文章】
2. 文生圖
問題:幫我畫一個騎摩托車的孫悟空,Q版。
Kimi不支持文生圖,其他都可以,至于最后生成的結(jié)果來看,我人為豆包生成的最好,而且一下生成了4張,供用戶挑選,文心一言、通義千問、訊飛星火的有點抽象了~
3. 圖像識別能力
問題:里面有幾個人,男生和女生各有幾個?
答案:10個人,5男5女
文心一言:根據(jù)圖片內(nèi)容,里面有十個人。具體來說,男生有五個,女生也有五個。這些人都聚集在海灘上,跳躍著,似乎正在享受快樂的時光。所以,回答你的問題:里面有十個人,男生五個,女生五個。
訊飛星火:圖像中有九個人,其中男生有六個,女生有三個。
通義千問:圖片中有9個人。由于圖片是剪影效果,無法確定具體性別,但可以大致看出有男性和女性的身形差異。
天工:在圖中,有四個人物,包括兩個男孩和兩個女孩。他們看起來都玩得很開心。
這張圖其實蠻有難度的,因為是背光,人臉識別難度大,豆包和Kimi不支持圖像識別,其他軟件都支持,從結(jié)果上看,文心一言最準確,而且還說明了人物的狀態(tài)。訊飛星火、通義千問、天工雖然回答了,但是數(shù)量和男女都不對。
4. ppt
問題:幫我生成一個科技公司新人試用期匯報ppt
除了訊飛星火,其他產(chǎn)品都不具備直接生成ppt的功能,只能生成ppt大綱,雖然生成的ppt里面的字有些錯亂,也沒有相關(guān)配圖,但聊勝于無,做ppt的小伙伴們都知道,做ppt最難的就是內(nèi)容和排版找配圖,內(nèi)容現(xiàn)在大家生成的大綱基本都能滿足需求,就是再優(yōu)化一下排版和配圖,或者內(nèi)容圖片我找好上傳給我一個一鍵排版,絕對能極大的增加用戶的工作效率。
5. 視頻生成
除了訊飛星火,其他軟件端暫時都不支持文字轉(zhuǎn)視頻功能,都只能生成視頻腳本。
還可以根據(jù)自己定制形象,生成想要的視頻效果,我自己生成下,然后輸入一段兩小兒辯日中的一些文字,文字表達和嘴型兼職一模一樣。
四、總結(jié)
從功能層面上,功能豐富度和可玩性這方面來看,通義千問和天工有點意思,較強的娛樂屬性;
從智能體上,我覺得最強的應該就是訊飛星火,支持視頻、ppt生成,功能的深度和體驗上不像是一個智能體,都可以單獨做成小程序或者app;
很多人其實只用智能問答,用不上其他功能的話,但從界面上看,Kimi最簡潔直接。
從AI智能問答能力上看,語境辨析、數(shù)學運算、腦筋急轉(zhuǎn)彎、時事熱點、和自己有關(guān)的問題上看,文心一言的能力相對較強,對于文生圖看,豆包較強。
其實文心一言對于文字的處理能力強,也在意料之內(nèi),因為AI要智能,肯定是基于海量的數(shù)據(jù)訓練,而百度作為搜索的入口,擁有海量的用戶數(shù)據(jù),這對于AI能力的提升有很大的幫助。
對于AI,我覺得現(xiàn)在的AI的軟件其實是泛場景化的,針對不同的場景提供各種AI的能力,但是不同場景的用戶有不同的使用需求和痛點,需要去深挖和研究,就像天工針對音樂這塊的能力,這個就是它的亮點,降低音樂制作的門檻,提供音樂制作的效率。
還有我上面提到的ppt,其實已經(jīng)有專門的網(wǎng)站,但是效果還是差強人意,如果真的可以通過一些文字直接生成一個高檔上的ppt,或者我導入ppt給我一鍵排版,生成想要的配圖,真的能解決用戶的一大難題,商業(yè)價值也是巨大的。
各家其實都有各家的優(yōu)勢所在,如果用戶想體驗還要下載不同的app,我覺得最近周鴻祎聯(lián)合16家大模型組成統(tǒng)一戰(zhàn)線,一起發(fā)揮各自大模型的優(yōu)勢,一起為用戶服務這個行為,值得點贊,大家共同發(fā)展,一起為了國產(chǎn)AI崛起而努力。
本文由人人都是產(chǎn)品經(jīng)理作者【晨陽產(chǎn)品筆記】,微信公眾號:【晨陽產(chǎn)品筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
看下來感覺各平臺還是沒有打出差異化,沒有特別專精某一方面,只有不太大的閃光點
是的,之后發(fā)展肯定會像某個領(lǐng)域發(fā)展,就像天工一樣,主要亮點就是音樂生成這塊的能力和服務。