AIGC工具全面審視:生成式AI在實(shí)際應(yīng)用中的表現(xiàn)如何?
過去這一年,全球涌現(xiàn)出了眾多生成式AI產(chǎn)品。在這篇文章中,我們將探討這些工具的表現(xiàn),通過實(shí)際體驗(yàn)和評(píng)估,為讀者提供一個(gè)關(guān)于當(dāng)前AI工具的全面視角。
2023年,AI技術(shù)迎來了其發(fā)展史上的一次重大飛躍。隨著技術(shù)突破和令人矚目的產(chǎn)品陸續(xù)亮相,AI不僅成為了技術(shù)界的焦點(diǎn),也深深吸引了資本的目光。這一年,AI展現(xiàn)出了前所未有的發(fā)展勢(shì)頭,無論是在基礎(chǔ)模型能力、實(shí)際應(yīng)用場(chǎng)景,還是資本投入方面都取得了顯著進(jìn)展。
特別是在2022年11月30日,OpenAI發(fā)布了ChatGPT,標(biāo)志著AI技術(shù)的一個(gè)新紀(jì)元。緊接著,在2023年1月,ChatGPT的月活躍用戶數(shù)突破1億大關(guān),創(chuàng)下了歷史新高,彰顯了全球AI市場(chǎng)的爆發(fā)潛力。
伴隨這股勢(shì)頭,全球范圍內(nèi)涌現(xiàn)出眾多創(chuàng)新的生成式AI工具,它們按功能可以劃分為:文本生成、圖像創(chuàng)作、音視頻處理等多個(gè)類別。在這篇文章中,我們將探討這些工具的表現(xiàn),通過實(shí)際體驗(yàn)和評(píng)估,為讀者提供一個(gè)關(guān)于當(dāng)前AI工具的全面視角。
一、ChatGPT-4
所屬公司:OpenAI 發(fā)布時(shí)間:2023年5月8日 榜單:#2 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
2023年3月15日,OpenAI宣布推出GPT-4,這標(biāo)志著大型語言模型進(jìn)入了一個(gè)新階段。相較于前代產(chǎn)品GPT-3.5,GPT-4不僅在處理自然語言方面取得了顯著提升,而且在多語言處理能力上也有了重大突破。更值得一提的是,GPT-4引入了“多模態(tài)”功能,支持圖像和語音輸入,甚至可以輸出圖片,大大拓寬了其應(yīng)用范圍。
界面體驗(yàn)
ChatGPT-4的用戶界面呈現(xiàn)了現(xiàn)代化和直觀的設(shè)計(jì)風(fēng)格,其簡潔的設(shè)計(jì)語言和優(yōu)化的用戶操作流程極大地便利了用戶與系統(tǒng)的交互。界面的清晰度和直觀性使得用戶即便是初次使用,也能輕松上手。
使用感受
作為商業(yè)化應(yīng)用的初代大型語言模型,ChatGPT-4在專業(yè)知識(shí)獲取、文案生成、上下文理解等方面表現(xiàn)出色。答案的完整性和連貫性同樣值得稱贊。然而,最近的使用體驗(yàn)中發(fā)現(xiàn)模型在生成答案時(shí)偶有不穩(wěn)定現(xiàn)象,可能與OpenAI目前的資源分配有關(guān)。
不過,總體來說,ChatGPT-4在提供高效、準(zhǔn)確回答方面依然表現(xiàn)卓越。
二、通義系列
阿里巴巴旗下的通義系列包含多款A(yù)I大模型,如通義千問(語言模型)、通義萬相(藝術(shù)創(chuàng)作模型)、通義聽悟(音視頻模型)和通義智文(AI閱讀助手),它們?cè)诙鄠€(gè)領(lǐng)域如電商、設(shè)計(jì)、對(duì)話和法律分析中發(fā)揮著重要作用。
平時(shí)工作生活中使用的較多的是通義千問、通義萬相、通義聽悟、通義智文幾種,幫助我獲取整理專業(yè)知識(shí),獲取靈感以及快速閱讀:
通義千問:多模態(tài) AI 大模型
所屬公司:阿里巴巴 發(fā)布時(shí)間:2023年10月31日 榜單:#28 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
界面體驗(yàn):
通義千問擁有簡潔而一致的頁面布局,提供沉浸式的問答體驗(yàn)。界面無過多修飾,專注于核心功能,使用戶更易于集中注意力在問題與回答上。
使用感受:
在語義理解和答案準(zhǔn)確度方面,通義千問表現(xiàn)優(yōu)異,尤其在處理千字以內(nèi)的查詢時(shí),回答流暢且無明顯間斷。
通義萬相:AI 藝術(shù)創(chuàng)作模型
界面體驗(yàn):
萬相的界面以深色模式為主,突出了圖片生成區(qū)域,同時(shí)提供了關(guān)鍵詞選項(xiàng),便于用戶快速進(jìn)行創(chuàng)作。
使用感受:
雖然在人物圖像創(chuàng)作方面表現(xiàn)較好,但在抽象圖標(biāo)和文本引導(dǎo)的圖片生成方面仍有提升空間。圖片細(xì)節(jié)處理方面也存在一定的挑戰(zhàn)。
通義聽悟
一個(gè)非常好的在線會(huì)議、視頻學(xué)習(xí)、播客學(xué)習(xí)等音視頻轉(zhuǎn)文字并且整理以及摘要的平臺(tái)。
界面體驗(yàn):
聽悟的界面設(shè)計(jì)強(qiáng)調(diào)智能感,功能入口明確,降低了用戶學(xué)習(xí)成本。其功能覆蓋了視頻轉(zhuǎn)錄、實(shí)時(shí)解析等多種場(chǎng)景。
使用感受:
- 實(shí)時(shí)記錄場(chǎng)景:語音識(shí)別以及文本轉(zhuǎn)錄的內(nèi)容準(zhǔn)確度挺高,較為嘈雜的場(chǎng)景也能比較準(zhǔn)確的識(shí)別文字;
- 視頻場(chǎng)景:能夠提取摘要,并且能區(qū)分講話人進(jìn)行總結(jié),以及生成 PPT且定位,但是PPT僅僅是截取視頻的整個(gè)畫面;
- 播客場(chǎng)景:暫不支持摘要提取,只能復(fù)制文本內(nèi)容,需要自行加工;
通義智文:一個(gè)文檔電子書籍快速整理閱讀的 AI 平臺(tái)
界面體驗(yàn):
智文的界面簡約,主要聚焦于閱讀體驗(yàn)。
使用感受:
閱讀場(chǎng)景覆蓋全面,對(duì)于電子書籍,智文能夠提供準(zhǔn)確的全文摘要和章節(jié)總結(jié),極大地提高了閱讀效率。(移動(dòng)端推薦 “Cubox” 對(duì)于間斷的公眾號(hào)、網(wǎng)頁文章體驗(yàn)不錯(cuò),就是需要付費(fèi)體驗(yàn)摘要、問答等 AI 能力)
三、天工 AI
所屬公司:北京昆侖萬維科技股份有限公司 發(fā)布時(shí)間:2023年7月5日 榜單:#15 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
天工AI是由奇點(diǎn)智源和昆侖萬維聯(lián)合開發(fā)的一款綜合型大模型平臺(tái),它集成了搜索、對(duì)話和創(chuàng)作等多種功能。
界面體驗(yàn):
- 天工AI采用了瀏覽器式的界面布局,這種設(shè)計(jì)貼合了產(chǎn)品的功能定位。然而,其背景設(shè)計(jì)較為復(fù)雜,可能會(huì)對(duì)用戶造成視覺疲勞。
- 功能入口清晰,便于新用戶快速熟悉并使用各項(xiàng)功能。
使用感受:
- 在回答問題方面,天工AI展現(xiàn)出了較高的答案完整性。它能夠結(jié)合全網(wǎng)搜索,提煉并展示相關(guān)的新聞資訊鏈接,這不僅提高了回答的可信度,也增強(qiáng)了專業(yè)性。
- 答案生成過程中,天工AI能夠準(zhǔn)確標(biāo)注信息來源,這是其一個(gè)突出的特點(diǎn),幫助用戶理解答案的依據(jù)。
- 天工AI在處理各類信息時(shí)表現(xiàn)出色,能夠快速匹配并提供豐富的背景資料,滿足用戶的多元化需求。
四、kimi
所屬公司:Moonshot AI 發(fā)布時(shí)間:2024年1月12日 榜單:#13 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
Kimi Chat是Moonshot AI推出的一款功能豐富的工具,專注于整理資料、處理文件和提供快速網(wǎng)址訪問。它在簡化日常工作流程方面展現(xiàn)出了顯著的優(yōu)勢(shì)。
界面體驗(yàn):
- Kimi Chat采用了簡潔而清晰的界面設(shè)計(jì),以瀏覽器形式呈現(xiàn),為用戶提供了舒適和直觀的使用體驗(yàn)。
- 背景設(shè)計(jì)干凈且現(xiàn)代,這不僅降低了視覺干擾,也增加了用戶操作的便捷性。
使用感受:
- Kimi Chat在速讀新聞和總結(jié)文章方面表現(xiàn)突出。它能夠快速解析和歸納大量信息,極大地提高了工作效率。
- 與天工AI相似,Kimi Chat在回答問題時(shí)會(huì)聯(lián)網(wǎng)搜索相關(guān)新聞資訊,盡管它在信息來源的廣度上不如天工AI全面,但在文章鏈接和電子書籍的快速解析上則表現(xiàn)更為出色。
- 綜合來看,Kimi Chat在快速處理和總結(jié)大量文本資料方面具有明顯優(yōu)勢(shì),尤其適合于快節(jié)奏的工作環(huán)境。
五、文心一言
所屬公司:百度 發(fā)布時(shí)間:2023年6月29日 榜單:#8 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
文心一言,作為百度研發(fā)的全新一代知識(shí)增強(qiáng)大語言模型,不僅在對(duì)話互動(dòng)上表現(xiàn)出色,還在問題解答和創(chuàng)作協(xié)助方面提供了高效的幫助。該模型特別擅長文案生成和潤色,以及幫助用戶制定計(jì)劃和獲取信息。
界面體驗(yàn):
- 文心一言的界面設(shè)計(jì)采用了直觀簡潔的布局,減少了視覺上的干擾,使用戶能夠?qū)W⒂趩柎鸾换ァ?/li>
- 界面上無多余修飾,提供了沉浸式的用戶體驗(yàn),使得信息檢索和交互過程更為流暢。
使用感受:
- 在專業(yè)知識(shí)回答方面,文心一言的表現(xiàn)略遜于通義千問,但在文案潤色和計(jì)劃制定等方面的能力卻十分出色,特別適合用于日常的文案處理任務(wù)。
- 獨(dú)特之處在于,文心一言在用戶輸入完畢后能夠提供一鍵優(yōu)化指令的功能,這一點(diǎn)在用戶體驗(yàn)上極為便捷。
- 盡管在生成過程中偶有卡頓,但整體而言,文心一言在幫助用戶高效獲取信息和知識(shí)方面發(fā)揮了顯著的作用。
六、訊飛星火
所屬公司:科大訊飛 發(fā)布時(shí)間:2024年6月13日 榜單:#21 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
訊飛星火是科大訊飛推出的新一代認(rèn)知智能大模型,它憑借其跨領(lǐng)域的知識(shí)庫和語言理解能力,為用戶提供自然對(duì)話方式的任務(wù)理解和執(zhí)行。這一模型不斷從海量數(shù)據(jù)中學(xué)習(xí),致力于解決問題的全流程閉環(huán),從提出問題到規(guī)劃解決方案。
界面體驗(yàn):
訊飛星火的界面設(shè)計(jì)遵循了AI大模型的常規(guī)布局,提供了沉浸式的問答體驗(yàn)。界面簡潔,無過多修飾,便于用戶專注于與模型的交互。
使用感受:
- 雖然在專業(yè)知識(shí)方面的表現(xiàn)略顯不足,但其在邏輯推理、解題和寫作等教育相關(guān)領(lǐng)域表現(xiàn)出色。
- 在實(shí)際應(yīng)用中,訊飛星火特別適合于教育和學(xué)習(xí)場(chǎng)景,其對(duì)問題的理解和答案的提供都表現(xiàn)得十分專業(yè)。
七、智普清言
所屬公司:智譜華章 發(fā)布時(shí)間:2023年8月14日 榜單:#26 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
智普清言,由智譜AI公司在2023年訓(xùn)練的GLM-4語言模型,是一款基于深度學(xué)習(xí)技術(shù)的自然語言處理模型。通過學(xué)習(xí)大量文本數(shù)據(jù),它能夠理解和生成自然語言,針對(duì)用戶問題和需求提供適當(dāng)?shù)拇饛?fù)和支持。
界面體驗(yàn):
- 智普清言的界面遵循AI大模型的常規(guī)布局,提供沉浸式問答體驗(yàn)。界面設(shè)計(jì)集中在功能性和易用性,助于用戶快速理解并使用各項(xiàng)功能。
- 智普清言特別增加了功能入口和靈感大全,提升了操作便利性,使用戶易于接觸和探索更多功能。
使用感受:
- 在處理一些專業(yè)或深層次問題時(shí),表現(xiàn)有較大的驚喜,其回答的準(zhǔn)確性和深度表現(xiàn)不錯(cuò)。
- 智普清言在生成式的回答方面也表現(xiàn)不俗,可以生成較為流暢和通順的回答。
- 智普清言在回答完成之后還會(huì)根據(jù)歷史提問智能推薦相關(guān)問題或知識(shí),幫助用戶更加深入了解。
- 智普清言還能自己定制智能助手,并且按照自己的專業(yè)喜好進(jìn)行訓(xùn)練,幫助用戶更好的完成專業(yè)工作或者處理生活事項(xiàng)。
八、Gemini
所屬公司:Google 發(fā)布時(shí)間:2024年2月6日 榜單:#13 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
Gemini 是 Google 推出的原生多模態(tài)大模型,Google 稱 Gemini 是其歷史上最強(qiáng)大、最通用的模型,在許多基準(zhǔn)測(cè)試中都具有最先進(jìn)的性能。Google DeepMind 的 CEO Demis Hassabis 稱 Gemini 可以像人類一樣理解我們周圍的世界,并吸收任何類型的輸入和輸出,包括文本、代碼、視頻、音頻和圖像。Gemini 模型從大到小分為 Ultra,Pro,Nano 三個(gè)版本。其中 Pro 版本已經(jīng)整合到谷歌的 Bard 平臺(tái)中,但目前僅支持英文地區(qū)的用戶使用。
界面體驗(yàn):
- Gemini的界面設(shè)計(jì)緊隨其功能多樣性,呈現(xiàn)出極簡風(fēng)格,便于用戶專注于與模型的互動(dòng)。
- 雖然在模型能力介紹方面的信息不如其他平臺(tái)詳盡,略增加了用戶學(xué)習(xí)成本,但整體上為用戶提供了清晰、直觀的交互體驗(yàn)。
使用感受:
- Gemini背靠Google強(qiáng)大的搜索引擎,特別在基于網(wǎng)絡(luò)搜索的問題處理方面表現(xiàn)出色。它能夠整合網(wǎng)絡(luò)資源,提供全面、多樣的答案。
- 對(duì)于專業(yè)性較高的問題,Gemini的表現(xiàn)尚有提升空間,可能與語言處理能力相關(guān)。在答案的完整性和專業(yè)度方面相比通義千問有所不足。
- 總體來看,Gemini在多模態(tài)處理和網(wǎng)絡(luò)資源整合方面展現(xiàn)了顯著的優(yōu)勢(shì),尤其適合處理需要廣泛信息整合的查詢。
九、Claude
Claude是Anthropic開發(fā)的一款人工智能聊天機(jī)器人,Claude可以理解自然語言并生成相應(yīng)的回復(fù),和人類進(jìn)行基本的對(duì)話與交流,相比其他大模型語言更加人性化,Claude具有一定的情感理解能力,可以從對(duì)話中解析出對(duì)方的情緒變化和態(tài)度,并在一定程度上調(diào)整自己的回應(yīng)語氣。Claude的知識(shí)和理解能力還比較有限,它更類似于一個(gè)知識(shí)圖譜+搜索引擎,可以在已有知識(shí)上快速匹配和檢索信息,但還無法進(jìn)行復(fù)雜的推理或深入分析。
界面體驗(yàn):
- Claude的界面設(shè)計(jì)保持了簡約風(fēng)格,便于用戶進(jìn)行流暢的交互。這種設(shè)計(jì)雖不復(fù)雜,但卻充分滿足了與AI進(jìn)行自然對(duì)話的需求。
- 用戶界面注重功能性和易用性,使得即使是初次接觸的用戶也能快速上手。
使用感受:
- Claude在自然語言處理方面表現(xiàn)出色,尤其是在理解用戶輸入和生成人性化回應(yīng)方面具有顯著優(yōu)勢(shì)。
- 盡管知識(shí)和分析能力相對(duì)有限,它更像是結(jié)合了知識(shí)圖譜和搜索引擎的工具,能在已有知識(shí)范圍內(nèi)快速匹配和檢索信息。
- 在實(shí)際使用中,Claude尤其適合于需要情感理解和基本信息檢索的場(chǎng)景,提供了友好和自然的交流體驗(yàn)。
十、Perplexity AI
所屬公司:Perplexity AI 發(fā)布時(shí)間:2023年3月27日 榜單:#47 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
Perplexity AI是一個(gè)先進(jìn)的AI工具,專注于提供深入的、以問題為中心的搜索和分析。它通過理解和分析用戶的查詢,提供相關(guān)和深度的答案,不僅僅是傳統(tǒng)搜索引擎的結(jié)果列表。
界面體驗(yàn):
- Perplexity AI的界面簡約,突出搜索功能,減少了視覺干擾,使用戶更易于專注于搜索任務(wù)。
- 所有功能都是直觀的,提升易用性。
使用感受:
- 整個(gè)搜索和獲取答案的流程是流暢的,響應(yīng)時(shí)間非常迅速,即使是復(fù)雜查詢也能迅速回應(yīng)。用戶從提出問題到得到答案的體驗(yàn)是無縫的。
- Perplexity AI在提供深度、有針對(duì)性的搜索結(jié)果方面表現(xiàn)出色,但是,它在理解一些極其復(fù)雜或模糊的查詢方面仍有提升空間。
十一、Poe
所屬公司:Quora 發(fā)布時(shí)間:2022年12月19日 榜單:#90 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
Poe(Platform for Open Exploration)是由Quora開發(fā)的一個(gè)人工智能聊天機(jī)器人平臺(tái)。這個(gè)平臺(tái)匯集了多種AI聊天機(jī)器人,如ChatGPT、Sage、Dragonfly和Claude,使用戶能夠與它們進(jìn)行互動(dòng)并獲取信息。
界面體驗(yàn):
- Poe的界面設(shè)計(jì)契合自身功能定位,充分考慮到用戶導(dǎo)航需求,旨在減少用戶的認(rèn)知負(fù)擔(dān),使用戶能夠迅速開始與AI的互動(dòng)。
- Poe的閱讀體驗(yàn)不佳,文字內(nèi)容的字號(hào)以及行間距不太合理,使得文本過于密集,閱讀舒適性過低。
使用感受:
- Poe展現(xiàn)了一定程度的個(gè)性化,用戶可以根據(jù)自己的需求,選擇相應(yīng)的AI 助手或者自定義AI機(jī)器人進(jìn)行對(duì)話。
- Poe的語音識(shí)別技術(shù)非常先進(jìn),可以準(zhǔn)確識(shí)別用戶的語音指令,并進(jìn)行相應(yīng)的回復(fù),但是在語義理解方面有待提高。
十二、豆包
所屬公司:春田智韻(抖音) 發(fā)布時(shí)間:2023年8月24日 榜單:#3 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
AI工具“豆包”是由抖音集團(tuán)推出的一款免費(fèi)的智能對(duì)話和創(chuàng)作助手。它基于云雀大模型,可以實(shí)現(xiàn)文本生成、圖像生成、語音交互等多種功能。
界面體驗(yàn):
- 豆包的界面設(shè)計(jì)簡潔且直觀,沒有過多的繁瑣元素,讓人一目了然。
- 導(dǎo)航清晰明確,新用戶也能快速上手,降低學(xué)習(xí)成本。
使用感受:
- 在學(xué)習(xí)場(chǎng)景、輔助閱讀方面表現(xiàn)出色,能快速響應(yīng),并流暢生成答案,但是在語義理解以及知識(shí)庫的廣度略顯不足。
- 左側(cè)導(dǎo)航欄提供了更加專業(yè)的“智能體”,用戶可以選擇其進(jìn)行定向、專業(yè)的解決問題,主要是學(xué)習(xí)、寫作、情感聊天方面表現(xiàn)出色。
十三、PopAI
所屬公司:INAI PTE 發(fā)布時(shí)間:2023年10月12日 榜單:未計(jì)入 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
PopAI 是一款由美國人工智能公司 PopAI Inc. 開發(fā)的 AI 工具,它基于 GPT-3 大模型,可以幫助用戶進(jìn)行內(nèi)容創(chuàng)作,也可以幫助用戶閱讀和理解現(xiàn)有內(nèi)容。用戶可以上傳各種格式的文檔,包括 PDF 文件。
界面體驗(yàn):
- 界面上的排版清晰,主次功能區(qū)分明顯,層次感強(qiáng),便于閱讀。
- 導(dǎo)航結(jié)構(gòu)清晰,用戶可以很容易地找到他們需要的功能。
使用感受
- PopAI在閱讀 PDF 并生成摘要和圖表上表現(xiàn)優(yōu)異,準(zhǔn)確率以及處理速度都不錯(cuò);
- PopAi 還可以幫助您制作演示幻燈片或用于其他目的的草稿文本,并且提供了一些PPT、Word等類型模板供用戶選擇,并且能幫助用戶優(yōu)化生成ppt、pdf等,極大程度上方便用戶。
十四、chitchop
ChitChop是抖音集團(tuán)發(fā)布的一款人工智能輔助工具海外產(chǎn)品,可為用戶提供多達(dá)200+智能機(jī)器人服務(wù),通過提供創(chuàng)意靈感、提高工作效率來服務(wù)用戶的工作和生活。它是基于Skylark大語言模型創(chuàng)建的AI工具集合。
界面體驗(yàn):
- 界面布局符合產(chǎn)品定位,卡片顏色與背景形成鮮明對(duì)比,突出重要功能;
- 將所有工具通過瀑布流卡片的形式展現(xiàn),方便用戶精準(zhǔn)選擇;
使用感受:
- 和豆包同屬抖音集團(tuán),覆蓋場(chǎng)景比豆包更全,當(dāng)選擇不同智能體的時(shí)候會(huì)自動(dòng)幫用戶發(fā)送提示語,可以直接發(fā)送當(dāng)前場(chǎng)景下的問題,降低用戶學(xué)習(xí)成本。
- 在響應(yīng)時(shí)間上表現(xiàn)良好,但是答案的完整性上略有欠缺;
- 在文案比如工作日?qǐng)?bào)、周報(bào)、寫作、擴(kuò)寫、潤色等方面表現(xiàn)更佳;
十五、騰訊混元
騰訊混元大模型是騰訊公司推出的一款基于Transformer架構(gòu)的預(yù)訓(xùn)練語言模型,擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens。具有強(qiáng)大的自然語言處理能力。它能夠理解和生成人類語言文本,同時(shí)支持多語言,為開發(fā)者提供了豐富的API接口和工具,方便集成到各類應(yīng)用中。
界面體驗(yàn):
混元大模型的用戶界面簡潔直觀,優(yōu)化的用戶操作流程極大地便利了用戶與系統(tǒng)的交互。界面的清晰度和直觀性使得用戶即便是初次使用,也能輕松上手。
使用感受:
- 文生圖方面表現(xiàn)優(yōu)異,生成時(shí)間以及對(duì)語義的理解上表現(xiàn)不錯(cuò),但是在生成的風(fēng)格上效果欠佳,和表達(dá)的不太一致。
- 在專業(yè)知識(shí)方面,表現(xiàn)尚可,生成速度以及連貫性表現(xiàn)不錯(cuò),答案完整性以及專業(yè)度有待提高。
十六、360智腦
所屬公司:奇虎360 發(fā)布時(shí)間:2023年7月21日 榜單:未計(jì)入 數(shù)據(jù)來源:點(diǎn)點(diǎn)數(shù)據(jù)
360智腦大模型是由360自行研發(fā)的AI大語言模型。它規(guī)模龐大,參數(shù)達(dá)到千億級(jí)別,使其具備了跨模態(tài)生成的能力。它能夠處理各種形式的數(shù)據(jù),包括文字、圖像、語音和視頻等,因此在文本生成、圖像生成以及文本到視頻的轉(zhuǎn)換等多個(gè)領(lǐng)域都能發(fā)揮重要作用。
界面體驗(yàn):
- 360智腦的界面設(shè)計(jì)采用了直觀簡潔的布局,減少了視覺上的干擾,使用戶能夠?qū)W⒂趩柎鸾换ァ?/li>
- 適用場(chǎng)景以及場(chǎng)景模板外漏,降低用戶學(xué)習(xí)成本。
使用感受:
- 360 智腦背靠360搜索引擎,問答的廣度以及時(shí)效性表現(xiàn)不錯(cuò)。
- 在專業(yè)度上的效果欠佳,目前的答案完整性有待提高。
- 創(chuàng)新性以及個(gè)性化上體驗(yàn)不錯(cuò),以數(shù)字人的概念來包裝不同專業(yè)場(chǎng)景,讓用戶對(duì)話感受上更加人性化。
十七、其他 AI 工具探索
除了上述詳細(xì)評(píng)測(cè)的主要工具外,還有許多值得一提的AI工具在特定領(lǐng)域展現(xiàn)出了獨(dú)特的價(jià)值。這里簡要介紹一些我個(gè)人認(rèn)為非常出色的平臺(tái):
創(chuàng)作類工具
- 如廣為人知的Midjourney,它在創(chuàng)意藝術(shù)生成方面展現(xiàn)了令人贊嘆的能力,盡管學(xué)習(xí)成本較高。
- Stable Diffusion同樣引人注目,提供了豐富的創(chuàng)意激發(fā)和藝術(shù)創(chuàng)作功能。
- 國內(nèi)的Vega AI則在本地化創(chuàng)作上有著出色表現(xiàn)。
音視頻類工具
- Google的MusicLM引領(lǐng)了將文本轉(zhuǎn)化為音樂的新趨勢(shì),為創(chuàng)意音樂制作提供了全新的可能。
- Rask則在提升口語能力方面表現(xiàn)突出,尤其適合于英語學(xué)習(xí)者。
- Sora和Runway等工具在視頻編輯和處理方面提供了高效和創(chuàng)新的解決方案。
綜合評(píng)價(jià)
2024年注定是AI產(chǎn)業(yè)快速發(fā)展的一年,也是AI工具逐漸普及的一年。這些工具不僅能提升我們的工作效率,處理復(fù)雜任務(wù),也正在逐步改變我們的日常生活和創(chuàng)作方式。從大型互聯(lián)網(wǎng)公司到智能手機(jī)制造商,都在積極布局AI市場(chǎng),推出了眾多具有創(chuàng)新性和實(shí)用性的AI功能和應(yīng)用。我們有理由相信,未來AI將在更多領(lǐng)域展現(xiàn)其獨(dú)特的價(jià)值和影響力。
十八、總結(jié)
回顧2024年AI領(lǐng)域的發(fā)展,我們見證了從大型語言模型到多模態(tài)工具的飛速進(jìn)步。這些AI工具不僅為專業(yè)人士帶來了前所未有的便利,也逐漸滲透到了我們?nèi)粘I畹拿總€(gè)角落。
本篇文章中,我嘗試評(píng)測(cè)了市面上的一些主流AI工具,從ChatGPT-4的深度交互到通義系列的廣泛應(yīng)用,再到Gemini等工具的創(chuàng)新能力。每一款工具都以其獨(dú)特的方式對(duì)我們的工作方式和思維模式產(chǎn)生了影響。
值得一提的是:這些工具仍在不斷進(jìn)化。隨著技術(shù)的發(fā)展和市場(chǎng)需求的變化,我們可以期待未來它們將帶來更多驚喜和可能性。同時(shí),我們也應(yīng)警惕這些工具可能帶來的挑戰(zhàn),如信息安全和隱私保護(hù)等問題。
總體而言,2024年標(biāo)志著AI技術(shù)的一個(gè)新里程碑。除了各大互聯(lián)網(wǎng)公司研發(fā)各類大模型平臺(tái),手機(jī)廠商也在投入大量的資源去布局 AI 市場(chǎng)。并且去年各大手機(jī)已經(jīng)推出了一些 AI 智能功能:像我們 OPPO 推出了通話摘要、智能消除、合影優(yōu)化等智能、實(shí)用且廣受好評(píng)的功能。今年我們也將推出基于 OPPO 自研大模型有關(guān)于圖像創(chuàng)作、通話以及辦公等場(chǎng)景的一系列便捷、實(shí)用且智能的功能與能力來方便用戶的生活、工作,大家可以期待一下。
作者:咚咚
本文由 @咚咚 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)
感覺分析的方向上有點(diǎn)兒偏,每家都有側(cè)重的場(chǎng)景內(nèi)容,界面交互層面沒什么分析的必要
這些產(chǎn)品頁面上都差不多,核心差異化還是再各自AI生成內(nèi)容的差異上