精品国产欧美日韩另类一区，国产高清一级毛片在线不卡，亚洲精品无码久久久久牙蜜区，国产精品福利一区二区，一级无码免费做a在线，国产精品久久久久AV，一本视频在线精品，中文字幕在线播放

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

AIGC工具全面審視：生成式AI在實(shí)際應(yīng)用中的表現(xiàn)如何？

何曦

2024-03-25

2 評(píng)論 3026 瀏覽 25 收藏

31 分鐘

過去這一年，全球涌現(xiàn)出了眾多生成式AI產(chǎn)品。在這篇文章中，我們將探討這些工具的表現(xiàn)，通過實(shí)際體驗(yàn)和評(píng)估，為讀者提供一個(gè)關(guān)于當(dāng)前AI工具的全面視角。

2023年，AI技術(shù)迎來了其發(fā)展史上的一次重大飛躍。隨著技術(shù)突破和令人矚目的產(chǎn)品陸續(xù)亮相，AI不僅成為了技術(shù)界的焦點(diǎn)，也深深吸引了資本的目光。這一年，AI展現(xiàn)出了前所未有的發(fā)展勢(shì)頭，無論是在基礎(chǔ)模型能力、實(shí)際應(yīng)用場(chǎng)景，還是資本投入方面都取得了顯著進(jìn)展。

特別是在2022年11月30日，OpenAI發(fā)布了ChatGPT，標(biāo)志著AI技術(shù)的一個(gè)新紀(jì)元。緊接著，在2023年1月，ChatGPT的月活躍用戶數(shù)突破1億大關(guān)，創(chuàng)下了歷史新高，彰顯了全球AI市場(chǎng)的爆發(fā)潛力。

伴隨這股勢(shì)頭，全球范圍內(nèi)涌現(xiàn)出眾多創(chuàng)新的生成式AI工具，它們按功能可以劃分為：文本生成、圖像創(chuàng)作、音視頻處理等多個(gè)類別。在這篇文章中，我們將探討這些工具的表現(xiàn)，通過實(shí)際體驗(yàn)和評(píng)估，為讀者提供一個(gè)關(guān)于當(dāng)前AI工具的全面視角。

一、ChatGPT-4

所屬公司：OpenAI 發(fā)布時(shí)間：2023年5月8日榜單：#2 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

2023年3月15日，OpenAI宣布推出GPT-4，這標(biāo)志著大型語言模型進(jìn)入了一個(gè)新階段。相較于前代產(chǎn)品GPT-3.5，GPT-4不僅在處理自然語言方面取得了顯著提升，而且在多語言處理能力上也有了重大突破。更值得一提的是，GPT-4引入了“多模態(tài)”功能，支持圖像和語音輸入，甚至可以輸出圖片，大大拓寬了其應(yīng)用范圍。

界面體驗(yàn)

ChatGPT-4的用戶界面呈現(xiàn)了現(xiàn)代化和直觀的設(shè)計(jì)風(fēng)格，其簡潔的設(shè)計(jì)語言和優(yōu)化的用戶操作流程極大地便利了用戶與系統(tǒng)的交互。界面的清晰度和直觀性使得用戶即便是初次使用，也能輕松上手。

使用感受

作為商業(yè)化應(yīng)用的初代大型語言模型，ChatGPT-4在專業(yè)知識(shí)獲取、文案生成、上下文理解等方面表現(xiàn)出色。答案的完整性和連貫性同樣值得稱贊。然而，最近的使用體驗(yàn)中發(fā)現(xiàn)模型在生成答案時(shí)偶有不穩(wěn)定現(xiàn)象，可能與OpenAI目前的資源分配有關(guān)。

不過，總體來說，ChatGPT-4在提供高效、準(zhǔn)確回答方面依然表現(xiàn)卓越。

二、通義系列

阿里巴巴旗下的通義系列包含多款A(yù)I大模型，如通義千問（語言模型）、通義萬相（藝術(shù)創(chuàng)作模型）、通義聽悟（音視頻模型）和通義智文（AI閱讀助手），它們?cè)诙鄠€(gè)領(lǐng)域如電商、設(shè)計(jì)、對(duì)話和法律分析中發(fā)揮著重要作用。

平時(shí)工作生活中使用的較多的是通義千問、通義萬相、通義聽悟、通義智文幾種，幫助我獲取整理專業(yè)知識(shí)，獲取靈感以及快速閱讀：

通義千問：多模態(tài) AI 大模型

所屬公司：阿里巴巴發(fā)布時(shí)間：2023年10月31日榜單：#28 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

界面體驗(yàn)：

通義千問擁有簡潔而一致的頁面布局，提供沉浸式的問答體驗(yàn)。界面無過多修飾，專注于核心功能，使用戶更易于集中注意力在問題與回答上。

使用感受：

在語義理解和答案準(zhǔn)確度方面，通義千問表現(xiàn)優(yōu)異，尤其在處理千字以內(nèi)的查詢時(shí)，回答流暢且無明顯間斷。

通義萬相：AI 藝術(shù)創(chuàng)作模型

界面體驗(yàn)：

萬相的界面以深色模式為主，突出了圖片生成區(qū)域，同時(shí)提供了關(guān)鍵詞選項(xiàng)，便于用戶快速進(jìn)行創(chuàng)作。

使用感受：

雖然在人物圖像創(chuàng)作方面表現(xiàn)較好，但在抽象圖標(biāo)和文本引導(dǎo)的圖片生成方面仍有提升空間。圖片細(xì)節(jié)處理方面也存在一定的挑戰(zhàn)。

通義聽悟

一個(gè)非常好的在線會(huì)議、視頻學(xué)習(xí)、播客學(xué)習(xí)等音視頻轉(zhuǎn)文字并且整理以及摘要的平臺(tái)。

界面體驗(yàn)：

聽悟的界面設(shè)計(jì)強(qiáng)調(diào)智能感，功能入口明確，降低了用戶學(xué)習(xí)成本。其功能覆蓋了視頻轉(zhuǎn)錄、實(shí)時(shí)解析等多種場(chǎng)景。

使用感受：

實(shí)時(shí)記錄場(chǎng)景：語音識(shí)別以及文本轉(zhuǎn)錄的內(nèi)容準(zhǔn)確度挺高，較為嘈雜的場(chǎng)景也能比較準(zhǔn)確的識(shí)別文字;
視頻場(chǎng)景：能夠提取摘要，并且能區(qū)分講話人進(jìn)行總結(jié)，以及生成 PPT且定位，但是PPT僅僅是截取視頻的整個(gè)畫面；
播客場(chǎng)景：暫不支持摘要提取，只能復(fù)制文本內(nèi)容，需要自行加工；

通義智文：一個(gè)文檔電子書籍快速整理閱讀的 AI 平臺(tái)

界面體驗(yàn)：

智文的界面簡約，主要聚焦于閱讀體驗(yàn)。

使用感受：

閱讀場(chǎng)景覆蓋全面，對(duì)于電子書籍，智文能夠提供準(zhǔn)確的全文摘要和章節(jié)總結(jié)，極大地提高了閱讀效率。（移動(dòng)端推薦 “Cubox” 對(duì)于間斷的公眾號(hào)、網(wǎng)頁文章體驗(yàn)不錯(cuò)，就是需要付費(fèi)體驗(yàn)摘要、問答等 AI 能力）

三、天工 AI

所屬公司：北京昆侖萬維科技股份有限公司發(fā)布時(shí)間：2023年7月5日榜單：#15 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

天工AI是由奇點(diǎn)智源和昆侖萬維聯(lián)合開發(fā)的一款綜合型大模型平臺(tái)，它集成了搜索、對(duì)話和創(chuàng)作等多種功能。

界面體驗(yàn)：

天工AI采用了瀏覽器式的界面布局，這種設(shè)計(jì)貼合了產(chǎn)品的功能定位。然而，其背景設(shè)計(jì)較為復(fù)雜，可能會(huì)對(duì)用戶造成視覺疲勞。
功能入口清晰，便于新用戶快速熟悉并使用各項(xiàng)功能。

使用感受：

在回答問題方面，天工AI展現(xiàn)出了較高的答案完整性。它能夠結(jié)合全網(wǎng)搜索，提煉并展示相關(guān)的新聞資訊鏈接，這不僅提高了回答的可信度，也增強(qiáng)了專業(yè)性。
答案生成過程中，天工AI能夠準(zhǔn)確標(biāo)注信息來源，這是其一個(gè)突出的特點(diǎn)，幫助用戶理解答案的依據(jù)。
天工AI在處理各類信息時(shí)表現(xiàn)出色，能夠快速匹配并提供豐富的背景資料，滿足用戶的多元化需求。

四、kimi

所屬公司：Moonshot AI 發(fā)布時(shí)間：2024年1月12日榜單：#13 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

Kimi Chat是Moonshot AI推出的一款功能豐富的工具，專注于整理資料、處理文件和提供快速網(wǎng)址訪問。它在簡化日常工作流程方面展現(xiàn)出了顯著的優(yōu)勢(shì)。

界面體驗(yàn)：

Kimi Chat采用了簡潔而清晰的界面設(shè)計(jì)，以瀏覽器形式呈現(xiàn)，為用戶提供了舒適和直觀的使用體驗(yàn)。
背景設(shè)計(jì)干凈且現(xiàn)代，這不僅降低了視覺干擾，也增加了用戶操作的便捷性。

使用感受：

Kimi Chat在速讀新聞和總結(jié)文章方面表現(xiàn)突出。它能夠快速解析和歸納大量信息，極大地提高了工作效率。
與天工AI相似，Kimi Chat在回答問題時(shí)會(huì)聯(lián)網(wǎng)搜索相關(guān)新聞資訊，盡管它在信息來源的廣度上不如天工AI全面，但在文章鏈接和電子書籍的快速解析上則表現(xiàn)更為出色。
綜合來看，Kimi Chat在快速處理和總結(jié)大量文本資料方面具有明顯優(yōu)勢(shì)，尤其適合于快節(jié)奏的工作環(huán)境。

五、文心一言

所屬公司：百度發(fā)布時(shí)間：2023年6月29日榜單：#8 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

文心一言，作為百度研發(fā)的全新一代知識(shí)增強(qiáng)大語言模型，不僅在對(duì)話互動(dòng)上表現(xiàn)出色，還在問題解答和創(chuàng)作協(xié)助方面提供了高效的幫助。該模型特別擅長文案生成和潤色，以及幫助用戶制定計(jì)劃和獲取信息。

界面體驗(yàn)：

文心一言的界面設(shè)計(jì)采用了直觀簡潔的布局，減少了視覺上的干擾，使用戶能夠?qū)Ｗ⒂趩柎鸾换ァ?/li>
界面上無多余修飾，提供了沉浸式的用戶體驗(yàn)，使得信息檢索和交互過程更為流暢。

使用感受：

在專業(yè)知識(shí)回答方面，文心一言的表現(xiàn)略遜于通義千問，但在文案潤色和計(jì)劃制定等方面的能力卻十分出色，特別適合用于日常的文案處理任務(wù)。
獨(dú)特之處在于，文心一言在用戶輸入完畢后能夠提供一鍵優(yōu)化指令的功能，這一點(diǎn)在用戶體驗(yàn)上極為便捷。
盡管在生成過程中偶有卡頓，但整體而言，文心一言在幫助用戶高效獲取信息和知識(shí)方面發(fā)揮了顯著的作用。

六、訊飛星火

所屬公司：科大訊飛發(fā)布時(shí)間：2024年6月13日榜單：#21 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

訊飛星火是科大訊飛推出的新一代認(rèn)知智能大模型，它憑借其跨領(lǐng)域的知識(shí)庫和語言理解能力，為用戶提供自然對(duì)話方式的任務(wù)理解和執(zhí)行。這一模型不斷從海量數(shù)據(jù)中學(xué)習(xí)，致力于解決問題的全流程閉環(huán)，從提出問題到規(guī)劃解決方案。

界面體驗(yàn)：

訊飛星火的界面設(shè)計(jì)遵循了AI大模型的常規(guī)布局，提供了沉浸式的問答體驗(yàn)。界面簡潔，無過多修飾，便于用戶專注于與模型的交互。

使用感受：

雖然在專業(yè)知識(shí)方面的表現(xiàn)略顯不足，但其在邏輯推理、解題和寫作等教育相關(guān)領(lǐng)域表現(xiàn)出色。
在實(shí)際應(yīng)用中，訊飛星火特別適合于教育和學(xué)習(xí)場(chǎng)景，其對(duì)問題的理解和答案的提供都表現(xiàn)得十分專業(yè)。

七、智普清言

所屬公司：智譜華章發(fā)布時(shí)間：2023年8月14日榜單：#26 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

智普清言，由智譜AI公司在2023年訓(xùn)練的GLM-4語言模型，是一款基于深度學(xué)習(xí)技術(shù)的自然語言處理模型。通過學(xué)習(xí)大量文本數(shù)據(jù)，它能夠理解和生成自然語言，針對(duì)用戶問題和需求提供適當(dāng)?shù)拇饛?fù)和支持。

界面體驗(yàn)：

智普清言的界面遵循AI大模型的常規(guī)布局，提供沉浸式問答體驗(yàn)。界面設(shè)計(jì)集中在功能性和易用性，助于用戶快速理解并使用各項(xiàng)功能。
智普清言特別增加了功能入口和靈感大全，提升了操作便利性，使用戶易于接觸和探索更多功能。

使用感受：

在處理一些專業(yè)或深層次問題時(shí)，表現(xiàn)有較大的驚喜，其回答的準(zhǔn)確性和深度表現(xiàn)不錯(cuò)。
智普清言在生成式的回答方面也表現(xiàn)不俗，可以生成較為流暢和通順的回答。
智普清言在回答完成之后還會(huì)根據(jù)歷史提問智能推薦相關(guān)問題或知識(shí)，幫助用戶更加深入了解。
智普清言還能自己定制智能助手，并且按照自己的專業(yè)喜好進(jìn)行訓(xùn)練，幫助用戶更好的完成專業(yè)工作或者處理生活事項(xiàng)。

八、Gemini

所屬公司：Google 發(fā)布時(shí)間：2024年2月6日榜單：#13 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

Gemini 是 Google 推出的原生多模態(tài)大模型，Google 稱 Gemini 是其歷史上最強(qiáng)大、最通用的模型，在許多基準(zhǔn)測(cè)試中都具有最先進(jìn)的性能。Google DeepMind 的 CEO Demis Hassabis 稱 Gemini 可以像人類一樣理解我們周圍的世界，并吸收任何類型的輸入和輸出，包括文本、代碼、視頻、音頻和圖像。Gemini 模型從大到小分為 Ultra，Pro，Nano 三個(gè)版本。其中 Pro 版本已經(jīng)整合到谷歌的 Bard 平臺(tái)中，但目前僅支持英文地區(qū)的用戶使用。

界面體驗(yàn)：

Gemini的界面設(shè)計(jì)緊隨其功能多樣性，呈現(xiàn)出極簡風(fēng)格，便于用戶專注于與模型的互動(dòng)。
雖然在模型能力介紹方面的信息不如其他平臺(tái)詳盡，略增加了用戶學(xué)習(xí)成本，但整體上為用戶提供了清晰、直觀的交互體驗(yàn)。

使用感受：

Gemini背靠Google強(qiáng)大的搜索引擎，特別在基于網(wǎng)絡(luò)搜索的問題處理方面表現(xiàn)出色。它能夠整合網(wǎng)絡(luò)資源，提供全面、多樣的答案。
對(duì)于專業(yè)性較高的問題，Gemini的表現(xiàn)尚有提升空間，可能與語言處理能力相關(guān)。在答案的完整性和專業(yè)度方面相比通義千問有所不足。
總體來看，Gemini在多模態(tài)處理和網(wǎng)絡(luò)資源整合方面展現(xiàn)了顯著的優(yōu)勢(shì)，尤其適合處理需要廣泛信息整合的查詢。

九、Claude

Claude是Anthropic開發(fā)的一款人工智能聊天機(jī)器人，Claude可以理解自然語言并生成相應(yīng)的回復(fù),和人類進(jìn)行基本的對(duì)話與交流，相比其他大模型語言更加人性化，Claude具有一定的情感理解能力,可以從對(duì)話中解析出對(duì)方的情緒變化和態(tài)度,并在一定程度上調(diào)整自己的回應(yīng)語氣。Claude的知識(shí)和理解能力還比較有限，它更類似于一個(gè)知識(shí)圖譜+搜索引擎,可以在已有知識(shí)上快速匹配和檢索信息,但還無法進(jìn)行復(fù)雜的推理或深入分析。

界面體驗(yàn)：

Claude的界面設(shè)計(jì)保持了簡約風(fēng)格，便于用戶進(jìn)行流暢的交互。這種設(shè)計(jì)雖不復(fù)雜，但卻充分滿足了與AI進(jìn)行自然對(duì)話的需求。
用戶界面注重功能性和易用性，使得即使是初次接觸的用戶也能快速上手。

使用感受：

Claude在自然語言處理方面表現(xiàn)出色，尤其是在理解用戶輸入和生成人性化回應(yīng)方面具有顯著優(yōu)勢(shì)。
盡管知識(shí)和分析能力相對(duì)有限，它更像是結(jié)合了知識(shí)圖譜和搜索引擎的工具，能在已有知識(shí)范圍內(nèi)快速匹配和檢索信息。
在實(shí)際使用中，Claude尤其適合于需要情感理解和基本信息檢索的場(chǎng)景，提供了友好和自然的交流體驗(yàn)。

十、Perplexity AI

所屬公司：Perplexity AI 發(fā)布時(shí)間：2023年3月27日榜單：#47 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

Perplexity AI是一個(gè)先進(jìn)的AI工具，專注于提供深入的、以問題為中心的搜索和分析。它通過理解和分析用戶的查詢，提供相關(guān)和深度的答案，不僅僅是傳統(tǒng)搜索引擎的結(jié)果列表。

界面體驗(yàn)：

Perplexity AI的界面簡約，突出搜索功能，減少了視覺干擾，使用戶更易于專注于搜索任務(wù)。
所有功能都是直觀的，提升易用性。

使用感受：

整個(gè)搜索和獲取答案的流程是流暢的，響應(yīng)時(shí)間非常迅速，即使是復(fù)雜查詢也能迅速回應(yīng)。用戶從提出問題到得到答案的體驗(yàn)是無縫的。
Perplexity AI在提供深度、有針對(duì)性的搜索結(jié)果方面表現(xiàn)出色，但是，它在理解一些極其復(fù)雜或模糊的查詢方面仍有提升空間。

十一、Poe

所屬公司：Quora 發(fā)布時(shí)間：2022年12月19日榜單：#90 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

Poe（Platform for Open Exploration）是由Quora開發(fā)的一個(gè)人工智能聊天機(jī)器人平臺(tái)。這個(gè)平臺(tái)匯集了多種AI聊天機(jī)器人，如ChatGPT、Sage、Dragonfly和Claude，使用戶能夠與它們進(jìn)行互動(dòng)并獲取信息。

界面體驗(yàn)：

Poe的界面設(shè)計(jì)契合自身功能定位，充分考慮到用戶導(dǎo)航需求，旨在減少用戶的認(rèn)知負(fù)擔(dān)，使用戶能夠迅速開始與AI的互動(dòng)。
Poe的閱讀體驗(yàn)不佳，文字內(nèi)容的字號(hào)以及行間距不太合理，使得文本過于密集，閱讀舒適性過低。

使用感受：

Poe展現(xiàn)了一定程度的個(gè)性化，用戶可以根據(jù)自己的需求，選擇相應(yīng)的AI 助手或者自定義AI機(jī)器人進(jìn)行對(duì)話。
Poe的語音識(shí)別技術(shù)非常先進(jìn)，可以準(zhǔn)確識(shí)別用戶的語音指令，并進(jìn)行相應(yīng)的回復(fù)，但是在語義理解方面有待提高。

十二、豆包

所屬公司：春田智韻（抖音）發(fā)布時(shí)間：2023年8月24日榜單：#3 數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

AI工具“豆包”是由抖音集團(tuán)推出的一款免費(fèi)的智能對(duì)話和創(chuàng)作助手。它基于云雀大模型，可以實(shí)現(xiàn)文本生成、圖像生成、語音交互等多種功能。

界面體驗(yàn)：

豆包的界面設(shè)計(jì)簡潔且直觀，沒有過多的繁瑣元素，讓人一目了然。
導(dǎo)航清晰明確，新用戶也能快速上手，降低學(xué)習(xí)成本。

使用感受：

在學(xué)習(xí)場(chǎng)景、輔助閱讀方面表現(xiàn)出色，能快速響應(yīng)，并流暢生成答案，但是在語義理解以及知識(shí)庫的廣度略顯不足。
左側(cè)導(dǎo)航欄提供了更加專業(yè)的“智能體”，用戶可以選擇其進(jìn)行定向、專業(yè)的解決問題，主要是學(xué)習(xí)、寫作、情感聊天方面表現(xiàn)出色。

十三、PopAI

所屬公司：INAI PTE 發(fā)布時(shí)間：2023年10月12日榜單：未計(jì)入數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

PopAI 是一款由美國人工智能公司 PopAI Inc. 開發(fā)的 AI 工具，它基于 GPT-3 大模型，可以幫助用戶進(jìn)行內(nèi)容創(chuàng)作，也可以幫助用戶閱讀和理解現(xiàn)有內(nèi)容。用戶可以上傳各種格式的文檔，包括 PDF 文件。

界面體驗(yàn)：

界面上的排版清晰，主次功能區(qū)分明顯，層次感強(qiáng)，便于閱讀。
導(dǎo)航結(jié)構(gòu)清晰，用戶可以很容易地找到他們需要的功能。

使用感受

PopAI在閱讀 PDF 并生成摘要和圖表上表現(xiàn)優(yōu)異，準(zhǔn)確率以及處理速度都不錯(cuò)；
PopAi 還可以幫助您制作演示幻燈片或用于其他目的的草稿文本，并且提供了一些PPT、Word等類型模板供用戶選擇，并且能幫助用戶優(yōu)化生成ppt、pdf等，極大程度上方便用戶。

十四、chitchop

ChitChop是抖音集團(tuán)發(fā)布的一款人工智能輔助工具海外產(chǎn)品，可為用戶提供多達(dá)200+智能機(jī)器人服務(wù)，通過提供創(chuàng)意靈感、提高工作效率來服務(wù)用戶的工作和生活。它是基于Skylark大語言模型創(chuàng)建的AI工具集合。

界面體驗(yàn)：

界面布局符合產(chǎn)品定位，卡片顏色與背景形成鮮明對(duì)比，突出重要功能；
將所有工具通過瀑布流卡片的形式展現(xiàn)，方便用戶精準(zhǔn)選擇；

使用感受：

和豆包同屬抖音集團(tuán)，覆蓋場(chǎng)景比豆包更全，當(dāng)選擇不同智能體的時(shí)候會(huì)自動(dòng)幫用戶發(fā)送提示語，可以直接發(fā)送當(dāng)前場(chǎng)景下的問題，降低用戶學(xué)習(xí)成本。
在響應(yīng)時(shí)間上表現(xiàn)良好，但是答案的完整性上略有欠缺；
在文案比如工作日?qǐng)?bào)、周報(bào)、寫作、擴(kuò)寫、潤色等方面表現(xiàn)更佳；

十五、騰訊混元

騰訊混元大模型是騰訊公司推出的一款基于Transformer架構(gòu)的預(yù)訓(xùn)練語言模型，擁有超千億參數(shù)規(guī)模，預(yù)訓(xùn)練語料超2萬億tokens。具有強(qiáng)大的自然語言處理能力。它能夠理解和生成人類語言文本，同時(shí)支持多語言，為開發(fā)者提供了豐富的API接口和工具，方便集成到各類應(yīng)用中。

界面體驗(yàn)：

混元大模型的用戶界面簡潔直觀，優(yōu)化的用戶操作流程極大地便利了用戶與系統(tǒng)的交互。界面的清晰度和直觀性使得用戶即便是初次使用，也能輕松上手。

使用感受：

文生圖方面表現(xiàn)優(yōu)異，生成時(shí)間以及對(duì)語義的理解上表現(xiàn)不錯(cuò)，但是在生成的風(fēng)格上效果欠佳，和表達(dá)的不太一致。
在專業(yè)知識(shí)方面，表現(xiàn)尚可，生成速度以及連貫性表現(xiàn)不錯(cuò)，答案完整性以及專業(yè)度有待提高。

十六、360智腦

所屬公司：奇虎360 發(fā)布時(shí)間：2023年7月21日榜單：未計(jì)入數(shù)據(jù)來源：點(diǎn)點(diǎn)數(shù)據(jù)

360智腦大模型是由360自行研發(fā)的AI大語言模型。它規(guī)模龐大，參數(shù)達(dá)到千億級(jí)別，使其具備了跨模態(tài)生成的能力。它能夠處理各種形式的數(shù)據(jù)，包括文字、圖像、語音和視頻等，因此在文本生成、圖像生成以及文本到視頻的轉(zhuǎn)換等多個(gè)領(lǐng)域都能發(fā)揮重要作用。

界面體驗(yàn)：

360智腦的界面設(shè)計(jì)采用了直觀簡潔的布局，減少了視覺上的干擾，使用戶能夠?qū)Ｗ⒂趩柎鸾换ァ?/li>
適用場(chǎng)景以及場(chǎng)景模板外漏，降低用戶學(xué)習(xí)成本。

使用感受：

360 智腦背靠360搜索引擎，問答的廣度以及時(shí)效性表現(xiàn)不錯(cuò)。
在專業(yè)度上的效果欠佳，目前的答案完整性有待提高。
創(chuàng)新性以及個(gè)性化上體驗(yàn)不錯(cuò)，以數(shù)字人的概念來包裝不同專業(yè)場(chǎng)景，讓用戶對(duì)話感受上更加人性化。

十七、其他 AI 工具探索

除了上述詳細(xì)評(píng)測(cè)的主要工具外，還有許多值得一提的AI工具在特定領(lǐng)域展現(xiàn)出了獨(dú)特的價(jià)值。這里簡要介紹一些我個(gè)人認(rèn)為非常出色的平臺(tái)：

創(chuàng)作類工具

如廣為人知的Midjourney，它在創(chuàng)意藝術(shù)生成方面展現(xiàn)了令人贊嘆的能力，盡管學(xué)習(xí)成本較高。
Stable Diffusion同樣引人注目，提供了豐富的創(chuàng)意激發(fā)和藝術(shù)創(chuàng)作功能。
國內(nèi)的Vega AI則在本地化創(chuàng)作上有著出色表現(xiàn)。

音視頻類工具

Google的MusicLM引領(lǐng)了將文本轉(zhuǎn)化為音樂的新趨勢(shì)，為創(chuàng)意音樂制作提供了全新的可能。
Rask則在提升口語能力方面表現(xiàn)突出，尤其適合于英語學(xué)習(xí)者。
Sora和Runway等工具在視頻編輯和處理方面提供了高效和創(chuàng)新的解決方案。

綜合評(píng)價(jià)

2024年注定是AI產(chǎn)業(yè)快速發(fā)展的一年，也是AI工具逐漸普及的一年。這些工具不僅能提升我們的工作效率，處理復(fù)雜任務(wù)，也正在逐步改變我們的日常生活和創(chuàng)作方式。從大型互聯(lián)網(wǎng)公司到智能手機(jī)制造商，都在積極布局AI市場(chǎng)，推出了眾多具有創(chuàng)新性和實(shí)用性的AI功能和應(yīng)用。我們有理由相信，未來AI將在更多領(lǐng)域展現(xiàn)其獨(dú)特的價(jià)值和影響力。

十八、總結(jié)

回顧2024年AI領(lǐng)域的發(fā)展，我們見證了從大型語言模型到多模態(tài)工具的飛速進(jìn)步。這些AI工具不僅為專業(yè)人士帶來了前所未有的便利，也逐漸滲透到了我們?nèi)粘Ｉ畹拿總€(gè)角落。

本篇文章中，我嘗試評(píng)測(cè)了市面上的一些主流AI工具，從ChatGPT-4的深度交互到通義系列的廣泛應(yīng)用，再到Gemini等工具的創(chuàng)新能力。每一款工具都以其獨(dú)特的方式對(duì)我們的工作方式和思維模式產(chǎn)生了影響。

值得一提的是：這些工具仍在不斷進(jìn)化。隨著技術(shù)的發(fā)展和市場(chǎng)需求的變化，我們可以期待未來它們將帶來更多驚喜和可能性。同時(shí)，我們也應(yīng)警惕這些工具可能帶來的挑戰(zhàn)，如信息安全和隱私保護(hù)等問題。

總體而言，2024年標(biāo)志著AI技術(shù)的一個(gè)新里程碑。除了各大互聯(lián)網(wǎng)公司研發(fā)各類大模型平臺(tái)，手機(jī)廠商也在投入大量的資源去布局 AI 市場(chǎng)。并且去年各大手機(jī)已經(jīng)推出了一些 AI 智能功能：像我們 OPPO 推出了通話摘要、智能消除、合影優(yōu)化等智能、實(shí)用且廣受好評(píng)的功能。今年我們也將推出基于 OPPO 自研大模型有關(guān)于圖像創(chuàng)作、通話以及辦公等場(chǎng)景的一系列便捷、實(shí)用且智能的功能與能力來方便用戶的生活、工作，大家可以期待一下。

作者：咚咚

本文由 @咚咚原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可，禁止轉(zhuǎn)載

題圖來自Unsplash，基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App