模型、產(chǎn)品、實踐三維度看AI
在人工智能蓬勃發(fā)展的當(dāng)下,AI技術(shù)的復(fù)雜性與多樣性讓許多從業(yè)者和研究者感到既興奮又困惑。為了更好地理解AI的全貌,本文將從模型、產(chǎn)品和實踐三個維度展開深入探討,供大家參考。
今年是個熱鬧的AI年,年初的deepseekR1平地一聲雷,又一次掀起了全民的熱潮,做為一個AI行業(yè)的從業(yè)者,見證了23年AI的驚起到沉浸,再到24年的蓬勃發(fā)展,我想每個月進錄一下在AI行業(yè)中發(fā)生的那些有趣的事情,就有了這份月報。
AI發(fā)展中最重要的一個事情莫過于模型能力&算力成本。
模型能力決定了AI到底有多強,是洲際導(dǎo)彈還是弓箭;而算力成本決定了AI到底是個高大上的科研產(chǎn)品,還是普通人都可以日常使用的工具;AI月報的第一部分我們就來重點關(guān)注這個事情。
第二部分是有趣的AI產(chǎn)品,會帶著大家看看實用有趣的AI產(chǎn)品。
第三部分是落地實踐案例,我們?nèi)タ纯碅I在日常生活中有哪些非常棒的使用方法。
一、模型能力 & 算力成本
1.1 閉源模型
2月份新發(fā)布的模型:
- OpenAI的ChatGPT4.5(看不懂升級了點啥)
- 馬斯克的Grok3(榜單第一)
- Anthropic的Claude3.7(極強編程能力)
- 谷歌的Gemini2.0系列(Flash、pro、Flash Thinking 百萬上下文)
模型排行榜參考Chatbot Arena LLM Leaderboard,它是業(yè)界公認(rèn)的最公正、最權(quán)威榜單之一,也是全球頂級大模型的最重要競技場。
模型排行榜參考Chatbot Arena LLM Leaderboard,它是業(yè)界公認(rèn)的最公正、最權(quán)威榜單之一,也是全球頂級大模型的最重要競技場。
它們的模型成本對比如圖所示:
從成本上來看,OpenAI的4.5真是離譜到家的產(chǎn)品,價格比最貴的Claude貴10倍以上了;谷歌的Gemini模型繼續(xù)保持了量大便宜的慣例,Gemini和DeepSeek一樣都支持緩存命中,相同內(nèi)容的token成本還能再降低1/10。
以下是新模型發(fā)布值得關(guān)注的點:
1)Claude 3.7:編程能力強到爆炸。
在單獨的模型編程榜中,Claude3.7無疑是遙遙領(lǐng)先了,其它模型跟它的差距變得更大了。
從代碼長度測試下來,600行的代碼它可以輕輕松松寫下來,1700行都能夠搞定;之前Claude3.5也就300行輕松,再多一點各種bug頻出了。
一句話寫個網(wǎng)頁案例:
2)Grok3
是其它家沒有的功能;模型能力也非常強,且沒啥太多的忌諱。
3)Gemini2.0
超強的上下文能力,支持100萬token,保持了Gemini家族的慣性。
4)ChatGPT的4.5升級了
實在不知道它升級了點啥,目前只能200美刀一個月的會員才能用;從模型能力和測評上來看這個模型好像新版本強的有限。
來源:Twitter karminski-牙醫(yī)
經(jīng)典的草莓問題還是數(shù)不對,其它能力也看起來變化不大,具體的在等大家測試下來看看。
來源:Twitter Alex Northstar
1.2 開源模型
開源模型上通義發(fā)布了3個開源模型,他們分別是:
1)多模態(tài)識別模型
Qwen2.5-VL,有 3B、7B 和 72B 三個尺寸版本。
72B是比GPT4o和Claude3.5更強的視覺模型,能夠最多支持1個小時的視頻理解。
不錯的多模態(tài)識別能力
2)超長文本處理模型
Qwen2.5-1M,專門處理長文本的AI模型;分為7B和14B兩個模型。在100萬token的大海撈針中,有不錯的表現(xiàn)
3)文生視頻模型:Wan2.1
有1.3B和14B兩個版本。視頻評測VBench中踩下Sora、Pika等國際對手(總分86.22%第一)。
comfyUI也接入這個模型,效果看起來還是很不錯的
二、有趣的AI產(chǎn)品
1. ima知識庫
騰訊出品的一款基于deepseekR1的PC端知識庫產(chǎn)品,用來閱讀文章非常省事。
支持網(wǎng)站瀏覽器和傳文章等多種閱讀方式,還可以搜索公眾號的內(nèi)容,記得用的時候選R1模型。
用R1讀文章,讓它運用深度思考的能力同時說人話,可以快速抓到一個文章的重點,然后自己根據(jù)需求再去判斷要不要繼續(xù)讀文章。
2. AI編程產(chǎn)品
Cursor 3.7出來了,做產(chǎn)品更方便了,這兩款A(yù)I產(chǎn)品都適合用AI來寫代碼。
Cursor:最新版以Agent模式為核心,對小白來說用AI編程門檻又低了一些,之前的環(huán)境問題都可以讓AI干活來搞定了;同時也支持Claude3.7,編程能力杠杠的。
字節(jié)的Tera:一款新上的AI編程工具,交互頁面更舒服一點,目前還是免費狀態(tài);支持3.5和3.7。
3. 用R1的一些渠道
官網(wǎng)總是出現(xiàn)R1不干活的情況,2月份也有不少平替出來,各家云廠商也都支持了R1的調(diào)用,大家可以按需進行選擇;但需要注意云廠商的R1是沒有虛擬緩存的,對于批量打api的成本需要重新算成本。
云的話:硅基云、阿里云、火山云都可以,根據(jù)大家的需求選擇;官網(wǎng)也恢復(fù)充值了,但是看起來還是不穩(wěn)定,沒有1月份并發(fā)快。
本地化+API調(diào)用建議選擇chatbox+硅基流動,用起來體驗還不錯
4. 秘塔搜索研究模式
把搜索變成了兩種不同的研究模式,用于提升搜索的準(zhǔn)確性,用起來體驗還不錯
我在做API價格對比的時候搜了一下,拋掉Gemini2沒找到信息源,整理的沒啥問題
5. 可靈1.6的毛絨玩具
把任何東西變成毛絨玩具,是個蠻好玩的特效功能;我試了試把滅霸轉(zhuǎn)化一下,看起來還不錯,而且生成的時候可靈還會給你加個好玩的配音。
三、落地實踐案例
1. 簡單方便用好R1的一個小技巧:加一句說人話。
就可以讓R1輸出的內(nèi)容更加接地氣,而不是高大上的一堆堆詞。
2. Claude 3.7的畫圖,以下是一些案例參考
3. 飛書多維表格+R1
是個很便捷不需要開發(fā)就可以使用AI能力的文檔,下面是一些給大家找的參考案例
先介紹一下這個功能:飛書文檔在最近的多維表格里接入了R1模型,可以直接通過表格來調(diào)取火山云的API來實現(xiàn)AI功能,不需要編程只需要調(diào)一下文檔就可以了
Cynthia’s做的AI文獻速度神器:
https://jih7kdah80b.feishu.cn/wiki/BpSIwQSyritC1eko1OKcIvDknKb?table=tblK1CVZBHe1zBY9&view=vewekYXv2s
木水醬的AI胃之書:為了好好吃飯,我用飛書多維表格+DeepSeek做了個定制版胃之書
4. AI陪伴的總結(jié)文章:10 個月,5 萬 DAU,我們可能找到了 AI 陪伴的另一種可能
AI創(chuàng)業(yè)中一直難繞過去的一個問題是token消耗,這和傳統(tǒng)互聯(lián)網(wǎng)時的邊際成本遞減完全反過來了,用戶用的越多消耗越多,特別是聊天類的產(chǎn)品形態(tài),還得把上下文包含進來要么角色就傻了,這個成本增加的更厲害,AI陪伴產(chǎn)品也就很難盈利。
從王登科做的獨響,可以看到他們對社交本身的深刻認(rèn)知,然后打造了這樣一款有意思的AI陪伴產(chǎn)品,能夠產(chǎn)品有良性的增長和盈利;對業(yè)務(wù)深度的洞察是做好一個產(chǎn)品的永恒的前提。
本文由人人都是產(chǎn)品經(jīng)理作者【云舒】,微信公眾號:【云舒的AI觀察筆記】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評論,等你發(fā)揮!