Gemini Ultra來了!每月19.9刀,前兩月免費,網(wǎng)友實測:GPT4不香了
在去年,谷歌推出了Gemini Pro和Gemini Nano,而現(xiàn)在,谷歌宣布,Bard今后統(tǒng)稱Gemini,Bard將改頭換面,帶來由超大杯Ultra 1.0 驅(qū)動的會員版Gemini Advanced全新體驗??礃幼釉?024年,AI行業(yè)的熱潮仍將繼續(xù)。
農(nóng)歷春節(jié)除夕這一天,Google 直接來了一票大的:
Bard今后統(tǒng)稱Gemini。
通過Gemini Advanced,即可訪問Google能力最強的原生多模態(tài)大模型Gemini Ultra!
去年12月,Google 推出Gemini Pro和Gemini Nano,人們可以通過聊天機器人Bard、Pixel 8 Pro 和三星S24 系列手機免費使用。而今天,Bard改頭換面,帶來由超大杯Ultra 1.0 驅(qū)動的會員版Gemini Advanced全新體驗,同時推出支持安卓和iOS客戶端的手機移動應(yīng)用。
新服務(wù)訂閱價格為每月19.99美金,和ChatGPT Plus、Perplexity Pro等主流生成式AI應(yīng)用每月20美金的價格差不多。不過為了顯示誠意,Google會提供前兩個月免費試用。
一、Google最高階多模態(tài)大模型,Gemini Ultra新時代開啟
據(jù)Google CEO 桑達爾·皮查伊稱,Ultra 1.0是首個在 MMLU(大規(guī)模多任務(wù)語言理解)上超越人類專家的模型,使用了包括數(shù)學(xué)、物理、歷史、法律、醫(yī)學(xué)和倫理學(xué)在內(nèi)的57個學(xué)科組合來測試知識和解決問題的能力。
因此,Gemini Advanced在編碼、邏輯推理、遵循微妙指令和協(xié)作創(chuàng)意項目等高度復(fù)雜的任務(wù)上將更加強大。不僅可以與用戶進行更長、更詳細(xì)的對話,還能更好地理解提示上下文。
比如:Gemini Advanced可以成為個人導(dǎo)師,為你創(chuàng)建逐步說明、個性化測驗或根據(jù)學(xué)習(xí)風(fēng)格量身定制回答;解決更復(fù)雜的編碼場景,并協(xié)助評估不同的編程思路;成為數(shù)字創(chuàng)作者的創(chuàng)意伙伴,生成新鮮內(nèi)容,分析最新趨勢,制定商業(yè)計劃書。值得一提的是,Gemini Ultra內(nèi)由Imagen 2生成的所有圖像都應(yīng)用了數(shù)字水?。m然你看不到它)。
隨著新功能不斷添加,用戶將體驗到更強的多模態(tài)能力、更多交互式編程功能以及更深入的數(shù)據(jù)分析。目前Gemini Advanced僅支持英語,可以在超過150個國家和地區(qū)使用,將逐步擴展到更多語言。
二、安卓和IOS手機端登場,Gmail、文檔、表格可使用
Gemini Advanced作為全新Google One AI高級計劃的一部分,還會給用戶提供2TB存儲空間。此外,AI高級訂閱者很快就能夠在Gmail、Docs、Slides、Sheets等之前被集合為Duet AI的應(yīng)用中指調(diào)用Gemini Ultra。
為了實現(xiàn)手機端輕松訪問,Google此次推出全新Gemini應(yīng)用程序。
你可以拍攝一張車胎的照片請求說明,為晚宴邀請函生成自定義圖像,或者要求撰寫一條復(fù)雜短信。Google稱之為“構(gòu)建真正的AI助手的重要第一步,一個具有對話性、多模態(tài)的新型實用助理?!?/p>
安卓手機用戶可以下載Gemini應(yīng)用程序,或按照平時激活Google助手的方式——比如直接說“嘿,Google”來將它喚醒。Gemini 能為你剛拍攝的照片生成描述,回答閱讀中文章的相關(guān)問題。許多Google助手的語音功能也將通過Gemini App可用,包括設(shè)置定時器、打電話和控制智能家居設(shè)備等。
雖然iOS應(yīng)用還在路上,但Google表示在接下來的幾周里即會上架App Store。
三、將Gemini 能力擴展至更多產(chǎn)品
Gemini也將全面應(yīng)用于個人和企業(yè)每天使用的產(chǎn)品,包括 Workspace 和谷歌云服務(wù)。
Workspace:
皮查伊表示,目前已經(jīng)有超過100萬人正在使用像 「Help me write 」這樣的功能,通過 Duet AI 提高生產(chǎn)力和創(chuàng)造力。從今天起,Duet AI 將改為 Gemini for Workspace,并且很快, Google One AI 高級計劃訂閱者就能在 Gmail、Docs、Sheets、Slides 和 Meet 等谷歌辦公全套件中使用 Gemini Ultra。
谷歌云:
對于云客戶來說,Gemini 將幫助提高企業(yè)生產(chǎn)力,協(xié)助開發(fā)人員更高效編寫代碼,并保護組織免受網(wǎng)絡(luò)攻擊。
開發(fā)者一直是每一次重大技術(shù)變革的基礎(chǔ),在 Gemini 生態(tài)系統(tǒng)中也扮演著同樣重要的角色。現(xiàn)在已經(jīng)有數(shù)十萬技術(shù)人員和企業(yè)正在使用 Gemini 大模型進行開發(fā)。Google將在下周分享更多關(guān)于開發(fā)者和云客戶未來權(quán)益的詳細(xì)信息。
皮查伊還透露,Google已經(jīng)在積極訓(xùn)練下一代 Gemini 模型了。
四、網(wǎng)友迫不及待,Gemini Ultra新鮮開測
去年12月6日Google發(fā)布Gemini Pro時,對標(biāo)的是GPT-3.5。由于取消了原定的線下亮相,Gemini系列被媒體渲染得陰影重重。于是沒隔幾天,中杯大杯忽然集體登場,還以一個震懾三觀的“鴨子”視頻demo引發(fā)熱烈討論和網(wǎng)絡(luò)打假。當(dāng)時Google曾預(yù)告說在32項LLM廣泛使用的基準(zhǔn)測試中,Gemini Ultra有30項都超越了 ChatGPT代表的業(yè)界最先進水平。
究竟Ultra版本實力如何,現(xiàn)在終于可以上手一探究竟了。
用寫LinkedIn Post來測試內(nèi)容生成。結(jié)論是Gemini Ultra憑借更多標(biāo)題選項、更快響應(yīng)速度和“沒有愚蠢的emoji表情”擊敗GPT-4成為絕對勝者。
網(wǎng)友 Alphabetting拿出一道邏輯推理題:Tabitha喜歡餅干但不喜歡蛋糕,喜歡羊肉但不喜歡羔羊肉,喜歡秋葵但不喜歡南瓜。它詢問按照相同規(guī)則,Tabitha會喜歡櫻桃還是梨。
Gemini Ultra給出的建議是:“Tabitha喜歡發(fā)音兩個音節(jié)的食物,不喜歡一個音節(jié)的食物?!彼谐鲋i題中每種食物的音節(jié)數(shù),由于「cherries」有兩個音節(jié),因此答案是櫻桃。
GPT-4認(rèn)為Tabitha的偏好可能與單詞最后一個字母有關(guān)。她喜歡的食物結(jié)尾是輔音,而她不喜歡的食物結(jié)尾是原因。這樣的話,櫻桃和梨都符合條件——有些棘手,但一定要選一個的話,那就櫻桃吧。
他表示Gemini Ultra成功解決了被GPT-4搞到稀碎的邏輯測試。
用戶Brett Winton測試兩者的文生圖功能,提示詞是“生成一個畫家試圖在火箭外部畫靜物的圖像,讓它幽默一些,一幅插畫“。左邊是GPT-4,右邊是Gemini Ultra。
AI模型的想象力見仁見智,不過Gemini圖像里的畫家比起繪畫更像在吃東西,手部細(xì)節(jié)也有點問題。評論里都覺得GPT-4更好些。
他又緊接著對比了Gemini Ultra、 Claude和GPT-3.5對于8年級數(shù)學(xué)題計算能力。
題面是:Garcia正策劃一個比薩派對,她需要確保30名學(xué)生每人至少得到3片,每個比薩有8片。為增加多樣性, Garcia決定訂購一半奶酪比薩和一半香腸比薩。然而有5名學(xué)生是素食者,只會吃奶酪比薩。
請回答:
- Garcia需要訂購多少個比薩,以確保每個學(xué)生至少3片?
- 每種類型比薩各多少個?
- 如果每個比薩12美元,總訂單費用是多少?
在之前的測試中, Gemini Pro把這道題搞砸了。此次Ultra答對了總數(shù)12個比薩和費用144美元。但第2題的正確答案應(yīng)該是兩種比薩各6個,Ultra沒通過。
Brett Winton表示,Gemini Ultra和Claude一樣,數(shù)學(xué)計算都不如GPT-3.5準(zhǔn)確。
編碼能力上,網(wǎng)友Mervin Praison在Gemini Ultra用Python成功創(chuàng)建了一個貪吃蛇游戲。
更多更深入的用例,大家可以抓住兩個月的免費試用福利,親自上手玩一玩。
五、OpenAI開辟AI代理新戰(zhàn)場,Google 不甘落后
谷歌副總裁兼Gemini體驗和Google助手部門總經(jīng)理Sissie Hsiao表示,“對谷歌來說,Gemini不僅僅是模型。它實際上是我們思考最先進技術(shù),以及我們在其基礎(chǔ)上構(gòu)建的整個生態(tài)系統(tǒng)的轉(zhuǎn)變,從影響數(shù)十億用戶的產(chǎn)品,到開發(fā)者和企業(yè)用來創(chuàng)新的API平臺?!?/p>
就在昨天,The Information發(fā)表題為《OpenAI正將AI競爭焦點轉(zhuǎn)移到能操作設(shè)備和自動化任務(wù)的軟件上》的報道。
文中爆料,OpenAI正在開發(fā)一種代理軟件,能有效接管手機和電腦,替用戶執(zhí)行復(fù)雜任務(wù)操作。你可以命令ChatGPT執(zhí)行從文檔到表格的數(shù)據(jù)轉(zhuǎn)移,自動填寫費用報告并輸入到會計軟件中,或者在特定預(yù)算下創(chuàng)建行程或預(yù)訂機票等基于網(wǎng)絡(luò)的任務(wù)。
隨著越來越多全新大模型的推出,OpenAI也深知今年可能不再擁有市場上最強大LLM的可能性。所以加緊開辟新戰(zhàn)場早做準(zhǔn)備。
據(jù)知情人士稱,這類請求將觸發(fā)代理點擊、光標(biāo)移動、文本輸入等其它人類動作。可能會將將ChatGPT變成Sam Altman私下稱為「超智能個人工作助理」的工具,也將與微軟Copilot和谷歌Gemini for Workspace 展開更直接競爭。
去年ChatGPT已經(jīng)給OpenAI帶來16億美元收入,微軟也靠生成式AI顯著拉升了最新季度財報業(yè)績。
而AI業(yè)務(wù)卻還沒有給Google帶來明朗的現(xiàn)金流。如今付費版本Gemini Advanced和Ultra 1.0的推出會帶來怎樣的市場回饋,那些已經(jīng)花錢訂閱GPT的用戶們會不會轉(zhuǎn)投Gemini,人工智能整合進谷歌生態(tài)的全新究極樣貌是什么?這些都讓人期待。今年,注定繼續(xù)是高潮迭起的AI拉鋸戰(zhàn)。
作者:Jessica
來源公眾號:硅星人Pro(ID:Si-Planet),硅(Si)是創(chuàng)造未來的基礎(chǔ),歡迎來到這個星球。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @硅星人 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!