實(shí)測(cè)四款頭部AI高考志愿助手:一個(gè)能打的都沒有

0 評(píng)論 1883 瀏覽 0 收藏 21 分鐘

隨著人工智能技術(shù)的飛速發(fā)展,AI填報(bào)高考志愿已成為現(xiàn)實(shí)。今年,大模型的加入讓這一服務(wù)備受矚目。然而,這些AI助手的表現(xiàn)究竟如何?是否真正能夠幫助考生做出最合適的選擇?本文通過實(shí)際測(cè)試市面上四款頭部AI高考志愿助手,深入分析了它們?cè)谥驹竿扑]能力、復(fù)雜需求解決能力、推薦解釋能力等方面的表現(xiàn)。結(jié)果可能出人意料,讓我們一起揭開AI高考志愿助手的神秘面紗。

雖然AI填報(bào)高考志愿,已經(jīng)不是什么新鮮事,但今年有大模型的加持,讓市場(chǎng)變得看點(diǎn)十足。

因?yàn)樘顖?bào)志愿,本質(zhì)上是一套篩選并匹配數(shù)據(jù)的邏輯:大多數(shù)情況下,是根據(jù)高考成績(jī)從全國(guó)眾多大學(xué)高校中篩選出不低于門檻的部分,再?gòu)倪@部分中根據(jù)考生需求匹配最合適的一項(xiàng)或者幾項(xiàng)作為首選和備選。

這項(xiàng)涉及數(shù)據(jù)、系統(tǒng)和決策的繁雜工作,正好撞在了人工智能大模型的“槍口”上。百度、夸克、QQ瀏覽器、天工AI等等,一眾新老玩家都把“AI報(bào)志愿”幾個(gè)大字放到應(yīng)用最顯眼的位置,成了季度主打。

但有大模型加持的AI志愿填報(bào)到底水平如何,是否可靠,也是一直爭(zhēng)論不休的話題。尤其是今年,七個(gè)省份迎來了首屆“新高考”。

新高考采用分類考試、綜合評(píng)價(jià)、多元錄取的考試招生制度,與以往相比,在考試、命題、招生、錄取等方面都出現(xiàn)了很大變化。新高考賦予了考生更多的選擇空間,但也意味著過去的報(bào)考經(jīng)驗(yàn)將不再適用。不過人工智能的幫助是否會(huì)讓報(bào)考變得簡(jiǎn)單呢?

為了找到答案,我們?cè)囉昧松鲜?款市面最火的應(yīng)用,并且在相同環(huán)境、相同條件下對(duì)平臺(tái)進(jìn)行志愿推薦能力、復(fù)雜需求解決能力、推薦解釋能力等多方面進(jìn)行評(píng)測(cè),看看最終的結(jié)果如何。另外,為了確保測(cè)試的公平性,我們所使用的都是各個(gè)AI的非付費(fèi)公開版本,看看在“0收費(fèi)”的情況下,AI能給出怎樣的建議。

Part.1 沖、穩(wěn)、保,AI三把斧

首先,這四個(gè)平臺(tái)都需要先完善自己的省份以及專業(yè)、分?jǐn)?shù),我們假設(shè)自己是來自河南的理科考生,此次高考分?jǐn)?shù)586。

在完善了基本信息后,各個(gè)平臺(tái)會(huì)根據(jù)高考成績(jī)給到一個(gè)具體高考排名,而這個(gè)高考排名則是由省招生辦提供。

根據(jù)這些基礎(chǔ)信息,百度、夸克以及QQ瀏覽器都給到了“可沖擊、較穩(wěn)妥、可保底”三個(gè)方向的參考院校,并且在數(shù)據(jù)層面做得非常全面且詳細(xì),從歷年分?jǐn)?shù)到招生計(jì)劃,甚至連學(xué)費(fèi)和細(xì)分科目都給了參考。相反天工AI遜色許多,僅給到十余家推薦學(xué)院,以及往年的最低錄取分?jǐn)?shù)以及排名作為參考。

從學(xué)校推薦數(shù)量來看,百度給到了92所,夸克給到48所,QQ瀏覽器為55所。

但有意思的是,百度提供的92所院校均為可沖擊院校,穩(wěn)妥以及保底院校并未給出推薦。

值得一提的是,這4個(gè)平臺(tái)給到的院校推薦也有一定差別,百度和QQ瀏覽器以及天工AI給到的院校推薦覆蓋全國(guó),且在數(shù)據(jù)更新上也比較及時(shí),夸克多半為省內(nèi)院校,對(duì)想去省外的考生來說參考價(jià)值不大。

圖源:科技新知(夸克AI志愿助手)

另外,各個(gè)平臺(tái)給到的院校錄取預(yù)測(cè)概率也有較大差別。

拿浙江農(nóng)林大學(xué)舉例,在相同條件下,QQ瀏覽器給到的錄取概率為42%,百度給到的概率為20%,夸克則直接不將該學(xué)校作為沖刺目標(biāo)。

還有安陽(yáng)師范學(xué)院,夸克和百度均將其列為沖刺目標(biāo),且概率為50%左右,而在QQ瀏覽器上卻為穩(wěn)妥院校。

當(dāng)然,在百度、夸克以及QQ瀏覽器中,高考生均可以根據(jù)地理位置、院校性質(zhì)(如985、211或雙一流等)、專業(yè)偏好等進(jìn)一步篩選和排序院校,整理志愿信息等,使推薦更加貼合個(gè)人需求。

天工AI則是以智能體的問答形式所呈現(xiàn)。

圖源:科技新知(夸克AI志愿助手)

只是在錄取概率這一最重要的功能上,各家差異巨大的分析結(jié)果,還有眼花繚亂的大數(shù)據(jù),家長(zhǎng)看了都很迷惑,更別說剛高中畢業(yè)的學(xué)生。

而據(jù)科技新知結(jié)合各家平臺(tái)給到的信息推測(cè),這些內(nèi)容均來自權(quán)威官網(wǎng)、招生簡(jiǎn)章、專業(yè)書籍以及名師視頻等渠道,最后由AI綜合全網(wǎng)信息后進(jìn)行整理總結(jié),靠各家算法進(jìn)行輸出?;究梢岳斫鉃榭繑?shù)據(jù)進(jìn)行簡(jiǎn)單篩選,給到建議。

如果想要更加精準(zhǔn)的借助AI來輔助填報(bào)志愿,可以盡可能地將自己的想法與喜好詳細(xì)告訴AI,以此來獲得更準(zhǔn)確的答復(fù)。

這也是體現(xiàn)各家AI水準(zhǔn)的重要檢測(cè)標(biāo)準(zhǔn)。

Part.2 選專業(yè),誰(shuí)更專業(yè)?

從學(xué)校推薦數(shù)量來看,百度給到了92所,夸克給到48所,QQ瀏覽器為55所。但有意思的是,百度提供的92所院校均為可沖擊院校,穩(wěn)妥以及保底院校并未給出推薦。在更多需求下,基礎(chǔ)的過濾篩選模式變得無(wú)力,AI智能體更能理解考生的擇校標(biāo)準(zhǔn),所以各家背后的王牌大模型也成了比較對(duì)象。所以我們測(cè)試了百度的文心一言、騰訊的元寶、阿里的通義千問以及天工AI四家大模型應(yīng)用,在面對(duì)更詳細(xì)的志愿填報(bào)需求時(shí)的表現(xiàn)。

同樣,我們需要給自己一個(gè)身份設(shè)定,假設(shè)自己是一位來自河南的理科考生,喜歡踢球、唱歌、動(dòng)手能力強(qiáng),對(duì)各種實(shí)驗(yàn)以及電子產(chǎn)品十分感興趣,高考分?jǐn)?shù)為520分。雖然描述并不算詳細(xì),但也足夠讓AI建立一個(gè)對(duì)我們的初步印象,給出專業(yè)推薦。

根據(jù)這一身份設(shè)定,在第一輪回答中,各家給到的結(jié)果區(qū)別十分明顯。

騰訊元寶以及天工AI的推薦十分相似,均是一些理工科主流專業(yè),但兩家大模型給到的信息都十分有限,給出的推薦理由也十分勉強(qiáng),幾乎都是圍繞“動(dòng)手動(dòng)力”這一關(guān)鍵詞展開。

值得一提的是,這4個(gè)平臺(tái)給到的院校推薦也有一定差別,百度和QQ瀏覽器以及天工AI給到的院校推薦覆蓋全國(guó),且在數(shù)據(jù)更新上也比較及時(shí),夸克多半為省內(nèi)院校,對(duì)想去省外的考生來說參考價(jià)值不大。

圖源:科技新知(騰訊元寶推薦)

圖源:科技新知(天工AI推薦)

相比之下,通義千問以及文心一言除了考慮到專業(yè)選擇的實(shí)際性,也根據(jù)興趣興趣提供了相關(guān)活動(dòng)或輔修專業(yè)。

比如在踢球這個(gè)愛好下,提供了體育科學(xué)這一輔修專業(yè)。

圖源:科技新知(通義千問推薦)

圖源:科技新知(文心一言推薦)

值得一提的是,相較于其他平臺(tái)的籠統(tǒng)回答,文心一言更進(jìn)一步的提供了就業(yè)前景、專業(yè)細(xì)分、跨學(xué)科特性等更多參考信息。

圖源:科技新知(文心一言推薦)

不過這里需要注意的是,在AI推薦的專業(yè)中,并非都是理科統(tǒng)招可以報(bào)考的,其中一些需要通過藝考后才能選擇,此外不同的學(xué)校還會(huì)有其他的申請(qǐng)要求,而AI對(duì)此并沒有太多的說明,這是一個(gè)明顯的漏洞,需要你繼續(xù)追問對(duì)應(yīng)專業(yè)和學(xué)校的相關(guān)細(xì)節(jié),AI才會(huì)給出更詳細(xì)的回答。

整體看下來,各家AI還是基本完成了初步的專業(yè)篩選要求,只是除文心一言和通義千問外,其余兩家AI的表現(xiàn)都比較一般,沒有帶來太多驚喜。通義千問和文心一言的回答更具參考價(jià)值,可以讓你快速了解自己興趣愛好所對(duì)應(yīng)的專業(yè)情況,節(jié)省許多的時(shí)間和精力。

不過,選專業(yè)的測(cè)試并非到此為止,很多考生在選擇專業(yè)時(shí)也會(huì)十分關(guān)注未來就業(yè)形勢(shì),然而作為剛結(jié)束高考的學(xué)生來說,對(duì)某個(gè)專業(yè)了解有限的情況下,AI或許可以根據(jù)現(xiàn)有的市場(chǎng)需求、未來的市場(chǎng)發(fā)展方向、相關(guān)政策等方面給予我們一些建議。那么站在這個(gè)角度,AI會(huì)提供什么更專業(yè)的看法呢?

再向AI輸入“4年后,你認(rèn)為哪個(gè)專業(yè)會(huì)有最好的就業(yè)環(huán)境?”后,AI的回答也在意料之外。

騰訊元寶、天工AI、通義千問3家平臺(tái),都給出了包括新能源、生物科技、人工智能等前沿性專業(yè)推薦,文心一言回答的邏輯與其他3家完全不同,給到的是電子信息、計(jì)算機(jī)等更偏向傳統(tǒng)專業(yè)。不過4家平臺(tái)都針對(duì)各個(gè)專業(yè)做了就業(yè)方向和行業(yè)趨勢(shì)等分析,給出了更加詳細(xì)的解釋。

圖源:科技新知(通義千問回答)

有意思的是,騰訊元寶、天工AI、通義千問3家平臺(tái)雖然給出了比較專業(yè)且更前沿的專業(yè)的推薦,但是在沒有提供關(guān)鍵詞的情況下,都與上一個(gè)問題中提到的專業(yè)關(guān)聯(lián)性不大,有許多專業(yè)都是第一次出現(xiàn)在回答中,而且與提供的興趣愛好關(guān)聯(lián)性并不大。

文心一言提供的專業(yè)則與上個(gè)回答相似。

圖源:科技新知(文心一言回答)

不過這里需要注意的是,在AI推薦的專業(yè)中,并非都是理科統(tǒng)招可以報(bào)考的,其中一些需要通過藝考后才能選擇,此外不同的學(xué)校還會(huì)有其他的申請(qǐng)要求,而AI對(duì)此并沒有太多的說明,這是一個(gè)明顯的漏洞,需要你繼續(xù)追問對(duì)應(yīng)專業(yè)和學(xué)校的相關(guān)細(xì)節(jié),AI才會(huì)給出更詳細(xì)的回答。

整體看下來,各家AI還是基本完成了初步的專業(yè)篩選要求,只是除文心一言和通義千問外,其余兩家AI的表現(xiàn)都比較一般,沒有帶來太多驚喜。通義千問和文心一言的回答更具參考價(jià)值,可以讓你快速了解自己興趣愛好所對(duì)應(yīng)的專業(yè)情況,節(jié)省許多的時(shí)間和精力。

不過,選專業(yè)的測(cè)試并非到此為止,很多考生在選擇專業(yè)時(shí)也會(huì)十分關(guān)注未來就業(yè)形勢(shì),然而作為剛結(jié)束高考的學(xué)生來說,對(duì)某個(gè)專業(yè)了解有限的情況下,AI或許可以根據(jù)現(xiàn)有的市場(chǎng)需求、未來的市場(chǎng)發(fā)展方向、相關(guān)政策等方面給予我們一些建議。那么站在這個(gè)角度,AI會(huì)提供什么更專業(yè)的看法呢?

再向AI輸入“4年后,你認(rèn)為哪個(gè)專業(yè)會(huì)有最好的就業(yè)環(huán)境?”后,AI的回答也在意料之外。

騰訊元寶、天工AI、通義千問3家平臺(tái),都給出了包括新能源、生物科技、人工智能等前沿性專業(yè)推薦,文心一言回答的邏輯與其他3家完全不同,給到的是電子信息、計(jì)算機(jī)等更偏向傳統(tǒng)專業(yè)。不過4家平臺(tái)都針對(duì)各個(gè)專業(yè)做了就業(yè)方向和行業(yè)趨勢(shì)等分析,給出了更加詳細(xì)的解釋。

這一步,基本可以篩選出一部分合適自己,且是前景較好的專業(yè),那么根據(jù)專業(yè)以及分?jǐn)?shù)倒推,通過AI志愿助手是否可以幫助考生選出合適的學(xué)校呢?

Part.3 真實(shí)志愿填報(bào),AI只能當(dāng)輔助

在選好專業(yè)后,我們回到百度、夸克、QQ瀏覽器的AI志愿助手上,看看能否幫助我們選擇一個(gè)靠譜的院校,畢竟真實(shí)的志愿填報(bào)除了院校,專業(yè)的選擇也至關(guān)重要。這里我們將各個(gè)平臺(tái)的篩選模型改為專業(yè)優(yōu)先,并且專業(yè)選擇為計(jì)算機(jī)類。

首先是百度,在選擇想要報(bào)考的專業(yè)后,并沒有篩選出合適的院校,甚至排位順序都沒有改變。點(diǎn)開默認(rèn)排序的第一個(gè)院校,雖然顯示有20%的沖擊概率,但僅有一個(gè)專業(yè)有20%概率,而我們想要選擇的計(jì)算機(jī)類專業(yè),則只有9%的沖擊概率。

圖源:科技新知(百度AI志愿助手)

如果將選擇改為錄取概率從高到底也是如此,雖然不少院校的外顯概率很高,但點(diǎn)開后均非我們所選的計(jì)算機(jī)專業(yè)。

在整個(gè)篩選過程,百度的AI志愿助手幾乎沒有體現(xiàn)出任何智能,連基礎(chǔ)的篩選排序都未能如意。

不過,“老師傅”夸克也沒有給到我們太大驚喜??淇穗m然篩選出了符合條件的院校,但與百度相似,外顯概率顯示的也是本校最高概率的其他專業(yè),而非我們想要報(bào)考的計(jì)算機(jī)專業(yè)。我們點(diǎn)開一個(gè)外顯為60%的穩(wěn)妥院校,但計(jì)算機(jī)類專業(yè)的錄取概率為19%。

圖源:科技新知(夸克AI志愿助手)

相比之下,QQ瀏覽器的篩選能力更直觀,在選擇計(jì)算類專業(yè)后,過濾掉了45所,僅剩下10所院校,雖然與前兩者一致,外顯的并非是我們所選專業(yè)的錄取概率,不過逐一點(diǎn)開后發(fā)現(xiàn)也還算貼切。

圖源:科技新知(QQ瀏覽器AI志愿助手)

縱觀這三個(gè)平臺(tái),其實(shí)可以發(fā)現(xiàn)一個(gè)共同點(diǎn),就是各家均以院校為重,錄取概率也是按照院校中要求最低專業(yè)的概率來計(jì)算,但如今家長(zhǎng)、學(xué)生對(duì)于志愿填報(bào)早已不是單純只看學(xué)校,專業(yè)選擇也十分重要,但顯然AI志愿助手還不能給到好的建議,甚至連打輔助都難。

坦白講,讓看似“聰明”的AI來填志愿,似乎不太靠譜。浙江大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院教授陳華鈞看了AI的回答后,也是連連搖頭,“它不是專門為填志愿訓(xùn)練的,算法的訓(xùn)練很大程度依賴于訓(xùn)練數(shù)據(jù)的選擇,這包括了建模方式,對(duì)考生、學(xué)校和專業(yè)到底怎么評(píng)估,這個(gè)過程每個(gè)AI工具都不會(huì)一樣,所以給到的結(jié)果也不盡人意”。

不過夸克相關(guān)人員也向科技新知表示,AI志愿助手作為信息參考工具,跟市面上的收費(fèi)咨詢服務(wù)是有本質(zhì)的不同,最終的志愿填報(bào)策略和選題的決定權(quán)還是在用戶手里,需考量自身興趣、家庭背景、成長(zhǎng)規(guī)劃等。

對(duì)于多數(shù)考生來說,只要利用好AI的能力,在填報(bào)志愿時(shí)確實(shí)可以起到事半功倍的效果。而且以上的AI功能,大多是免費(fèi)提供的,并不需要支付會(huì)員費(fèi)用或是繳納高昂的輔導(dǎo)費(fèi),這一定程度上也讓可以拉近與其他考生的差距。但高考志愿填報(bào)除了復(fù)雜的分析、計(jì)算外更看重考生本身的意愿,很多時(shí)候,無(wú)論怎么選,都不會(huì)完美,都會(huì)有遺憾,不過請(qǐng)不要忘了,命運(yùn)永遠(yuǎn)是掌握在自己手中的。

作者丨王思原??編輯丨賽柯

本文由人人都是產(chǎn)品經(jīng)理作者【科技新知】,微信公眾號(hào):【科技新知】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒評(píng)論,等你發(fā)揮!