特斯拉Robotaxi發(fā)布后,具身智能話題再引熱議,涉及三大技術(shù)派
隨著特斯拉最新發(fā)布的Robotaxi和其Cybercab車型的亮相,自動(dòng)駕駛和具身智能領(lǐng)域再次成為熱議的焦點(diǎn)。埃隆·馬斯克的這一雄心勃勃的舉措不僅展示了特斯拉在自動(dòng)駕駛技術(shù)上的深入探索,也預(yù)示著未來出行方式的重大變革。
近日,特斯拉舉辦了名為”We,Robot”的發(fā)布會(huì),正式揭開了Robotaxi的神秘面紗。在發(fā)布會(huì)上,特斯拉CEO埃隆·馬斯克展示了一款專為自動(dòng)駕駛設(shè)計(jì)的全新車型——Cybercab。
據(jù)了解,Cybercab預(yù)計(jì)將依賴特斯拉的全自動(dòng)駕駛(FSD)軟件,可能包括攝像頭和激光雷達(dá)技術(shù)。此外,在該場發(fā)布會(huì)上,特斯拉還展示了一個(gè)專門的打車APP,用于召喚和支付Robotaxi服務(wù)。
在自動(dòng)駕駛業(yè)界,F(xiàn)SD頗為知名。一位行業(yè)從業(yè)者稱,國內(nèi)自動(dòng)駕駛系統(tǒng)較之還有差距。此輪公開展示,讓人們對(duì)自動(dòng)駕駛引導(dǎo)具身智能的未來展開了想象。
我們認(rèn)為,F(xiàn)SD下的自動(dòng)駕駛除駕駛技術(shù)高超外,在未來的人形機(jī)器人和具身智能領(lǐng)域也可能實(shí)現(xiàn)突破。
為此話題,我們找到了國內(nèi)的一些頂級(jí)企業(yè),并就此問題展開了深入討論。多位企業(yè)高管或CEO表示,已經(jīng)做好了和特斯拉“一起卷”的準(zhǔn)備。
雖然對(duì)手強(qiáng)大,但幾派掌門仍有勝券在握。
01 Sora派崛起前的靜默
其實(shí),不論是具身智能還是自動(dòng)駕駛,根本上是機(jī)器對(duì)3D物理世界的理解。可以說,哪種技術(shù)能理解真實(shí)物理世界、進(jìn)而進(jìn)行決策,誰就有可能拿到具身智能的最終入場券。
原理上,在實(shí)現(xiàn)決策之前,只有通過精確地感知和理解周圍的環(huán)境,機(jī)器才能做出準(zhǔn)確的決策并執(zhí)行復(fù)雜的任務(wù)。
以目前的技術(shù)而言,或有三種方向有望成為未來的佼佼者。
其一是以Sora為代表的文生視頻派。其想在機(jī)器人植入“腦”。
視頻由一系列幀組成。這一派所秉持的,是讓機(jī)器人學(xué)習(xí)連續(xù)的圖像,并從中獲得關(guān)于物體和環(huán)境隨時(shí)間變化的豐富信息用以加深機(jī)器人的理解。
這一派的貢獻(xiàn)可能是,讓機(jī)器人可以在未來具備學(xué)習(xí)多種操作任務(wù)和在多種環(huán)境中泛化的潛能。
國內(nèi)某家頂級(jí)的文生視頻公司對(duì)數(shù)科星球DigitalPlanet進(jìn)行了獨(dú)家回復(fù)。其科學(xué)家稱:“本質(zhì)上這是一個(gè)雞生蛋、蛋生雞的問題,要讓機(jī)器人更聰明,就要部署更多機(jī)器人獲取數(shù)據(jù),難點(diǎn)是推動(dòng)飛輪效應(yīng)的第一個(gè)動(dòng)力在哪里?!?/p>
他和他的團(tuán)隊(duì)認(rèn)為,文生視頻是解決上述問題唯一的路?!拔覀兯f的具身智能所面臨的問題,比汽車這種限定場景更為復(fù)雜,你可以理解成,他們是大數(shù)據(jù)集里的一個(gè)子集,”他補(bǔ)充。
這家公司解決的方案是,先通過視頻網(wǎng)站采集數(shù)據(jù),然后通過視頻生成結(jié)果反饋到具身智能中,而通過力學(xué)采集、自動(dòng)駕駛(雷達(dá)波)采集數(shù)據(jù)要在之后作為補(bǔ)充。
在數(shù)科星球DigitalPlanet的再三追問下,其表示,最晚將在明年的此時(shí)公布和Robotaxi差不多量級(jí)的產(chǎn)品發(fā)布。而當(dāng)下,各家文生視頻公司還處在“蓄力憋大招”的階段。
但好消息是,Sora派已在嘗試將AI大腦植入至機(jī)器人中。直到此文寫作之時(shí),對(duì)方表示“已經(jīng)在小數(shù)據(jù)集中形成了物理規(guī)律的學(xué)習(xí)”?!斑@一點(diǎn),你可以在AI游戲的進(jìn)展中得知,別的就不方便透露了”,這位企業(yè)家稱。
他的預(yù)期是,游戲的scaling law(規(guī)模法則)既已完成,就預(yù)示著已經(jīng)有了在大規(guī)模數(shù)據(jù)集中部署的可行性。
對(duì)于在機(jī)器人中植入“腦”,已經(jīng)很近了。
02 高精度物理模擬派
其二是以英偉達(dá)為代表的,在虛擬環(huán)境中測試和優(yōu)化機(jī)器人的技術(shù)派。他們規(guī)定了機(jī)器人的行為動(dòng)作。
因?yàn)?,CUDA有著優(yōu)秀的并行計(jì)算能力,可提供高精度的物理模擬,可以讓編輯好的行為部署到現(xiàn)實(shí)世界中。在英偉達(dá)眾多算法框架中,多種產(chǎn)品可以作為機(jī)器人動(dòng)作生成工具。
其中,例如在Omniverse平臺(tái),提供了逼真的物理模擬,這對(duì)于訓(xùn)練機(jī)器人理解3D物理世界有所幫助。這一派的優(yōu)勢是,可以通過模擬不同的環(huán)境和情況,讓機(jī)器人可以在沒有實(shí)際風(fēng)險(xiǎn)的情況下學(xué)習(xí)和適應(yīng)。
不過,這一派別極其依賴高質(zhì)量的3D內(nèi)容庫。
在數(shù)科星球DigitalPlanet此前分析中,對(duì)比GPT所依賴的高質(zhì)量文本數(shù)據(jù)語料,高質(zhì)量的3D內(nèi)容存量僅僅為前者的1/1000,大量數(shù)據(jù)并未公開且獲取難度大。
也因此,英偉達(dá)走上了構(gòu)建3D市場和數(shù)字資產(chǎn)庫、與其他數(shù)據(jù)庫合作和利用AI生成3D內(nèi)容的道路。
不過,以一些國內(nèi)相關(guān)公司的進(jìn)展來看,這條路似乎并不順暢?!耙恍╉?xiàng)目開始做定制項(xiàng)目了,這似乎代表著其商業(yè)潛力沒得到應(yīng)有的開發(fā)、或是僅此而已了”,一位投資人稱。
在基于數(shù)據(jù)生成特定動(dòng)作方面,還需觀察。僅以目前所掌握的情況而言,其作為鮮有服務(wù)型機(jī)器人的升級(jí)版未來可期,但做到極度神似真人,還尚需時(shí)間。
03 自動(dòng)駕駛、車路云協(xié)同派
其三是自動(dòng)駕駛、車路云派。他們影響著機(jī)器人的“場”。
應(yīng)該說,Robotaxi的具身智能發(fā)展方向有著代表性意義。一位資深從業(yè)者回答數(shù)科星球DigitalPlanet:“目前特斯拉FSD進(jìn)入中國市場,幾乎已成為確定性事件,而這個(gè)變局的影響才剛剛開始?!?/p>
可以預(yù)計(jì)的是,F(xiàn)SD將成為鯰魚,再次發(fā)生攪動(dòng)效應(yīng)。
在特斯拉發(fā)布會(huì)中,幾個(gè)要點(diǎn)頗為重要:
其一是,特斯拉的數(shù)據(jù)訓(xùn)練規(guī)模龐大,據(jù)稱有數(shù)百萬車隊(duì)在做測試和收集數(shù)據(jù);其二是,因技術(shù)同源性,其電池、電力電子系統(tǒng)、先進(jìn)的電驅(qū)系統(tǒng)、軟件系統(tǒng)、人工智能計(jì)算機(jī),都適用于人形機(jī)器人;其三是,特斯拉預(yù)計(jì)將來實(shí)現(xiàn)量產(chǎn)的人形機(jī)器人成本大約2萬到3萬美元,可能比一輛車還便宜。
我們得到的資料顯示,此機(jī)器人“可以當(dāng)老師、照顧小孩、遛狗、修剪草坪、購物、幫你倒酒水飲料等等?!?/p>
所以,幾乎是在一瞬間,自動(dòng)駕駛走向具身智能的通路被打開了。
元戎啟行CEO周光稱,“我們正在基于端到端模型和Thor芯片研發(fā)VLA模型”,據(jù)了解,VLA(視覺-語言-動(dòng)作)模型旨在使機(jī)器人能夠理解視覺信息、語言指令,并據(jù)此執(zhí)行相應(yīng)的動(dòng)作。該公司率先提及VLA概念,并因此得到了發(fā)展先機(jī)。
結(jié)果是,在這家公司所引導(dǎo)的具身智能已初步具備“智慧”。比如,在一些潮汐路段,碰到堵車時(shí),車輛堵著后面的車,自動(dòng)駕駛系統(tǒng)會(huì)自動(dòng)“向前挪一挪”。這被認(rèn)為是,系統(tǒng)已初步具備了少許智慧。
在這一派別的競爭中,核心點(diǎn)仍然是擁有海量的數(shù)據(jù)。
周光稱:“特斯拉未必能成為破局者?!彼o出的理由是,F(xiàn)SD入華需要一定時(shí)間進(jìn)行本土化的訓(xùn)練適配,國內(nèi)主機(jī)廠仍具有一定的本土化優(yōu)勢。他認(rèn)為,一旦智能駕駛系統(tǒng)在消費(fèi)市場迅速鋪開,以這家公司為例的本土廠商所獲得的數(shù)據(jù)量會(huì)大大提升,屆時(shí)與特斯拉的技術(shù)差距會(huì)逐漸縮小。
除了端到端,智能網(wǎng)聯(lián)的問題也尤為重要。
中國工程院院士國家智能網(wǎng)聯(lián)汽車創(chuàng)新中心首席科學(xué)家李克強(qiáng)認(rèn)為:“FSD做的實(shí)際上是車云協(xié)同,而在這個(gè)過程中車路云一體化才是自動(dòng)駕駛的終極?!保–ICV大會(huì))
蘑菇車聯(lián)的內(nèi)部員工提及,可以將具身智能看作智能體。在未來,當(dāng)智能體變多之時(shí),不同智能體之間的協(xié)同問題將會(huì)水漲船高。
在智能體變得越來越多的時(shí)候,協(xié)同問題或?qū)⒊蔀榫呱碇悄馨l(fā)展的關(guān)鍵。為了解決這個(gè)問題,蘑菇車聯(lián)的方案是“通過建立‘通感算’網(wǎng)絡(luò)體系,為車輛(自動(dòng)駕駛車輛、非自動(dòng)駕駛車輛)以及各種智能設(shè)備(機(jī)器人、無人機(jī)等)提供系統(tǒng)級(jí)實(shí)時(shí)數(shù)字孿生服務(wù)。”
他們還預(yù)估,未來將出現(xiàn)兩套網(wǎng)絡(luò),“天網(wǎng)”由衛(wèi)星系統(tǒng)構(gòu)成,而“地網(wǎng)”就是車路云網(wǎng)絡(luò)。原理是,智能體需要接入車路云網(wǎng)絡(luò),因?yàn)檐嚶吩凭W(wǎng)絡(luò)可以在系統(tǒng)級(jí)層面解決群體安全、群體效率與群體博弈問題。
蘑菇車聯(lián)副總裁呂斌認(rèn)為,類似智能車這類“單點(diǎn)智能”場景會(huì)向著系統(tǒng)智能的方向進(jìn)化。
目前,據(jù)數(shù)科星球DigitalPlanet所知,蘑菇車聯(lián)車路云一體化項(xiàng)目已在北京、上海、深圳、天津、四川、遼寧、湖南、云南、山東、湖北等多地實(shí)現(xiàn)落地運(yùn)行。
當(dāng)然,這也為具身智能的大面積應(yīng)用做好了充分的鋪墊。
結(jié)尾
Sora裝腦、Omniverse裝四肢、自動(dòng)駕駛和路網(wǎng)云做場,已構(gòu)成一場關(guān)于自動(dòng)駕駛和具身智能的新角斗場。
數(shù)科星球DigitalPlanet看到,新的爭奪已悄然開始。而在FSD進(jìn)入中國市場前夜,“自動(dòng)駕駛?cè)蠹摇敝坏奶}卜快跑等企業(yè)已摩拳擦掌,靜待競爭來臨。
作為完全對(duì)標(biāo)Robotaxi的企業(yè),自2021年以來已在包括北京、上海、廣州、深圳、重慶、武漢、成都、長沙、合肥、陽泉、烏鎮(zhèn)在內(nèi)的全國11個(gè)城市開放載人測試。
目前,國內(nèi)的無人車已在成本方面有著巨大優(yōu)勢。而其他自動(dòng)駕駛公司也已在快速地跑馬圈地。
各路“神仙”似乎已在躍躍欲試。
在不遠(yuǎn)的將來,街上遍布人形機(jī)器人的情形將不會(huì)遙遠(yuǎn)??梢源_定的是,在這個(gè)過程中,國產(chǎn)Sora、3D大模型、自動(dòng)駕駛、無人車和車路云企業(yè)將為此不遺余力。
這勢必是一場激烈的戰(zhàn)斗。
作者丨苑晶 編輯丨大兔
本文由人人都是產(chǎn)品經(jīng)理作者【數(shù)科星球】,微信公眾號(hào):【數(shù)科星球DigitalPlanet】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!