繼「全國(guó)都能開(kāi)」后,「車(chē)位到車(chē)位」成為智駕最新的評(píng)價(jià)標(biāo)準(zhǔn)。
具體分兩個(gè)維度,「有沒(méi)有」以及「強(qiáng)不強(qiáng)」,就此區(qū)隔強(qiáng)者與恒強(qiáng)者的身份。
放眼全球范圍內(nèi),特斯拉、華為、理想、小鵬、小米、極氪六名智駕玩家,都進(jìn)入了「車(chē)位到車(chē)位」的競(jìng)爭(zhēng)場(chǎng)域。
一場(chǎng)更嚴(yán)苛的像素級(jí)競(jìng)爭(zhēng)開(kāi)啟后,新舊勢(shì)力們追趕第一梯隊(duì)的弦崩得更緊了。
優(yōu)勝劣汰下,有人離終點(diǎn)更近一步,就意味著有人離淘汰也更近一步。
01 當(dāng)智駕談?wù)摗杠?chē)位到車(chē)位」時(shí),到底在談?wù)撌裁?/span>
端到端落地后,比拼關(guān)鍵在于用戶體驗(yàn)。
從營(yíng)銷(xiāo)視角著眼,用戶體驗(yàn)是一個(gè)很籠統(tǒng)的詞,車(chē)企/供應(yīng)商需要借助一個(gè)強(qiáng)有力的論據(jù),讓用戶看到擊穿痛點(diǎn)的價(jià)值。
由此,各玩家盯上了「車(chē)位到車(chē)位」。
華為率先提出了這個(gè)概念,按照字面含義,它指向了從任意車(chē)位出發(fā)到目的地車(chē)位的全程智駕。
如果說(shuō)此前「全國(guó)都能開(kāi)」是從面上證明開(kāi)城規(guī)模廣,現(xiàn)在的「車(chē)位到車(chē)位」就是從點(diǎn)上明確使用價(jià)值強(qiáng),把「從 A 點(diǎn)開(kāi)到 B 點(diǎn)」的底層邏輯映射到現(xiàn)實(shí)層面。
在華為打出樣本之后,小鵬、理想、極氪、小米都心照不宣地將「車(chē)位到車(chē)位」提上日程。
大洋彼岸的特斯拉,最近也將「車(chē)位到車(chē)位」功能更新到智駕最新版本 FSD V13.2 中。
我們?cè)噲D從六名玩家對(duì)于這一功能的敘事中,解讀其背后的隱含意義,主要有三點(diǎn)。
一是全場(chǎng)景覆蓋。
「車(chē)位到車(chē)位」打通了停車(chē)場(chǎng)到公開(kāi)道路、公開(kāi)道路到園區(qū)、園區(qū)地面到地下車(chē)庫(kù)等多種場(chǎng)景,其中,「過(guò)閘機(jī)」能力成為了表述關(guān)鍵詞。
理想強(qiáng)調(diào)在端到端大模型應(yīng)用下,系統(tǒng)可以自主通行 ETC,且不限范圍、無(wú)需學(xué)習(xí),全國(guó)超 1 萬(wàn)個(gè)收費(fèi)站均可識(shí)別通行。
極氪則表示該功能具備行業(yè)首個(gè)「四抬杠」能力,能夠毫秒級(jí)精準(zhǔn)捕捉抬杠狀態(tài),自動(dòng)識(shí)別并通過(guò)地庫(kù)閘機(jī)、高速 ETC 閘機(jī)、園區(qū)閘機(jī)等。
二是應(yīng)對(duì)復(fù)雜路況。
此前車(chē)企在闡述智駕能力時(shí),往往把應(yīng)對(duì)多個(gè)極端場(chǎng)景作為重點(diǎn)論據(jù)。但極端場(chǎng)景多樣化無(wú)法窮盡。
而在「車(chē)位到車(chē)位」的語(yǔ)境下,則強(qiáng)調(diào)了智駕應(yīng)對(duì)復(fù)雜路況的連貫性與完整性。
小鵬就強(qiáng)調(diào)了車(chē)輛在「車(chē)位到車(chē)位」整個(gè)過(guò)程中,能夠應(yīng)對(duì)復(fù)雜路口、匯流變道、識(shí)別并避讓特種車(chē)輛,實(shí)現(xiàn) U 型掉頭等特殊操作,做到全程無(wú)接管。
三是連接泊車(chē)功能。
車(chē)企在自動(dòng)泊車(chē)能力上已經(jīng)卷到了厘米、分秒級(jí)別。
這邊小鵬表示,系統(tǒng)可以泊入比車(chē)身寬僅 30cm 的極窄車(chē)位,號(hào)稱側(cè)方位、斷頭位、刁鉆車(chē)位「一把到位」;
那邊極氪跟上,聲稱其泊車(chē)功能支持車(chē)寬+左右 20cm 的窄車(chē)位泊入,平均泊車(chē)時(shí)長(zhǎng) 36 秒,在壓線情況下能實(shí)現(xiàn)智能偏移。
現(xiàn)在,在「車(chē)位到車(chē)位」的應(yīng)用場(chǎng)景中,這種出色的泊車(chē)能力與車(chē)輛行駛之間沒(méi)有斷點(diǎn)。用戶坐進(jìn)車(chē)內(nèi),就可以啟動(dòng)智駕,系統(tǒng)可以在自動(dòng)駕駛與泊車(chē)無(wú)縫協(xié)作下,到達(dá)下一個(gè)車(chē)位。
由此,跨過(guò)「車(chē)位到車(chē)位」這道大坎的玩家們,正在新的度量衡中開(kāi)啟競(jìng)速。
目前,理想已經(jīng)在 11 月底全量推送了「車(chē)位到車(chē)位」功能,華為、小米、小鵬、特斯拉都開(kāi)啟了不同程度的內(nèi)測(cè),都預(yù)計(jì)明年開(kāi)啟全量推送,極氪則預(yù)計(jì)明年一季度分批推送,二季度全量推送。
02「車(chē)位到車(chē)位」水面之下,暗流交相涌動(dòng)
當(dāng)各家都亮出「車(chē)位到車(chē)位」大招時(shí),如何評(píng)判功能優(yōu)劣的問(wèn)題接踵而至。
理想汽車(chē)技術(shù)專家文治宇曾一針見(jiàn)血指出,車(chē)位到車(chē)位做的好不好,主要看兩個(gè)核心要素。
一是體驗(yàn)連貫性,即在啟動(dòng)這個(gè)功能前是否需要多次學(xué)習(xí),學(xué)習(xí)完成后能否立即開(kāi)啟使用;
二是產(chǎn)品完整性,即對(duì)于一些復(fù)雜起步場(chǎng)景,如多層車(chē)庫(kù)能,是否也能夠駕馭,做到全程無(wú)斷點(diǎn)。
圍繞這兩點(diǎn),把目前這些玩家的「車(chē)位到車(chē)位」功能放進(jìn)審視場(chǎng)域中,可以明顯看到共性與差異。
共性在于,無(wú)論內(nèi)測(cè)還是全量推送,目前國(guó)內(nèi)玩家在地庫(kù)、封閉停車(chē)場(chǎng)場(chǎng)景時(shí)由于沒(méi)有導(dǎo)航信息,需要先由用戶跑「圖」。
具體建圖方式還不一致,有玩家要求車(chē)企把地庫(kù)所有路線全部跑一遍,相當(dāng)于給地庫(kù)建一次全面、清晰的地圖后,方可使用「車(chē)位到車(chē)位」;
另一種思路是,用戶僅需按照系統(tǒng)要求,完成起點(diǎn)、目的地的車(chē)位駛?cè)脒M(jìn)口、駛出出口的路線學(xué)習(xí),即可啟動(dòng)該功能。
當(dāng)然,系統(tǒng)也會(huì)結(jié)合用戶常駕駛路線數(shù)據(jù),通過(guò)靜默學(xué)習(xí),自動(dòng)生成通勤路線的「車(chē)位到車(chē)位」。
所以,唯一區(qū)分點(diǎn)在于,「車(chē)位到車(chē)位」功能能否適用于初次行駛場(chǎng)景,即用戶在陌生路段不建圖,也能全程使用智駕。
目前似乎只有特斯拉做到了。
在國(guó)外用戶實(shí)測(cè) FSD V13.2 版本的視頻中,用戶把車(chē)輛開(kāi)進(jìn)多樓層、甚至標(biāo)識(shí)不清晰的停車(chē)場(chǎng)頂樓后,還故意繞了很多圈迷惑 FSD,但開(kāi)啟智駕后,系統(tǒng)在未提前學(xué)習(xí)路線的情況下,沒(méi)有出現(xiàn)無(wú)目的繞圈、跟車(chē)行為,而是很快找到正確路線,并從出口處駛離停車(chē)場(chǎng)。
如果說(shuō)國(guó)內(nèi)玩家「車(chē)位到車(chē)位」功能需要學(xué)習(xí)路線后才能開(kāi)啟,就意味著它目前適用于固定、高頻率的出行路線,而特斯拉把這一先驗(yàn)條件摘除后,用戶則可以通過(guò)從車(chē)位開(kāi)啟智駕,去往任何「無(wú)圖」區(qū)域。
另一差異點(diǎn)在于,玩家們的對(duì)于「車(chē)位到車(chē)位」的具體解題思路還不一致:
一派以理想為代表,遵循「VPA+NOA+VPA」的技術(shù)路徑。
即在停車(chē)場(chǎng)路段,驅(qū)動(dòng)系統(tǒng)行駛的是記憶泊車(chē)/代客泊車(chē)模式,而駛?cè)牍_(kāi)道路后,則立刻轉(zhuǎn)變?yōu)橹邱{領(lǐng)航模式。從 SR 畫(huà)面可以直觀看出,當(dāng)系統(tǒng)進(jìn)入停車(chē)場(chǎng)景時(shí),從泊車(chē)界面會(huì)絲滑切入智駕界面。
這一路徑,也成為了目前多數(shù)玩家的選擇。
另一派以特斯拉、小鵬為代表,用一套模式打通全場(chǎng)景。
即無(wú)論是在園區(qū)封閉路段、地下停車(chē)場(chǎng)區(qū)域還是在公開(kāi)路段,SR 界面一直保持智駕 NOA 畫(huà)面,不會(huì)隨場(chǎng)景變化切換軟件系統(tǒng)。
小鵬自動(dòng)駕駛產(chǎn)品高級(jí)總監(jiān)袁婷婷表示,這種方式的優(yōu)點(diǎn)在于,當(dāng)行駛到停車(chē)場(chǎng)與公開(kāi)道路的交匯點(diǎn)時(shí),系統(tǒng)不會(huì)因切換軟件導(dǎo)致卡殼現(xiàn)象,相當(dāng)于從汽車(chē)起步時(shí),就切換到 NGP 系統(tǒng)上,保證體驗(yàn)一致性。
行泊一體的邏輯,還使得 XNGP 大模型在封閉場(chǎng)景及停車(chē)場(chǎng)區(qū)域,可以更好應(yīng)對(duì)繞柱、避障、極窄通道會(huì)車(chē)、連續(xù)急彎等場(chǎng)景。并且,相比兩套模型,一套模型的更新、維護(hù)在成本、效率上似乎是更優(yōu)解。
總之,盡管目前特斯拉 FSD V13.2 內(nèi)測(cè)版本看似領(lǐng)先一步,但距離其入華還有一段時(shí)間。
在此期間,國(guó)內(nèi)玩家的技術(shù)飛輪正瘋狂轉(zhuǎn)動(dòng),不斷優(yōu)化「車(chē)位到車(chē)位」功能,更新到最終全量推送的版本上。
在真正同臺(tái)競(jìng)技的時(shí)刻之前,勝負(fù)依然未定。
03 端到端進(jìn)化到 2.0 時(shí)代
「車(chē)位到車(chē)位」,可以看作各玩家對(duì)于「端到端」方法論的具體演繹。
「端到端」上車(chē),本就指向了 AI 系統(tǒng)擁有類人駕駛的能力,一張神經(jīng)大網(wǎng)囊括了從感知到規(guī)控所有模塊,從而在應(yīng)對(duì)極端場(chǎng)景時(shí),不再被生硬的規(guī)則控制,而是像人類司機(jī)一樣觀察、思考、決策、執(zhí)行。
這反映到「車(chē)位到車(chē)位」的實(shí)際場(chǎng)景中,系統(tǒng)可以應(yīng)對(duì)各類極端情況,駕駛水平愈發(fā)出色,由此構(gòu)成了技術(shù)-應(yīng)用的完整閉環(huán)。
在數(shù)據(jù)閉環(huán)迭代過(guò)程中,「端到端」技術(shù)也演化到了 2.0 階段。
這時(shí),投身于端到端浪潮的頭部玩家們,從路徑收斂走到了路徑分野的十字路口。
一邊從感知規(guī)控模塊劃分,「兩段式端到端」向「一段式端到端」奔涌。
前者將感知模塊視為一段,預(yù)測(cè)到?jīng)Q策模塊視為另一段;后者則是將感知與規(guī)控端到端模塊全部打通。
「兩段式端到端」典型代表為華為乾崑 ADS3.0,由 GOD+PDP 網(wǎng)絡(luò)組成,GOD 網(wǎng)絡(luò)負(fù)責(zé)感知、識(shí)別障礙物,PDP 網(wǎng)絡(luò)則根據(jù)感知信息迅速做出決策。
而「一段式端到端」主要玩家有 Momenta、商湯科技等,將感知端到端與規(guī)控端到端都集成到一個(gè)大模型中,使系統(tǒng)能夠更直接、高效地處理信息并作出反應(yīng)。
一段式端到端是兩段式端到端的進(jìn)化形態(tài),由于其打通感知、規(guī)控端到端環(huán)節(jié),使得模型感知信息更準(zhǔn)確,規(guī)控反應(yīng)可以更為順暢,靈活,智駕水平更強(qiáng)。
Momenta 已經(jīng)踐行了這一演進(jìn)路徑,在 2023 年量產(chǎn)兩段式端到端后,在今年上半年又實(shí)現(xiàn)了一段式端到端落地。
據(jù)媒體報(bào)道,華為車(chē) BU 也在攻入一段式端到端方案,這或?qū)⒊蔀?ADS 4.0 版本的重要能力。
另一邊從技術(shù)路線思考,「端到端+VLM」朝「VLA」路徑開(kāi)始迭代。
理想以「快慢系統(tǒng)」理論為基礎(chǔ),先設(shè)計(jì)出一套「端到端+VLM(視覺(jué)語(yǔ)言大模型)」系統(tǒng)。
兩個(gè)模型分工協(xié)作,端到端模型基于快思考,負(fù)責(zé)處理常規(guī)的駕駛行為,VLM 模型通過(guò)慢思考,應(yīng)對(duì)高難度的極端場(chǎng)景。
而 VLA 模型是近期走上技術(shù)神壇的關(guān)鍵詞,由元戎啟行率先提出。
VLA 即視覺(jué)-語(yǔ)言-動(dòng)作模型,顯然,從名稱中可以發(fā)現(xiàn),它是「端到端+VLM」系統(tǒng)的一整個(gè)融合體。
這種一體化方式,使系統(tǒng)接受到數(shù)據(jù)后,不再由「快慢」系統(tǒng)進(jìn)行多次交互與調(diào)整,而是一次性生成最終駕駛指令,提高信息處理、決策的效率,并能夠應(yīng)對(duì)一些更具挑戰(zhàn)性的長(zhǎng)尾場(chǎng)景,如幾十秒路況的長(zhǎng)時(shí)序推理等。
最近理想發(fā)布的高級(jí)工程師招聘細(xì)則中,清晰提到的一條「負(fù)責(zé)研發(fā)和落實(shí)理想汽車(chē)下一代自動(dòng)駕駛端到端 VLA 大模型算法」,再次證實(shí)了 VLA 模型將成為未來(lái)方案。
事實(shí)上,無(wú)論是「一段式端到端」還是「VLA」模型的新型進(jìn)化,背后都是對(duì) AI 資源的進(jìn)一步消耗。
模型參數(shù)越大,對(duì)硬件算力、數(shù)據(jù)閉環(huán)的迭代能力要求越高。
據(jù)悉,部署 VLA 模型,對(duì)芯片算力等級(jí)直接來(lái)到了 NVIDA DRIVE Thor,算力高達(dá) 1000+TOPS。
資源戰(zhàn)打響后,智駕第一梯隊(duì)與其它玩家的分水嶺變得更大了。
在端到端 2.0 時(shí)代,性能體驗(yàn)與成本都在朝不同方向無(wú)限延伸:
性能走向高處,「車(chē)位到車(chē)位」成為衡量智駕水平的核心維度;
成本走向低處,高階智駕正快速落地 20 萬(wàn)元以內(nèi)的新車(chē)。
其它智駕玩家們?cè)谇昂髪A擊下,「性價(jià)比」的擔(dān)子更重了。
這也意味著,智駕「第一梯隊(duì)」走的越來(lái)越快,掌握了更多資源,一場(chǎng)馬太效應(yīng)正在行業(yè)默默蓄勢(shì)。
市場(chǎng)很現(xiàn)實(shí),如果不想被規(guī)則淘汰,那就只能改寫(xiě)規(guī)則。