2月18日第一電動(dòng)消息,蘋果公司在自動(dòng)駕駛領(lǐng)域取得重大突破。蘋果將自博弈技術(shù)引入自動(dòng)駕駛,通過10天生成16億公里的模擬數(shù)據(jù),訓(xùn)練算法無需真實(shí)數(shù)據(jù)。這一技術(shù)的核心是GIGAFLOW模擬器,它能夠以極低的成本生成海量的模擬數(shù)據(jù),實(shí)現(xiàn)SOTA(State-of-the-art,當(dāng)前最佳)的效果。蘋果的這一成果在CARLA、nuPlan和Waymo開放數(shù)據(jù)集上進(jìn)行了零樣本獨(dú)立測試,均獲得了SOTA表現(xiàn),證明了其泛化性和魯棒性。
蘋果的自博弈技術(shù)類似于自對(duì)抗生成網(wǎng)絡(luò)(GAN),通過智能體與自我的副本或歷史版本博弈實(shí)現(xiàn)進(jìn)化。在自動(dòng)駕駛領(lǐng)域,蘋果設(shè)計(jì)了極簡的獎(jiǎng)勵(lì)函數(shù),無需真實(shí)數(shù)據(jù),而是生成大規(guī)模的模擬數(shù)據(jù),讓多個(gè)智能體在地圖上進(jìn)行自博弈,實(shí)現(xiàn)算法進(jìn)化。這種方法的優(yōu)勢在于速度快、成本低,依靠公共云上的8張A100,蘋果每小時(shí)可模擬和學(xué)習(xí)44億次狀態(tài)轉(zhuǎn)移,相當(dāng)于720萬公里的駕駛經(jīng)驗(yàn),速度比利用真實(shí)數(shù)據(jù)快了36萬倍。