在城市NOA逐漸成為智能汽車發(fā)展關(guān)鍵節(jié)點的背景下,自動駕駛行業(yè)的競爭焦點正逐步轉(zhuǎn)向數(shù)據(jù)、算力和算法模型的完善。隨著2023年上海車展后,業(yè)界對于“重感知+輕地圖”、純感知與融合感知路線,以及BEV+Transformer模型的共識形成,如何有效利用算力、算法和大規(guī)模高質(zhì)量數(shù)據(jù),成為實現(xiàn)自動駕駛商業(yè)化落地的關(guān)鍵。
在自動駕駛領(lǐng)域,數(shù)據(jù)被視為生命之源,其重要性不言而喻。特別是在端到端自動駕駛時代,數(shù)據(jù)的作用被空前放大。與傳統(tǒng)基于規(guī)則的算法時代不同,端到端技術(shù)依賴于大量數(shù)據(jù)來訓(xùn)練模型,使其能夠識別和預(yù)測各種駕駛場景。高質(zhì)量的數(shù)據(jù)輸入直接決定了模型輸出的準(zhǔn)確性和可靠性,這些數(shù)據(jù)不僅需要涵蓋各種道路和天氣條件,還要確保標(biāo)注的準(zhǔn)確性和多樣性。
獲取海量、多樣化、高質(zhì)量的數(shù)據(jù)是自動駕駛技術(shù)發(fā)展的首要前提。例如,特斯拉在自動駕駛數(shù)據(jù)積累方面走在了行業(yè)前列,其FSD測試?yán)锍棠繕?biāo)達(dá)到60億英里,以滿足全球監(jiān)管機構(gòu)的要求。特斯拉通過不斷擴大FSD功能覆蓋更多用戶,以獲取更多的真實路況數(shù)據(jù)。這一策略顯著提升了其自動駕駛系統(tǒng)的性能和泛化能力。
數(shù)據(jù)閉環(huán)的構(gòu)建是實現(xiàn)自動駕駛系統(tǒng)持續(xù)優(yōu)化和進(jìn)化的核心。這包括數(shù)據(jù)的采集、回傳、標(biāo)注、訓(xùn)練以及最終的OTA反饋到車端。盡管數(shù)據(jù)閉環(huán)的概念并非新穎,但在自動駕駛領(lǐng)域,其復(fù)雜性和挑戰(zhàn)性顯著增加。除了傳統(tǒng)的代碼端問題解決,自動駕駛系統(tǒng)還需要關(guān)注AI模型的調(diào)整和優(yōu)化,這引入了數(shù)據(jù)標(biāo)注、模型訓(xùn)練等新環(huán)節(jié)。
在數(shù)據(jù)采集環(huán)節(jié),自動駕駛企業(yè)面臨諸多挑戰(zhàn),包括采集策略的制定、數(shù)據(jù)質(zhì)量的定義和評估,以及數(shù)據(jù)分布的處理。同時,數(shù)據(jù)回傳的成本和存儲處理的延遲也是亟待解決的問題。在數(shù)據(jù)標(biāo)注環(huán)節(jié),盡管大模型的應(yīng)用可以自動化部分標(biāo)注工作,但復(fù)雜場景的標(biāo)注仍需人工完成,這極大地增加了標(biāo)注的成本和時間。
隱私保護(hù)和數(shù)據(jù)泛化問題也是自動駕駛企業(yè)在數(shù)據(jù)處理過程中必須嚴(yán)肅對待的挑戰(zhàn)。不同車型傳感器配置的差異導(dǎo)致數(shù)據(jù)采集的復(fù)用性降低,而合成數(shù)據(jù)的應(yīng)用為解決這一問題提供了新的思路。
在自動駕駛領(lǐng)域,合成數(shù)據(jù)尤其適用于極端情況的模擬。這些極端情況難以在真實道路上進(jìn)行模擬,但通過合成數(shù)據(jù)技術(shù),可以在幾小時內(nèi)模擬數(shù)百萬個極端場景,從而提升算法的性能和泛化能力。
數(shù)據(jù)在自動駕駛產(chǎn)業(yè)的驅(qū)動力不可忽視。完備的閉環(huán)模型需要大規(guī)模、高質(zhì)量、多場景的數(shù)據(jù)支持,同時還需要高算力、高效率、相對低成本的算法模型,以及趨向自動化的數(shù)據(jù)標(biāo)注與處理。數(shù)據(jù)閉環(huán)的每一步推進(jìn)都是成本和效率的博弈,需要上下游企業(yè)共同合作,實現(xiàn)數(shù)據(jù)共享、技術(shù)開源和生態(tài)共建。在這條實現(xiàn)城市NOA和更高級別智能駕駛的道路上,每一步都至關(guān)重要。