訂閱
糾錯(cuò)
加入自媒體

車載邊緣運(yùn)算如何成為自動(dòng)駕駛重要技術(shù)?

全球汽車快訊 據(jù)外媒報(bào)道,自動(dòng)駕駛車輛需要大量的傳感器、海量的數(shù)據(jù)、持續(xù)提升的運(yùn)算能力、實(shí)時(shí)操作及安全性顧慮,上述因素將運(yùn)算的核心從云端推向了網(wǎng)絡(luò)邊緣。

自動(dòng)駕駛車輛將持續(xù)不斷地感知路況、定位及周邊車輛,然后發(fā)送上述數(shù)據(jù)。自動(dòng)駕駛車輛每秒將生產(chǎn)近1GB的數(shù)據(jù)量,由于存在帶寬和延遲,即便是先向集中式服務(wù)器某個(gè)發(fā)送兆兆字節(jié)(TB)的片段,再將其用于數(shù)據(jù)分析,該方法依然不切實(shí)際。

由于大量的數(shù)據(jù)需要傳輸、存在延遲和網(wǎng)絡(luò)安全性問(wèn)題,目前的云端運(yùn)算服務(wù)架構(gòu)對(duì)向無(wú)人駕駛車輛提供實(shí)時(shí)的人工智能處理有妨礙作用。

因此,作為人工智能的主要代表性技術(shù),深度學(xué)習(xí)將被整合到邊緣運(yùn)算框架內(nèi)。邊緣人工智能運(yùn)算可解決延遲敏感型監(jiān)控,如:目標(biāo)追蹤與檢測(cè)、位置感知及云端運(yùn)算范式所面臨隱私性保護(hù)方面的挑戰(zhàn)。

若邊緣運(yùn)算平臺(tái)能負(fù)責(zé)預(yù)先訓(xùn)練深度學(xué)習(xí)建模

只有當(dāng)所采集的數(shù)據(jù)能夠?qū)崿F(xiàn)本地化處理、能做出實(shí)時(shí)決策和預(yù)判,且對(duì)遠(yuǎn)程資源無(wú)依賴時(shí),才能實(shí)現(xiàn)邊緣人工智能運(yùn)算的真實(shí)價(jià)值。該情況的發(fā)生僅存在于以下前提條件:邊緣運(yùn)算平臺(tái)能負(fù)責(zé)預(yù)先訓(xùn)練深度學(xué)習(xí)建模并擁有運(yùn)算資源在本地執(zhí)行實(shí)時(shí)推理。

延遲和本地化(地點(diǎn),locality)是邊緣(運(yùn)算)的兩大核心要素,因?yàn)閷?duì)于無(wú)人駕駛車輛而言,數(shù)據(jù)傳輸延遲和上行服務(wù)中斷是無(wú)法忍受的事情,且會(huì)引發(fā)安全隱患(SO26262)。

舉個(gè)例子,車載傳感器應(yīng)能在3秒內(nèi)檢測(cè)并識(shí)別周邊的環(huán)境,該過(guò)程并不依賴于云端的運(yùn)算資源,且可靠性要達(dá)到99.9999%。

對(duì)于一輛以120公里/小時(shí)行駛的車輛而言,1毫秒的來(lái)回延遲(round-trip latency)意味著車輛與靜態(tài)目標(biāo)物間的距離縮短了3厘米。如果對(duì)方是相向行駛中的車輛,該延遲意味著這兩輛車間的距離縮短了6厘米。

目前,對(duì)自動(dòng)駕駛車輛的功能應(yīng)用而言,最令人興奮的莫過(guò)于車載人工智能運(yùn)算任務(wù),其中包括:目標(biāo)檢測(cè)、目標(biāo)分割、路面追蹤、標(biāo)識(shí)和信號(hào)識(shí)別,上述任務(wù)主要依賴于通用類硬件——中央處理器(CPU)、圖形處理器(GPU)、現(xiàn)場(chǎng)可編程門陣列(FPGA)或通用的處理器。

然而,應(yīng)將耗電量、運(yùn)行速度、精確度、內(nèi)存占用、芯片尺寸、物料清單成本等因素統(tǒng)統(tǒng)納入到自動(dòng)駕駛及內(nèi)置應(yīng)用的功能設(shè)計(jì)中。

為滿足熱穩(wěn)定約束,采用的冷卻負(fù)載將進(jìn)一步提升圖形處理器的高耗電量,這將極大地縮短車輛的駕駛里程數(shù)和電動(dòng)車的燃油效率。

別致的包裝/套件、風(fēng)扇冷卻和通用型實(shí)現(xiàn)組件也不可或缺。因此,這就需要采用更為便宜、能效更高的優(yōu)化版人工智能加速器芯片(如:針對(duì)特定領(lǐng)域、基于人工智能推理的專用集成電路,ASIC),將其作為加速邊緣深度學(xué)習(xí)推理速度的實(shí)用方案。

人工智能車載邊緣運(yùn)算的優(yōu)點(diǎn)

最近,在提升車輛安全性和能源效率方面,付出了重大的努力。如今,車載通信及基于5G網(wǎng)絡(luò)的車聯(lián)網(wǎng)(V2X)所取得的技術(shù)進(jìn)步為車輛與基礎(chǔ)設(shè)施網(wǎng)絡(luò)間的通信(V2I)提供了可靠的通信鏈路。

邊緣運(yùn)算最適用于帶寬密集型和延遲敏感型應(yīng)用,如:出于安全原因,需要立即做出行為及響應(yīng)的無(wú)人駕駛汽車。

自動(dòng)駕駛系統(tǒng)極為復(fù)雜,其緊密地整合了以下多種技術(shù):感應(yīng)、定位、感知、決策、與云端平臺(tái)的順暢交互以生成高清地圖并完成數(shù)據(jù)存儲(chǔ)。這類技術(shù)的復(fù)雜性為自動(dòng)駕駛邊緣運(yùn)算系統(tǒng)的設(shè)計(jì)工作平添了海量的挑戰(zhàn)。

車載邊緣運(yùn)算(Vehicular edge computing,VEC)系統(tǒng)需要實(shí)時(shí)處理海量的數(shù)據(jù)。由于VEC系統(tǒng)是可移動(dòng)的,其通常具有非常嚴(yán)格的能耗限制因素。

為此,當(dāng)務(wù)之急是在合理的能耗范圍內(nèi)提供充足的運(yùn)算能力,從而確保自動(dòng)駕駛車輛的安全性。即便該車輛也高速行駛,也需要做到這一點(diǎn)。

談到為自動(dòng)駕駛車輛設(shè)計(jì)一款邊緣運(yùn)算生態(tài)系統(tǒng),其超負(fù)荷挑戰(zhàn)在于:提供能實(shí)時(shí)處理且足夠強(qiáng)大的運(yùn)算能力、保障可靠性、可擴(kuò)容性、成本和安全性,從而確保自動(dòng)駕駛車輛用戶體驗(yàn)的安全性與品質(zhì)。

表2——車載邊緣運(yùn)算與車載云端運(yùn)算的對(duì)比

低延遲

對(duì)于行車安全而言,零(低)延遲是必需/必要條件。許多自動(dòng)駕駛車輛制造商的設(shè)計(jì)構(gòu)想是:傳感器數(shù)據(jù)將流向云端,進(jìn)行自動(dòng)駕駛車輛所需的深層數(shù)據(jù)處理、深度學(xué)習(xí)、訓(xùn)練及分析,使得車企采集了海量的駕駛數(shù)據(jù),然后利用機(jī)器學(xué)習(xí)來(lái)提升基于人工智能的自動(dòng)駕駛實(shí)踐和學(xué)習(xí)。

據(jù)估計(jì),在整個(gè)網(wǎng)絡(luò)發(fā)送數(shù)據(jù),整個(gè)來(lái)回(發(fā)送和接收)需要至少150-200毫秒,鑒于車輛在行駛中,且需要做出車輛控制方面的駕駛決策,該耗時(shí)占用了大量的時(shí)間。

據(jù)豐田透露,到2025年,車輛與云端網(wǎng)絡(luò)間的數(shù)據(jù)傳輸量或?qū)⑦_(dá)到10艾字節(jié)(exabytes)/月,是當(dāng)前數(shù)據(jù)量的1萬(wàn)倍。而云端網(wǎng)絡(luò)的設(shè)計(jì)顯然并不足以快速處理自動(dòng)駕駛車輛所傳輸?shù)暮A繑?shù)據(jù)。

自動(dòng)駕駛車輛將執(zhí)行時(shí)間敏感型進(jìn)程任務(wù),如:在本地(邊緣)實(shí)時(shí)執(zhí)行車道追蹤、交通監(jiān)控、目標(biāo)檢測(cè)或語(yǔ)義分割并采取相應(yīng)的駕駛操控。同時(shí),為應(yīng)對(duì)耗時(shí)較長(zhǎng)的任務(wù),自動(dòng)駕駛車輛將傳感器數(shù)據(jù)上傳到云端進(jìn)行數(shù)據(jù)處理,最終在將分析結(jié)果發(fā)回到自動(dòng)駕駛車輛。

為此,邊緣運(yùn)算技術(shù)提供一個(gè)端對(duì)端系統(tǒng)架構(gòu)框架,用于向本地化網(wǎng)絡(luò)分配運(yùn)算過(guò)程。一款設(shè)計(jì)精良的、基于人工智能的自動(dòng)駕駛與智能網(wǎng)聯(lián)車輛將是一款協(xié)作式邊緣-云端運(yùn)算系統(tǒng),高效的視頻/圖像處理及多層分布式(5G)網(wǎng)絡(luò)——這是本地處理和云端處理的集合體。

邊緣人工智能運(yùn)算旨在為云端提供互補(bǔ),而非完全取代后者。

圖5——協(xié)作式邊緣-云端運(yùn)算

數(shù)據(jù)處理速度

鑒于網(wǎng)絡(luò)間數(shù)據(jù)傳輸?shù)恼麄(gè)來(lái)回要消耗大量的時(shí)間,出于安全因素,許多數(shù)據(jù)處理不得不在車載系統(tǒng)內(nèi)完成。

車輛將自行運(yùn)算源源不斷的數(shù)據(jù),無(wú)需進(jìn)行數(shù)據(jù)傳輸。得益于車聯(lián)網(wǎng)網(wǎng)速及數(shù)據(jù)傳輸?shù)乃俣,車載數(shù)據(jù)的處理速度將有助于降低延遲并提升準(zhǔn)確性。

人機(jī)間的相互依賴意味著:實(shí)時(shí)信息傳輸?shù)乃俣戎陵P(guān)重要。邊緣人工智能運(yùn)算的應(yīng)用涉及:擁有足量的本地化運(yùn)算處理能力和內(nèi)存容量,能夠確保自動(dòng)駕駛車輛及人工智能處理器能執(zhí)行其各自亟待完成的任務(wù)。

可靠性

確保自動(dòng)駕駛車輛的安全性是非常關(guān)鍵的任務(wù)。邊緣運(yùn)算為擁堵的云端網(wǎng)絡(luò)減輕了壓力,通過(guò)縮減數(shù)據(jù)處理與車輛間的延時(shí)來(lái)提升可靠性。制造自動(dòng)駕駛車輛的車企沒(méi)花多長(zhǎng)時(shí)間就認(rèn)識(shí)到了云端網(wǎng)絡(luò)的局限性。盡管云端是不可或缺的重要一環(huán),但自動(dòng)駕駛車輛需要更為分散的應(yīng)對(duì)途徑。

憑借邊緣運(yùn)算以及與車輛位置更近的邊緣數(shù)據(jù)中心,因遠(yuǎn)方網(wǎng)絡(luò)問(wèn)題而對(duì)當(dāng)?shù)刈詣?dòng)駕駛車輛造成影響的概率將大幅降低。即使車輛附近的數(shù)據(jù)中心真的出現(xiàn)網(wǎng)絡(luò)問(wèn)題,自動(dòng)駕駛車輛的車載智能邊緣推理將繼續(xù)自行高效地運(yùn)行,因?yàn)槠浔緛?lái)就能應(yīng)對(duì)重要的處理功能。

如今,車企提供多層防御層和冗余防護(hù),旨在應(yīng)對(duì)斷電、斷網(wǎng)乃至運(yùn)算故障。自動(dòng)駕駛車輛還能夠動(dòng)態(tài)地重新規(guī)劃路線,為網(wǎng)絡(luò)流量乃至決策提供助力,使自動(dòng)駕駛車輛能夠安全地停車。擁有邊緣人工智能功能的無(wú)人駕駛車輛可憑借預(yù)見性系統(tǒng)分析來(lái)為車載診斷功能提供支持,該系統(tǒng)能在整個(gè)生命周期中不斷成長(zhǎng)并實(shí)現(xiàn)功能演進(jìn)。

隨著大量擁有邊緣運(yùn)算功能的車輛連接到(云端)網(wǎng)絡(luò)上,數(shù)據(jù)可借助多個(gè)途徑重新發(fā)送,旨在確保車輛能在需要時(shí)獲取信息的訪問(wèn)權(quán)限。車聯(lián)網(wǎng)(IoV)和邊緣運(yùn)算高效地整合到綜合性分布式邊緣架構(gòu)內(nèi),該架構(gòu)可提供無(wú)與倫比的可靠性及可及性。

網(wǎng)絡(luò)安全性

自動(dòng)駕駛車輛邊緣運(yùn)算生態(tài)系統(tǒng)的最終挑戰(zhàn)在于為自動(dòng)駕駛車輛提供充足的運(yùn)算能力、冗余和網(wǎng)絡(luò)安全,保障自動(dòng)駕駛車輛的駕駛安全性,也就是為自動(dòng)駕駛車輛提供保護(hù)。

邊緣運(yùn)算系統(tǒng)可應(yīng)對(duì)面向感應(yīng)和運(yùn)算堆棧各個(gè)層級(jí)的網(wǎng)絡(luò)攻擊,這也是該系統(tǒng)最令人關(guān)注的地方。

自動(dòng)駕駛車輛的網(wǎng)絡(luò)安全性應(yīng)涵蓋自動(dòng)駕駛邊緣運(yùn)算堆棧的不同層級(jí)。這類網(wǎng)絡(luò)安全性包括:傳感器的網(wǎng)絡(luò)安全性、操作系統(tǒng)的網(wǎng)絡(luò)安全性、控制系統(tǒng)的網(wǎng)絡(luò)安全性及通信的網(wǎng)絡(luò)安全性。

此外,隨著數(shù)量安全性的重要性提升,邊緣網(wǎng)關(guān)的人工智能將減少車載信息娛樂(lè)系統(tǒng)的通信量及通信結(jié)果。

可擴(kuò)容性

從根本性上講,車載邊緣運(yùn)算擁有分布式架構(gòu),該架構(gòu)有助于將數(shù)據(jù)帶來(lái)網(wǎng)絡(luò)邊緣,自動(dòng)駕駛車輛可在網(wǎng)絡(luò)邊緣進(jìn)行實(shí)時(shí)的數(shù)據(jù)分析與數(shù)據(jù)交互,就像本地化操作那般。

對(duì)于某些任務(wù)而言,云端是不可或缺的一環(huán),自動(dòng)駕駛車輛還需要更為分散的應(yīng)對(duì)途徑。舉個(gè)例子,智能傳感器能夠分析其自身采集的視頻輸入,確定哪些幀數(shù)的視頻需要關(guān)注,然后只向服務(wù)器發(fā)送上數(shù)幀數(shù)所對(duì)應(yīng)的視頻數(shù)據(jù)。

這種分散式架構(gòu)可縮短數(shù)據(jù)傳輸過(guò)程中的網(wǎng)絡(luò)延遲,因?yàn)閿?shù)據(jù)不再需要在網(wǎng)絡(luò)和云端中來(lái)回發(fā)送,可直接進(jìn)行處理。相較于過(guò)去的車輛,基于人工智能的車輛配置了更多的車載運(yùn)算能力,能夠自行處理更多的任務(wù),且可預(yù)測(cè)性更高、延遲更短。

成本

越來(lái)越多的路側(cè)單元配置了功能強(qiáng)大的人工智能本地處理器,其有助于降低能耗、維護(hù)和運(yùn)營(yíng)成本及向云端進(jìn)行數(shù)據(jù)傳輸所涉及到的高帶寬成本。同時(shí),作為諸多核心驅(qū)動(dòng)力中的一員,如今運(yùn)算設(shè)備與傳感器的價(jià)格跳水,使得邊緣運(yùn)算成為現(xiàn)實(shí)的可行性有多了幾分。

人工智能車規(guī)級(jí)處理器技術(shù)

汽車業(yè)正在經(jīng)歷關(guān)鍵性技術(shù)轉(zhuǎn)型,向著更高層級(jí)的自動(dòng)駕駛技術(shù)水平挺進(jìn)。智能駕駛需要更高效、功能更強(qiáng)大的人工智能處理器。

據(jù)Horizon Robotics提供的車企需求匯總顯示,越高層級(jí)的自動(dòng)駕駛技術(shù),對(duì)每秒萬(wàn)億次運(yùn)算(magnitude tera operations per second,TOPS)量級(jí)的需求量就更高。

換言之,2級(jí)自動(dòng)駕駛技術(shù)需要2 TOPS的運(yùn)算能力,3級(jí)自動(dòng)駕駛技術(shù)則需要24 TOPS的運(yùn)算能力,4級(jí)和5級(jí)自動(dòng)駕駛技術(shù)所需的運(yùn)算能力則分別為320 TOPS和逾4,000 TOPS。

汽車處理器通?煞譃槿箢悾

基于中央處理器和圖形處理器技術(shù)的處理器:往往靈活性更高,但通常耗電量也更大;

相較于圖形處理器,現(xiàn)場(chǎng)可編程門陣列對(duì)運(yùn)算資源的需求更少,但成本更高,可編程性受限;

專用集成電路:通常采用定制化設(shè)計(jì),在性能夠、成本和耗電量方面,其表現(xiàn)更高效。

傳統(tǒng)的中央處理器和圖形處理器正竭力滿足4級(jí)和5級(jí)自動(dòng)駕駛車輛提升的高水準(zhǔn)運(yùn)算要求。在4級(jí)和5級(jí)自動(dòng)駕駛層級(jí),相較于前兩者,現(xiàn)場(chǎng)可編程門陣列和專用集成電路的性能更為出色。

運(yùn)算能力將成為“車輪上的數(shù)據(jù)中心”。在考慮汽車應(yīng)用的復(fù)雜性時(shí),光靠運(yùn)算力是不夠的。人工智能汽車芯片的能源效益、性能及成本效益也應(yīng)納入到考量范圍。

到目前為止,在低功耗、性功能和成本方面,全定制的專用集成電路要遠(yuǎn)超圖形處理器/現(xiàn)場(chǎng)可編程門陣列,這就是向自動(dòng)駕駛車輛整合針對(duì)人工智能的專用集成電路愈發(fā)火爆的原因了。

高執(zhí)行能力的加速器芯片

Gyrfalcon Technology, Inc (GTI公司)的推理加速器擁有一款卷積神經(jīng)元網(wǎng)絡(luò)特定域架構(gòu)(Convolutional Neural Network Domain-Specific Architecture,CNN-DSA)及一款矩陣處理引擎(Matrix Processing Engine,MPE)及一項(xiàng)高效的人工智能內(nèi)存處理(AI Processing in Memory,APiM)技術(shù)。

例如,GTI的LightSpeeur2803S提供了24 TOPS/Watt的電源效率性能,其所有的卷積神經(jīng)元網(wǎng)絡(luò)處理都能在內(nèi)存中完成,而非在動(dòng)態(tài)隨機(jī)存儲(chǔ)器(DRAM)。

該款神經(jīng)元網(wǎng)絡(luò)加速器可對(duì)448×448 RGB的圖像輸入值進(jìn)行分類,其計(jì)算速度在16.8 TOPS以上,峰值功耗不足700mW,其精度也可媲美VGG的基準(zhǔn)水平。

Gyrfalcon旗下的CNN- DSA加速器可重置設(shè)定值,旨在為各層級(jí)尺寸及層級(jí)類型的CNN建模系數(shù)提供支持。

對(duì)于諸如無(wú)人駕駛汽車人工智能平臺(tái)等更多運(yùn)算密集型邊緣運(yùn)算應(yīng)用而言,GTI旗下基于顯示卡第二個(gè)插槽(PCIe)的人工智能加速卡采用了16x 2803S的芯片設(shè)計(jì),其可提供270 TOPS和9.9 TOPS/W的運(yùn)算效率,該設(shè)備旨在滿足4級(jí)自動(dòng)駕駛?cè)斯ぶ悄芷嚨男阅苄枨蟆?/p>

GTI旗下基于人工智能的芯片擁有靈活的、可擴(kuò)容的架構(gòu),可輕松實(shí)現(xiàn)并聯(lián)或串聯(lián)布局,用于任何既定性能/建模尺寸。串聯(lián)功能可提供靈活性并減少主機(jī)的工作量。串聯(lián)還支持尺寸更大、更復(fù)雜的建模(如:ResNet-101、ResNet-152等)。

圖8——GTI旗下基于人工智能的加速器,其擁有一款可擴(kuò)容架構(gòu):(a)為提升性能的串聯(lián)架構(gòu)、(b)大型建模的串聯(lián)架構(gòu)

許多自動(dòng)駕駛車輛應(yīng)用的向量函數(shù)(underlying function)是深度學(xué)習(xí)技術(shù),如:卷積神經(jīng)元網(wǎng)絡(luò),該技術(shù)通常被用于車輛及行人探查、路面追蹤、標(biāo)識(shí)與信號(hào)識(shí)別及對(duì)語(yǔ)音指令的詮釋。

GTI旗下基于人工智能的架構(gòu)是“硅晶驗(yàn)證”獨(dú)立式加速器技術(shù),其可被用于任何類型的傳感器輸出值,如:視頻、音頻及其他形式的數(shù)據(jù)。這還涉及了來(lái)自于機(jī)器學(xué)習(xí)攝像頭及高分辨率激光雷達(dá)的高數(shù)據(jù)速率及來(lái)自雷達(dá)和超聲波傳感器的低數(shù)據(jù)速率。(本文為編譯作品,所用英文原文和圖片選自ept.ca)

聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

人工智能 獵頭職位 更多
掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容
文章糾錯(cuò)
x
*文字標(biāo)題:
*糾錯(cuò)內(nèi)容:
聯(lián)系郵箱:
*驗(yàn) 證 碼:

粵公網(wǎng)安備 44030502002758號(hào)