版權聲明:此文源自廠家供稿,如需轉載請尊重版權并保留出處。內容若存有質量疑問請立即與本網(wǎng)聯(lián)系,商用車之家將盡快處理并予以回應。
——歡迎到訪! 專業(yè)商用車網(wǎng)絡媒體 為您服務!
作為世界第一大商用車市場,中國商用車市場正處于轉型升級的關鍵時期。近年來,無論是相關政策法規(guī)的出臺,還是技術、方案的革新,商用車行業(yè)的發(fā)展始終圍繞著保障安全和提高效率的核心主題。
10月28日,元橡科技CTO任杰出席商用車安全大講堂線上交流會,從綜合立體視覺解決方案價值亮點及未來啟發(fā)的角度,分享和探討高性價比商用車智駕系統(tǒng)研發(fā)量產(chǎn)實踐。(以下為部分交流內容整理。)
關于商用車的安全與效率,我們在關注什么?
相比于乘用車而言,商用車既作為一種交通運輸工具,也是我們日常經(jīng)濟活動中重要的生產(chǎn)資料。提高商用車的安全與效率,具體來說,我們可以延展出一些關鍵詞,比如“節(jié)能環(huán)?!?、“物流與交通設計”、“智慧城市”……以及我們重點關注的“智能駕駛主動安全”這一領域。
在商用車的營運過程中,普遍存在的一些隱患和問題包括:
l 司機易疲勞駕駛,工作環(huán)境惡劣
l 容易造成司機盲區(qū),產(chǎn)生安全事故
l 商用車質量慣性大,提速慢,司機駕駛習慣勻速,節(jié)省油耗
l 急剎車對商用車司機造成嚴重安全傷害
l ……
而現(xiàn)有的商用車智能駕駛系統(tǒng)仍存在著較大的“漏報”和“誤報”的局限性?!奥﹫蟆币簿褪墙鼇沓3R娭T報端的一些事故,比如撞上前方側翻車輛等;“誤報”則是感知系統(tǒng)會把一些不存在或沒有風險的目標錯誤地識別,例如把地面上的一些畫、幻影當成是真正的行人,從而產(chǎn)生了不必要的規(guī)避。
在漏報和誤報之間取得均衡,提升整個智能駕駛系統(tǒng)的上限,是業(yè)內孜孜不倦追求的一個目標,因為人類社會駕駛場景里面還存在太多的長尾效應,太多目前常規(guī)的系統(tǒng)還不能克服的一些困難。
漏報(撞上前方側翻車輛)丨來自互聯(lián)網(wǎng)公開資料
誤報(道路平面上的虛假行人)丨來自互聯(lián)網(wǎng)公開資料
從場景規(guī)模和難度上我們把智能駕駛系統(tǒng)分成幾大層次:
i. 其一就是規(guī)模小一點、難度也低一點的封閉場景,比如港口、礦區(qū)無人駕駛;
ii. 再往前,我們現(xiàn)在有很多物流企業(yè),包括乘用車也已經(jīng)在推進高速場景的NOA等等,當然,這種智能駕駛系統(tǒng)里也都存在著上述所提到的一些局限性;
iii. 而到最后,我們真正希望推動的是在人類社會生活中更主要的一些場景,比如城市道路上,是不是能夠有更好的系統(tǒng)去輔助人類司機,替代人類去完成一些艱苦的工作。這就要求系統(tǒng)具備強大的理解場景的能力和細節(jié)把握的能力,要求系統(tǒng)感知的信息足夠稠密和高效。
這是智能駕駛發(fā)展和演進的趨勢,而為了更好地解決當前智能駕駛的局限,面向未來更高階的智能駕駛發(fā)展趨勢,元橡科技始終專注推動“綜合立體視覺”解決方案。
為什么是綜合立體視覺解決方案?
雙目立體視覺是人眼仿生學,它基于三角測量原理,通過視差和距離之間的反比關系,對周圍環(huán)境能得到一個三維的感知。而我們提出的“綜合立體視覺”的概念,在雙目相機感知傳感器的基礎上,還要配合大腦中樞,把立體視覺和AI充分結合起來,去達到一種高效能的感知和處理能力。
元橡科技雙目立體視覺的特點:低成本&高性能
l 深度圖與RGB圖天然對齊
l 立體信息可識別對象,降低對樣本量和硬件算力要求
l 全類型對象檢測,降低長尾效應風險
l 局部可見障礙物、模糊目標均能測量
l 百米檢測誤差小于5%,不依賴地面
l 拓展性強,如限高、限寬、地形檢測
l 圖像分辨率提高,小目標識別性能倍增,算力基本增加不大
和目前大家比較熟知的一些傳感器(激光雷達、4D毫米波等)對比,元橡雙目相機的立體視覺成像所包含信息的豐富程度是非常高的,我們常說一圖勝千言,這是雙目相機非常擅長并且應該發(fā)揮作用的地方,而從精準度上來講,雙目立體視覺測距性能已經(jīng)非??焖俚乇平す饫走_的性能。
高性價比的優(yōu)勢,決定了雙目立體視覺系統(tǒng)成為實現(xiàn)商用車安全與效率平衡的可行性方案。
元橡自研的Deep Fusion架構很大程度上提高了系統(tǒng)魯棒性和安全閉環(huán)保障。Deep Fusion框架融合視差和AI能力,可以實現(xiàn)目標類型的“N+1”,真正做到全類型障礙物檢測,大大降低長尾效應的影響。
Deep Fusion特點:
l 有效結合圖像與視差信息,準確描述障礙物3D屬性
l 較低的算力需求下實現(xiàn)更遠的檢測能力
l 全類型障礙物的檢出能力
l 提升融合毫米波能力:融合需要的目標空間位置和類別屬性同時具備
其中“N+1”目標類型,“N”指車輛、行人、自行車、交通標識等指定多類型檢測目標,通常用AI語義處理分析,而“1”則是指一些通用障礙物,比如樹叢、柵欄,以及路面施工鐵板等不知道什么時候出現(xiàn)的未知類型。對于這些,我們人類有很好的感知和避障能力,但目前的很多系統(tǒng),尤其是單目系統(tǒng),就很難去很好地識別。
元橡綜合立體視覺解決方案
所以這也就是我們?yōu)槭裁聪Mo業(yè)界推薦綜合立體視覺解決方案,因為我們看到了在這些方面上,我們提出的“N+1”完備目標檢測新范式具有更好的泛化性、通用性,可以應用到更多的實際場景。比如商用車的限高,車身較高的商用車在通過一些橋梁、山區(qū)涵洞的時候如果發(fā)生刮蹭,帶來的經(jīng)濟損失是非常大的,通過雙目相機可以去做高度可通過性的檢測,相類似的還有通過狹窄通道時的限寬預警等。立體視覺技術在諸如此類的場景需求上已經(jīng)有了一些很好的應用,落地之后也得到了比較好的反饋。通過提前給到司機輔助性的信息和警告,可以有效避免一些刮蹭事故和經(jīng)濟損失。
高性價比商用智能駕駛的未來啟發(fā)
首先,目前在乘用車上有兩方面很強烈的趨勢,一是高分辨率,二是大角度周身環(huán)繞。我們認為,未來在乘用車先行的技術帶動下,商用車也會往這個趨勢去應用和發(fā)展。
目前可能1M、2M的分辨率是主流,后期分辨率會變得越來越高?,F(xiàn)在乘用車有很多新的旗艦車型開始上8M的前視,甚至是周視的設備,在周視環(huán)繞感知的傳感器方案里,視覺是起到非常大的作用的。如果我們把車看成是泛機器人,有了比較好的感知傳感器,它就有了很好的視野、觸覺等感官,這樣它就可以更智能地去做一些決策和判斷,來更安全、快速、高效地完成運輸任務。
而從今年特斯拉的AI Day展示的Tesla Occupancy Networks看,它基于車身一圈的傳感器,通過占有網(wǎng)格的神經(jīng)網(wǎng)絡和大量的數(shù)據(jù)訓練而得到一種相對比較直觀的視覺效果。其實類似的這種三維感知的能力元橡很早之前也就能做到了,我們并不需要那么多復雜的傳感器陣列,只是通過簡單的雙目立體視覺,同時也不需要那么大量的數(shù)據(jù)積累和數(shù)據(jù)閉環(huán)訓練、標注維護。在三維環(huán)境感知方面,立體視覺的空間表達更精細,顆粒度更細,精準度也更好,這也是立體視覺高性價比和高性能的體現(xiàn)。
Tesla Occupancy Networks丨來自互聯(lián)網(wǎng)公開資料
元橡高性價比的“Occupancy grid map”空間表達
高分辨率視覺傳感器、大角度視場角(FOV)以及周身環(huán)繞感知能力將成為未來商用車智能駕駛系統(tǒng)的重中之重,是我們對于未來工作的展望和啟發(fā)。
總體來講,對于商用車發(fā)展的思考,我們始終認為是“安全第一”,在保障社會運轉和人身安全的基礎之上,再去提高運輸效率,通過科技賦能,輔助司機改善工作環(huán)境,減輕勞動強度,規(guī)避分心和盲區(qū)等因素導致的安全隱患。元橡科技將致力于綜合立體視覺解決方案,從更好的感知出發(fā),實現(xiàn)更好的決策,更好的執(zhí)行,最終得到更好的安全和效率。