蘋果手機上安裝了“激光雷達”!這聽上去是一件多麽(me) 酷炫的事啊。但在傳(chuan) 感器行業(ye) 內(nei) ,激光雷達已經不是什麽(me) 新名詞了。而且蘋果的“激光雷達”,有轉換概念的嫌疑。真正的激光雷達傳(chuan) 感器,由激光器、激光檢測器和測量電路組成,優(you) 點是能實現無接觸遠距離測量、速度快、精度高、量程大、抗光、電幹擾能力強等。配合5G的普及,在無人駕駛、3D測量等行業(ye) ,前景可觀。
目前,機械旋轉激光雷達的高成本是一個(ge) 限製因素,但是隨著基於(yu) MEMS 的反射鏡、光學相控陣等新技術的出現,價(jia) 格正在下降。
據悉近日,Hesai 發布了新的 32 通道(也提供 16 通道版本)中檔激光雷達。PandarXT 基於(yu) 整合了 Hesai 自主開發的 LiDAR ASIC 的新係統架構,是一種經濟高效的解決(jue) 方案,專(zhuan) 為(wei) 多種應用而設計,包括無人物流,機器人,測量,安全,製圖和中低速自動駕駛。

基於(yu) Hesai 自主開發的 LiDAR ASIC 的新係統架構提供了額外的性能增強。PandarXT 的最小範圍為(wei) 零,即使物體(ti) 直接觸摸傳(chuan) 感器的外殼,它也會(hui) 輸出有效的點雲(yun) 。它還具有毫米級的測距精度和卓越的精度。此外,其提高的反射率精度和更大的動態範圍使得能夠準確,一致地檢測回射器,低反射率目標以及反射率突然變化的物體(ti) 邊界。
而成立不到五年的以色列創業(ye) 公司 Innoviz 已經擁有一個(ge) 稱為(wei) InnovizOne 的汽車級傳(chuan) 感器,該傳(chuan) 感器將於(yu) 2021 年在 BMW 上首次批量生產(chan) ,他們(men) 縮小了設計規模,以保持與(yu) 原始係統相似或更好的性能。
與(yu) InnovizOne 一樣,InnovizTwo 傳(chuan) 感器具有 256 行垂直分辨率和 0.1 度角分辨率。封裝尺寸小於(yu) 電流傳(chuan) 感器。對於(yu) 具有 10%反射率的目標,檢測範圍預計將超過 200 m,其聲稱新型激光雷達傳(chuan) 感器便宜 70%,計劃在 2021 年第三季度開始向客戶交付樣品,並有望在 2023 年秋季為(wei) 批量生產(chan) 應用做好準備。
在自主駕駛的環境中,激光雷達是一種主動傳(chuan) 感器,通過發射激光照亮周圍環境。通過處理從(cong) 反射麵接收到的激光回波,可以精確測量距離。另一方麵,基於(yu) 激光雷達的算法也進入了快車道。對於(yu) 自主車輛,激光雷達主要用於(yu) 感知和定位。感知係統提供了一種機器可解釋的車輛周圍環境的表示。
從(cong) 用戶的角度來看,感知係統的輸出包括三個(ge) 層次的信息:
·物理描述:姿勢、速度、物體(ti) 形狀。
·語義(yi) 描述:對象的類別。
·意圖預測:物體(ti) 行為(wei) 的可能性。
因此,激光雷達的輸出用於(yu) 目標檢測、分類、跟蹤和意圖預測,對應於(yu) 各個(ge) 層次的信息。由於(yu) 激光雷達在測距精度上的優(you) 越性,所提供的物理信息具有很高的可靠性。而激光雷達所攜帶的語義(yi) 信息要比攝像機獲得的要少,甚至更難。
在實際應用中,激光雷達和攝像機是相輔相成的:攝像機的距離估計能力差,而激光雷達對目標的識別效果不理想。精確的物理和語義(yi) 信息,加上地圖信息,將毫無疑問地提高意向預測。經過多年的發展,以激光雷達為(wei) 中心的感知係統對於(yu) 基於(yu) 模型的處理算法已經趨於(yu) 成熟。深度學習(xi) (DL)正在改變這個(ge) 領域的學習(xi) 方法。傳(chuan) 統的基於(yu) 模型的激光雷達數據處理方法具有計算友好、可解釋性強等特點。而數據驅動的 DL 方法在提供語義(yi) 信息方麵表現出了超常的能力,這是傳(chuan) 統方法的弱點。
最明顯的傳(chuan) 感器是上麵的 Velodyne UltraPuck 激光雷達。
1。 激光雷達技術原理和現狀分析
典型的激光雷達是用一束或幾束激光掃描其視場。通過這一係統,設計了精密的光束控製係統。激光束是由一個(ge) 振幅調製的半導體(ti) 激光器產(chan) 生的,它在近紅外波段發射。激光束被環境反射回掃描儀(yi) ,光電探測器接收返回信號。
快速電子過濾信號,並測量發送和接收信號之間的差,與(yu) 距離成正比。基於(yu) 此差異,從(cong) 傳(chuan) 感器模型中估計距離。通過信號處理,補償(chang) 了由表麵材料引起的反射能量變化的差異以及發射器和接收器之間的環境狀態。
激光雷達輸出包括與(yu) 掃描環境相對應的三維點雲(yun) 和與(yu) 反射激光能量相對應的強度。圖 2 顯示了這個(ge) 工作原理的概念表示。

圖 2:ToF 激光測距儀(yi) 的一個(ge) 例子。測距儀(yi) 采用直接法或相幹法測量由掃描係統控製的某一方向的距離。
激光雷達係統可以分為(wei) :激光測距係統和掃描係統。激光測距儀(yi) 包括通過調製波照亮目標的激光發射器;通過光學處理和光電轉換後從(cong) 反射光子產(chan) 生電子信號的光電探測器;將發射的激光準直並將反射信號聚焦到光電探測器和信號處理電子設備,根據接收到的信號估計激光源和反射麵之間的距離。掃描係統通常會(hui) 以不同的方位角和垂直角控製激光束,用 i 表示,其中 i 是確定光束指向的方向的索引。
A、 激光測距原理
用激光束測量物體(ti) 距離的測距儀(yi) 被稱為(wei) 激光測距儀(yi) 。它們(men) 的工作方式取決(jue) 於(yu) 激光束中使用的信號調製類型。脈衝(chong) 激光被用來測量飛行時間(ToF),這些被稱為(wei) 直接探測激光測距儀(yi) 。激光信號也可以是一種調頻連續波(FMCV),利用多普勒效應間接測量距離和速度。這些被稱為(wei) 相幹探測激光測距儀(yi) 。
飛行時間(ToF):ToF 激光測距儀(yi) 通過計算發射和接收激光之間的時差來測量距離:ToF 激光雷達以其結構簡單、信號處理方法簡單等優(you) 點,在目前的汽車激光雷達市場上占據主導地位。然而,由於(yu) 眼睛的安全要求,增加其最大射程的潛力受到有限發射功率的限製。在 ToF 激光雷達中,返回信號可以是來自強太陽光的幹擾,也可以是來自其他 ToF 激光雷達的激光束的幹擾。
相幹檢測:通過將本機載波信號與(yu) 接收信號混合,可以對接收信號進行解調,從(cong) 而獲得激光信號的相位和頻移,從(cong) 而獲得距離反射麵的距離和速度。這可以看作是 FMCW(調頻連續波)雷達的光學版本,這是目前流行的乘用車 ADAS 係統。

圖 3:相幹探測原理:通過混合發射和接收的光波產(chan) 生的中頻(紅色跡線)來估計距離。
因為(wei) FMCW 激光雷達連續不斷地使用較少的發射功率來照明物體(ti) ,從(cong) 而符合眼睛安全要求,並且可以使用更多的功率來擴大視野。
FMCW 激光雷達可以同時直接測量距離和速度,而對於(yu) ToF 激光雷達,速度是通過幾個(ge) 連續的傳(chuan) 感器讀數間接估計得到的。通過使用 FMCW 激光信號,可以減少來自其他激光源和強光的幹擾效應。然而,FMCW 激光雷達需要具有長相幹距離的高質量激光發生器。
B、 激光發射和接收
激光信號的產(chan) 生和發射以及反射信號的接收電子設備也反映了激光測距儀(yi) 的性能和成本。
1) 激光源:ToF 激光雷達需要脈衝(chong) (調幅)激光信號。這是用脈衝(chong) 激光二極管或光纖激光器產(chan) 生的。半導體(ti) 激光器通過向二極管的結處通電而引起激光振蕩。
半導體(ti) 激光器可分為(wei) 兩(liang) 類:邊緣發射激光器(EEL)和表麵發射半導體(ti) 激光器(VCSEL)。EEL 在電信行業(ye) 的應用由來已久。VCSEL 輸出圓形光束,而 EEL 發射橢圓激光束,需要額外的光束整形光學元件。
在 VCSEL 中,在單個(ge) 芯片上形成二維激光陣列比 EEL 更容易,這一點很重要,因為(wei) 它可以提高激光雷達的分辨率。相比之下,由於(yu) 功率限製,VCSEL 的範圍更短。汽車用脈衝(chong) 激光二極管是一種混合型器件。
也就是說,激光芯片上安裝了由 MOSFET 晶體(ti) 管觸發的電容器。因此,在每次柵極打開時,電容器中積累的電荷將被釋放到芯片中,這將以可控的方式發射光脈衝(chong) 。這些光源具有成本效益,因為(wei) 它們(men) 的 905nm 輸出可以通過經濟高效的矽探測器檢測。
然而,這些二極管的脈衝(chong) 重複率有限,峰值功率較低,可能需要冷卻。用於(yu) 3DFlash 激光雷達的激光二極管光源采用二極管堆疊技術,將多個(ge) 邊緣發射棒組裝成一個(ge) 垂直堆疊。散熱成為(wei) 一個(ge) 問題,因此需要散熱片以及累積超過眼睛安全要求的發射功率。
光纖激光器可以有更高的輸出功率,這在工作在高波長時非常有用。它們(men) 的輸出光束可以使用光纖進行分割和路由到多個(ge) 傳(chuan) 感器位置,它們(men) 具有更好的脈衝(chong) 重複頻率、更好的光束質量等。但是,它們(men) 可能體(ti) 積龐大,從(cong) 而導致難以集成到車輛中的非緊湊係統。
2) 激光波長:選擇合適的激光波長應綜合考慮大氣窗、眼睛安全要求和成本。850-950nm(近紅外)和 1550nm(短波紅外)激光器因其在工業(ye) 上的廣泛應用而得到了廣泛的應用。無論是價(jia) 格低廉的二極管激光器,還是波長 850-950nm 或 1550nm 的更強大的光纖激光器,都很容易從(cong) 市場上買(mai) 到。
1550nm 激光的眼睛安全標準允許的最大功率高於(yu) 850-950nm 的激光,這意味著可以獲得更大的射程。然而,昂貴的 InGaAs 基光電二極管需要探測 1550nm 的激光回波。InGaAs 基光電二極管的效率低於(yu) 成熟的矽基光電二極管。另外,大氣對 1550nm 的吸收比 850-950nm 強。因此,近紅外波段(例如 905nm)的激光雷達係統仍然是主流。
3) 光電探測器:光電探測器通過光電效應將光功率轉換為(wei) 電能。光敏感度是描述光電探測器接收光子時的響應的最關(guan) 鍵特性之一。光敏性取決(jue) 於(yu) 接收激光的波長。因此,激光雷達係統中光電探測器的選擇與(yu) 激光波長的選擇密切相關(guan) 。最常用的探測器有 PIN 光電二極管、雪崩光電二極管(APD)、單光子雪崩二極管(SPAD)、矽光電倍增管(SiPM)。
PIN 光電二極管:是由 p-i-n 結形成的一個(ge) 沒有移動電荷載流子的耗盡區。通過對光電二極管施加反向偏置,吸收光子將在反向偏置光電二極管中產(chan) 生電流。
雪崩光電二極管(APD):是一種通過雪崩效應施加反向電壓來倍增光電流的光電二極管。與(yu) PIN 光電二極管相比,APD 倍增信號的能力降低了噪聲的影響,獲得了更高的內(nei) 部電流增益(約 100)和信噪比。因此,apd 在當代激光雷達係統中相當普遍。矽基 apd 是敏感的通過可見光譜區直到近紅外約 1000nm.InGaAs 的 apd 波長可長至 1700nm,但成本較高。
單光子雪崩二極管(SPAD):是一種 APD,設計用於(yu) 在高於(yu) 擊穿電壓(Geiger 模式)的反向偏壓下工作,允許在非常短的時間內(nei) 檢測到極少數光子。SPAD 可以獲得 106 的增益,這明顯高於(yu) APD。這一特性使 SPAD 能夠在遠距離探測到極弱的光。此外,可用於(yu) SPAD 製造的 CMOS 技術使得在一個(ge) 芯片上集成光電二極管陣列。這對於(yu) 提高激光雷達的分辨率,同時降低成本和功耗是很有必要的。
矽光電倍增管(SiPM):基於(yu) SPAD,同時啟用光子計數。SPAD 工作的 Geiger 模式是一種光子觸發模式,SPAD 無法分辨接收到的光通量的大小。為(wei) 了克服這個(ge) 問題,SiPM 集成了一個(ge) 密集的“微電池”陣列(一對 SPAD 和一個(ge) 失超電阻),它們(men) 工作相同且獨立。SiPM 的輸出本質上是從(cong) 每個(ge) 微單元檢測到的光電流的組合。在這種方法中,SiPM 能夠給出關(guan) 於(yu) 瞬時光子通量大小的信息。
C、 掃描係統
掃描係統(或光束控製係統)是為(wei) 了使發射的激光能夠快速探測大麵積區域而設計的。現有的掃描方法通常分為(wei) 機械旋壓或固態掃描。
前者通常包含一個(ge) 龐大的旋轉鏡係統,如早期自主駕駛史上的 Velodyne HDL64。後來的“固態”指的是沒有運動部件的掃描係統(甚至有些仍然由微鏡控製),這是汽車工業(ye) 的首選。機械旋轉:目前最流行的汽車激光雷達掃描解決(jue) 方案是機械旋轉係統,該係統通過由電機控製的旋轉組件(如鏡子、棱鏡等)來控製激光束,從(cong) 而產(chan) 生大視場(FoV)。
傳(chuan) 統上,點頭鏡係統和多邊形鏡係統是主要的應用類型。例如,如圖 4(a)所示的機械旋轉方案,嵌入式點頭鏡係統傾(qing) 斜激光器以產(chan) 生垂直視場。然後,旋轉激光雷達基座,獲得 360°水平視場。最先進的激光雷達使用多光束來減少移動機構。

圖 4:按掃描方法分類的激光雷達係統。
例如,Velodyne VLP 係列使用激光二極管和光電二極管陣列來增加點雲(yun) 密度。與(yu) 寬視場相比,機械旋壓係統具有高信噪比(SNR)的優(you) 勢。然而,在汽車內(nei) 部這種複雜的振動環境中,旋轉機構是很常見的。典型的產(chan) 品示例:Velodyne 的 HDL64 如圖 5(A)所示。

圖 5:激光雷達產(chan) 品示例:
(a)來自 Velodyne 的機械旋轉 905nm 激光雷達,(b)來自 Luminar 的 1550nm MEMS 激光雷達、(c)大陸公司的 Flash 激光雷達。
MEMS 微掃描:MEMS(Micro-Electro-Mechanical Systems)技術允許使用矽製造技術製造微型機械和機電設備。從(cong) 本質上講,MEMS 反射鏡是嵌入芯片上的反射鏡。
MEMS 反射鏡通過平衡兩(liang) 種相反的力來旋轉:
一種是由繞在反射鏡周圍的導電線圈產(chan) 生的電磁力(Lorentz 力),另一種是來自扭杆的彈性力(作為(wei) 旋轉軸)。這一原理如圖 4(b)所示。MEMS 反射鏡可以是一維運動的單軸,也可以是二維運動的雙軸。
同時,MEMS 反射鏡可以在其固有振蕩頻率下以諧振模式工作,從(cong) 而獲得大偏轉角和高工作頻率。在非諧振模式下,可以控製 MEMS 掃描鏡,使其跟隨程序化的掃描軌跡。
例如,對於(yu) 基於(yu) MEMS 的 AEYE 激光雷達,激光雷達可以動態地改變視場和掃描路徑,以聚焦於(yu) 某些關(guan) 鍵部件。雖然 MEMS 激光雷達仍然包含運動部件,但由於(yu) IC 工業(ye) 中成熟的技術能夠滿足嚴(yan) 格的成本要求,這種近固態技術仍然具有廣闊的應用前景。Luminar 的 MEMS 1550nm 激光雷達示例如圖 5(b)所示。
Flash:最初用於(yu) 航天器自主著陸和與(yu) 衛星對接,3DFlash 激光雷達完全移除掃描係統內(nei) 的旋轉部件。因此,它們(men) 是真正的固態。Flash 激光雷達的行為(wei) 就像照相機。一種由光學擴散器傳(chuan) 播以同時照亮整個(ge) 場景的單個(ge) 激光器。
然後,它使用一個(ge) 2D 光電二極管陣列(類似於(yu) 用於(yu) 照相機的 CMOS/CCD)來捕捉激光回波,最後對其進行處理以形成 3D 點雲(yun) ,如圖 4(c)所示。由於(yu) Flash 激光雷達的所有像素同時測量距離,避免了平台運動引起的運動補償(chang) 問題。此外,基於(yu) 半導體(ti) 的 3DFlash 激光雷達有助於(yu) 大規模生產(chan) 的製造和封裝,從(cong) 而降低成本。
然而,3DFlash 激光雷達的一個(ge) 關(guan) 鍵問題是它的探測範圍有限(通常小於(yu) 100 米),這是因為(wei) 為(wei) 了保護眼睛的安全,在一個(ge) 小功率閾值下,一個(ge) 擴散激光就負責探測整個(ge) 區域。另一個(ge) 缺點是視野有限,因為(wei) 它不能像掃描式激光雷達那樣旋轉和掃描周圍環境。大陸集團用於(yu) 中程感知的商用閃光激光雷達產(chan) 品的典型示例如圖 5 所示
光學相控陣(OPA):作為(wei) 一種真正的固態激光雷達,光學相控陣(OPA)激光雷達不包含運動部件。與(yu) 相控陣雷達類似,OPA 能夠引導激光束通過各種類型的相位調製器。
如圖 4(d)所示,當激光通過透鏡時,光速可以通過光學相位調製器改變。因此,不同路徑中的不同光速允許控製光波陣麵形狀,從(cong) 而控製轉向角。雖然 OPA 作為(wei) 一種很有前途的技術被寄予厚望,但目前市場上還沒有商業(ye) 化的產(chan) 品。
D、 汽車激光雷達的現狀
機械旋壓激光雷達是第一個(ge) 進入量產(chan) 車階段的產(chan) 品。2017 年,奧迪發布了最新的豪華轎車 A8,該車配備了 Valeo 的 Scala 激光雷達以實現自動駕駛功能,這是世界上第一款搭載汽車級激光雷達的商用車。
法雷奧的 scala 3 是一種 4 層機械旋轉激光雷達,類似於(yu) 它的表兄 IBEO Lux4。通過 Scala 的授權,A8 能夠實現 L3 級別的自動駕駛功能,而不需要手放在方向盤上(需要法律允許)。2019 年,法雷奧從(cong) 多家汽車製造商那裏獲得了下一代激光雷達 Scala2 的 5 億(yi) 訂單。
同時,為(wei) 了降低成本,提高係統的魯棒性,很多公司都把目光投向了固態掃描係統。
如表一所示, Innoviz、Continental 和 Quanergy 正在分別開發 MEMS、Flash 和 OPA 激光雷達。2018 年,寶馬宣布與(yu) Innoviz 合作在 2021 年進行係列生產(chan) 。為(wei) 了增加最大探測距離,一些人使用了工作在單光子探測模式(蓋革模式)下的 SPAD 陣列。

表一:具有代表性的激光雷達製造商和采用的技術。標有*的製造商使用單光子蓋革模式 SPAD 作為(wei) 光電探測器。
outster OS-1644 采用 CMOS 基 SPAD 檢測 2D VCSEL 激光器陣列發射的 850nm 激光。豐(feng) 田製造了一個(ge) 激光雷達原型,其中包含一個(ge) 用於(yu) 接收 905nm 激光的 CMOSSPAD 陣列(202x96 像素)。
Princetion Lightware(收購方阿爾戈艾)還實現了 SPAD 激光雷達原型 5,同時信息披露較少。至於(yu) SiPM,SensL(OmmniVision 收購)已經製造了一個(ge) LiDAR 原型,而商業(ye) 產(chan) 品仍在開發中。
由於(yu) 比近紅外激光允許更高的功率閾值,一些人轉而使用 SWIR 激光器(例如 1550nm),如 Luminar(宣布與(yu) 豐(feng) 田合作)、AEYE。基於(yu) 相幹探測的 FMCW 激光雷達受到汽車製造商和投資商的追捧。
Strobe 和 Blackmore 這兩(liang) 個(ge) 具有代表性的 FMCW 激光雷達初創公司,分別很快被 Cruise 和 Aurora 收購。在本文中,我們(men) 對幾家具有代表性的汽車激光雷達供應商及其公開技術進行了分類和列舉(ju) 。

激光雷達的另一個(ge) 發展趨勢是克服惡劣的天氣條件,如雨、霧、雪、灰塵等。根據公式 1,不利的天氣條件增加了傳(chuan) 輸損耗 Tr,並削弱了接收能量變小的物體(ti) β的反射率。由於(yu) SWIR 激光器(如 1550nm)可以獲得更高的傳(chuan) 輸功率,因此該波長的激光雷達有望在惡劣天氣下具有更好的性能。
2。 激光雷達感知係統
對於(yu) 自主車輛,其感知係統根據感知傳(chuan) 感器的輸出、定位和地圖數據,將感知環境解釋為(wei) 層次化的對象描述(即物理、語義(yi) 、意圖感知)。
如圖 6 所示,傳(chuan) 統的 LiDAR 數據處理流水線分為(wei) 4 個(ge) 步驟:目標檢測、跟蹤、識別和運動預測。最近興(xing) 起的深度學習(xi) 技術正在改變這一經典流程,我們(men) 將在經典方法之後介紹它。由於(yu) Velodyne 激光雷達在研究領域的普及,綜述的數據處理方法主要基於(yu) 這種機械旋轉激光雷達。

圖 6:典型的激光雷達感知係統的管道,每個(ge) 步驟的輸出示例。示例來自作者的平台,如圖 1 所示。請注意,在目標檢測後,我們(men) 隻處理道路內(nei) 的物體(ti) (用黃線表示)。
A、 目標檢測
目標檢測算法提取候選對象並估計其物理信息:被檢測對象的位置和形狀。由於(yu) 在大多數交通場景中,目標垂直於(yu) 一個(ge) 平坦的地麵,目標檢測算法通常包括:地麵濾波和聚類。地麵過濾將點雲(yun) 標記為(wei) 地麵或非地麵。然後,利用聚類方法將非地麵點劃分為(wei) 不同的目標。
在早期的研究中,激光雷達的點雲(yun) 被投影到圍繞激光雷達 360°的極坐標網格中。每個(ge) 網格單元內(nei) 的點被連續處理以生成一個(ge) 虛擬掃描,該掃描指定了空閑、占用和遮擋的區域。占用的虛擬掃描被分組到對象簇中。
采用了這種方法,而不是對每個(ge) 點進行處理,而是采用基於(yu) 網格的局部平麵擬合方法。將能夠擬合為(wei) 平麵的網格劃分為(wei) 接地網,剩餘(yu) 的非接地網采用連接元件標記(CCL)進行聚類。然而,基於(yu) 極坐標網格的方法往往需要將三維激光雷達點投影到離散網格中,這會(hui) 丟(diu) 失激光雷達測量的原始信息。
在球麵坐標係(r,ψ,θ)中處理激光雷達信號提供了一種更好的方法。對於(yu) 作者所用的 Velo-dyne 超光球,每束激光的垂直角是固定的,方位角由掃描時間和電機轉速決(jue) 定。因此,每個(ge) 量程讀數可以用 Pi 表示,j=(ρi,j,i,θj,),其中 i 表示某一激光束,j 是方位角指數,如圖 7 所示。

圖 7:用於(yu) 進一步處理的旋轉激光雷達(Velodyne UltraPuck)的距離圖。偽(wei) 彩色的範圍圖像(32x1800)有助於(yu) 以下處理。
這種方法自然地將範圍讀數填充到預定義(yi) 的數據緩衝(chong) 區(範圍圖像),因此允許快速訪問點及其相鄰點。近幾年來,在距離視角下處理激光雷達數據變得越來越流行。
例如,基於(yu) 一幅距離圖像,對每一列中的地麵點進行了分割。剩餘(yu) 的非地麵點通過距離和角度的標準很容易地進行分組。對於(yu) 32 束激光雷達來說,在英特爾 i5 處理器中,它們(men) 達到了 4 毫秒。逐行處理範圍圖像。他們(men) 在每個(ge) 掃描行(實際上是距離圖像中的行)中應用聚類,然後逐行合並這些簇。
圖 6 顯示了基於(yu) 距離圖像的地麵濾波和聚類的示例結果。綠色點是地麵點,非地麵點被分組到候選對象中(在藍色多邊形中)。目標檢測提供初始的物理信息,例如物體(ti) 的位置。以下步驟(如識別和跟蹤)對檢測到的對象補充語義(yi) 和更多物理信息,如航向、速度。
B、 物體(ti) 識別
基於(yu) 機器學習(xi) 的對象識別方法為(wei) 檢測到的對象提供語義(yi) 信息(如行人、車輛、卡車、樹木、建築物等)。使用的典型識別過程包括計算緊湊對象描述符的特征提取步驟和預訓練分類器基於(yu) 提取的特征預測對象類別的分類步驟。
文獻中提出的特征可以大致分為(wei) 兩(liang) 類:整體(ti) 對象的全局特征,或每個(ge) 點的局部特征。物體(ti) 的大小、半徑、中心矩或最大強度是最基本的全局特征。將主成分分析(PCA)應用於(yu) 三維點雲(yun) 是獲取全局形狀特征的另一種有效方法。
通過分析主成分分析得到的特征值,可以得到三個(ge) 顯著特征(表麵性、線性性、分散性)。對於(yu) 局部特征,計算了每個(ge) 點及其相鄰點的三個(ge) 顯著性特征。對三個(ge) 顯著性特征提取 3 個(ge) 直方圖,每個(ge) 直方圖包含 4 個(ge) 間隔在 0 到 1 之間的箱子,作為(wei) 局部特征。一個(ge) 更複雜的特征是引入的自旋圖像(SI)。
SI 是通過圍繞給定點 p 的曲麵法線 n 旋轉網格來創建的。SI 的虛擬像素是到通過 n 的直線或到由 p 和 n 定義(yi) 的平麵的距離。將單個(ge) 逐點特征轉換為(wei) 全局特征:對於(yu) 一個(ge) 對象,隻使用其中心點的 SI 作為(wei) 對象描述符。在文獻中,有更複雜的特征,比如全局傅立葉直方圖(GFH)描述符。然而,實時性要求限製了特征的複雜性。
特征提取後,分類是一個(ge) 典型的有監督機器學習(xi) 過程:由一個(ge) 真實數據集訓練的分類器預測輸入對象的類別。著名的數據集如 kitti6 提供了豐(feng) 富的資源。在機器學習(xi) (ML)的武器庫中,可以應用大量的機器學習(xi) 工具,如 Naive Bayes、支持向量機(SVM)、KNN、隨機森林(RF)和梯度提升樹(GBT)。
基於(yu) 徑向基函數(RBF)核的支持向量機(SVM)由於(yu) 其速度快、精度高等優(you) 點,仍然是目前最流行的支持向量機方法。圖 6 顯示了基於(yu) 我們(men) 的實現(基於(yu) RBF 核的 SVM)對檢測到的道路目標的識別結果。最近,應用證據神經網絡對激光雷達目標進行分類。證據分類器可以更好地處理實踐中經常遇到的未知類。
C、 目標跟蹤
多目標跟蹤(MOT)算法通過時空一致性來關(guan) 聯和定位檢測 / 識別的目標。MOT 保持被探測物體(ti) 的身份,並給出它們(men) 的物理狀態,即軌跡、姿態、速度。
MOT 是一個(ge) 經典的工程問題,已經被研究了很長時間。基本體(ti) 係結構主要包括單個(ge) 目標跟蹤器,該跟蹤器“最優(you) ”估計被跟蹤對象的狀態,數據關(guan) 聯將新的檢測分配給跟蹤器。
單目標跟蹤器將運動建模為(wei) 動態狀態空間模型,並在貝葉斯濾波框架下對運動狀態進行估計。Kalman Filter(KF)家族 - 高斯線性假設下的經典 KF 及其變種擴展 Kalman 濾波器(EKF),Unscented Kalman Filter(UKF),是目前流行的工具箱。
使用了一個(ge) 帶有恒定速度模型的 KF 來跟蹤激光雷達探測。作為(wei) KF 的一種非線性形式,EKF 被用於(yu) 激光雷達目標跟蹤。交互多模型(IMM)濾波器將單個(ge) 動態模型擴展到多個(ge) 機動模型,能夠處理更複雜的情況。
IMM 濾波器由多個(ge) 並行運行的濾波器組成,每個(ge) 濾波器使用不同的運動模型。對於(yu) 單個(ge) 物體(ti) ,IMM-UKF 濾波器應用,其中三個(ge) UKF 用於(yu) 三個(ge) 運動模型:恒定速度、恒定轉彎速率和隨機運動。
作為(wei) 另一種常用的方法,粒子濾波(PF)是為(wei) 更一般的不滿足高斯線性假設的情況而設計的。PF 在激光雷達數據處理中的應用可以追溯到 DARPA。最簡單的方法是最近鄰(NN)濾波器,它根據檢測和軌跡之間的歐氏距離或馬氏距離將檢測分配給最近的軌跡。NN 濾波器對於(yu) 雜波場景是不夠的。
相比之下,聯合概率數據關(guan) 聯濾波器(JPDAF)為(wei) 檢測航跡關(guan) 聯提供了一種軟的、概率的方法。JPDAF 在一個(ge) 選通窗口中考慮所有可能的檢測(包括不檢測),估計它們(men) 對軌跡的分配概率,並取所有關(guan) 聯假設的加權平均值。
與(yu) 雷達基 MOT 相比,基於(yu) LiDAR 的 MOT 的所有檢測都被建模為(wei) 點,而基於(yu) LiDAR 的 MOT 的獨特之處在於(yu) 它還應該跟蹤檢測的形狀。最簡單的形狀模型是一個(ge) 二維邊界框,它假設檢測到的是類似汽車的物體(ti) 。
L 形擬合是估計包圍盒中心、寬度、高度和方向的最常用方法。然而,二維邊界盒不足以滿足更一般的物體(ti) ,如行人、樹木、建築物等。一種更複雜的方法實現了多個(ge) 形狀模型:點、多邊形、L 形和各種對象的線。在跟蹤運動目標時,其形狀隨姿態和傳(chuan) 感器視點的變化而變化。
D、 目標意向預測
前麵介紹的模塊提供檢測到的目標的過去和現在的信息。而在自主駕駛係統中,決(jue) 策和路徑規劃算法需要跟蹤目標的未來運動。以往的工作基於(yu) 某些運動學模型,假設是完美地擬合檢測對象,不適用於(yu) 長期預測。
針對這一缺點,提出了一種基於(yu) 機器學習(xi) 方法的機動或行為(wei) 識別方法。車輛常見的操縱有切入、變道、製動、超車等。采用高斯混合模型(GMM)或隱馬爾可夫模型(HMM)對汽車跟馳、變道行為(wei) 進行了建模。基於(yu) HMM 實現的機動分類,
在車輛交互模型約束下,利用變分高斯混合模型(VGMMs)預測車輛的運動。隨著 RNN 在時序數據建模中的成功應用,基於(yu) LSTM 的方法越來越流行。利用 LSTM 對交叉口駕駛員的意圖進行分類,結果表明 LSTM 優(you) 於(yu) 其他傳(chuan) 統的機器學習(xi) 方法。
提出了一種用於(yu) 機動識別和軌跡預測的編解碼 LSTM 模型。除了識別單個(ge) 物體(ti) 的動作外,社交 LSTM 被提出用來捕捉所有物體(ti) 之間的相互作用。這是通過社會(hui) 池實現的,它將目標的相鄰對象的 LSTM 狀態下采樣為(wei) 一個(ge) 社會(hui) 張量。應用和改進了原有的社會(hui) 統籌部分,用於(yu) 車輛軌跡預測。
E、 新興(xing) 的深度學習(xi) 方法
在計算機視覺和語音識別取得巨大成功之後,激光雷達數據處理也迎來了深度學習(xi) 的浪潮。深度學習(xi) 是機器學習(xi) 算法的一個(ge) 子集,主要使用多層神經網絡。
與(yu) 支持向量機等傳(chuan) 統的機器學習(xi) 方法相比,DL 技術能夠從(cong) 原始輸入中自動提取特征。卷積神經網絡(CNN)和遞歸神經網絡(RNN),如 LSTM(long-short-term memory)是最常用的工具。
感知係統的基本組成部分、地麵分割、目標檢測、跟蹤和識別都可以通過深度神經網絡(DNN)來實現。例如,通過將 CNN 應用於(yu) 由多通道距離圖像表示的 LiDAR 點來分割地麵點。
與(yu) 基於(yu) 聚類的可檢測任意目標的目標檢測方法不同,基於(yu) DNN 的解決(jue) 方案基於(yu) 有監督學習(xi) 的模式,通過識別來實現目標檢測。車輛可以通過基於(yu) CNN 的神經網絡在激光雷達點的 BEV(鳥瞰圖)表示中檢測到。
一種更為(wei) 複雜的神經網絡,將 CNN 用於(yu) 激光雷達數據的距離像和 BEV,然後與(yu) 攝像機檢測進行融合。然而,由於(yu) 激光雷達的物理局限性,激光雷達隻能對車輛進行有效的檢測,KITTI benchmark 中行人檢測的最佳結果平均精度僅(jin) 為(wei) 52.40%(在本文寫(xie) 作時采用的方法是不可信的)。
將證據理論集成到基於(yu) 激光雷達的道路分割和製圖的 DL 體(ti) 係結構中。利用 DL 實現了目標跟蹤。與(yu) 傳(chuan) 統跟蹤算法中描述的濾波跟蹤框架不同,提出了一種檢測跟蹤框架下的深層結構模型。
檢測網首先處理一係列的激光雷達數據和圖像以生成檢測方案。然後,通過尋找最佳檢測關(guan) 聯來估計軌跡,並通過行軍(jun) 網和計分網實現。
除了改進傳(chuan) 統的感知成分外,點式語義(yi) 切分在以前很難實現,現在可以通過深度學習(xi) 來實現。提出了一種通用的三維點雲(yun) 語義(yi) 分割方法點網。然而,由於(yu) 激光雷達數據 w.r.t 距離的稀疏性,該方法不能很好地應用於(yu) 自動駕駛場景。
squezeseg 將 CNN 應用於(yu) 激光雷達點的距離視圖中,實現了實時分割。由於(yu) 缺少大量帶注釋的數據集,這兩(liang) 種方法的性能還不能在實際使用中部署。雖然這種情況已經被 semantickitti8 所改變,Semantickitti8 是基於(yu) KITTI 的最新也是最大的逐點注釋數據集。
基於(yu) 這個(ge) 數據集,RangeNet 通過一個(ge) 並不複雜的 DNN 結構展示了令人著迷的性能和速度。圖 8 示出了 RangeNet 的結構和示例結果。隨著越來越多的標注數據集,我們(men) 有充分的理由期待基於(yu) LiDAR 的語義(yi) 分割將有更好的性能。

圖 8:RangeNet 中提出的神經網絡結構
3。 結論與(yu) 未來方向
本文首先對激光雷達技術進行了綜述。介紹了激光雷達如何“看到”世界和什麽(me) 構成了激光雷達。分析了激光雷達技術的主要發展方向。綜上所述,目前的汽車激光雷達麵臨(lin) 著以下限製或挑戰:
1)成本;
2)滿足汽車可靠性和安全標準(如 ISO26262、IEC61508);
3)測量距離長(如公路應用>200m);
4)惡劣天氣,如雨、霧、雪等;
5)圖像級分辨率;
6)尺寸較小,便於(yu) 集成。目前,各種可能的解決(jue) 方案,從(cong) 激光源(905nm V.S.1550nm)、掃描方法(自旋 /MEMS/OPA/Flash)或測距原理(ToF 或 FMCW)都被用來克服這些困難。
很難預測哪種汽車激光雷達解決(jue) 方案將主導未來,但有一點是肯定的:汽車激光雷達正在走出實驗平台,進入越來越多的量產(chan) 汽車。
然後,介紹了基於(yu) 激光雷達的自動駕駛感知係統的簡明教程。介紹了感知係統提供的三個(ge) 層次的信息,以及典型的處理流程。一般來說,與(yu) 攝像機或雷達相比,激光雷達是測量距離最精確的傳(chuan) 感器。
因此,由基於(yu) 激光雷達的算法評估的物理信息(物體(ti) 的位置、方向、形狀等)是非常可靠的。然而,語義(yi) 描述是激光雷達的缺點。這是由於(yu) 激光雷達的分辨率低,其本質是作為(wei) 一個(ge) 距離測量傳(chuan) 感器,而不是上下文傳(chuan) 感器。與(yu) 攝像機的融合彌補了激光雷達在識別方麵的不足。
意圖預測水平獨立於(yu) 特定的傳(chuan) 感器,而激光雷達所帶來的精確物理信息將增強其預測能力。將深度學習(xi) 應用於(yu) 激光雷達的三維數據將是未來研究的重要方向之一。缺乏大量的三維點雲(yun) 數據集是深度學習(xi) 方法成功應用的瓶頸。隨著新型激光雷達的快速發展,將出現更加適用於(yu) 特定激光雷達的新算法。
轉載請注明出處。







相關文章
熱門資訊
精彩導讀



















關注我們

