機車偵測、追蹤及對應

作者:

胡家睿、李則霖、詹巧同

刊登日期:2020/03/31

摘要

在亞洲區發展自主駕駛的難度較歐美地區高,因為亞洲地區的交通發展往往因為地狹人稠而發展出高機動性的機車文化使得交通較複雜。因此為了在台灣發展自主駕駛技術,如何對應機車變成一重要的課題,工研院機械所去年已申請到國內第一張開放場域測試車牌,已於新竹南寮漁港週邊進行複雜交通測試,其中就包含多樣的機車行為應對情境,因此本文將就自主駕駛車如何針對機車之相關經驗來進行介紹。

Enabling self-driving vehciles in Taiwan would be more challenging than other areas due to the high complexity of the crowded scooter traffic environments. As a result, how to deal and react with these scooters on roads is an important capabiltiy for autonomous driving systems. The self-driving vehicles group at MMSL, ITRI obtained the first self-driving car license in the NanLiao open field last year and has being collected a number of cases containing special behavior of scooters. This article will reveal some of our approaches for dealing with scooters on public roads.

關鍵詞(Keywords) 自主駕駛車、偵測、追蹤 Autonomous vehicle, Detection, Tracking

前言

《由國家地理雜誌》舉辦的「2018年度旅行攝影師大賽」中攝影師M.CHAK拍下了台灣特有的「機車瀑布」,這並不是機緣巧合下捕捉到的瞬間,實際上台灣正是亞州機車密度最高的國家,機車總數約為14,000,000輛,以台北市為例每1平方公里中就有3500台機車,這些機車具備高度的靈活性,因此可輕易的穿梭、並排在車陣中亦或做出突然改變行徑方向的操作,這對於自主駕駛系統來說無疑是一大挑戰,因此本文將如何針對這些機車進行偵測、追蹤及讓自主駕駛車針對追蹤的結果進行反應進行描述,依循著地利之便在自主駕駛車能對應這高度複雜的機車互動時,相信能提高台灣在自主駕駛領域中之競爭力。

機車偵測

一般在自主駕駛車輛上會配置多種特性不同的感測器來達到相互弭平缺點的部份,常見的感測器有:光達、雷達及相機,不同的感測器有不同的演算法來達到偵測機車的目的,本節將對不同的感測方式及特性做介紹。

1.影像偵測:

  在影像偵測的部份其優點在於可以得到很好的類別判斷,目前使用最多的方法是利用深度學習來達成,其可以由資料庫中學習到不同類別物件的特徵,並以此(包含幾何與顏色)區分物件,甚至在部份遮擋、尺寸不依的情況下也可判斷出物件的存在與類別,但對於距離上的判定較差。由於深度學習網路的種類有許多不同的種類,在此以YOLOv3 [2]做一介紹,其特性是快速且對小物件偵測相較於前一代有更好的表現,處理速度方面,因為YOLOv3本身是一個 one-stage-detector,也是其取名為YOLO的原因: You only look once,這種類型的架構本身處理速度就較快,YOLOv3其原理是將影像切割成多個網格,偵測各個網格是否為物件的中心以及該物件的長、寬、分數、種類,最後再利用非極大值抑制 (Non-Maximum Suppression, NMS) 將面積重複比例太大的結果去除,即可完成物件偵測;而小物件偵測的部分由於 YOLOv3 架構最後連接金字塔型的輸出,可以理解成網格內部再切割成以小網格為中心做偵測,因此小物件偵測的效果也較前一代有大幅度的提升,小物件偵測在道路環境下十分重要,尤其是台灣的環境有許多擁擠的人潮和車潮,因此更提升了這項特性的重要性,一般道路上常見的物件種類有:車、機車、行人、巴士及卡車,圖1中被方框框起來的區域代表深度學習網路偵測到的結果。

圖1 深度學習物件偵測結果

2.點雲偵測:

點雲資料主要由光達產生,光達本身的優點在於可以得到相對其他感測器較準的距離及尺寸資訊,其原理為雷射源發出光束,當光束遭遇到物體時會產生反射,利用光速計算飛行時間後可得物體相對於本車之距離。對於使用點雲來做機車的偵測可以有幾種不同的方法:最廣為人知的便是利用歐氏距離的大小來將點雲的點分群,主要概念為找尋連續性,在現實世界中物體與物體間應會保持距離,所以此方法假設落在同一個物體上的點距離應小於落在不同物件的點距離,因此所有滿足距離閥值的點會被歸類為同一物件,如圖2(a),或者是將點雲依照發射與接收的順序排列整齊如同影像一般再利用傳統機器視覺的方式來切割,當分群完成後可以利用簡單的分類器(如:支援向量機Support Vector Machine, SVM)利用分群完的群聚的特徵進行分類,當然由於深度學習的興起,在研究上也有越來越多的深度學習網路出現用來進行光達物件的分類,如:pointNet[3],如果訓練成果優良則可直接得到完整的障礙物3D空間尺寸,並提供外接框 (bounding box) 輸出,較不會有因視角或部份遮擋致使觀測物的量測值變形的問題,如圖2(b)。

…本文未結束

更完整的內容 歡迎訂購 2020年4月號 445期

機械工業雜誌‧每期240元‧一年12期2400元

我要訂購