250,000輛汽車–用於機器學習的十大免費車輛圖像和視頻數據集

作者 | Limarc Ambalina

來源 | lionbridge.ai

編輯 | 代碼醫生團隊

隨着特斯拉自動駕駛汽車的興起以及谷歌Waymo等項目的興起,自動駕駛汽車行業似乎每年都在增長。無人駕駛汽車是計算機視覺的一個重要領域,具有眾多應用程序,並且具有巨大的獲利潛力。

與所有計算機視覺算法一樣,自動駕駛汽車需要訓練有素的圖像數據。通常很難獲得大量的高質量圖像或找到信譽良好的圖像注釋服務。手動注釋成千上萬張圖像更加困難,有時效率低下。

在哪裡可以找到免費圖像和視頻數據集以進行自動駕駛汽車開發?

以下是10個開放圖像和視頻數據集的列表,這些數據集非常適合在自動駕駛汽車研究和開發中使用。下面的數據集包含超過250,000張圖像和靜止視頻幀,其中一些已經被注釋。

1. BIT車輛數據集 –來自北京智能信息技術實驗室的數據集包含9,850幅車輛圖像。這些圖像按車輛類型分為以下六類:公共汽車,小型客車,小型貨車,轎車,SUV和卡車。

http://iitlab.bit.edu.cn/mcislab/vehicledb/

2. 城市景觀圖像對-使用從德國駕駛的車輛拍攝的交通視頻,該數據集包括2,975個圖像對。每個單獨的圖像文件的左側都有原始的靜止幀,而右側在語義上已分割了相同的幀。

https://www.kaggle.com/dansbecker/cityscapes-image-pairs

來自「城市景觀圖像對」數據集的樣本圖像

3. GTI車輛圖像數據庫 –此數據集包括3,425個道路上車輛的后角圖像,以及3,900個沒有車輛的道路圖像。

https://www.gti.ssr.upm.es/data/Vehicle_database.html

4. 帶邊界框的KITTI對象檢測 –取自卡爾斯魯厄技術學院的基準套件,該數據集由該套件的對象檢測部分中的圖像組成。該圖像數據集包括超過14,000張圖像,這些圖像由7,518張測試圖像和7,481張訓練圖像組成,並在單獨的文件中帶有邊界框標籤。

https://www.kaggle.com/twaldo/kitti-object-detection

來自KITTI對象檢測數據集的樣本圖像

5. LISA紅綠燈數據集 –儘管此數據集不專註於車輛,但它仍然是用於訓練自動車輛算法的非常有用的圖像數據集。LISA交通信號燈數據集包括夜間和白天的視頻,總計43,0007幀,其中包括帶注釋的113,888個交通信號燈。該數據集的重點是交通信號燈。但是,幾乎所有車架中都裝有交通信號燈和車輛。

https://www.kaggle.com/mbornoe/lisa-traffic-light-dataset

6. 尼泊爾車輛-由加德滿都街頭拍攝的總共30部交通視頻組成,該數據集包含從這些視頻中裁剪的4,800輛車輛的圖像。在4800張圖像中,有1811張為兩輪車,而2989張為四輪車。

https://github.com/sdevkota007/vehicles-nepal-dataset

7. 雨雪交通監控 –該數據集由22個視頻組成,每個視頻約5分鐘。使用RGB彩色相機和紅外熱像儀捕獲視頻。因此,數據包括超過130,000個RGB熱圖像對。

https://www.kaggle.com/aalborguniversity/aau-rainsnow

8. 斯坦福汽車數據集 –來自斯坦福大學AI實驗室的數據集包含196種不同類型汽車的16,185張圖像。

http://ai.stanford.edu/~jkrause/cars/car_dataset.html

9. 自動駕駛汽車的語義分割 –作為Lyft Udacity Challenge的一部分創建,此數據集包含5,000張圖像和相應的語義分割標籤。

https://www.kaggle.com/kumaresanmanickavelu/lyft-udacity-challenge#dataB.tar.gz

10. TME高速公路數據集 –由28個視頻片段組成,總計27分鐘的視頻,該數據集包括30,000多個帶有車輛注釋的幀。

http://cmp.felk.cvut.cz/data/motorway/