ICCV 2019无人驾驶研究成果大总结(含大量论文及项目数据)

本文授权转载自:智车科技

感知

【Fast PointR-CNN】

论文:http://openaccess.thecvf.com/content_ICCV_2019/papers/Chen_Fast_Point_R-CNN_ICCV_2019_paper.pdf

简介:腾讯和香港大学联合发表的论文基于KITTY提出了一种新的使用激光雷达技术的快速三维检测方法。它将立体像素和点云表示合并在一个两阶段的方法中,以利用两者的优势:立体像素表示用于初始提案,点云表示用于细化阶段。

【Range Adaptation for 3D Object Detection in LiDAR】

论文:http://openaccess.thecvf.com//content_ICCVW_2019/papers/ADW/Wang_Range_Adaptation_for_3D_Object_Detection_in_LiDAR_ICCVW_2019_paper.pdf

简介:沃尔沃与杜克大学联合发表的文章表示随着激光雷达输入变得更加稀疏,现有的三维检测网络的性能随着距离的增加而降低。为此,本文提出了一种基于距离的神经网络性能改进方法,以提高对远距离目标的性能。

【M3D-RPN:Monocular 3D Region Proposal Network for Object Detection】

论文:http://openaccess.thecvf.com//content_ICCVW_2019/papers/ADW/Wang_Range_Adaptation_for_3D_Object_Detection_in_LiDAR_ICCVW_2019_paper.pdf

项目代码:

https://github.com/garrickbrazil/M3D-RPN

简介:密歇根州立大学的文章提出一种新的单镜头单目三维目标检测方法,极大地提高了基于KITTY数据集的技术水平。

【VehicleDetection With Automotive Radar Using Deep Learning on Range-Azimuth-DopplerTensors】

论文:http://openaccess.thecvf.com//content_ICCVW_2019/papers/CVRSUAD/Major_Vehicle_Detection_With_Automotive_Radar_Using_Deep_Learning_on_Range-Azimuth-Doppler_ICCVW_2019_paper.pdf

简介:美国高通公司的团队探索了一种通过雷达输出探测车辆的方法。与其他方法不同的是,作者提出了处理原始传感器测量数据以提高性能。

【JointMonocular 3D Vehicle Detection and Tracking】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Hu_Joint_Monocular_3D_Vehicle_Detection_and_Tracking_ICCV_2019_paper.pdf

项目代码:

https://github.com/ucbdrive/3d-vehicle-tracking

简介:加州大学伯克利分校表示检测和跟踪任务通常在一个模块化的反病毒堆栈中相互独立建模。这项工作提出了一种端到端的神经网络,它只使用一个摄像头就能学会两者。

【How Do NeuralNetworks See Depth in Single Images?】

论文:http://openaccess.thecvf.com/content_ICCV_2019/papers/van_Dijk_How_Do_Neural_Networks_See_Depth_in_Single_Images_ICCV_2019_paper.pdf

简介:荷兰代尔夫特理工大学近年来从单一图像的深度方法有显着提高。作者研究了这些方法是如何工作的,得出的结论是它们过度适合物体在图像中的垂直位置。如果摄像头安装在车上的不同位置可能会导致错误。

【Robust Multi-Modality Multi-Object Tracking】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Zhang_Robust_Multi-Modality_Multi-Object_Tracking_ICCV_2019_paper.pdf

项目代码:

https://github.com/ZwwWayne/mmMOT

简介:南洋理工大学的多模态感知(在激光雷达和摄像头中检测和跟踪目标)通常是通过模块化的、多阶段的方法实现的,每个方法都有自己的假设。该方法允许将这些单独的步骤合并到一个端到端可训练的系统中,从而提高的性能。

感知&规划

【Exploring theLimitations of Behavior Cloning for Autonomous Driving】

论文:http://openaccess.thecvf.com/content_ICCV_2019/papers/Codevilla_Exploring_the_Limitations_of_Behavior_Cloning_for_Autonomous_Driving_ICCV_2019_paper.pdf

项目代码:

https://github.com/felipecode/coiltraine/blob/master/docs/exploring_limitations.md

简介:丰田研究所表示目前自动驾驶汽车(AVs)的轨迹规划仍然主要是手工工作。使用机器学习解决这个问题的方法之一是模仿现有的驱动程序。作者研究了这种方法的局限性,并提出了一个新的数据集来评估学习策略的性能。

【TowardsLearning Multi-Agent Negotiations via Self-Play】

论文:

http://openaccess.thecvf.com//content_ICCVW_2019/papers/ADW/Tang_Towards_Learning_Multi-Agent_Negotiations_via_Self-Play_ICCVW_2019_paper.pdf

简介:苹果公司表示强化学习可能是机器人在没有人工编码的情况下学习如何行动的一种强有力的方式,但在现实的机器人技术中很难应用。在本论文中,作者使用模拟来评估一个基于强化学习的系统。

【PIE: ALarge-Scale Dataset and Models for Pedestrian Intention Estimation andTrajectory Prediction】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Rasouli_PIE_A_Large-Scale_Dataset_and_Models_for_Pedestrian_Intention_Estimation_ICCV_2019_paper.pdf

项目数据集:

http://data.nvision2.eecs.yorku.ca/PIE_dataset/

简介:约克大学提出了一个新的数据集来预测行人的意图和未来的轨迹。作者还为这些任务提供了基线模型。

建图&定位

【DAGMapper:Learning to Map by Discovering Lane Topology】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Homayounfar_DAGMapper_Learning_to_Map_by_Discovering_Lane_Topology_ICCV_2019_paper.pdf

简介:Uber ATG为自动驾驶汽车创建了高清语义映射工作,提出了一种自动生成语义地图的方法,实现了89%的正确拓扑。

【GSLAM: AGeneral SLAM Framework and Benchmark】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Zhao_GSLAM_A_General_SLAM_Framework_and_Benchmark_ICCV_2019_paper.pdf

项目代码:

https://github.com/zdzhaoyong/GSLAM

简介:中国西北工业大学表示SLAM系统在过去十年中得到了显著的发展,在此基础上,提出了一个统一的框架来比较现有方法的不同组成部分,并帮助开发新的方法。

【LPD-Net: 3DPoint Cloud Learning for Large-Scale Place Recognition and Environment Analysis】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Liu_LPD-Net_3D_Point_Cloud_Learning_for_Large-Scale_Place_Recognition_and_ICCV_2019_paper.pdf

简介:香港中文大学在预先构建的地图中,基于雷达的本地化是自动驾驶汽车视觉堆栈的关键组成部分。在这篇论文中,作者提出了一个全局学习描述符来识别车辆在地图的哪个部分。

【SemanticKITTI:A Dataset for Semantic Scene Understanding of LiDAR Sequences】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Behley_SemanticKITTI_A_Dataset_for_Semantic_Scene_Understanding_of_LiDAR_Sequences_ICCV_2019_paper.pdf

网址:

http://www.semantic-kitti.org/

项目代码:

https://github.com/PRBonn/semantic-kitti-api

简介:德国波恩大学提出了一种新的数据集,它提供了所有KITTY序列中点云的语义注释。以此来开发地图和感知系统的语义分类。

自动驾驶数据管理

【DBUS: HumanDriving Behavior Understanding System】

论文:

http://openaccess.thecvf.com//content_ICCVW_2019/papers/ADW/Li_DBUS_Human_Driving_Behavior_Understanding_System_ICCVW_2019_paper.pdf

简介:滴滴出行联合南加利福尼亚大学表示Crowd-sourcing是一种收集大量人类驾驶数据来训练自动驾驶系统的方法。使这些数据可搜索且有用。为了解决这个问题,作者提出了一个端到端系统,该系统允许处理、索引和查询大量的驱动数据,以检索相关的场景。

【Large ScaleMultimodal Data Capture, Evaluation and Maintenance Framework for AutonomousDriving Datasets】

论文:

http://openaccess.thecvf.com//content_ICCVW_2019/papers/AUTONUE/Lakshminarayana_Large_Scale_Multimodal_Data_Capture_Evaluation_and_Maintenance_Framework_for_ICCVW_2019_paper.pdf

项目代码:

https://github.com/intel/driving-data-collection-reference-kit

简介:因特尔公司表示自动驾驶不仅是对人工智能的挑战,也是一个重大的工程和数据管理挑战。本文描述了一个存储和处理大量自动驾驶数据的案例研究和所涉及的挑战。

【Meta-Sim:Learning to Generate Synthetic Datasets】

论文:

http://openaccess.thecvf.com/content_ICCV_2019/papers/Kar_Meta-Sim_Learning_to_Generate_Synthetic_Datasets_ICCV_2019_paper.pdf

项目代码:

https://github.com/nv-tlabs/meta-sim

简介:NVIDIA联合多伦多大学在具有挑战性的条件下综合数据是训练或测试自动驾驶堆栈的方法之一。本文提出了一种基于用户文本输入的场景生成模型。

【Advanced Pedestrian Dataset Augmentation for Autonomous Driving】

论文:

http://openaccess.thecvf.com//content_ICCVW_2019/papers/ADW/Vobecky_Advanced_Pedestrian_Dataset_Augmentation_for_Autonomous_Driving_ICCVW_2019_paper.pdf

简介:布拉格捷克理工大学在具有挑战性的条件下综合数据是训练或测试自动驾驶堆栈的方法之一。作者提出了使用GANs来生成行人检测问题的数据。