首页 > 汽车 > 车界动态 > 正文

百度自动驾驶数据集ApolloScape:数据量最大、环境最复杂、标注最精准

文章来源:
字体:
发布时间:2018-06-10 17:03:18

        自动驾驶已经从实验室象牙塔”进入到规模化上路、量产阶段,在自动驾驶开发测试中,海量、高质的真实数据是必不可缺的“原料”。但是,少有团队有能力开发并维持一个适用的自动驾驶平台,定期校准并收集新数据,因此行业亟需一个数据量充沛、涵盖场景丰富的自动驾驶专用数据平台。今年3月,百度大规模自动驾驶数据集ApolloScape应需开放,致力于为全世界自动驾驶技术研究者提供更为实用的数据资源及评估标准。

ApolloScape是百度Apollo自动驾驶开放平台的专题项目之一,是目前行业内环境最复杂、标注最精准、数据量最大的三维自动驾驶数据集。ApolloScape开放了比CityscapesKitti等同类数据集大10倍以上的数据量,包括感知、仿真场景、路网数据等数十万帧逐像素语义分割标注的高分辨率图像数据,以及与其对应的逐像素语义标注、稠密点云、立体图像、立体全景图像,并进一步涵盖更复杂的环境、天气和交通状况等。

图片1.jpg 

Kitti,CityScapes和ApolloScape关于数据实例的对比

ApolloScape涵盖了最复杂的道路状况,提供最有挑战性的数据支持,数据集包括了全新提供的逐帧标注的视频序列和三维背景,以及中国最复杂的街景, 单张图片内可以包含上百个车和行人。

图片2.jpg 

ApolloScape标注数据示例

 

图片3.jpg 

ApolloScape深度数据示例

同时,ApolloScape开放数据集采用了逐像素语义分割标注的方式,包含数十万帧逐像素语义分割标注的高分辨率图像数据,为便于研究人员更好的利用数据集的价值。ApolloScape在数据集中定义了共26个不同语义项的数据实例(例如汽车、自行车、行人、建筑、路灯等),并将进一步涵盖更复杂的环境、天气和交通状况等。

图片4.jpg 

ApolloScape数据集中包含的各类实例的信息

环境模拟用于自动驾驶在汽车和计算机行业引起了很多关注。ApolloScape还将进行更多关于仿真的前沿技术研究,打造真实世界还原度最高、场景最丰富的仿真平台。基于Apollo仿真平台,ApolloScape计划同时将数十辆自动驾驶车辆投入到同一个路网中行驶,可以模拟真实的复杂驾驶场景和多车博弈过程。这也是目前最先进的智能驾驶仿真技术之一,不仅适用于典型的相对安全的场景,而且还适用于不确定和危险的环境,可以帮助研发人员有效检验并优化预测、决策和路径规划等算法,显著提升自动驾驶的测试多样性。目前ApolloScape开放模拟工具包括WorldSimLogSim,同时还在开发下一代技术,可用于生成真实世界驾驶场景和驾驶员行为的真实模拟。

未来,ApolloScape计划为数据集拓展更多类型、更多属性的数据。例如,通过添加红外图像,帮助自动驾驶算法更容易进行夜间检测;提取更稠密的轨迹信息,用于对驾驶行为进行建模;以及通过众包模式采集立体视觉的驾驶特殊事件图像等。

除了开放工具及数据,ApolloScape还旨在为全球开发者、研究人员搭建起一个学术交流的高端平台,共同探索前沿领域技术突破及应用创新。424日,首届ApolloScape学术峰会在北京召开,会议汇集了来自美国、德国, 澳洲、中国等地的国内外自动驾驶领域杰出的专家学者,一同交流分享自动驾驶数据相关的先进理念和研究成果,为自动驾驶业界与学界能量交换搭建了新接口,以凝聚学术力量。

 

图片5.jpg 

此外,Apollo开放平台还将在6月开幕的CVPRIEEE国际计算机视觉与模式识别会议)期间举办大会唯一的自动驾驶研讨会(Workshop on Autonomous Driving),并将基于ApolloScape的大规模数据集定义了多项任务挑战。ApolloScape已正式于国外知名机器学习竞赛平台Kaggle上线Video Segmentation Challenge(视频场景解析挑战赛),比赛中所提供的数据集中将包含大量的分段原始驾驶图像,包含有20+种场景标注信息。赛事将持续到612日。目前已有来自全球的一百多只队伍正式报名参加。

虽然国外有不少可供选择的数据集,但是国内的路况复杂程度显然与国外不同。自动驾驶在复杂路况下的测试仅依靠技术手段很难解决,需要大规模精准数据集的帮助,这也是百度决定开放ApolloScape的初衷。百度希望通过公开的方式,吸引更多企业和开发者利用并补充数据集,进而提高自动驾驶的感知能力。随着源源不断的合作伙伴、开发者和学界能量的导入,将给ApolloScape带来更充沛的生长养分,其数据量还将越来越大,涵盖更为丰富、复杂全球化场景,打造全球最大的自动驾驶开放数据集。