1.7 常用数据集: Argoverse

category
type
status
slug
date
summary
tags
password
icon
Argoverse数据集是一个由Argo AI公司发布的大规模自动驾驶数据集,旨在支持自动驾驶领域的多种研究任务,如3D跟踪、运动预测、立体深度估计等。
与Waymo Open Dataset一样, Argoverse也是一个免费开源数据集.
 
notion image

1.7.1 Motion Forecasting Dataset

轨迹预测对应的数据集是Argoverse 2 motion forecasting dataset. 数据集包含超过1000小时的驾驶数据,覆盖多个城市和天气条件, 包括激光雷达(LiDAR)、相机、GPS、IMU等多种传感器数据,以及高精地图数据.
Argoverse每年也会举办Motion Forecasting Competition, 2024年预测模型的排行如下:
notion image

1.7.2 数据格式

Argoverse 2数据集同样基于场景scenario划分, 每个scenario包含地图数据和scenario数据. 地图原始数据以json存储, scenario原始数据以parquet 储存, 官方提供了API进行数据的读取.
notion image

1.7.3 地图数据格式

每个场景都包含有各自的高精度地图数据,包括3D车道、人行道和可行驶区域几何形状——这些数据来源于六个不同城市(奥斯汀、底特律、迈阿密、帕罗奥多、匹兹堡和华盛顿特区)。地图数据由3个子数据组成:

1.7.3.1 Lane Segments 车道

  • id: lane segments的id
  • is_intersection: 是否位于路口
  • right_lane_boundary: 车道右边界的3D折线
  • left_lane_boundary: 车道左边界的3D折线
  • predecessors: 车道的前继车道
  • successors: 车道的后继车道
  • right_neighbor_id: 车道的右邻居车道id
  • left_neighbor_id: 车道的左邻居车道id

1.7.3.2 Drivable Area 可行驶区域

  • id: 可行驶区域的id
  • area_boundary: 可行驶区域的边界, 由3D多边形表达

1.7.3.3 Pedestrian Crossings 人行横道

  • id: 人行横道的id
  • edge1: 人行横道主轴的一侧边界, 由两个点组成
  • edge2: 人行横道主轴的另一侧边界, 由两个点组成

1.7.4 scenario场景数据格式

每个scenario都包含11s的数据, 具体如下:
  • scenario_id: scenario ID.
  • timestamps_ns: scenario内的所有的 时间步长-时间戳.
  • tracks: scenario内所有object的轨迹.
  • focal_track_id: scenario内需要预测的object.
  • city_name: scenario数据来源城市.

1.7.4.1 tracks数据格式

scenario内的主要数据在tracks中, 每个track定义如下
  • track_id: object轨迹的id
  • object_states: 每个时间步长的状态, 每个state定义如下
    • observed:该状态是否在scenario观察时间窗口内.
    • timestep: 时间步长, [0, num_scenario_timesteps).
    • position: 坐标.
    • heading: 朝向角.
    • velocity: 方向的速度.
  • object_type: object的类型, 定义如下
    • Dynamic: 动态类型
      • VEHICLE : 车辆
      • PEDESTRIAN : 行人
      • MOTORCYCLIST : 摩托车
      • CYCLIST : 自行车
      • BUS : 公交车
    • Static: 静态类型
      • STATIC : 静止的
      • BACKGROUND : 背景
      • CONSTRUCTION : 建筑
      • RIDERLESS_BICYCLE : 没有人的自行车
    • UNKNOWN: 未知类型
  • category: 轨迹质量分类, 包含以下几个标签:
    • TRACK_FRAGMENT: 质量较低的轨迹数据, 可能只包含几个时间戳
    • UNSCORED_TRACK: 用于上下文输入的未打分轨迹.
    • SCORED_TRACK: 与自车相关的高质量轨迹, 用于多智能体预测挑战赛.
    • FOCAL_TRACK: scenario内的主要轨迹, 用于单智能体预测.

参考链接

上一篇
动手学控制理论
下一篇
端到端-理论与实战视频课程
Loading...