4.2 M2I:从边缘预测走向交互预测

category
type
status
slug
date
summary
tags
password
icon
上一节我们介绍了边缘预测, 条件预测和联合预测的概念, 以及scene transformer和QCNeXt的一些联合预测的尝试. 但是他们其实都没有很好的考虑预测轨迹的交互性, 本节我们将介绍交互预测的里程碑论文M2I: From Factored Marginal Trajectory Prediction to Interactive Prediction.
notion image

4.2.1 Relation Predictor 交互关系预测模型

上一节已经介绍过, 边缘预测的局限性主要有:
  • 不考虑agent之间的交互
  • 不同agent之间的预测轨迹不自洽(相互碰撞)
以上图为例, 边缘预测中不考虑车辆之间的交互关系, 那么他们的预测结果是相互独立的, 可以写成:
M2I从交互关系着手: 将车辆分为主导者(蓝车)和被动者(红车). 这种情况下, 两车存在先后决策关系, 即蓝车右转入弯时不会考虑红车; 但是红车需要考虑蓝车的动作, 再执行跟随动作入弯. 也就是基于主导者的预测结果, 计算被动者的预测结果:
M2I将两车关系建立为一个分类模型, 类型为: . 分别对应着主导者, 被动者 和 无交互关系.
但是GT数据中是没有这些标签的, 我们需要设计规则来给GT打上标签, 是两个车辆的轨迹, 首先我们计算如下值:
  • 两车GT轨迹最接近对方轨迹的点, 定义为各自的交互点
  • 代表两交互点点之间的欧式距离
  • 车1到达交互点的时间
  • 车2到达交互点的时间
接着M2I设计了如下规则, 来判定GT数据中谁是主导者和被动者, 并打上标签作为真值:
  • >阈值时: 判定两车没有交互关系, 两车都判定为主导者;
  • <阈值时:
    • 时: 即车1先到交互点, 判定车1, 车2
    • 时: 即车2先到交互点, 判定车2, 车1;
然后通过一个MLP输出分类概率, 并计算交叉熵损失.
Relation Predictor是一个较简单的分类网络, 可以在M2I模型之前单独训练, 这样模型整体收敛较快.

4.2.2 条件预测

Relation Predictor输出交互关系以后, M2I根据他们的标签分别进行预测.
notion image
如图, M2I对主导者进行边缘预测, 因为主导者不需要考虑其他车辆的预测信息. 有了主导者的预测信息之后, 将其输入给条件预测器, 输出被动者的条件预测轨迹.
不管是边缘预测还是条件预测, 都是考虑个模态.
notion image
主导者的边缘预测输出了个模态轨迹, 条件预测器会为每个模态轨迹输出个被动者轨迹. 一共有条轨迹.

4.2.3 结果和分析

论文中展示了一些仿真结果, 可以明显的看到在这些主从交互场景中, 交互预测的结果明显优于边缘预测. 交互预测结果更加真实可信.
notion image
但是M2I对交互问题考虑的比较简单, 对于主从交互场景效果很好, 但是有一些明显的不足:
  • 主要考虑了两车之间的交互预测, 但是多车之间可能存在更复杂混乱的交互关系
  • 两车之间的交互并不一定只有主从交互, 也存在关系对等的交互: 比如两车到达交互点的时间接近, 存在更为复杂的博弈关系时, 就很难用主从交互来建模

参考链接

  • M2I: From Factored Marginal Trajectory Prediction to Interactive Prediction
上一篇
动手学控制理论
下一篇
端到端-理论与实战视频课程
Loading...