1 行为决策概述 | 自动驾驶小白说

tags

password

icon

欲寄彩笺兼尺素，山长水阔知何处

—晏殊《蝶恋花》

🏰代码及环境配置：请参考环境配置和代码运行!

在推进自动驾驶技术向L4乃至L5级别迈进的过程中，行为决策层面所面临的挑战构成了关键技术瓶颈之一。这一层次不仅要求系统能够应对纷繁复杂且多变的真实驾驶场景，还需在复杂的多智能体环境中作出精准预测与适应，同时，面对环境信息的不完全性和感知不确定性，车辆需展现出高度的灵活性和鲁棒性。

换而言之，自动驾驶的行为决策系统必须满足：

广泛适应多变的驾驶环境：构建一个能够全面覆盖各种复杂驾驶情境的能力，包括但不限于城市拥堵、乡村小路、恶劣天气及夜间行驶等，确保在各种未知或未预料到的环境中都能安全行驶。

精准预测多智能体行为：在多智能体交互的复杂交通环境中，实现对包括行人、其他车辆、非机动车在内的所有参与者的行为预测，从而制定出既安全又高效的行驶策略。这需要深度理解交通规则和驾驶习惯，以及利用先进的预测模型来评估并响应这些参与者的潜在动作。

处理感知不确定性：在面临环境信息缺失或被遮挡的情境下，行为决策系统必须能够依赖不完整的感知数据，结合历史信息、上下文理解和策略性推理，来制定合理且安全的决策。这要求系统具备强大的容错能力和对未知情形的适应能力。

近年来，随着深度强化学习等前沿技术的蓬勃发展，为突破这一瓶颈提供了新的途径。深度强化学习结合了深度学习的特征提取能力和强化学习的决策优化能力，使自动驾驶系统能够在模拟环境中不断学习和优化行为策略，逐步逼近甚至超越人类驾驶员的决策水平。这为真正实现高度自主甚至完全无人的自动驾驶技术开辟了新的可能性。

对于自动驾驶而言，决策一般包含两种：车道决策和障碍物决策，其中：

车道决策：指在路上行驶时，我们是应该保持当前车道直行，还是借旁边车道再返回本车道，或因为某个目的而进行变道（这三种情况如下图所示）。而对于车道决策而言，常用的算法包括：

障碍物决策：指的是在给定车道决策的情况下，如何定性地去处理障碍物。如车前有石头挡着路，可以决定从左绕开还是从右绕开。前面有车要cut in时，我们可以选择在它cut in前加速超过它，也可以选择减速让行。目前常用的障碍物决策算法包括：

行为决策系统涉及到的内容比较多且比较杂，目前尚未有某个算法可以完美的解决所有场景，接下来我们将分若干小节简单了解下相关的内容。