速度协调的 Q 学习模型研究
DOI:
CSTR:
作者:
作者单位:

作者简介:

通讯作者:

中图分类号:

U491.4

基金项目:


Research on Q-Learning model of speed harmonization
Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    为平滑高速公路瓶颈区域上、下游车流速度,基于单位距离速度变化量和多项式 SG 卷积平滑处理的 2 个奖励函数,分别建立了 2 个速度协调的 Q 学习模型。利用 Excel-VBA、VISSIM 和 MATLAB 的集成仿真平台, 对奖励函数的性能进行了仿真分析。研究结果表明:基于 SG 卷积平滑的奖励函数,可以有效地缓解瓶颈上游“走 走停停”的现象,减小速度的波动幅度。速度协调的 Q 学习模型可以根据交通状态实时选择最优的运行速度。

    Abstract:

    In order to optimize the speed of upstream and downstream traffic flow in the bottleneck area of expressway, two reward functions based on unit distance velocity variation and SG convolution smoothing were proposed, and two Q-learning models of speed harmonization were established. The integrated simulation platform combining Excel-VBA, VISSIM and MATLAB was used to simulate the reward functions. The results show that, the reward function based on SG convolution smoothing can effectively relieve the stop-and-go traffic on the upstream of the bottleneck. The fluctuation amplitude of speed was reduced. The Q-Learning model of speed-coordinated can suggest the optimal real time speed according to the traffic state.

    参考文献
    相似文献
    引证文献
引用本文

刘元元 ,卢守峰 ,刘肖亮 ,等.速度协调的 Q 学习模型研究[J].交通科学与工程,2021,37(2):98-104.
LIU Yuan-yuan, LU Shou-feng, LIU Xiao-liang, et al. Research on Q-Learning model of speed harmonization[J]. Journal of Transport Science and Engineering,2021,37(2):98-104.

复制
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:
  • 最后修改日期:
  • 录用日期:
  • 在线发布日期: 2022-06-06
  • 出版日期:
文章二维码