青草视频网,在线播放国产不卡免费视频,国产高清1024永久免费

交通場景下基于深度強化學習的感知型路徑分配算法

信息技術與網絡安全 6期

曹歡

(中國科學技術大學信息科學技術學院，安徽合肥230026)

摘要： 路徑分配問題是交通數字孿生系統的重要研究方向之一，其重點是綜合考量行駛需求的動態變化以及路網信息的實時改變，實現高效合理的路徑規劃。現階段一些經典的分配算法如粒子群、Dijkstra等算法及其優化模型僅能達到全局靜態最優，忽略了現實交通中的復雜變化。而逐漸推出的各種深度學習算法雖能進行全面的時空預測，但受限于海量歷史數據的歸納分析以及較高的運算成本，難以大規模應用。鑒于此，提出了一種靜態分配算法與深度強化學習算法結合的感知型路徑分配算法,在行駛中依據實時路網信息和車輛當前狀態，實現全局路徑動態再分配及更新，相關算法的精度和效率在仿真實驗中得到驗證。

關鍵詞： 路徑分配深度強化學習路網路況感知

中圖分類號： TP181
文獻標識碼： A
DOI： 10.19358/j.issn.2096-5133.2022.06.008
引用格式：曹歡. 交通場景下基于深度強化學習的感知型路徑分配算法[J].信息技術與網絡安全，2022，41(6)：43-49.

Perceptual path allocation algorithm based on deep reinforcement learning in traffic scene

Cao Huan

(School of Information Science and Technology，University of Science and Technology of China，Hefei 230026，China)

Abstract： Path allocation problem is one of the important research directions of traffic digital twin system. Its focus is to comprehensively consider the dynamic changes of driving demand and the real-time changes of road network information, so as to realize efficient and reasonable path planning. At present, some classical allocation algorithms such as particle swarm optimization, Dijkstra and their optimization models can only achieve global static optimization, ignoring the complex changes in real traffic. Although various depth learning algorithms gradually introduced can carry out comprehensive spatio-temporal prediction, they are difficult to be applied on a large scale due to the inductive analysis of massive historical data and high operation cost. In view of this, this paper proposes a perceptual path allocation algorithm based on the combination of static allocation algorithm and deep reinforcement learning algorithm. During driving, the global path is dynamically redistributed and updated according to the real-time road network information and the current state of vehicles. The accuracy and efficiency of the proposed algorithm are verified in the simulation experiment.

Key words : path allocation；deep reinforcement learning；road network；traffic perception

0 引言

目前我國交通環境日益復雜，現有交通體系的服務能力難以滿足城市居民的出行期望，城市面臨日益嚴峻的交通管理挑戰。研究者們希望借助交通數字孿生技術，通過數據驅動、精準建模，實現交通的模擬、預測診斷和優化[1]。然而在交通仿真模擬層次，現有的路徑分配模塊不能反映出現實交通的多變狀況。在人-車-路的核心體系中，天氣氣候、交通管制、突發事故等影響因子將時刻影響駕駛員的判斷以及路網的狀態[2]。

在當前的交通數字孿生系統中，現有的路徑分配方法主要分為兩類，第一類為用于實現靜態全局路徑最優的傳統算法，如經典的蟻群算法、Floyd算法、A-Star、粒子群算法、Dijkstra及其改進算法等，本質為基于圖論中重要的最短路徑問題所提出的各種方案，也即在一個加權有向圖中，按一定要求尋找一條權重總和最短的路徑[3]。如Xu[4]等基于二叉樹結構，通過雙向搜索方法加快搜索效率，作為A-Star改進算法；Lee[5]等基于遺傳算法實現蟻群算法中的參數調節優化。在路網信息發生變化時，該類算法難以做出及時反饋。如果需要滿足動態路徑規劃的需求，則需要施加額外的更新優化和重規劃機制。第二類指的是通過機器學習、時空神經網絡、強化學習等技術來實現路徑分配。這一類更加強調數據的搜集、分析和處理，通過提取海量歷史數據的價值信息，為解決路徑規劃問題提供了一個新的思路[6]。

本文的中心工作是研究了一種基于傳統路徑算法與深度強化學習的感知型路徑分配算法，首先通過改進版Dijkstra算法為所有車輛分配初始路徑，路網中的車輛在不斷感知當前位置、行駛軌跡以及目標路網中各路段的車流等信息后，通過DDQN(Double DQN)將自動選擇是否重新進行全局的路徑規劃，實現路徑更新。與現有的經典路徑規劃方法相比，本文提出的規劃方案填補了傳統模型在路況變化下的泛化性、拓展性不足，優化了深度學習型方法的資源損耗，同時基于強化學習模型在長期收益方面的優越性，本文模型更加滿足路徑分配模型對當今城市路網交通出行的各種需求。

本文詳細內容請下載：http://www.rjjo.cn/resource/share/2000004534

作者信息：

曹歡

(中國科學技術大學信息科學技術學院，安徽合肥230026)

微信圖片_20210517164139.jpg

原創聲明：此內容為AET網站原創，未經授權禁止轉載。

相關內容