123,123

2026年04月01日星期三

當前位置

-網(wǎng)站首頁 -專利超市 -一種減少車輛超參數(shù)調(diào)整的深度強化學習方法

專利名稱	一種減少車輛超參數(shù)調(diào)整的深度強化學習方法
申請?zhí)?專利號	CN202411023989.8	專利權人（第一權利人）	長春工業(yè)大學
申請日	2024-07-29	授權日	2024-12-06
專利類別	授權發(fā)明	戰(zhàn)略新興產(chǎn)業(yè)分類	新一代信息技術
技術主題	獎勵學習\|超參數(shù)\|學習架構\|維修車輛\|逆強化學習\|非線性\|仿真\|決策控制
應用領域	資源分配\|內(nèi)燃活塞發(fā)動機\|人造生命\|物理實現(xiàn)\|神經(jīng)學習方法
意向價格	具體面議
專利概述	一種減少車輛超參數(shù)調(diào)整的深度強化學習方法，涉及基于深度強化學習的自動駕駛車輛減少超參數(shù)調(diào)整的技術領域。提出了深度逆強化學習的車輛操縱穩(wěn)定性非線性獎勵學習架構，并進一步提出了高速公路場景下自車非線性操縱穩(wěn)定性獎勵與行駛規(guī)則獎勵的自動駕駛集成決控策略，大大減少了在集成決控策略訓練過程中對車輛操穩(wěn)獎勵函數(shù)的超參數(shù)設置。本發(fā)明的步驟是：獲取深度逆強化學習訓練所需的專家策略；使用深度逆強化學習獲取車輛操縱穩(wěn)定性獎勵；使用多進程異步方法加速深度逆強化學習訓練速度；高速復雜場景中的車輛集成決控。本發(fā)明能夠在不依賴車輛大量的穩(wěn)定性超參數(shù)設置的基礎上，實現(xiàn)在高速場景中具有車輛穩(wěn)定性保持能力的集成決控。
圖片資料
合作方式	擬轉(zhuǎn)讓
聯(lián)系人	戚梅宇	聯(lián)系電話	13074363281