專利名稱 一種融合經(jīng)驗(yàn)價(jià)值動(dòng)態(tài)評(píng)估的強(qiáng)化學(xué)習(xí)避撞控制方法
申請(qǐng)?zhí)?專利號(hào) CN202510031632.2 專利權(quán)人(第一權(quán)利人) 長(zhǎng)春工業(yè)大學(xué)
申請(qǐng)日 2025-01-09 授權(quán)日 2025-06-06
專利類別 授權(quán)發(fā)明 戰(zhàn)略新興產(chǎn)業(yè)分類 新一代信息技術(shù)
技術(shù)主題 樣本分類|風(fēng)險(xiǎn)評(píng)估|工業(yè)工程學(xué)|強(qiáng)化學(xué)習(xí)|仿真|實(shí)時(shí)計(jì)算
應(yīng)用領(lǐng)域 內(nèi)燃活塞發(fā)動(dòng)機(jī)|防撞系統(tǒng)|生物學(xué)模型|設(shè)計(jì)優(yōu)化/仿真|特殊數(shù)據(jù)處理應(yīng)用|控制裝置
意向價(jià)格 具體面議
專利概述 一種融合經(jīng)驗(yàn)價(jià)值動(dòng)態(tài)評(píng)估的強(qiáng)化學(xué)習(xí)避撞控制方法,為解決當(dāng)前智能駕駛控制策略樣本利用率差的等問(wèn)題。本發(fā)明涉及智能駕駛領(lǐng)域。本發(fā)明包括風(fēng)險(xiǎn)評(píng)估模塊、經(jīng)驗(yàn)樣本分類模塊、經(jīng)驗(yàn)樣本價(jià)值評(píng)估模塊和經(jīng)驗(yàn)池分配模塊。其中,風(fēng)險(xiǎn)評(píng)估模塊實(shí)時(shí)評(píng)估每個(gè)環(huán)境步的風(fēng)險(xiǎn)參數(shù),經(jīng)驗(yàn)樣本分類模塊根據(jù)風(fēng)險(xiǎn)參數(shù)將經(jīng)驗(yàn)樣本分類儲(chǔ)存在安全、待觀察和危險(xiǎn)三個(gè)經(jīng)驗(yàn)池中,經(jīng)驗(yàn)價(jià)值評(píng)估模塊實(shí)時(shí)動(dòng)態(tài)評(píng)估經(jīng)驗(yàn)樣本的價(jià)值,并將三個(gè)經(jīng)驗(yàn)池中的經(jīng)驗(yàn)樣本分別進(jìn)行排序,經(jīng)驗(yàn)池分配模塊實(shí)時(shí)動(dòng)態(tài)評(píng)估三個(gè)經(jīng)驗(yàn)池的價(jià)值,確定三個(gè)經(jīng)驗(yàn)池的抽取比例,傳至智能體進(jìn)行經(jīng)驗(yàn)回放,更新安全通行策略,重復(fù)上述過(guò)程,直至獲得最優(yōu)的安全通行策略。
圖片資料 一種融合經(jīng)驗(yàn)價(jià)值動(dòng)態(tài)評(píng)估的強(qiáng)化學(xué)習(xí)避撞控制方法
合作方式 具體面議
聯(lián)系人 戚梅宇 聯(lián)系電話 13074363281