專利名稱 一種基于深度強化學(xué)習(xí)的端到端自主運動決策方法
申請?zhí)?專利號 CN202510267110.2 專利權(quán)人(第一權(quán)利人) 長春工業(yè)大學(xué)
申請日 2025-03-07 授權(quán)日 2025-07-25
專利類別 授權(quán)發(fā)明 戰(zhàn)略新興產(chǎn)業(yè)分類 新一代信息技術(shù)
技術(shù)主題 控制工程|數(shù)據(jù)依賴|機器|機器人動作|強化學(xué)習(xí)|學(xué)習(xí)集|類機器人|實驗室
應(yīng)用領(lǐng)域 生物學(xué)模型
意向價格 具體面議
專利概述 本發(fā)明公開一種基于深度強化學(xué)習(xí)的端到端自主運動決策方法,該方法涉及多機器人運動、機器學(xué)習(xí)、集成決策等領(lǐng)域。首先采用改進Mamba?YOLOv10實現(xiàn)對玻璃制品的精準識別;然后針對端到端自主運動的數(shù)據(jù)依賴問題,提出將經(jīng)驗回放機制HER和設(shè)計的獎勵函數(shù)應(yīng)用到深度Q網(wǎng)絡(luò)中,實現(xiàn)HER?DQN的集成式?jīng)Q策框架。與其他方法相比,本發(fā)明不僅能夠在復(fù)雜光照條件和環(huán)境干擾下精準識別玻璃制品,還能提高生物化學(xué)實驗室轉(zhuǎn)運機器人在自主運動決策時的穩(wěn)定性和魯棒性,設(shè)計的端到端自主運動決策方法具有實時性和高效性,能夠使生物化學(xué)實驗室轉(zhuǎn)運機器人安全自主的完成執(zhí)行任務(wù),可應(yīng)用于農(nóng)業(yè)、工業(yè)、服務(wù)業(yè)等領(lǐng)域都有有益成效。
圖片資料 一種基于深度強化學(xué)習(xí)的端到端自主運動決策方法
合作方式 具體面議
聯(lián)系人 戚梅宇 聯(lián)系電話 13074363281