恭喜中國科學(xué)院自動化研究所楊寧獲國家專利權(quán)
買專利賣專利找龍圖騰,真高效! 查專利查商標(biāo)用IPTOP,全免費(fèi)!專利年費(fèi)監(jiān)控用IP管家,真方便!
龍圖騰網(wǎng)恭喜中國科學(xué)院自動化研究所申請的專利基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法和裝置獲國家發(fā)明授權(quán)專利權(quán),本發(fā)明授權(quán)專利權(quán)由國家知識產(chǎn)權(quán)局授予,授權(quán)公告號為:CN119311334B 。
龍圖騰網(wǎng)通過國家知識產(chǎn)權(quán)局官網(wǎng)在2025-03-25發(fā)布的發(fā)明授權(quán)授權(quán)公告中獲悉:該發(fā)明授權(quán)的專利申請?zhí)?專利號為:202411874791.0,技術(shù)領(lǐng)域涉及:G06F9/445;該發(fā)明授權(quán)基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法和裝置是由楊寧;呂品;梁劍設(shè)計(jì)研發(fā)完成,并于2024-12-18向國家知識產(chǎn)權(quán)局提交的專利申請。
本基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法和裝置在說明書摘要公布了:本公開涉及一種基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法和裝置,所述方法包括:接收用戶端的計(jì)算服務(wù)請求;獲取用戶端當(dāng)前的狀態(tài)信息;將狀態(tài)信息輸入到安全強(qiáng)化學(xué)習(xí)模型,得到針對計(jì)算服務(wù)請求的決策結(jié)果,其中,安全強(qiáng)化學(xué)習(xí)模型是通過最大化包含障礙函數(shù)的目標(biāo)函數(shù)訓(xùn)練得到的,障礙函數(shù)用于在安全強(qiáng)化學(xué)習(xí)模型的訓(xùn)練過程中根據(jù)第一約束條件對目標(biāo)函數(shù)值進(jìn)行懲罰性調(diào)整,決策結(jié)果為確定將計(jì)算服務(wù)請求對應(yīng)的任務(wù)卸載到多個(gè)服務(wù)器中的哪個(gè)服務(wù)器中進(jìn)行處理,多個(gè)服務(wù)器包括云服務(wù)器和至少一個(gè)邊緣服務(wù)器;基于決策結(jié)果對計(jì)算服務(wù)請求對應(yīng)的任務(wù)進(jìn)行卸載。障礙函數(shù)能夠自動觸發(fā)預(yù)先懲罰機(jī)制,有效避免違規(guī)行為的發(fā)生。
本發(fā)明授權(quán)基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法和裝置在權(quán)利要求書中公布了:1.一種基于懲罰機(jī)制的安全強(qiáng)化學(xué)習(xí)任務(wù)卸載方法,其特征在于,所述方法包括:接收用戶端的計(jì)算服務(wù)請求;獲取所述用戶端當(dāng)前的狀態(tài)信息;將所述狀態(tài)信息輸入到安全強(qiáng)化學(xué)習(xí)模型,得到針對所述計(jì)算服務(wù)請求的決策結(jié)果,其中,所述安全強(qiáng)化學(xué)習(xí)模型是通過最大化包含障礙函數(shù)的目標(biāo)函數(shù)訓(xùn)練得到的,所述障礙函數(shù)用于在所述安全強(qiáng)化學(xué)習(xí)模型的訓(xùn)練過程中根據(jù)第一約束條件對目標(biāo)函數(shù)值進(jìn)行懲罰性調(diào)整,所述第一約束條件為針對能耗、延遲、帶寬中的至少一項(xiàng)的約束條件,所述決策結(jié)果為確定將所述計(jì)算服務(wù)請求對應(yīng)的任務(wù)卸載到多個(gè)服務(wù)器中的哪個(gè)服務(wù)器中進(jìn)行處理,所述多個(gè)服務(wù)器包括云服務(wù)器和至少一個(gè)邊緣服務(wù)器;基于所述決策結(jié)果對所述計(jì)算服務(wù)請求對應(yīng)的任務(wù)進(jìn)行卸載;其中,所述障礙函數(shù)用于在所述安全強(qiáng)化學(xué)習(xí)模型的當(dāng)前策略的執(zhí)行結(jié)果越接近所述第一約束條件的情況下,通過更大的懲罰項(xiàng)對所述目標(biāo)函數(shù)值進(jìn)行懲罰性調(diào)整;其中,所述障礙函數(shù)的表示形式包括: 其中,為所述障礙函數(shù),是一個(gè)擴(kuò)展的連續(xù)凸對數(shù)勢壘函數(shù),為對數(shù)勢壘函數(shù)的給定常數(shù),為所述第一約束條件的索引,為待優(yōu)化的當(dāng)前策略,為約束函數(shù),為動作,為優(yōu)勢函數(shù)。
如需購買、轉(zhuǎn)讓、實(shí)施、許可或投資類似專利技術(shù),可聯(lián)系本專利的申請人或?qū)@麢?quán)人中國科學(xué)院自動化研究所,其通訊地址為:100190 北京市海淀區(qū)中關(guān)村東路95號;或者聯(lián)系龍圖騰網(wǎng)官方客服,聯(lián)系龍圖騰網(wǎng)可撥打電話0551-65771310或微信搜索“龍圖騰網(wǎng)”。
1、本報(bào)告根據(jù)公開、合法渠道獲得相關(guān)數(shù)據(jù)和信息,力求客觀、公正,但并不保證數(shù)據(jù)的最終完整性和準(zhǔn)確性。
2、報(bào)告中的分析和結(jié)論僅反映本公司于發(fā)布本報(bào)告當(dāng)日的職業(yè)理解,僅供參考使用,不能作為本公司承擔(dān)任何法律責(zé)任的依據(jù)或者憑證。
- 恭喜青島東卡環(huán)保工程技術(shù)有限公司王培義獲國家專利權(quán)
- 恭喜青島海爾智能技術(shù)研發(fā)有限公司胡燦獲國家專利權(quán)
- 恭喜國立大學(xué)法人神戶大學(xué)西田敬二獲國家專利權(quán)
- 恭喜京瓷技術(shù)公司A·賈克拉獲國家專利權(quán)
- 恭喜朗姆研究公司理查德·M·布蘭克獲國家專利權(quán)
- 恭喜廈門宏發(fā)汽車電子有限公司陳藝陽獲國家專利權(quán)
- 恭喜弗提圖德薩沃有限公司請求不公布姓名獲國家專利權(quán)
- 恭喜無錫小天鵝電器有限公司郝秀獲國家專利權(quán)
- 恭喜甲骨文國際公司N·H·E·德科斯塔獲國家專利權(quán)
- 恭喜瑞澤恩制藥公司L·珀塞爾獲國家專利權(quán)


熱門推薦
- 恭喜清華大學(xué)楊東超獲國家專利權(quán)
- 恭喜康斐爾APC有限責(zé)任公司丹尼爾·萬吉爾德獲國家專利權(quán)
- 恭喜無錫小天鵝電器有限公司徐金茂獲國家專利權(quán)
- 恭喜無錫小天鵝電器有限公司彭建平獲國家專利權(quán)
- 恭喜三星電子株式會社崔株溶獲國家專利權(quán)
- 恭喜北京夢之墨科技有限公司魯強(qiáng)獲國家專利權(quán)
- 恭喜杭州銳冠科技有限公司張家春獲國家專利權(quán)
- 恭喜青島海爾空調(diào)器有限總公司關(guān)婷婷獲國家專利權(quán)
- 恭喜奧克蘭聯(lián)合服務(wù)有限公司呼愛國獲國家專利權(quán)
- 恭喜馬維爾亞洲私人有限公司N·米茲拉希獲國家專利權(quán)