當前位置 : 首頁 > 專利喜報 > 恭喜浙江工業大學張棟輝獲國家專利權

恭喜浙江工業大學張棟輝獲國家專利權

買專利賣專利找龍圖騰，真高效！查專利查商標用IPTOP,全免費！專利年費監控用IP管家,真方便！

龍圖騰網恭喜浙江工業大學申請的專利一種基于A3C和事件觸發的網絡化伺服系統控制方法獲國家發明授權專利權，本發明授權專利權由國家知識產權局授予，授權公告號為：CN114488786B 。

龍圖騰網通過國家知識產權局官網在2025-04-15發布的發明授權授權公告中獲悉：該發明授權的專利申請號/專利號為：202111224264.1，技術領域涉及：G05B13/04；該發明授權一種基于A3C和事件觸發的網絡化伺服系統控制方法是由張棟輝;張丹設計研發完成，并于2021-10-20向國家知識產權局提交的專利申請。

本一種基于A3C和事件觸發的網絡化伺服系統控制方法在說明書摘要公布了：一種基于A3C和事件觸發的網絡化伺服系統控制方法，屬于網絡化電機控制技術領域。它包括以下步驟：1、建立網絡化伺服控制系統的系統模型；2、設計考慮離散系統的事件觸發策略3、基于事件觸發的網絡化伺服系統控制方案設計；4、控制器設計；5、強化學習A3C方案設計。本發明給出網絡化伺服系統的數學模型，并使用時延系統的分析方法，提出了一個事件觸發機制和狀態反饋控制的閉環時延系統；導出控制器的設計方法；設計一個基于事件觸發狀態反饋控制算法，利用線性矩陣不等式工具箱獲得控制器參數；最后，通過A3C方案的優化，設計了一個基于A3C和事件觸發的動態閾值狀態反饋控制算法；能夠自主調節觸發參數的動態事件觸發策略。

本發明授權一種基于A3C和事件觸發的網絡化伺服系統控制方法在權利要求書中公布了：1.一種基于A3C和事件觸發的網絡化伺服系統控制方法，其特征在于，包括以下步驟；1建立網絡化伺服控制系統的系統模型：定義xk∈Rp表示系統的狀態向量，uk∈Rm表示系統的控制輸入，ωk∈Rq表示系統的干擾，yk∈Rp表示系統輸出，其中p、m、q分別表示xk、uk、ωk的維度，A，B，F，C都是滿足維數要求的系統參數矩陣，則系統模型為：xk+1＝Axk+Buk+Fωkyk＝Cxk設計基于狀態反饋信號的伺服系統控制器：uk＝Kxk，K表示控制器增益；2設計考慮離散系統的事件觸發策略：在網絡系統中，受到通信資源受限和長距離傳輸的影響，存在傳輸延遲τj，其中為大于0的實數，應用零階保持器，系統在事件產生器下的動態模型表示為：其中，kj表示系統的采樣時刻，當前采樣時刻的數據xkj是否被發送用來更新控制器由以下的條件判斷：[xk-xkj]TΦj[xk-xkj]≤εjxTkΦjxk其中，Φj為正定矩陣，然后通過公式推導得到延時函數為：定義最大采樣時間得到：其中， 3基于事件觸發的網絡化伺服系統控制方案設計：定義上一時刻與下一時刻采樣時間之間狀態誤差為：事件觸發的判斷條件可改寫為：ekkTΦjekk≤εjxTk-dkΦjxk-dk基于事件觸發的網絡化伺服控制系統模型可以被描述為：其中表示系統的初始狀態；4控制器設計：給定0≤εj≤1，γ＞0，τM＞0和適當維度的矩陣Pj＞0，Qj＞0，Rj＞0，Zj0，Φj＞0和K使得下列不等式成立：則基于事件觸發的網絡化伺服控制系統模型為在均方意義上是指數穩定的并且具有給定的H∞性能水平γ，可得控制器增益K： 5強化學習A3C方案設計：基于A3C的強化學習方法對閾值進行優化，得到在保證系統性能的情況下，觸發次數較少的動態閾值，強化學習的問題通常可以轉化為一個動態規劃問題，所以將動態閾值問題轉化為一個多維動態規劃問題，并用一個五元組Sr，Ar，Pr，λr，r表示，其中，Sr設計狀態空間、Ar為設計動作空間、Pr為概率轉移矩陣、λr為設計折扣函數、r為設計獎勵函數；5.1設計狀態空間Sr，Sr用來表示系統的狀態集，為了讓訓練的閾值使系統能夠在保持良好性能的情況下盡可能地減少觸發次數，將第n段時間內觸發的總數記為tn，將這段時間內系統的平均輸出值記為yn，因此，定義sr，n＝[Xnyntn]T，其中Xn表示第n段時間內系統的最后一次輸出的狀態；5.2設計動作空間Ar，Ar是由一組在環境中執行的Agent組成，Agent的每一次執行，都會對環境進行更新，Agent的輸出是所需要的事件觸發條件的閾值，對Agent進行擴張，定義ar，n＝εj，nar，n≤εj，其中εj，n表示第n段時間內的閾值，εj表示閾值的上限，將第n段時間內的閾值進行擴張處理，所以定義ar，n，i＝εj，n，i＝εj，n+0.001*h，h∈[-5，4]，i∈[1，2，...，10]；5.3概率轉移矩陣Pr：Sr*Ar→ΛSr表示在當前環境執行當前動作ar，n后，下一個環境狀態sr，n+1的分布，即推導出來的基于事件觸發的伺服系統狀態空間方程；5.4設計折扣函數λr：λr的大小決定了對長期獎勵的影響，λr∈[0，1]；5.5設計獎勵函數rsr，n，ar，n：rsr，n，ar，n是將一組相對應的狀態-動作映射到一個標量上的函數，其表示當前動作ar，n施加在以sr，n為狀態的當前環境后得到的即時獎勵，同時使用雙獎勵函數，首先，在對Agent進行擴張的情況下，計算出每一條子線程的即時獎勵，定義其中，sr，n，i表示第n段時間內第i條子線程最后的環境狀態，并篩選出最小的獎勵定義總獎勵函數，其中sr，n，b表示εj，n，i＝εj，n的子線程的閾值，表示獎勵為的環境狀態，rb表示狀態為sr，n，b的即時獎勵，表示對觸發頻率和收斂速度的比重。

如需購買、轉讓、實施、許可或投資類似專利技術，可聯系本專利的申請人或專利權人浙江工業大學，其通訊地址為：310006 浙江省杭州市拱墅區朝暉六區潮王路18號；或者聯系龍圖騰網官方客服，聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。

免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息，力求客觀、公正，但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解，僅供參考使用，不能作為本公司承擔任何法律責任的依據或者憑證。

国产精品天干天干在线播放,大尺度揉捏胸床戏视频,樱花草www日本在线观看,狠狠躁夜夜躁人人爽天天天天97

龍圖騰網&IPTOP

設置信息完成注冊

手機號綁定多個賬號

恭喜浙江工業大學張棟輝獲國家專利權

熱門推薦

專利交易買賣與高校科技成果轉化平臺

專利交易

快速入口

知產工具

關于我們

咨詢服務