恭喜青島科技大學劉悅悅獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜青島科技大學申請的專利一種基于VQ-MAE網絡的抹香鯨叫聲增強方法獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119649837B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510161783.X,技術領域涉及:G10L21/0208;該發明授權一種基于VQ-MAE網絡的抹香鯨叫聲增強方法是由劉悅悅;蔣嘉銘;隋媛;施威;鄢社鋒;王景景設計研發完成,并于2025-02-14向國家知識產權局提交的專利申請。
本一種基于VQ-MAE網絡的抹香鯨叫聲增強方法在說明書摘要公布了:本發明涉及音頻信號處理領域,具體的涉及一種基于VQ?MAE網絡的抹香鯨叫聲增強方法,包括:步驟1:對抹香鯨叫聲音頻信號進行噪聲降低處理,調整音頻信號的振幅范圍;步驟2:處理頻譜圖像,將提取后的特征向量作為MAE網絡輸入的一部分;步驟3:通過LSTM網絡對音頻信號進行處理,提取原始的音頻信號的時序特征;步驟4:設計并訓練一個多模態掩碼編碼器MAE網絡,訓練不同模態的融合權重;步驟5:進行掩碼,選取掩碼效果最好的策略訓練網絡進行數據增強。本發明創新性的引入了多模態網絡融合聲音信號的時域、頻域以及空間域特征,更為精確且深入地捕捉與增強抹香鯨叫聲中的語義細節,為叫聲的分類和識別提供了強有力的支持。
本發明授權一種基于VQ-MAE網絡的抹香鯨叫聲增強方法在權利要求書中公布了:1.一種基于VQ-MAE網絡的抹香鯨叫聲增強方法,其特征在于,包括以下步驟:步驟1:對抹香鯨叫聲音頻信號進行噪聲降低處理,對音頻信號進行分割,將連續的音頻流分割成適合進一步分析的短片段,通過歸一化處理,調整音頻信號的振幅范圍,用于逐個分析每個叫聲信號;步驟2:利用預訓練的VQ-GAN模型將輸入的頻譜圖像進行處理,將圖像分割成多個小塊,并將這些小塊映射到高維向量空間中,用于提取輸入圖像的特征向量,將提取后的特征向量作為后續多模態掩碼編碼器MAE網絡輸入的一部分;步驟3:通過LSTM網絡對抹香鯨叫聲音頻信號進行處理,將原始的音頻信號的實部和虛部輸入到兩個獨立的LSTM層形成主干網絡,分別提取原始的音頻信號的實部和虛部的時序特征;步驟4:設計并訓練一個多模態掩碼編碼器MAE網絡,所述多模態掩碼編碼器MAE網絡接受步驟2中提取的特征向量和步驟3中提取的時序特征作為輸入,訓練不同模態的融合權重,以最大化融合性能;步驟5:用不同的掩碼策略進行掩碼,針對不同類型的抹香鯨叫聲采取不同的掩碼策略,并且采用可變掩碼率對多模態掩碼編碼器進行訓練,選取掩碼效果最好的策略訓練網絡進行數據增強。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人青島科技大學,其通訊地址為:266100 山東省青島市嶗山區松嶺路99號;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。