恭喜成都華棲云科技有限公司唐學怡獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜成都華棲云科技有限公司申請的專利一種基于錄播課程自動生成多語種慕課的方法及系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119400206B 。
龍圖騰網通過國家知識產權局官網在2025-03-25發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202411942309.2,技術領域涉及:G10L25/57;該發明授權一種基于錄播課程自動生成多語種慕課的方法及系統是由唐學怡;余軍;張汨;劉盾;袁淵;何翔宇;劉婷婷;董精松設計研發完成,并于2024-12-27向國家知識產權局提交的專利申請。
本一種基于錄播課程自動生成多語種慕課的方法及系統在說明書摘要公布了:本發明提供了一種基于錄播課程自動生成多語種慕課的方法及系統,涉及數字化技術領域;本發明通過智能降噪、語音識別、語音識別結果校正、聲紋訓練樣本提取、聲紋模型訓練等步驟,實現課程多維度智能整理和多語種視頻合成,包括智能降噪模塊、智能語音識別模塊、智能語音識別結果校正模塊、智能聲紋訓練樣本提取模塊、聲紋模型訓練模塊和多語種視頻合成模組;本發明解決了現有技術將錄播課程轉換為多語種慕課資源時耗費大量人力物力、無法快速規?;D換的問題;無需人工干預即可批量化自動化轉換錄播課程視頻為不同語種的慕課視頻,提高了聲紋模型的魯棒性,并實現了課程內容的精細化整理,節省大量人力物力,實現快速規?;恼n程國際化轉換。
本發明授權一種基于錄播課程自動生成多語種慕課的方法及系統在權利要求書中公布了:1.一種基于錄播課程自動生成多語種慕課的方法,其特征在于,通過如下步驟進行教學直播PPT對齊:步驟A:采集當前錄播課程的常態化錄播課程視頻文件;步驟B:對常態化錄播課程視頻文件進行智能降噪處理,得到降噪后的課程視頻;步驟C:對降噪后的課程視頻進行智能語音識別,得到對應的語音識別結果;步驟D:對語音識別結果進行智能語音識別結果校正,得到對應的校正后語音識別結果;步驟E:對校正后語音識別結果進行智能聲紋訓練樣本提取,得到對應的聲紋樣本文件;步驟F:通過聲紋樣本文件進行聲紋模型訓練,在訓練完成后得到老師的聲紋模型并賦予對應的模型ID;步驟G1:對降噪后的課程視頻和校正后語音識別結果進行課程多維度智能整理,得到整理后的課程視頻和整理后語音識別結果;步驟G2:將整理后語音識別結果進行多語種翻譯,得到對應的翻譯后文本;步驟G3:根據翻譯后文本和老師的聲紋模型進行TTS多語種合成,得到合成后的新語音;步驟G4:通過合成后的新語音和整理后的課程視頻進行合成處理,得到對應語種翻譯的成品視頻;其中,合成處理包括變速對齊和上字幕;在步驟E中,智能聲紋訓練樣本提取通過如下步驟進行:對校正后語音識別結果進行語句分割處理,得到若干語句單元并通過停用口水語詞庫篩選掉口水語詞;對語句單元進行音素多樣性評分,得到對應語句單元的音素多樣性得分;對語句單元進行情感穩定性評分,得到對應語句單元的情感穩定性得分;對語句單元進行句子長度評分,得到對應語句單元的句子長度得分;對語句單元進行背景噪聲評分,得到對應語句單元的背景噪聲得分;對語句單元進行語音語速評分,得到對應語句單元的語音語速得分;基于音素多樣性得分、情感穩定性得分、句子長度得分、背景噪聲得分和語音語速得分對各語句單元進行綜合評分,得到語句單元的綜合得分;其中,綜合評分采用自適應權重的綜合評分機制;根據綜合得分對語句單元進行排序,并從高到低選取設置比例的語句單元,拼接為一個完整的音頻文件,并作為聲紋樣本文件。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人成都華棲云科技有限公司,其通訊地址為:610000 四川省成都市高新區天府五街200號菁蓉匯4號樓A區9樓;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。