恭喜北京南天智聯信息科技股份有限公司鄭煦獲國家專利權
買專利賣專利找龍圖騰,真高效! 查專利查商標用IPTOP,全免費!專利年費監控用IP管家,真方便!
龍圖騰網恭喜北京南天智聯信息科技股份有限公司申請的專利基于監督學習的數據識別方法和系統獲國家發明授權專利權,本發明授權專利權由國家知識產權局授予,授權公告號為:CN119537899B 。
龍圖騰網通過國家知識產權局官網在2025-04-18發布的發明授權授權公告中獲悉:該發明授權的專利申請號/專利號為:202510094170.9,技術領域涉及:G06F18/211;該發明授權基于監督學習的數據識別方法和系統是由鄭煦;陳雷設計研發完成,并于2025-01-21向國家知識產權局提交的專利申請。
本基于監督學習的數據識別方法和系統在說明書摘要公布了:本發明公開了基于監督學習的數據識別方法和系統,具體涉及數據識別技術領域,用于解決現有監督學習方法在低頻特征捕獲及特征關聯建模中的不足,通過從多個數據源采集訓練數據并過濾不滿足質量門檻的樣本;通過維度約簡算法對特征進行信息增益測度,篩選具有高信息增益的特征集合;利用關聯規則算法生成稀疏特征組合集,提取關鍵低頻特征及其交互關系;將低頻特征集合輸入梯度提升機進行監督訓練,通過自適應加權策略強化低頻特征影響;在訓練過程中監測低頻特征的梯度更新趨勢及Shapley值分布,對異常特征調整加權策略以修正模型權重分配,提高了模型的泛化能力和預測精度,適用于復雜數據場景的特征識別和分析。
本發明授權基于監督學習的數據識別方法和系統在權利要求書中公布了:1.基于監督學習的數據識別方法,其特征在于,包括如下步驟:S1:從多個數據源采集訓練數據,并對訓練數據執行過濾操作以去除不滿足質量門檻的樣本;其中,從多個來源采集包含產品缺陷圖像的原始數據集包括來自三個不同類型的攝像頭采集的高清圖像、自動檢測設備生成的缺陷記錄日志以及云存儲平臺中的歷史缺陷數據;對于采集的數據執行字段一致性校驗并驗證日志數據的時間戳格式,在數據清洗環節剔除缺失字段的日志記錄并刪除格式錯誤的圖像文件,對清洗后的數據集進行質量評估,最終僅保留滿足標準的高質量數據樣本用于模型訓練;S2:對過濾后的訓練數據執行特征分析,采用維度約簡算法對各特征執行信息增益測度以生成具有高信息增益的特征集合;S3:利用關聯規則算法在具有高信息增益的特征集合的特征空間中生成稀疏特征組合集,并通過設定頻次閾值保留關鍵的低頻特征及其交互關系,得到低頻特征集合,具體包括:提取具有高信息增益的特征集合中的每個特征,構建特征空間用于存儲特征的所有可能的特征組合;使用關聯規則算法對特征空間中的所有特征組合進行頻次統計,計算每個特征組合的支持度,支持度定義為特征組合在訓練數據中同時出現的比例;基于支持度計算結果生成稀疏特征組合集,稀疏特征組合集包含所有滿足設定支持度范圍的特征組合;從稀疏特征組合集中提取支持度低于預設頻次閾值的特征組合,保留包含低頻特征的特征組合,并分析低頻特征之間的交互關系;將保留的低頻特征及其交互關系形成低頻特征集合,低頻特征集合僅包含支持度低于預設頻次閾值的低頻特征及其交互關系;S4:將低頻特征集合輸入梯度提升機進行初步監督訓練,并通過自適應加權策略設置初始權重以強化低頻特征在訓練中的影響;S5:監督訓練過程中,基于低頻特征的梯度更新趨勢和Shapley值的特征貢獻分布,監測低頻特征的權重變化及對梯度提升機的影響是否異常,并在異常時通過調整自適應加權策略以修正低頻特征的影響。
如需購買、轉讓、實施、許可或投資類似專利技術,可聯系本專利的申請人或專利權人北京南天智聯信息科技股份有限公司,其通訊地址為:100085 北京市海淀區上地信息路10號二層218室;或者聯系龍圖騰網官方客服,聯系龍圖騰網可撥打電話0551-65771310或微信搜索“龍圖騰網”。
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。