1. 痛點問題
工業時序數據具有應用領域廣、數據規模大、經濟價值高的特點,蘊含的巨大商業價值,因而其安全性受到不法分子采用黑客攻擊等技術手段以及雇傭商業間諜等非技術手段的威脅。數據所有者通常會采用前效方法對數據庫中的數據加以保護,但是這些方法只能有效防止外部人員進行非法盜竊,對于內部人員盜竊等途徑并不能有效遏制。數字水印是解決數據在傳播過程中安全問題的一個主流分支,通常的數字水印采用分組多數投票方法來提升算法的魯棒性,但時序數據通常有較多的噪聲,高價值數據點相對集中,因而一個未經加權的投票算法可能會因為大范圍的噪聲干擾而導致水印判定失效。此外,常見時序數字水印算法基于時間戳進行水印嵌入計算,容易受到更改時間戳或頻率變換的攻擊,一旦時間戳序列大幅度改變,水印提取算法將受到很大影響,很可能導致水印提取完全失效。
2. 解決方案
工業物聯網數據是工業大數據規模迅速擴張的主要來源。各類物聯網傳感器以極高的頻率采集其所在設備的工作狀態數據,通常為一系列包含數據產生時間戳(Timestamp)和采集數據(Data)形式為(Timestamp, Data) 的元組序列,稱為時間序列。工業時序數據具有應用領域廣、數據規模大、經濟價值高的特點,蘊含的巨大商業價值,因而其安全性受到不法分子采用黑客攻擊等技術手段以及雇傭商業間諜等非技術手段的威脅。
數據所有者通常會采用前效方法對數據庫中的數據加以保護,包括但不限于:數據加密、用戶權限劃分等等。但是,這些方法只能有效防止外部人員進行非法盜竊,對于內部人員盜竊等途徑并不能有效遏制。數字水印是解決數據在傳播過程中安全問題的一個主流分支,常見時序數字水印算法基于時間戳進行水印嵌入計算,容易受到更改時間戳或頻率變換的攻擊,一旦時間戳序列大幅度改變,水印提取算法將受到很大影響,很可能導致水印提取完全失效。此外,數字水印通常采用分組多數投票方法來提升算法的魯棒性,但時序數據通常有較多的噪聲,高價值數據點相對集中,因而一個未經加權的投票算法可能會因為大范圍的噪聲干擾而導致水印判定失效。
本項目針對常見的水印失效場景進行了分析,提出了能夠有效提示水印魯棒性的技術,更好的確保數據安全的管理能力。
3.合作需求
在全國范圍內工業互聯網/工業大數據相關領域尋求應用場景,希望能與能源/裝備制造行業的大中型企業開展這方面的合作研究和落地實施;并針對上述企業開展包括二次開發在內的各類實際應用,助力企業降本增效、轉型升級。
現有數字水印技術通常針對關系型、文檔型、視頻、圖像、音頻的數據,時序數據管理領域的水印工作仍處于起步和探索階段。本技術直接面向工業時序數據管理這一快速發展的領域,應用前景廣闊。
本項目提出一種具有時間戳對齊功能的時序數據水印方法,該方法可以識別時序數據的核心特征,通過自動監測時間序列數據的關鍵點,自動對齊時間戳,保證時序數據中插入的水印信息,不會因為頻率變換、插入、刪除等攻擊而失效,也使得對時間戳本身的修改無效,有效防止了時序插入和時序刪除攻擊對水印提取的影響。
圖1:一種具有時間戳對齊功能的時序數據水印算法示意圖
本項目提出的另一種基于數據特征權重分析的時序數據水印比較方法,采用數據特征分析,通過分析與比較時間序列數據的相對價值密度,賦予高價值密度數據點更高的數字水印權重,通過加權投票分析,保證高價值密度區域的數據安全,確保在高價值區間的水印重合更容易被監測,大幅度提升數字水印方法的可檢測性和安全性。
圖2:一種基于數據特征權重分析的時序數據水印比較算法示意圖
兩者都是面向工業時序數據水印這一關注較少的領域,現有視頻、音頻數據水印方法可一定程度上運用至時序水印領域,但由于缺乏針對工業時序數據的定制優化,效果并不理想。本技術具有一定的先進性,目前屬于理論研究和內部測試階段,理論和方法基本成熟,尚未針對工程應用進行完善。
掃碼關注,查看更多科技成果