基于社區結構的快速子圖匹配方法
1.痛點問題
隨著圖在各領域的廣泛應用,對圖上相關高效查詢方法的需求也與日俱增,特別是在社交網絡、金融、電商、安全和航天等眾多領域具有重要作用的子圖匹配查詢。
然而,現有子圖匹配方法在實際使用中速度均較慢,當數據量較大時,現有方法的時間開銷巨大,難以滿足具體匹配過程中的時效性需求。同時,這些方法沒有充分利用圖數據的本質結構特點進行剪枝,在運行效率上仍有較大的改進空間。
2.解決方案
本技術提出一種基于社區結構的子圖匹配方法,基于社區結構在匹配過程中進行剪枝從而加快子圖匹配的速度。流程圖如圖1所示。
圖1 本技術子圖匹配計算流程
首先,本技術識別數據圖中的社區結構,將數據圖劃分為若干“內部緊密關聯、相互之間連接松散”的社區。接著,基于社區結構,提出三種優化策略對子圖匹配過程進行優化,并實現了相關技術。
具體地,這三種優化策略包括兩階段破對稱策略、基于社區路徑的剪枝策略和基于社區結構的邊界剪枝策略。其中,兩階段破對稱策略利用模式圖中的自同構映射,根據已得到的若干匹配結果推斷出新的匹配結果,從而減少匹配過程中的計算量;基于社區路徑的剪枝策略根據數據圖中的跨社區的路徑構建索引,在匹配過程中提前發現無法產生匹配結果的匹配嘗試,減少匹配開銷;基于社區結構的邊界剪枝則考慮各社區的邊界節點,即那些和其他社區的節點間有邊關聯的節點,根據邊界節點的鄰居情況進行剪枝,減小搜索空間,加快子圖匹配速度。
基于上述優化策略,本技術提出的基于社區結構的高效子圖匹配方法能根據給出的數據圖和模式圖快速返回子圖匹配結果。該技術可以作為模塊嵌入金融、電商和航天等已有軟件系統,也可作為單獨軟件工具并支持二次開發。
3.合作需求
1)應用場景:在圖數據中快速查找滿足某種特定結構的子圖結構,進而作為查詢結果返回或用于后續深入分析。可用于包括但不限于社交網絡、金融、電商、安全和航天等眾多場景中。
2)資源對接:對圖查詢、圖分析有需求且對其高效性有要求的個人、單位和企業等。
清華大學
2022-12-05