近年來圖數據受到越來越多的關注,在海量圖數據中進行快速的復雜查詢是所有圖數據庫系統面臨的直接問題。本系統首創提出了將復雜條件查詢轉換成在大圖中進行子圖匹配的解決方法,該方法拋棄了傳統利用關系數據庫技術作為底層支持RDF數據的存儲和管理,利用基于結構感知的索引和查詢優化策略,極大地提高了在海量RDF知識圖譜數據和復雜查詢環境下的性能和系統可擴展性。 本系統支持W3C提出的RDF文件標準和SPARQL語法標準,提供C++、Java、Python、PHP等API接口,單機版本支持50億條邊秒級響應,分布式版本設計了基于查詢日志的分布式圖數據劃分策略,具有非常好的可擴展性。
本系統可應用于金融科技、政府大數據、公共安全、社交網絡、稅務、海關、交通、醫療、人工智能、數字出版等領域的知識圖譜應用項目中。
北京大學計算機研究所數據管理實驗室從2009年以來一直從事海量圖數據庫管理系統的研究工作,2011年首創提出gStore系統的理論基礎,到實現系統上線并開源,持續不斷進行優化和迭代開發,在開源社區獲得廣泛的關注。 1. 完成對RDF和SPARQL標準的支持以及多種API接口; 2. 完成單機版50億邊規模數據平均查詢秒級響應的優化; 3. 完成gStore系統的智能化安裝與運維; 目前項目已經完成產品化開發,圖數據庫系統gStore成功應用于多個企事業單位的金融、出版和法律等多個領域的知識圖譜應用,包括方正電子、北大軟件、深圳證券信息有限公司等。 項目主頁:http://gstore-pku.com/
掃碼關注,查看更多科技成果