本發明屬于數據挖掘領域,尤其是涉及一種基于自然共享最近鄰居搜索的發現簇和離群點的算法。其特征在于,首先對數據集進行自然最近鄰居搜索,當發現數據集中沒有共享最近鄰居的點的數量不再變化時搜索結束,得到搜索最近鄰個數n;根據提出的自然共享鄰居定義,計算每個對象在n近鄰下得到的自然共享最近鄰居關系;然后基于共享最近鄰的自然鄰居搜索算法確定了每個對象的自然共享最近鄰域關系,根據該自然共享最近鄰居關系,對數據進行聚類和離群點判別。本發明的算法中提出一種新的共享最近鄰居關系和自然鄰居搜索終止條件,解決了現有算法因為自然鄰居關系定義不夠嚴密及搜索條件不夠科學而引起的聚類效果不好和離群點檢測精度不高的問題。
掃碼關注,查看更多科技成果