一種基于自然共享最近鄰居搜索的發(fā)現(xiàn)簇和離群點的算法
本發(fā)明屬于數(shù)據(jù)挖掘領(lǐng)域,尤其是涉及一種基于自然共享最近鄰居搜索的發(fā)現(xiàn)簇和離群點的算法。其特征在于,首先對數(shù)據(jù)集進行自然最近鄰居搜索,當發(fā)現(xiàn)數(shù)據(jù)集中沒有共享最近鄰居的點的數(shù)量不再變化時搜索結(jié)束,得到搜索最近鄰個數(shù)n;根據(jù)提出的自然共享鄰居定義,計算每個對象在n近鄰下得到的自然共享最近鄰居關(guān)系;然后基于共享最近鄰的自然鄰居搜索算法確定了每個對象的自然共享最近鄰域關(guān)系,根據(jù)該自然共享最近鄰居關(guān)系,對數(shù)據(jù)進行聚類和離群點判別。本發(fā)明的算法中提出一種新的共享最近鄰居關(guān)系和自然鄰居搜索終止條件,解決了現(xiàn)有算法因為自然鄰居關(guān)系定義不夠嚴密及搜索條件不夠科學而引起的聚類效果不好和離群點檢測精度不高的問題。
中國農(nóng)業(yè)大學
2021-04-11