一種基于關聯(lián)分析與關聯(lián)分類的蛋白質二級結構預測技術
發(fā)明公開了一種基于關聯(lián)分析與關聯(lián)分類的蛋白質二級結構預測技術,以雙庫協(xié)同機制為基礎,將KDD*過程模型引入蛋白質二級結構預測問題中,KAAPRO方法以數(shù)據(jù)挖掘(知識發(fā)現(xiàn))為主體,采用基于KDD*過程模型Maradbcm算法以及關聯(lián)規(guī)則分類D-CBA方法。KAAPRO方法所取得關聯(lián)規(guī)則在一定程度上揭示了氨基酸物化屬性對蛋白質二級結構的影響關系,從而提高了預測的精度。其中Maradbcm算法挖掘意外規(guī)則的特性對純度較高的α蛋白質庫與β蛋白質庫進行關聯(lián)規(guī)則的挖掘,由此獲得的挖掘結果是精化的規(guī)則。D-CBA關聯(lián)分類方法使用可信度與支持度的測度作為一個復合型度量來進行蛋白質關聯(lián)分類。在保證預測精度的同時,為生物學家對二級結構進一步分析提供了依據(jù)。
北京科技大學
2021-04-11