發(fā)明公開了一種基于關(guān)聯(lián)分析與關(guān)聯(lián)分類的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測技術(shù),以雙庫協(xié)同機制為基礎(chǔ),將KDD*過程模型引入蛋白質(zhì)二級結(jié)構(gòu)預(yù)測問題中,KAAPRO方法以數(shù)據(jù)挖掘(知識發(fā)現(xiàn))為主體,采用基于KDD*過程模型Maradbcm算法以及關(guān)聯(lián)規(guī)則分類D-CBA方法。KAAPRO方法所取得關(guān)聯(lián)規(guī)則在一定程度上揭示了氨基酸物化屬性對蛋白質(zhì)二級結(jié)構(gòu)的影響關(guān)系,從而提高了預(yù)測的精度。其中Maradbcm算法挖掘意外規(guī)則的特性對純度較高的α蛋白質(zhì)庫與β蛋白質(zhì)庫進行關(guān)聯(lián)規(guī)則的挖掘,由此獲得的挖掘結(jié)果是精化的規(guī)則。D-CBA關(guān)聯(lián)分類方法使用可信度與支持度的測度作為一個復(fù)合型度量來進行蛋白質(zhì)關(guān)聯(lián)分類。在保證預(yù)測精度的同時,為生物學(xué)家對二級結(jié)構(gòu)進一步分析提供了依據(jù)。
掃碼關(guān)注,查看更多科技成果