一種文本分類方法與設(shè)備
本發(fā)明涉及計(jì)算機(jī)技術(shù)領(lǐng)域,提供一種文本分類方法與設(shè)備,所述方法包括:S1,利用基于關(guān)鍵詞庫擴(kuò)充的特征選擇規(guī)則,確定各目標(biāo)文本的特征詞集合;S2,利用基于特征詞類內(nèi)均勻度和特征詞類間區(qū)分度的權(quán)重計(jì)算公式,計(jì)算所述特征詞集合中各特征詞的權(quán)重;S3,利用最大權(quán)重融合算法,對(duì)同一目標(biāo)文本的特征詞在不同文本類別中的權(quán)重進(jìn)行權(quán)重融合運(yùn)算,構(gòu)建目標(biāo)文本特征向量;S4,基于所述目標(biāo)文本特征向量,利用多標(biāo)記分類模型對(duì)所述目標(biāo)文本進(jìn)行分類。本發(fā)明提供的一種文本分類方法與設(shè)備,能夠有效提高文本信息表達(dá)的準(zhǔn)確性、提高模型構(gòu)建的效率,確保準(zhǔn)確高效地對(duì)文本信息進(jìn)行多標(biāo)記分類。
中國農(nóng)業(yè)大學(xué)
2021-04-11