本發(fā)明公開了一種結(jié)合字符級和字符串級分類的文本檢測和識別方法,在圖像中提取可能屬于同一字符的像素集形成備選字符;濾除不滿足字符幾何特征統(tǒng)計規(guī)律的備選字符;采用基于字符旋轉(zhuǎn)和尺度不變性特征的字符級分類器對備選字符分類,以確定備選字符為某字符的概率;將字符兩兩合并形成初始字符串;計算兩兩字符串間的相似度,將相似度最高的兩字符串合并成新的字符串,直到?jīng)]有可再合并的字符串;采用基于字符串結(jié)構(gòu)特征的字符串級分類器對字符串分類,以確認具有語意的字符串;利用待識別字符為某一字符的概率對字符串識別,得到語意文本。本發(fā)明將文本檢測和識別過程作為一個整體,利用檢測和識別的相互作用提高結(jié)果精度,簡單高效。
未應用
掃碼關(guān)注,查看更多科技成果