人工智能NLP 引擎
主要研究自然語言處理研究領(lǐng)域的算法和應(yīng)用實踐。涉及語義解析、意圖識別、FAQ 問答、多輪對話、知識圖譜等關(guān)鍵技術(shù),研究內(nèi)容包括分詞、向量表示、分類等文本預(yù)處理技術(shù),以及將自然語言處理核心算法應(yīng)用落實到智能客服、NLP 引擎、航天空管交互等實際場景中,團隊研發(fā)的 AI 產(chǎn)品已經(jīng)跟國內(nèi)企業(yè)、研究所開展了長期合作并動態(tài)跟蹤,獲得了廣泛的一致好評。
人工智能 NLP 引擎項目是基于多語種分詞、多語種情緒識別、詞句關(guān)系分析、意圖識別、文本聚類等自然語言處理技術(shù)實現(xiàn)對海量錄音文本的知識挖掘,識別重要信息。為錄音服務(wù)行業(yè)下游業(yè)務(wù)的分析人員提供分析思路,以便得到多維度、多形式分析結(jié)果,將發(fā)現(xiàn)轉(zhuǎn)換為可落地的業(yè)務(wù)決策,這些數(shù)據(jù)驅(qū)動的業(yè)務(wù)決策,包括客戶體驗、座席行為、產(chǎn)品改進、風險監(jiān)測等多個方面,幫助企業(yè)改善用戶體驗、降低成本、提升效率、提升業(yè)績、降低風險等。
1.多語種分詞。分詞指的是將一個字序列切分成一個一個單獨的詞,是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。文本在入庫時調(diào)用接口進行了分詞,分詞可用于模型的匹配和熱詞的統(tǒng)計。
2.詞句關(guān)系分析。根據(jù)詞句關(guān)系接口識別的中心詞,然后用中心詞進行詞頻的統(tǒng)計,對于目標樣本,統(tǒng)計出高頻中心詞用來概括目標樣本中主要描述的對話內(nèi)容。
3.意圖識別。識別出客戶語句的意圖,以便進行相應(yīng)的功能操作、信息推薦等。
4.多語種情緒識別。情緒識別是對包含主觀信息的文本進行情感傾向性判斷,正向或者負向(如果能提供訓(xùn)練數(shù)據(jù)集,可以識別更多種類的情緒)。為客戶之聲下游任務(wù)的口碑分析、話題監(jiān)控、輿情分析等應(yīng)用提供幫助。目前支持中文、粵語的情緒識別。根據(jù)情緒標識,用情緒進行搜索和統(tǒng)計分析。
5.文本聚類。文本聚類將一大段文本中心詞和中心詞的關(guān)聯(lián)詞、近義詞生成一個圖,用于可視化文本的內(nèi)容。
6.自定義分詞、意圖。對分詞分詞、意圖種類進行增刪、擴展、微調(diào)等。
西安電子科技大學
2022-10-20