社會網(wǎng)絡已經(jīng)成為覆蓋用戶最廣、傳播影響最大、商業(yè)價值最高的 Web2.0 業(yè)務,在世
界范圍內(nèi),最著名的社會網(wǎng)絡代表是 Facebook、Twitter,用戶量分別達到 12 億、5 億;國 內(nèi)使用人數(shù)最多的社會網(wǎng)絡工具是新浪微博和騰訊微博,其中新浪微博用戶達到 5 億,騰訊 微博用戶超過 8 億。社會網(wǎng)絡中的巨大用戶群每天產(chǎn)生海量的用戶數(shù)據(jù)、關系數(shù)據(jù)和信息數(shù) 據(jù),若能夠?qū)A繑?shù)據(jù)進行準確、及時的分析,則會在精確營銷、輿情探測以及網(wǎng)絡安全等方面創(chuàng)造巨大價值。然而由于社會網(wǎng)絡的大數(shù)據(jù)特性以及分析方面要求準確、及時,目前缺 乏融合多項社會網(wǎng)絡分析技術的、成熟的社會網(wǎng)絡大數(shù)據(jù)分析系統(tǒng)。
社會網(wǎng)絡分析技術是一項關鍵技術,也是一項熱門的研究,涵蓋了社會學、人類學、社 會語言學、地理、社會心理學、通信研究、資訊科學、社會網(wǎng)絡分析與探勘、組織研究、經(jīng) 濟學以及生物學等多個領域,是一項多學科交叉技術。社會網(wǎng)絡大數(shù)據(jù)分析系統(tǒng)要求具有堅 實的數(shù)據(jù)支撐,即數(shù)據(jù)獲取全面、更新及時、獲取數(shù)量大,也強調(diào)多維度、多粒度的分析手 段相結合,并對分析速度、可視化以及人機交互等方面都提出很高的要求。
基于上述現(xiàn)狀和挑戰(zhàn),在國家科技支撐項目的資助下,實現(xiàn)基于新浪微博、Twitter 等 主要社會網(wǎng)絡交流工具的大數(shù)據(jù)分析系統(tǒng),系統(tǒng)完成從數(shù)據(jù)獲取、數(shù)據(jù)預處理、數(shù)據(jù)存儲、 消息中心、數(shù)據(jù)分析、結果可視化展示的閉環(huán)處理流程,支持多種社會網(wǎng)絡(Twitter、新浪 微博等)的數(shù)據(jù)實時、不間斷獲取,獲取數(shù)據(jù)量在國內(nèi)外同研究領域處于領先地位;實現(xiàn)整 體、個體、群體以及事件的多層次、多粒度分析模式;同時具備良好的人機交互操作界面以 及優(yōu)秀的分析展示效果。
掃碼關注,查看更多科技成果