微博情感信息挖掘系統(tǒng)
2017-07-25 10:31:10 來源:本站原創(chuàng) 瀏覽:89次我國有著龐大的互聯(lián)網(wǎng)用戶群,隨著微博的興起,互聯(lián)網(wǎng)上出現(xiàn)了大量的微博用戶群,針對大量的微博用戶,針對其情感信息的研究有著很重要的意義。所以大數(shù)據(jù)的分析也隨之出現(xiàn)。通過大數(shù)據(jù)的分析,可以更容易更方便了解到微博情感信息,可以準確掌握人們的心理情況。本系統(tǒng)采用了java技術(shù)開發(fā),采用大數(shù)據(jù)分析的理念和爬蟲技術(shù)進行微博數(shù)據(jù)的爬行和分析,也是一項比較有創(chuàng)新特色的畢業(yè)設(shè)計,系統(tǒng)功能主要分為以下幾個方面:
1、針對微博的信息進行格式化處理,主要挖掘微博題目、內(nèi)容、發(fā)布時間、轉(zhuǎn)發(fā)數(shù)量以及評價數(shù)量等基本信息,并存入數(shù)據(jù)庫。
2、數(shù)據(jù)信息的清洗:利用分詞技術(shù)對熱門的微博進行分詞,將停用詞和特殊的符號等不相干數(shù)據(jù)進行清理。
3、建立情感詞庫:通過建立積極情感詞庫和消極情感詞庫,為情感數(shù)據(jù)的挖掘做好服務(wù)工作。
4、蟻群算法在本系統(tǒng)中發(fā)揮重要的作用,本人利用蟻群算法信息素揮發(fā)原理,對微博數(shù)據(jù)信息進行動態(tài)情感分析,主要完成以下兩種關(guān)聯(lián):
a)事件與情感的關(guān)聯(lián),發(fā)現(xiàn)一些引起積極情感的事件,和一些引起負面情感的事件。
b)用戶與情感的關(guān)聯(lián),發(fā)現(xiàn)一些用戶在某個時間段與積極情感或消極情感的關(guān)聯(lián),給出用戶的情感變化曲線。
5、以曲線的方式,給用戶展示出直觀的情感的波動圖。
微博數(shù)據(jù)抓取:
前十名關(guān)鍵詞排名:
曲線圖: