?? 《文本挖掘技術(shù)及其應(yīng)用》??包括四個部分。第一部分包括兩章,介紹常用文本挖掘技術(shù),總結(jié)基本流程。第二部分共五章,在R軟件上詳細(xì)介紹了文本挖掘,包括R軟件的簡介與安裝,文本挖掘所需的基本R包,F(xiàn)acebook、微博、Twitter、網(wǎng)頁等爬蟲技術(shù)、數(shù)據(jù)預(yù)處理如斷詞、字詞處理、語料庫建立等,資料分析如關(guān)聯(lián)分析、集群分析、主成份分析和聚類分析。第三部分共兩章,在MS SQL Sever上介紹如何實現(xiàn)文本挖掘,第一章是數(shù)據(jù)預(yù)處理技術(shù),包括怎么導(dǎo)入文本數(shù)據(jù)、建立字詞與詞向量、建立訓(xùn)練集和測試集,第二章在MS SQL Sever上實現(xiàn)常用的文本數(shù)據(jù)挖掘方法,并進(jìn)行圖表分析。第四部分為顧問公司和新聞網(wǎng)合作的案例。