社交網站的資料探勘與分析

china-pub發表於2012-02-28
社交網站的資料探勘與分析
 

基本資訊

  • 原書名:
  • 原出版社:
  • 作者:   
  • 譯者:
  • 叢書名:
  • 出版社:機械工業出版社
  • ISBN:9787111369608
  • 上架時間:2012-2-24
  • 出版日期:2012 年2月

 

社交網站的資料探勘與分析

內容簡介

  《社交網站的資料探勘與分析》介紹組合社交網路資料、分析技術,如何透過視覺化幫助你找到你一直在社交世界中尋找的內容,以及那些你都不知道存在的有用資訊。每個獨立章節介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的python工具的意願。主要內容包括:獲得社交網路世界裡的直觀概要,使用github上靈活的指令碼來獲取社交網路api中的資料,學習如何應用便捷的python工具來交叉分析你所收集的資料,透過xhtml朋友網路探索基於微格式的社交聯絡,透過基於html5和javascript工具集的網路技術建立互動式視覺化等。
   facebook、twitter和linkedln產生了大量寶貴的社交資料,但是怎樣才能找出誰透過社交媒介正在進行聯絡?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網站資料、分析技術,如何透過視覺化找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用資訊。
  《社交網站的資料探勘與分析》每章都介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的python工具的意願。
 
 

目錄

《社交網站的資料探勘與分析》
前言 1
第1章緒論:twitter 資料的處理 9
python 開發工具的安裝 9
twitter 資料的收集和處理 11
小結 24
第2章微格式:語義標記和常識碰撞 26
xfn 和朋友 27
使用xfn 來探討社交關係 29
地理座標:興趣愛好的共同主線 37
(以健康的名義)對菜譜進行交叉分析 41
對餐廳評論的蒐集 43
小結 45
第3章郵箱:雖然老套卻很好用 47
mbox:unix 的入門級郵箱 48
mbox+couchdb= 隨意的email 分析 54
將對話執行緒化到一起 70
使用simile timeline 將郵件“事件”視覺化 79
分析你自己的郵件資料 82
小結 84
.第4章twitter :朋友、關注者和setwise 操作 85
rest 風格的和oauth-cladded api 86
幹練而中肯的資料採集器 90
友誼圖的構建 108
小結 116
第5章twitter:tweet ,所有的tweet ,只有tweet 118
筆pk 劍:和tweet pk 機槍(?!?) 118
對tweet 的分析(每次一個實體) 121
並置潛在的社交網站(或#justinbieber vs #teaparty) 144
對大量tweet 的視覺化 155
小結 163
第6章linkedin :為了樂趣(和利潤?)將職業網路聚類 164
聚類的動機 165
按職位將聯絡人聚類 167
獲取補充個人資訊 183
從地理上聚類網路 188
小結 192
第7章google buzz:tf-idf 、餘弦相似性和搭配 194
buzz=twitter+ 部落格(???) 195
使用nltk 處理資料 198
文字挖掘的基本原則 201
查詢相似文件 208
在二元語法中發buzz 215
利用gmail 221
在中斷之前試著建立一個搜尋引擎…… 225
小結 226
第8章部落格及其他:自然語言處理(等) 228
nlp :帕累託式介紹 228
使用nltk 的典型nlp 管線 231
使用nltk 檢測部落格中的句子 234
對檔案的總結 237
以實體為中心的分析:對資料的深層瞭解 245
小結 256
第9章facebook :一體化的奇蹟 257
利用社交網路資料 258
對facebook 資料的視覺化 274
小結 294
第10 章語義網:簡短的討論 296
發展中的變革 296
人不可能只靠事實生活 297
期望 301

社交網站的資料探勘與分析社交網站的資料探勘與分析.jpg

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16566727/viewspace-717279/,如需轉載,請註明出處,否則將追究法律責任。

相關文章