社交網站的資料探勘與分析
社交網站的資料探勘與分析
基本資訊
- 原書名:
- 原出版社:
- 作者:
- 譯者:
- 叢書名:
- 出版社:機械工業出版社
- ISBN:9787111369608
- 上架時間:2012-2-24
- 出版日期:2012 年2月
內容簡介
《社交網站的資料探勘與分析》介紹組合社交網路資料、分析技術,如何透過視覺化幫助你找到你一直在社交世界中尋找的內容,以及那些你都不知道存在的有用資訊。每個獨立章節介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的python工具的意願。主要內容包括:獲得社交網路世界裡的直觀概要,使用github上靈活的指令碼來獲取社交網路api中的資料,學習如何應用便捷的python工具來交叉分析你所收集的資料,透過xhtml朋友網路探索基於微格式的社交聯絡,透過基於html5和javascript工具集的網路技術建立互動式視覺化等。
facebook、twitter和linkedln產生了大量寶貴的社交資料,但是怎樣才能找出誰透過社交媒介正在進行聯絡?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網站資料、分析技術,如何透過視覺化找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用資訊。
《社交網站的資料探勘與分析》每章都介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的python工具的意願。
facebook、twitter和linkedln產生了大量寶貴的社交資料,但是怎樣才能找出誰透過社交媒介正在進行聯絡?他們在討論些什麼?或者他們在哪兒?本書簡潔而且具有可操作性,它將揭示如何回答這些問題甚至更多的問題。你將學到如何組合社交網站資料、分析技術,如何透過視覺化找到你一直在社交世界中尋找的內容,以及你聞所未聞的有用資訊。
《社交網站的資料探勘與分析》每章都介紹了在社交網路的不同領域挖掘資料的技術,這些領域包括部落格和電子郵件。你所需要具備的就是一定的程式設計經驗和學習基本的python工具的意願。
目錄
《社交網站的資料探勘與分析》
前言 1
第1章緒論:twitter 資料的處理 9
python 開發工具的安裝 9
twitter 資料的收集和處理 11
小結 24
第2章微格式:語義標記和常識碰撞 26
xfn 和朋友 27
使用xfn 來探討社交關係 29
地理座標:興趣愛好的共同主線 37
(以健康的名義)對菜譜進行交叉分析 41
對餐廳評論的蒐集 43
小結 45
第3章郵箱:雖然老套卻很好用 47
mbox:unix 的入門級郵箱 48
mbox+couchdb= 隨意的email 分析 54
將對話執行緒化到一起 70
使用simile timeline 將郵件“事件”視覺化 79
分析你自己的郵件資料 82
小結 84
前言 1
第1章緒論:twitter 資料的處理 9
python 開發工具的安裝 9
twitter 資料的收集和處理 11
小結 24
第2章微格式:語義標記和常識碰撞 26
xfn 和朋友 27
使用xfn 來探討社交關係 29
地理座標:興趣愛好的共同主線 37
(以健康的名義)對菜譜進行交叉分析 41
對餐廳評論的蒐集 43
小結 45
第3章郵箱:雖然老套卻很好用 47
mbox:unix 的入門級郵箱 48
mbox+couchdb= 隨意的email 分析 54
將對話執行緒化到一起 70
使用simile timeline 將郵件“事件”視覺化 79
分析你自己的郵件資料 82
小結 84
.第4章twitter :朋友、關注者和setwise 操作 85
rest 風格的和oauth-cladded api 86
幹練而中肯的資料採集器 90
友誼圖的構建 108
小結 116
第5章twitter:tweet ,所有的tweet ,只有tweet 118
筆pk 劍:和tweet pk 機槍(?!?) 118
對tweet 的分析(每次一個實體) 121
並置潛在的社交網站(或#justinbieber vs #teaparty) 144
對大量tweet 的視覺化 155
小結 163
第6章linkedin :為了樂趣(和利潤?)將職業網路聚類 164
聚類的動機 165
按職位將聯絡人聚類 167
獲取補充個人資訊 183
從地理上聚類網路 188
小結 192
第7章google buzz:tf-idf 、餘弦相似性和搭配 194
buzz=twitter+ 部落格(???) 195
使用nltk 處理資料 198
文字挖掘的基本原則 201
查詢相似文件 208
在二元語法中發buzz 215
利用gmail 221
在中斷之前試著建立一個搜尋引擎…… 225
小結 226
第8章部落格及其他:自然語言處理(等) 228
nlp :帕累託式介紹 228
使用nltk 的典型nlp 管線 231
使用nltk 檢測部落格中的句子 234
對檔案的總結 237
以實體為中心的分析:對資料的深層瞭解 245
小結 256
第9章facebook :一體化的奇蹟 257
利用社交網路資料 258
對facebook 資料的視覺化 274
小結 294
第10 章語義網:簡短的討論 296
發展中的變革 296
人不可能只靠事實生活 297
期望 301
rest 風格的和oauth-cladded api 86
幹練而中肯的資料採集器 90
友誼圖的構建 108
小結 116
第5章twitter:tweet ,所有的tweet ,只有tweet 118
筆pk 劍:和tweet pk 機槍(?!?) 118
對tweet 的分析(每次一個實體) 121
並置潛在的社交網站(或#justinbieber vs #teaparty) 144
對大量tweet 的視覺化 155
小結 163
第6章linkedin :為了樂趣(和利潤?)將職業網路聚類 164
聚類的動機 165
按職位將聯絡人聚類 167
獲取補充個人資訊 183
從地理上聚類網路 188
小結 192
第7章google buzz:tf-idf 、餘弦相似性和搭配 194
buzz=twitter+ 部落格(???) 195
使用nltk 處理資料 198
文字挖掘的基本原則 201
查詢相似文件 208
在二元語法中發buzz 215
利用gmail 221
在中斷之前試著建立一個搜尋引擎…… 225
小結 226
第8章部落格及其他:自然語言處理(等) 228
nlp :帕累託式介紹 228
使用nltk 的典型nlp 管線 231
使用nltk 檢測部落格中的句子 234
對檔案的總結 237
以實體為中心的分析:對資料的深層瞭解 245
小結 256
第9章facebook :一體化的奇蹟 257
利用社交網路資料 258
對facebook 資料的視覺化 274
小結 294
第10 章語義網:簡短的討論 296
發展中的變革 296
人不可能只靠事實生活 297
期望 301
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/16566727/viewspace-717279/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 資料探勘與分析(網際網路行業)行業
- 資料探勘的資料分析方法
- 資料探勘與分析 概念與演算法演算法
- 大資料時代,如何做資料探勘與分析!大資料
- 資料分析與資料探勘 - 04科學計算
- Yahoo前任資料官:資料探勘與分析技巧(下)IF
- 資料探勘與資料分析的主要區別是什麼
- 資料探勘方向分析
- 資料探勘與預測分析(第2版)
- 《資料分析與資料探勘》--天津大學公開課
- 資料探勘者與資料探勘青年的對話(轉)
- 大資料、資料分析、資料探勘的差別大資料
- 資料探勘與生活
- 資料探勘的10種分析方法
- 【python資料探勘課程】十七.社交網路Networkx庫分析人物關係(初識篇)Python
- 網站資料分析的基本流程網站
- 英文社交媒體網站 影片網站 評論資料集 語料庫網站
- 資料探勘與資料抽樣
- 淺談大資料、資料分析、資料探勘的區別!大資料
- 網站資料分析基礎網站
- 社交網路與美食–資料資訊圖
- 網站資料的背後——網站日誌的分析指標網站指標
- 統計學與資料探勘
- 大資料下網站資料分析應用大資料網站
- 萌新向Python資料分析及資料探勘 前言Python
- 網站資料分析:流量分析的四項指標網站指標
- 統計學與資料探勘的區別
- 資料探勘---BP神經網路神經網路
- 資料探勘的功能
- 神奇的資料探勘
- 網站資料分析工具一覽表網站
- 一文講清:資料分析與資料探勘到底有什麼區別?
- 網站資料分析:資料倉儲相關的問題(三)網站
- XML與面向Web的資料探勘技術(轉)XMLWeb
- logminer進行資料探勘分析測試
- 資料探勘技術:客戶價值分析
- 《資料探勘——概念與技術》書評
- .NET資料探勘與機器學習開源框架機器學習框架