用Python分析雙十一電商新聞傳播資料
同期來自螞蟻金服的金融支付資料顯示:截至18時55分,支付寶支付筆數達到了8.2億筆,已超過了去年全天的支付筆數,移動支付筆數超過了5.8億筆,佔比超七成。
下面我們用Python通過抓取百度搜尋“雙十一”關鍵詞的所有文字,對新聞文字進行文字挖掘,並對雙十一微博關鍵詞和相關博主的新聞傳播路徑進行分析。
主要利用beautifulsoup、urllib2、string等函式庫對文字進行抓取
主要程式碼片段如下:
if __name__==`__main__`:
myname=raw_input("請輸入關鍵詞
")
keywordsnum=raw_input("請輸入關聯詞個數
")
if int(keywordsnum) == 0:
keywords=[myname]
else:
keywords=[``]*int(keywordsnum)
for k in range(int(keywordsnum)):
keywords[k]=raw_input("請輸入關聯的關鍵字%d
"%(k+1))
url1 = "http://www.baidu.com/s?wd="+myname
response1 = urllib2.urlopen(url1)
content1 = response1.read()
soup1 = BeautifulSoup(content1,`lxml`)
site1 = soup1.find(class_="nums").get_text()
num = string.atoi(OnlyCharNum(site1[11:-1].strip() .lstrip() .rstrip(`,`)))
page = num/10
print num,page
filename=myname+".txt"
myfile=open(filename,"w")
keywordshownum=0
執行指令碼後輸入雙十一關鍵詞會進行抓取,介面如下:
抓取的結果放進txt文件以便進行後續分析,
通過jieba分詞等函式庫或者分詞軟體對txt文字進行詞頻分析,得出以下結果,顯示詞語的出現次數和頻率等,可以進一步進行視覺化處理生成標籤雲等:
本文完整原始碼下載地址:
http://pan.baidu.com/s/1i54raZF
在Python中文社群底部回覆“雙十一”三個字獲取本文完整原始碼下載密碼。
對微博雙十一、淘寶、京東關鍵詞進行挖掘得出以下相關聯的一些微博博主:
原文釋出時間為:2016-11-11
本文作者:阿橙
本文來自雲棲社群合作伙伴“Python中文社群”,瞭解相關資訊可以關注“Python中文社群”微信公眾號
相關文章
- 新聞聯播也可以拿用Python來做資料分析?Python
- 亞馬遜Alexa與美國媒體合作語音深度新聞,喚醒新聞傳播新模式亞馬遜模式
- 拓端tecdat:資料觀察“雙十一”網購新常態
- 雙十一再進化 人工智慧如何成為電商新戰場?人工智慧
- 印度新聞閱讀應用NewsHunt試水電商
- 研究顯示假新聞在 Twitter 上的傳播速度遠快於真新聞
- 研究顯示假新聞在Twitter上的傳播速度遠快於真新聞
- 資料新聞專家:如何在新聞裡使用資料
- APIshop精選介面助力雙十一電商業務API
- Fastdata:2020年央視《新聞聯播》資料包告AST
- “大資料新聞”的應用與誤區 什麼樣的新聞適用大資料技術大資料
- 教你用ActiveReports報表控制元件分析京東雙十一資料的價值控制元件
- 抖音電商新的解決方案-成都香播播助力抖音電商發展
- 中國社會科學院新聞與傳播研究所:微信群是更新速度最快的資訊傳播平臺
- 用主題模型視覺化分析911新聞(Python版)模型視覺化Python
- 國辦新規3招監管電商平臺雙十一促銷嚴防造假
- 大資料應用觸發預測性新聞大資料
- 谷歌資料帶你看美國的“雙十一”谷歌
- 2013年天貓雙十一資料直播
- 解密 Redis 助力雙十一背後電商秒殺系統解密Redis
- 新聞聯播與網路的區別
- 微熱點WRD:電視劇《夢華錄》網路傳播資料分析
- 雙十一在家學用 gitGit
- 新聞傳播學專業畢業生職業狀況調查報告
- 用分析軟體寫出真正重要的新聞
- 資料新聞的商業模式模式
- 聚聞 ~ 一個聚合資料新聞客戶端客戶端
- java傳送接收組播(多播)資料包(UDP包)JavaUDP
- 電商資料分析必備的4種資料分析方法
- 電商RPA助力電商運營做好資料分析
- 博睿資料攜阿里雲釋出雙十一電商網站使用者體驗報告阿里網站
- 天池新聞推薦入門賽之【資料分析】Task02
- 日本經濟新聞:2014年亞洲熱門商品及服務 阿里雙十一居首阿里
- 開源新聞:開源仿生腿、Python 資料管道、資料洩露檢測Python
- 北師大新聞傳播學院:2020中國城市海外網路傳播力報告
- 電商運營與大資料分析大資料
- BBC 新聞資料視覺化 Cookbook視覺化
- 雙十一:女性脫單攻略 讓大資料來幫忙大資料