用Python分析雙十一電商新聞傳播資料
同期來自螞蟻金服的金融支付資料顯示:截至18時55分,支付寶支付筆數達到了8.2億筆,已超過了去年全天的支付筆數,移動支付筆數超過了5.8億筆,佔比超七成。
下面我們用Python通過抓取百度搜尋“雙十一”關鍵詞的所有文字,對新聞文字進行文字挖掘,並對雙十一微博關鍵詞和相關博主的新聞傳播路徑進行分析。
主要利用beautifulsoup、urllib2、string等函式庫對文字進行抓取
主要程式碼片段如下:
if __name__==`__main__`:
myname=raw_input("請輸入關鍵詞
")
keywordsnum=raw_input("請輸入關聯詞個數
")
if int(keywordsnum) == 0:
keywords=[myname]
else:
keywords=[``]*int(keywordsnum)
for k in range(int(keywordsnum)):
keywords[k]=raw_input("請輸入關聯的關鍵字%d
"%(k+1))
url1 = "http://www.baidu.com/s?wd="+myname
response1 = urllib2.urlopen(url1)
content1 = response1.read()
soup1 = BeautifulSoup(content1,`lxml`)
site1 = soup1.find(class_="nums").get_text()
num = string.atoi(OnlyCharNum(site1[11:-1].strip() .lstrip() .rstrip(`,`)))
page = num/10
print num,page
filename=myname+".txt"
myfile=open(filename,"w")
keywordshownum=0
執行指令碼後輸入雙十一關鍵詞會進行抓取,介面如下:
抓取的結果放進txt文件以便進行後續分析,
通過jieba分詞等函式庫或者分詞軟體對txt文字進行詞頻分析,得出以下結果,顯示詞語的出現次數和頻率等,可以進一步進行視覺化處理生成標籤雲等:
本文完整原始碼下載地址:
http://pan.baidu.com/s/1i54raZF
在Python中文社群底部回覆“雙十一”三個字獲取本文完整原始碼下載密碼。
對微博雙十一、淘寶、京東關鍵詞進行挖掘得出以下相關聯的一些微博博主:
原文釋出時間為:2016-11-11
本文作者:阿橙
本文來自雲棲社群合作伙伴“Python中文社群”,瞭解相關資訊可以關注“Python中文社群”微信公眾號
相關文章
- 新聞聯播也可以拿用Python來做資料分析?Python
- Advancement of Science:Facebook 假新聞傳播調查
- 弘遼科技:雙十一再創高峰,剁手黨成就電商傳奇
- 群邑電商:2020雙十一全景洞察(上篇)
- 58同城:2021年“雙十一”主播類崗位就業資料就業
- Fastdata:2020年央視《新聞聯播》資料包告AST
- APIshop精選介面助力雙十一電商業務API
- 微熱點WRD:電視劇《夢華錄》網路傳播資料分析
- 電商RPA助力電商運營做好資料分析
- 烏雲爆告之雙十一電商的安全警示
- 研究顯示假新聞在 Twitter 上的傳播速度遠快於真新聞
- 研究顯示假新聞在Twitter上的傳播速度遠快於真新聞
- 微熱點:2018年度電影網路傳播資料分析報告
- 拓端tecdat:資料觀察“雙十一”網購新常態
- 教你用ActiveReports報表控制元件分析京東雙十一資料的價值控制元件
- 抖音電商新的解決方案-成都香播播助力抖音電商發展
- 解密 Redis 助力雙十一背後電商秒殺系統解密Redis
- 電商資料分析必備的4種資料分析方法
- 博睿資料攜阿里雲釋出雙十一電商網站使用者體驗報告阿里網站
- 亞馬遜Alexa與美國媒體合作語音深度新聞,喚醒新聞傳播新模式亞馬遜模式
- 電商運營與大資料分析大資料
- 中國社會科學院新聞與傳播研究所:微信群是更新速度最快的資訊傳播平臺
- 直播預告 | 一場直播教你看透雙十一電商風險
- ConTech資料實驗室:2019新經濟傳播報告
- 匯納科技:2019年雙十一實體商業客流分析簡報
- 萌新向Python資料分析及資料探勘 前言Python
- 博睿資料&阿里雲:2021年雙十一電商網站使用者體驗報告(附下載)阿里網站
- 羅強:騰訊新聞如何處理海量商業化資料?
- 實戰演練!5個資料分析在電商的最佳應用
- 公司新聞 | 愛可生榮獲《2022愛分析 · 信創廠商全景報告》資料庫市場代表廠商資料庫
- 雙十一在家學用 gitGit
- 掌握電商資料的4個要點!電商平臺資料分析其實很簡單
- 開源新聞:開源仿生腿、Python 資料管道、資料洩露檢測Python
- 掌上新聞隨心播控,HarmonyOS SDK助力新浪新聞打造精緻易用的資訊服務新體驗
- 電商資料分析指標體系劃分指標
- 1電商平臺零售資料分析
- 哪些行業適合做新聞宣傳?選擇新聞發稿服務商需要注意什麼?行業
- 天池新聞推薦入門賽之【資料分析】Task02