再續利用爬蟲技術結構化人名的掙錢機會

王平發表於2019-02-15

開年接著寫Python爬蟲掙錢系列文章,祝關注猿人學Python公眾號的新老朋友在19年掙被動收入上有所斬獲。

上一篇說了利用爬蟲結構化人名做網站掙百度網盟,還意猶未盡,這篇繼續接著說。

金色存錢罐

上一篇說的是結構化還沒有百度百科的小有名氣者,比如公司基中層管理者,圖書作者,自媒體作者等等。這些人在百度的搜尋量相對偏小,但是這樣的人有很多,數以百萬記這樣的人。他們累計起來的百度搜尋量是非常驚人的,誰能結構化過百萬這樣的人物介紹做成網站,每年的百度網盟收入會是百萬級人民幣的。

這是我親自實踐過,我結構化的人物規模在十萬級,每年的網盟收入在十萬RMB左右。廣而告之:有能力結構化十萬級和百萬級人物介紹的朋友(技術或資源)請聯絡我,一起掙錢。

這篇說的跟上一篇恰恰相反,這一篇說下結構化有大名氣人物做網站,依靠搜尋流量掙網盟收入的機會。以下想法是我思考過,但是沒有實踐過。

通常大明星,大V們都有百度百科了,還有很多新聞網站報導他們,你單純做個這些人物介紹網站,然後每個頁面標題就是他們的姓名。這個有搜尋流量的概率太小太小了。

但是有一種避開這些競爭的方法,做他們的微博。先看下圖:

微博大V的百度搜尋指數

上圖是明星、大V們的搜尋指數,標紅處表示百度搜尋指數,這個圖意思是每天在百度上搜趙麗穎微博有4000多次,搜劉愷威微博有3000多次。他們是想找這些人的新浪微博,覺不覺得很好奇,找某個人的微博為什麼不直接去微博裡搜尋,確在搜尋引擎裡找呢???告訴你,世界上所有的冷熱事情最終都會反映在搜尋行為上,雖然現在內容被各種APP割裂了。題外話。

做一個大V們的微博導航網站
1.使用爬蟲手段把微博上帶V的微博賬號個人資料頁和主頁抓取一遍。(主頁抓幾張圖片,抓一些微博就好)

2.做成一個網站,每個微博一個網頁,網頁標題就是XXX最新微博。

3.網頁裡要揉雜進他微博個人資料頁裡的內容,用於填充你的網頁,再加上你抓取他的微博主頁上的一些圖片和微博來豐富你網頁,對這些內容要在你的網頁上要有豐富的呈現,你的網頁才有被搜尋引擎索引並給與排名的可能。

4.不一定非要大V微博,有些微博粉絲數很高,也是沒有加V認證的,可以變成抓微博上粉絲數幾十萬以上的微博。

5.網頁裡要加上該微博的跳轉連結。待會說原因。

做微博導航網站的難度和挑戰
1.技術上肯定是很考驗你爬蟲技術能力的,要解決大量微博賬號和IP的問題,微博封禁異常賬號挺厲害的。

2.還是需要懂網站搭建和運營技巧。

3.智慧財產權風險,微博對使用者微博上的圖片和文字擁有智慧財產權,所以最好在你的網頁上提供一個微博點選跳轉地址來降低風險。

4.百度已在搜尋結果中優先展示加V微博個人主頁。

大V微博賬號在百度的搜尋結果

這是做微博導航網站的較大挑戰,不過因為這些人的搜尋量足夠大,只要你能排進搜尋結果首頁,就會有流量進入你的網站,並且很多沒有加V 的擁有幾十萬微博粉絲的賬號,百度是沒有優先展示的,這就是一個機會。
PS:微博的robots.txt是遮蔽了搜尋爬蟲抓取的,但是這幾家搜尋引擎沒一家遵守。

微博的robots檔案

流量有多大?
微博上有幾十萬個這樣的賬號,也就是你能做幾十萬張網頁,估算差一點,按有10%的頁面有搜尋排名,就有幾萬個頁面每天有搜尋流量,換算成網盟收入一年有小十萬。

再說明,上述是我思考過,自己沒有實踐,如果你通過這篇文章實現了記得回來點個“好看”。親!

擴充閱讀:
爬蟲掙錢系列:資料整合之–結構化人名的機會
說點俗的–如何利用Python爬蟲技術掙錢
利用爬蟲掙錢系列2-細說資料整合

猿人學banner宣傳圖

我的公眾號:猿人學 Python 上會分享更多心得體會,敬請關注。

***版權申明:若沒有特殊說明,文章皆是猿人學 yuanrenxue.com 原創,沒有猿人學授權,請勿以任何形式轉載。***

相關文章