爬蟲掙錢系列-(完結篇)結構化人名掙錢第三篇

王平發表於2019-02-18

原文網址 : https://www.yuanrenxue.com/earn-money/earn-money-pycrawler-3-2.html

本篇是寫利用爬蟲技術來結構化人物做網站掙網盟收入的第三篇，也是完結篇，這篇主要寫我是怎麼思考的，是如何分析到這個領域的，我會再舉一個我思考過的例項。

Python爬蟲掙錢思路總結

如果你是第一次看Python爬蟲掙錢系列文章，請先閱讀文末最下面的擴充閱讀，瞭解背景知識。

結構化人名的搜尋流量有這麼大嗎？

Yes. 非常大，Linkedin大家應該都知道吧，美國一個職業社交網站，簡單理解就是個人簡歷/職業資訊網站。我曾經看到Linkedin做增長黑客的一篇報導。

linkedin增長黑客報導

裡面提到了Linkedin為了增加搜尋流量，把使用者的個人檔案頁面開放給搜尋引擎索引，此舉讓Linkedin搜尋流量倍增，讓我明白了人名這一塊的搜尋流量原來如此大，這麼多人搜尋。在這之前我的認知是隻有明星，大人物才會有人在網上搜尋，其實小人物(相對的)，公司小領導，乃至平常百姓都會有人在網上搜尋。

linkedin流量統計

上圖是Linkedin一個月的訪問量是10億，換算成每天是3千萬。

linkedin搜尋流量統計

上圖是Linkedin的流量來源佔比，搜尋流量佔23.7%，可以想象這個流量有多麼巨大。

由此我花了很多時間去研究這塊流量的掙錢機會，發現還有很多人物是沒有百度百科，linkedin的(如果百度百科或linkedin上已經有這些人物了，你做同樣的人物有搜尋排名的概率很小)，他們的資訊都零星散落在一些新聞報導，人物採訪，會議的嘉賓介紹上，需要利用爬蟲手段把這些網頁全部抓回來儲存好，然後研究使用各種文字結構化技術來提取相關跟人物相關的資訊。(這個過程很痛苦，沒毅力的就算了)。

這讓我結構化了小十萬人名，網站流量做到小四萬，每年10萬左右的網盟收入。

舉個結構化人名的例子：

之前疫苗問題的長春生物董事長：高-俊-芳，我之前也不知道這麼個人，也不知道什麼時候結構化她的資訊，事情發生第二天早上我例行檢視網站流量，發現流量異常的高，都是在搜尋她的名字。那天她的流量超過2萬，那天中午才有人在百度百科編輯上她的百科資訊。

百度統計裡特定流量

再說一個結構化人名的機會

這個我沒有實踐過，是分析的時候曾經想過。我把視角一直放在國內，一直在結構化國內的人名，在中國有這種搜尋行為，在國外也會有這種搜尋人名的行為。為何不去做一個英語網站，關於人物介紹的英語網站呢？尋找還沒有維基百科的人物。而且英語比中文的文字處理要容易，至少不需要中文分詞，英語單詞間都是空格隔開的。

還有就是掙google adsense(類似百度網盟)，掙的是美金，美金跟人名幣是1:6.7的關係，也就是同樣情況下，你在國內百度網盟一年掙10萬RMB，做google是10萬美刀(合67萬人民幣)，有想法的可以深入研究下這塊的人名機會。

需要運用到的技術

1.不錯的爬蟲抓取技術(抓網頁，抓微博，抓微信公眾號)

2.不錯的文字結構化技術

對中文做文字處理，懂點自然語言處理(nlp)是必須的。

3.Web開發技術

無論是自己寫網站還是使用開源部落格系統，至少要懂得怎麼配置nginx(web伺服器)，linux，mysql，python(或php)

4.搜尋引擎優化技巧

各大搜尋引擎都提供官方的優化指南，理解並按照官方規則實施即可，其實我沒有過度關注搜尋優化，因為你提供了搜尋引擎缺失的內容，它是喜歡的，你需要有耐心等待有搜尋排名的那一刻。

整合資料做網站掙搜尋流量的思考

1.結構化人名只是整合資料的一個方向之一，而且是比較累的，相信還有其他領域是有這個機會的，只是我的視野還沒有看到。整合資料做網站不是做垃圾網站，不是做拷貝複製網站，是要找到搜尋引擎還缺失的內容，去彌補這塊內容，你的網站滿足了搜尋引擎，它自然會給你的網站有搜尋排名。

典型的如企業工商資訊查詢，官方一直是有企業工商資訊網站的，但是資訊很分散，另一個就是搜尋引擎爬蟲很難爬取這類官方網站，這給了天眼查/企查查機會，把企業工商資訊全部結構化出來很方便使用者查閱，每天的搜尋流量幾十萬。

2.結構化的規模一定要大才有機會，因為這些的每一個搜尋量都非常小，只有結構化足夠規模才能積少成多。

完結

利用爬蟲抓取網頁，結構化人名做網站掙網盟收入三篇完結，再次祝關注猿人學Python的新老朋友豬年找到掙被動收入的方向。

擴充閱讀

1.爬蟲掙錢系列：資料整合之–結構化人名的機會

2.爬蟲掙錢系列-再續利用爬蟲技術結構化人名的機會

3.說點俗的–如何利用Python爬蟲技術掙錢

4.利用爬蟲掙錢系列2-細說資料整合

猿人學banner宣傳圖

我的公眾號：猿人學 Python 上會分享更多心得體會，敬請關注。

***版權申明:若沒有特殊說明，文章皆是猿人學 yuanrenxue.com 原創，沒有猿人學授權，請勿以任何形式轉載。***

相關文章

爬蟲掙錢系列：資料整合之–結構化人名的機會
2019-02-13
爬蟲
再續利用爬蟲技術結構化人名的掙錢機會
2019-02-15
爬蟲
爬蟲掙錢系列-結構化商標資訊掙被動收入的可能性
2019-12-12
爬蟲
爬蟲掙錢系列：做網站掙網盟廣告的偏門
2019-03-28
爬蟲網站
Python掙錢系列：資料整合之-結構化企業資料
2019-08-10
Python
利用爬蟲掙錢系列2-細說資料整合
2018-12-04
爬蟲
我是如何獲得Google AdSense賬戶的-爬蟲掙錢系列
2019-02-22
Go爬蟲
個人利用Python爬蟲技術怎麼掙錢
2019-04-01
Python爬蟲
寫獨立技術部落格掙被動收入-掙錢系列
2019-03-11
開滴滴很掙錢？
2020-11-13
個人利用Python爬蟲技術怎麼掙錢-10萬被動收入
2018-12-02
Python爬蟲
技術社群的掙錢之道
2019-06-13
做茶葉生意掙錢嗎?
2021-01-23
我的 2024 年終總結，一分錢沒掙到
2024-12-24
小強帶你掙小錢v
2024-05-22
資料服務怎麼掙錢？
2022-02-28
出海出得好，要從“會掙錢”到“會花錢”
2019-09-29
來通過寫技術文章掙錢
2020-02-07
做亞馬遜真的能掙錢嗎？
2020-11-02
亞馬遜
上班族如何提升掙錢的效率
2021-09-09
網上賺錢最快的方法幹什麼能掙錢快
2020-10-26
小程式真的能幫商家掙到錢嗎
2019-03-14
howmuch：美國最掙錢的公司Top50
2020-08-03
5個能掙錢的自媒體平臺
2022-01-27
做敘事型別遊戲掙錢容易嗎？
2021-04-02
型別遊戲
開發者是如何從XGP中掙錢的
2020-11-26
他靠講爬蟲微課掙了一筆-但不講爬蟲技術
2018-12-10
爬蟲
搭建個人部落格掙錢的六個基本技能
2019-03-16
一本《Redis 深度歷險》，我能躺掙多少錢？
2018-12-12
Redis
學Python能掙多少錢?哪些人適合學Python?
2019-11-14
Python
蘋果靠什麼吸引開發者？掙錢極多
2020-06-17
蘋果
位元組跳動最“掙錢”的前端團隊招人啦～
2019-07-04
前端
在區塊鏈專案中掙錢的五種方法
2018-04-18
區塊鏈
這屆年輕人，為什麼越掙錢越窮
2021-11-01
防疫小遊戲陪玩還掙錢，3毛都可提現
2020-02-07
遊戲
BNP Paribas：調查顯示巴西IT行業企業家最掙錢
2018-04-13
行業
學習Python能掙多少錢?什麼人適合學習Python?
2019-12-05
Python
到底要賣多少份遊戲，才能讓開發商掙到錢？
2019-07-24
遊戲