簡單的招聘資訊圖表分析

x007xyz發表於2018-02-17

準備年後出門找工作，上招聘網站瀏覽了一下，發現瀏覽招聘資訊很難得到我想要的資訊，於是就有了這個專案。

需求

三年時間自己創業，基本是要用什麼就學，導致現在個人的技術棧十分的雜亂，所以我想要知道不同職位（當前）的就業情況和薪資水平。

其次，具體要去哪個城市也還沒有確定，所以想知道城市之間相同職位的薪資水平。

最後是對於招聘資訊要求技術棧的分析，希望通過分析企業的招聘資訊的具體資訊，提取關鍵字，分析出職業相關技術的熱度。

使用技術

也算是抱著學習新技能的心態去寫的，所以大部分都是本人最近沒有使用過的技術或沒有學習過的技術:

後端 koa（一直在使用 express，egg 也使用過，koa 居然直接跳過了，補一波）
資料庫本來是使用 mongodb 的，但是發現其實沒有必要使用資料庫。
模板引擎 arttemplate
前端就直接匯入 Boostrap 和 jQuery，這個是真的好久不見了，使用慣了 MVVM 框架，再寫 jQuery，憶苦思甜啊！
分詞 jieba，這個最後還是出了點問題，導致第三個需求沒法完成了。
還有簡單的 node 爬蟲，就是用 superagent+cheerio 實現了。
圖表 highchart

實踐過程

step.1 爬取資料

確定需要的資訊為：職位名稱、職位月薪、工作地點、詳情連結，f12 檢視頁面結構，讀取頁面後使用 cheerio 獲取需要的資訊。程式碼在 getData.js 中，具體可以參考10 分鐘教你擼一個 nodejs 爬蟲系統。

step.2 處理資料

分析薪資結構，我直接以 1 萬與 1.5 萬劃分為上中下三部分，對於獲取的資料做簡單的判斷統計，就可以了。展示形式為餅圖。

step.3 資料對比

可以同時獲取不同的職位或不同城市的資訊，並列顯示，不過以餅圖顯示，可以看出薪資分佈情況但是要比較數量就很不直觀了。所以將已查詢到的職位資訊數量放到同一張條形圖中，進行對比。

step.4 關鍵詞技術名詞分析（未完成）

原本的思路是使用結巴分詞，獲取關鍵詞，結果發現招聘詳情的關鍵詞是‘js’‘前端’‘服務端’，具體的技術名詞多隻出現一次，是自己想法上出現偏差，把自己關注的詞當做是文字的關鍵詞了。現在應該先分析出那些是技術名詞，然後作為字典去分析權重。如何分析技術名詞這個沒有思路，最直接的方法應該是直接 Google 得到相應的字典，但是沒有找到，這個功能就暫時放棄了，等有了好的方法再完成。

其他

github：github.com/x007xyz/job…

伺服器：http://95.163.201.100:3000

24個簡單、好看的視覺化圖表用法介紹！資料分析小白必看
2020-12-24
視覺化
一隻android簡訊控制馬的簡單分析
2020-08-19
Android
【招聘資訊】
2018-10-19
兩種簡單分析和優化MySQL資料庫表的方法
2020-10-13
優化MySql資料庫
Python資料分析入門（十六）：設定視覺化圖表的資訊
2021-04-13
Python視覺化
資料分析師招聘分析2.0
2020-08-24
分析一個簡單的goroutine資源池
2021-12-27
Go
招聘資訊採集
2023-11-10
form表單的簡單介紹
2020-10-18
ORM
社交網路分析的 R 基礎：（五）圖的匯入與簡單分析
2022-02-11
資料庫表連線的簡單解釋
2019-01-15
資料庫
圖形介面的TCP/IP簡單通訊
2020-10-09
TCP
簡單的UrlDns鏈分析
2024-04-16
DNS
Python運用於資料分析的簡單教程
2018-07-22
Python
python爬蟲--招聘資訊
2018-11-03
Python爬蟲
上海招聘職位資訊
2019-03-12
Flexbox 佈局的最簡單表單
2018-10-18
Flex
簡單的Socket通訊
2018-08-18
建立簡單的表測試
2018-03-14
.net圖表之ECharts隨筆06-這才是最簡單的
2018-11-29
Echarts
簡單的自定義表單控制元件
2024-05-13
控制元件
node事件迴圈和訊息佇列簡單分析
2019-06-23
事件佇列
攻防世界-簡單的圖片
2024-07-28
ChartCube圖表快速上手指南，輕鬆打造專業圖表，簡單到不可思議！
2024-11-18
最簡單的網路圖片的爬取 --Pyhon網路爬蟲與資訊獲取
2020-04-04
爬蟲
drools決策表的簡單使用
2022-05-30
socket 完成簡單的通訊
2020-05-07
mr原理簡單分析
2020-08-23
SSRF漏洞簡單分析
2020-07-16
簡單陰影分析
2020-12-27
一個簡單可分享的web資料透視分析
2024-04-05
Web
製作動態圖表，沒有比這個方法更簡單的了
2018-10-16
.net圖表之ECharts隨筆01-最簡單的使用步驟
2018-11-26
Echarts
編譯程式(compiler)的簡單分析
2018-08-07
編譯Compile
ElasticSearch 簡單的搜尋聚合分析
2018-04-16
Elasticsearch
實現簡單的輪播圖（單張圖片、多張圖片）
2020-02-11
Thinkphp 3.2 簡單輕資訊網站-—Haotizen
2019-05-11
PHP網站
Java簡單學生資訊管理系統
2021-07-20
Java
金融大資料分析還不簡單，有了Smartbi簡單幾步就能搞定
2022-01-20
大資料