2018年9月,當馬雲宣佈由張勇接任董事局主席,眾人才開始注意到這位“成功男人背後的男人”,原來是位出身CFO的CEO。
張勇是CFO成功轉型的典範,試想一下如果以後財務人的職業規劃中有了CEO這樣的角色,是不是很激動人心呢?
職業路徑是人才發展領域核心的基礎模組,在人才發展領域,e成科技基於海量職場資料,設計了整套智慧化解決方案,並命名為燈塔(Lighthouse),寓意為職場使用者提供個人發展的指引與建議。
背景大起底:學新聞可以去寫程式碼嗎?
IT崗人群的專業分佈情況並不讓人意外,其中有近一半的人是電腦科學、電子資訊工程、數學等理工科專業背景,而全市場在職人群專業分佈相比之下較為均衡,佔比最大的是財務與會計(9.2%),其次是電腦科學與技術,但比例僅佔8.5%。
網際網路行業職業發展路徑探索
現在,我們對IT崗人群背景有了基本瞭解,我們接下來深入探索他們的職業發展路徑。
崗位輪動蘊含的行業轉換>
IT的崗位輪動中,有61%是在網際網路行業內發生的;僅有39%涉及行業轉換,這其中,工業與網際網路行業之間的輪動最為高頻(約20%),其次是消費品行業,而醫藥和生活服務業則與網際網路行業屬性差異較大,之間的崗位輪動較少見。
可見上圖近似軸對稱,其他行業與網際網路之間的轉入與轉出比例十分相近,網際網路行業的規模增長主要取決於自身規模的擴充套件(即第一份工作就入職網際網路的人群),而不是從其他行業的轉入。第一部分的入崗年齡統計結果也一致印證了這一點。
職業發展路徑圖展示>
接下來,我們便來看看IT崗人群的職業發展路徑具體長什麼樣吧。我們結合了豐富的資料探勘演算法和業務規則,運用e成科技獨特的職能實體識別技術,從每份簡歷中提取其職業發展路徑(e.g., 軟體測試->前端開發->移動開發),最終得到各職能下的高頻發展路徑,下圖為部分IT崗的路徑示例。
程式設計師VS技術長(CTO):CTO的差異化特徵是什麼>
就像上圖所示,很多程式設計師在其職業生涯當中,一直在技術圈中打轉,卻很難有質的跨越。那王侯將相寧有種乎?取得突破的程式設計師都有什麼特徵呢,為此e成君分析了下CTO的表面資訊。
從統計結果看,CTO中男性佔比近90%,本科及以上學歷佔82.9%,約26%為計算機相關專業;所需工作年限呈現出右偏分佈,主要集中在5-10年之間。可見,學歷學校等基本背景並不是讓程式設計師的發展之路產生差異化的主要因素,而且,也並不是工作年限越長越可能成為CTO。那麼,是什麼影響了程式設計師的晉升之路呢?
帶著這個疑問,我們探索了各職能所需的重要技能列表。我們基於成熟的實體識別技術,得到職能實體及其對應的技能實體列表,再結合多樣化資料探勘和統計方法,得到了多種指標下,各個職能所需的重要技能序列。我們在下表中列舉了部分IT崗的所需技能之Top5。
從表格中我們可以發現,不同技術崗所需的重要技能偏向於細分領域的工具或技術知識,特別地,MySQL在程式設計師中的使用率是相當高的;而CTO所需的頭部技能大都為“冰山下”技能:
商業頭腦和市場運營。這需要程式設計師不光有鑽研技術的踏實努力,更需要多一份對外界的好奇心,培養廣博的視野和格局,去觀察和體會市場變化,順勢而行。
管理能力和戰略規劃。CTO作為企業技術部的一把手,搭班子第一、帶隊伍第二、定戰略第三。劉備找來關、張、趙、諸葛亮,拿捏住這四個人的心理訴求,基本不用操心其他了。這點則需要有良好的溝通能力作為支撐,有效的溝通能讓你事半功倍。
當然,除此之外CTO也需要有較強的架構設計能力。這點也一定程度支援了從“系統架構工程師”到“技術長”的職業路徑的合理性。
個性化職能預測
我們的模型資料主要基於簡歷中的個人基本資訊與工作經歷,基本資訊為學歷、專業等靜態屬性資訊,工作經歷則包括過往職能、技能、行業等序列資訊。為此,我們選擇LSTM作為整個模型的主體部分,完整的模型結構見下圖。
如上圖所示,對於每一個工作經歷的序列節點,我們用Global Average將節點特徵壓縮為單個向量,在此也可以使用Attention或者全連線等方式來處理,因為節點資訊諸如職業/技能等,並沒有前後序列相關的資訊,所以使用Attention這種無序的資訊抽取方式會比全連線更具魯棒性。院長的實驗結果顯示,Attention結構並沒有比Global Average取得更佳的結果,因此最終還是選擇了更為簡單的Global Average結構。
工作經歷抽象為向量序列後,我們將資料餵給了雙層LSTM。一般情形下,迴圈神經網路都能較好的處理序列資料,但對於RNN結構來說,在序列過長之後很容易出現前期資料遺忘的問題,且易發生梯度爆炸或者梯度消失,所以通常會選擇帶門控的迴圈神經網路,如LSTM、GRU等等,這裡我們選擇了LSTM結構。序列建模經常會用到雙向結構,但我們的序列資訊屬於一種時間序列,如果選擇雙向結構,則會發生資訊洩露的問題,所以最終選擇了單向的LSTM模型。
最後在將整個序列資訊轉為向量t之後,直接拼接基本資訊,經過兩層全連線輸出預測的職能,此為主任務。為了提高模型魯棒性,我們將前面每個節點的輸出(如上圖t1)同樣的跟基本資訊拼接,並預測下一份職能,此為副任務。只預測最後一個職能,會失去一些職能轉換的多樣性,而副任務可以很好地解決這個問題,並且能讓模型更好地學習到職能等特徵之間的關係,也變相地增加了資料量。
如上表所示,在得到模型之後,我們對模型效果進行了驗證,結果表明:61.5%左右的預測職能與真實職能一致或者高度相似;13.5%左右的預測職能與真實職能相對低階,容易相互轉換;17%左右的預測職能比真實職能看起來更合理;僅8%左右的預測職能與真實職能偏差較大。
這麼看來,在大部分情況下,模型預測的結果都符合預期或者相對合理,換句話來說,如果當你對下一份工作不是特別清晰的時候,也許我們能幫你指出一個不錯的方向哦!