大資料是否意味著更多的工作機會?

紫鳳發表於2012-09-28

據麥肯錫諮詢公司去年公佈的一份報告顯示,到2018年,美國在 “能夠分析資料幫助公司做出商業決策”方面將面臨150萬的人才缺口。 大量公司目前正在尋求可發掘大資料競爭優勢的人才。那麼“大資料人才”具體是指什麼呢?他們需要什麼樣的技能和教育背景呢?

         enter image description here

市場觀察人士稱,大量公司目前正在尋求擁有綜合技能,可發掘大資料競爭優勢的人才。研究機構國際資料分析研究所(IIA)執行長Jack Phillips稱:“排名第一的企業需求是招聘到能夠通過資料的使用和分析獲得競爭優勢的人才。這一點是毫無疑問的。”

那麼“大資料人才”具體是指什麼呢?這些職位都是什麼?他們需要什麼樣的技能呢?從事大資料工作的人需要什麼樣的教育背景呢?為此,美國計算機世界網站對這一新興領域內的傑出代表人物進行了專訪。

相關技能

曾經出任瑞銀財富管理公司商業風險與分析總監的Sandeep Sacheti稱:“現在對‘大資料專業人員’還沒有一個統一的定義。” 目前Sacheti已跳槽至威科集團,並出任該集團下屬企業法律服務公司客戶洞察與營運績效副總裁。

Sacheti的新職位全部是關於大資料的:利用分析法瞭解客戶、開發新產品、削減運營成本。在他主管的一個專案中,威科集團為律師事務所提供電子賬單服務的部門正在使用分析法挖掘從客戶那裡彙集到的資料(已取得了許可),以開發新的產品。

為了處理這些大資料工作,Sacheti目前採取雙管齊下的辦法,一方面從外面招聘人才,一方面培訓內部員工。他根據四組技能對大資料職位進行了劃分:資料科學家、資料架構師、資料視覺化人員和資料調整代理人。

由於不同的人會使用不同的技能,因此目前這些職位還沒有一個標準的稱謂。Robert Half Technology公司高階執行董事John Reed稱,同一個職位在一家公司裡可能被稱為資料分析師,但是在另一家公司裡可能並不叫資料分析師。有的大資料職位的稱謂就像Sacheti給出的職位名稱那樣,職位的稱謂中既沒有“大”這個字也沒有“資料”這一詞。

Phillips稱,目前已經有一些公司為了招聘到大資料人才向IIA尋求幫助。首先,他們會詢問能夠在哪裡找到這類人才。“隨後,他們會中止這些話題轉而詢問‘等一下,我怎麼才能知道我正尋找什麼?’”

Talent Analytics 公司執行長Greta Roberts稱:“每個人都會問,你是如何鑑別這些人的?你關注的是哪些技能?他們需要擁有什麼樣的學位?”

Phillips 和Roberts都表示,大資料職位相關的技能主要包括數學、統計學、資料分析、商業分析和自然語言處理。儘管還沒有達成一致,但是資料科學家、資料架構師等職位已經逐步獲得了共識。

必須要有強烈的好奇心

Cloudera公司的資料科學高階總監Josh Wills稱,在尋求大資料人才的同時,公司還開始大量招聘應用開發員和軟體工程師,而不是IT運作人員。

這並不是說在大資料中不再需要IT運作人員。畢竟,要由他們構建基礎設施,建立大資料系統。風險投資公司Greylock Partners的資料科學家D.J. Patil 稱:“這是Hadoop人員的領域。”

“如果沒有這些員工,你根本沒辦法做任何事情。他們構建了一個令人難以置信的基礎設施,但是他們不必做任何分析。”他指出,通過傳統的培訓或是自學,IT員工能夠輕而易舉地快速掌握Hadoop技能。主要Hadoop廠商中的培訓專案已經證明了許多IT員工能夠通過這一途徑掌握相關的技能。

也就是說,大資料中的許多職位需要程式設計知識和應用開發能力,需要知道如何滿足業務需求。

最重要的資質並不是學位、大學文憑,任職經歷和職稱。而是一些軟實力:好奇心、與非技術人員溝通的能力、堅忍不拔的性格和對創新的不懈追求。

Patil 稱:“傑出的員工都有一顆強烈的好奇心。” Patil與Cloudera創始人Jeff Hammerbacher一起被《福布斯》雜誌稱為“資料科學家”。Patil在LinkedIn任職期間曾經被任命為資料產品總監、首席研究員和首席安全官,幫助組建了資料研究團隊,幫助制訂了相關策略。

Patil為應用數學博士。Sacheti為農業及資源經濟學博士。對此,Patil表示,與大學文憑相比,好奇心和創造力更為重要。“大資料人才必須要涉足多個領域,能夠將一個領域內的想法應用到另一個領域中,此外還必須要能夠適應模稜兩可的東西。”

Cloudera的Wills則是通過一個迂迴的方式成為資料科學家的。Wills本科階段在杜克大學學習的是數學專業,並取得了學士學位。畢業後,Wills通過半工半學的方式在得克薩斯大學取得了碩士學位。期間,Wills曾經在多家公司工作過。在2007年,他還曾經休學為谷歌公司工作過。在谷歌工作期間,Wills的工作崗位是統計員。在跳槽至Cloudera公司成為資料科學家前,Wills已經成長為了一名軟體工程師。

總之,大資料專業人員看似在許多崗位上工作,並且每一個崗位都不精通。他稱:“每名大資料專業人員可能並不是世界最好的軟體工程師,也不是世界上最好的統計員,但是他們擁有與這兩個行業人員溝通的技能,能夠在營銷團隊和高階主管之間進行溝通。他們最大的技能是在公司中發揮‘膠水’一樣的作用,而許多公司都需要他們。”

“許多大資料人才都瞭解IT、軟體研發、應用研發和分析學。” Wills認為這類員工在公司中的作用將日益突顯。“我認為公司可以利用這類員工實現價值轉移。”

Sacheti也在尋找這類大資料人才。他稱:“我們發現有許多人擅長學習新技能,願意進行反覆設計和敏銳思考。”

為了調查大資料專業人員的成長途徑,IIA和Talent Analytics公司近期發起了一項網上投票,旨在調查大資料專業人員的技能、受教育程度,以及他們的情感與性格。結果預計將在年底揭曉,屆時人力資源專員將需要付費瀏覽。

Talent Analytics的Roberts稱:“在一些調查案例中,員工與生俱來的性格,如好奇心,可能比他們在IT、IS、CS等方面的受教育程度更能預測他們的工作業績。”

目標:冷靜的性格和嚴謹的態度

直到近年來,IT部門才開始關注員工的創造力、好奇心和溝通能力,而這可能也是為什麼大多數公司不讓他們的IT員工主導大資料專案的原因。

Phillips表示,IIA認為資料科學受到三個方面的支撐:技術(IT、系統、硬體和軟體)、數量(統計、數學、建模、演算法)和業務(所從事領域內的相關知識)。“我所看到的專業人員都是在第二個方面取得成功的人。雖然他們通曉技術,但是他們並不會運用技術,他們需要依靠IT部門為他們提供工具。”

Wills認為,大資料還需要一個嚴謹的態度。他解釋稱:“當我們在談論大資料科學時,實際上是在談論一個由經驗推動的程式。你常常需要嘗試大量不同的事情,必須要以平靜的心態來看待失敗。你需要做這類工作的員工有著冷靜的性格。”

市場研究機構Forrester Research 的首席分析師Brian Hopkins稱,他們需要能夠快速的調整自己的假設和解決問題的辦法。“你不能將自己限制在一個計劃中,而是需要適應在有著多個計劃或沒有計劃的環境中工作。”

他稱,這是一個與大多數IT員工所習慣的模式完全不同的運作模式。Hopkins 稱:“來自龐大的企業IT商店的IT員工可能會對他們做事麻利、行動迅速和處理靈活而感到不適應。”

在招聘經理人時,一旦發現了這類人選,公司往往願意對他們進行培訓,讓他們勝任大資料中的角色。Patil稱:“在LinkedIn裡,我們很大程度上是自己培訓自己,因為許多事情都是開放的。”他認為大多數公司也都能夠這麼做,“如果他們擁有合適的性格,那麼你可以選擇他們。”

在員工方面,部分IT員工喜歡自己的工作更具創新力,為此他們可能願意轉而選擇大資料作為自己的職業生涯規劃。Sacheti稱,如果一名IT員工處事靈活,願意學習新的工具,並且擁有一些藝術家的氣質,那麼他會選擇資料架構,甚至是資料視覺化這一領域。

對於那些喜歡把握機會展示自己創造力的IT員工來說,大資料職業生涯也具有潛在的吸引力。

大資料的技能與職位

大資料中沒有我們常見的職位,甚至沒有從業資格標準,人們難以知道是什麼因素讓一部分人適合從事大資料工作。通過對大資料專家和招聘人員的採訪,我們試著列出了大資料中一些最常見的職位和所需要的技能。

資料科學家:他們是大資料中的領導者。這一職位的角色與麥肯錫諮詢公司報告中的“深度分析人才”十分相似。一些公司還為資料科學家設立了高階管理員的職位。其中的許多人都曾經從事過數學或傳統統計學方面的研究。還有一部分人擁有人工智慧、自然言語處理或資料管理方面的教育背景。

資料架構師:他們是擅長處理散亂資料、各類不相干的資料、未定義資料和模稜兩可資料的程式設計師。資料架構師中的許多人都擁有傳統程式設計或商業智慧的教育背景,並且非常熟悉統計程式。為了能夠用新的方式駕馭資料,提供新的深層次見解,他們需要擁有創造力和堅忍不拔的性格。

資料視覺化人員:他們屬於技術人員,職責是通過分析將資料轉化為公司能夠使用的資訊。他們分析資料,然後用常人能夠理解的語言表述出這些資料所蘊含的資訊,以及它們對公司的影響。資料視覺化人員需要能夠理解公司所有部門,包括高階主管的意思,並能夠與他們進行溝通。

資料調整代理人:資料調整代理人的職責是根據資料分析推動內部運作和處理程式進行調整。他們中的許多人都擁有Six Sigma的教育背景,並且擁有把行話翻譯成其他人能夠理解的術語的溝通能力。

資料工程師/操作人員:他們是大資料基礎設施的設計者、建設者和管理者。他們開發出了可根據公司需要進行分析和提供資料的架構。同時,他們的架構還可確保系統能夠平穩執行。

本文選自china-cloud.com,連結地址為:http://www.china-cloud.com/yunjishu/shujuzhongxin/20120927_15263.html

圖片為@圖靈劉紫鳳 手工新增。選自《大資料:網際網路大規模資料探勘與分散式處理》圖書封面插圖,略有改動。

相關文章