大資料和人工智慧正成為了這個時代的主題曲,與此同時,焦慮感也開始在行業中蔓延,從初創公司、行業巨頭到從業者,都急切地想要跟上這股越來越熱的浪潮。
但在資料化轉型的嘗試中,很多企業卻面臨著資料團隊建設目標不清晰、業務界限模糊、人才缺乏等問題。
我的公司是否需要獨立的資料團隊? 我該何時、怎麼樣建設自己的資料團隊?
2017年7月,清華大學資料科學研究院聯合《大資料文摘》釋出了首份《頂級資料團隊建設全景報告》。致力於盤點資料團隊建設現狀,回答資料團隊發展中面臨的問題,力求為行業內資料團隊的組建和高校資料人才的培養提供指導性意見。
在之前的課題基礎上,9月26日,今年的《2018頂級資料團隊建設全景報告》(下稱報告)在清華大學重磅釋出。
本次《報告》將鏡頭拉近,對準AI轉型浪潮中,資料團隊的變革情況,以及資料從業者的自我建設:在AI革命大潮下,資料團隊需要做哪些準備?多數資料從業者的對自己的認知更偏向AI還是資料?AI轉型中他們如何發展自己,如何看待自己的技術責任?
調研囊括110,000+條海內外網路資料分析、1,000+份調查問卷內容,和8位海內外業界大咖深度訪談內容,從資料團隊本身、技術從業者和高校三個方向,給出了一幅頂級資料團隊建設圖景。
以下為《報告》部分要點。
人工智慧大背景下的資料團隊建設
人工智慧正在成為時代重要議題,也對資料團隊建設產生了重要影響。部分資料團隊也已經承擔或者計劃開展人工智慧相關工作。
據調研問卷結果顯示,人工智慧技術已經成為一半以上資料從業者所在機構的戰略性議題。八成以上從業者考慮在未來工作中更頻繁使用人工智慧相關技術。
在人工智慧專案實施上,18%的機構直接由原有資料團隊實施,14%的機構為資料團隊轉型的AI團隊實施,22%的機構新建AI團隊實施專案,10%的機構將這一工作外包出去。
Python為資料從業者使用最多的資料分析工具,但C、C++、JS 含金量最高
根據資料相關職位描述中要求的程式語言資訊以及相對應的薪資水平,我們計算出了每種程式語言的“技能含金量指數”。
從資料分析結果來看,Python可以說是資料從業者中最受歡迎的程式語言,問卷調研的受訪者中,超過 7 成在工作中需要使用 Python。
但大量的使用者也拉低了該語言的含金量。相反,使用人數佔比相對較少的 C、C++ 和 JavaScript 在市場上更具薪資競爭力。
多數資料從業者願意承擔相關技術責任,監管機構和團隊管理者更應該對技術後果負責
資料從業者是否應該在技術之外分出心力,瞭解技術背後更深的影響呢?這一在戰爭年代常引發巨大爭議的話題,在資料安全和人工智慧威脅日漸嚴重的今天,又被重新提上辯論場。
針對“開發者是否應該考慮程式碼的道德性?”,“如果需要為不正當的用途寫程式碼,你會寫嗎?”兩個問題,多數從業者選擇為自己的技術/程式碼結果負責。
開發人員或可以成為抵禦不道德程式碼和資料安全的最後一道防線。
在我們的問卷反饋中,針對“你認為誰應該為使用大資料與人工智慧技術帶來的道德問題承擔主要責任”這一問題,36%的受訪者選擇了政府/監管機構,30%選擇了管理者、19%選擇了技術人員。
在2018年 Stack Overflow 針對同一問題的全球調研中,近半數開發人員認為,機器學習和人工智慧演算法背後的創造者和技術人員最應該對人工智慧所帶來的社會問題負責。
Stack Overflow相關調研
https://insights.stackoverflow.com/survey/2018/#overview
相比國際從業者普遍觀點,中國資料團隊從業者在“技術責任”這一問題上更強調監管機構和團隊管理者的責任。
高校傳授技能與市場需求匹配存在偏差:高校注重基礎學科,市場更看重實操技能
透過對比國內高校傳授技能和公司技能需求,我們發現高校課程設計十分重視包括計算機系統、資料結構、高等數學等基礎課程,然而這些基礎學科能力並不常出現在市場招聘需求中。
然而,市場招聘需求中更多地提到了專案管理、產品設計與管理在內的實操技能,這些技能在高校課程中並不常見。
致謝:
為了答謝每一位填寫問卷的朋友,“完整高畫質版”將於2018年10月15日24:00前,免費透過問卷中填寫的郵件發給大家,再次感謝大家的支援。
最後也感謝報告團隊的辛勤付出~~
報告精華