只因寫了一段爬蟲,公司200多人被抓!
“一個程式設計師寫了個爬蟲程式,整個公司200多人被端了。”
“不可能吧!”
剛從朋友聽到這個訊息的時候,我有點不太相信,做為一名程式設計師來講,誰還沒有寫過幾段爬蟲呢?只因寫爬蟲程式就被端有點誇張了吧。
朋友說,訊息很確認並且已經進入審判階段了。
01.對訊息進一步確認
朋友認識幾個律師朋友,和他們有一些業務來往,得知他們想嘗試把業務擴充套件到程式設計師這個群體。那段時間我剛好離職也有時間,在朋友的安排下一起聊聊看看有沒有合作的機會。
他們為什麼想擴充套件人群到程式設計師這個行業呢?其實就是因為他們代理了這名程式設計師的官司,才發現很多程式設計師完全不懂法,直接說是法盲一點都不過分。
剛好我也很好奇程式設計師因爬蟲被抓這個案子,看看到底是怎麼回事,就和兩名律師以及朋友坐到一起,深入交流後才知道整個事件的來龍去脈。
這名程式設計師在被警察逮捕後,警察審問期間一直不承認自己觸犯了法律,並且也完全沒有意識到自己犯法了。進去之後總以為警察搞錯了,過幾天就會把自己放出來,結果也錯過了取保候審的機會。
律師說,這名程式設計師的媽媽當時在他畢業的時候,就因程式設計師這個行業太辛苦不同意他做程式設計師,但他對這個行業一直都很感興趣,堅持做了一名碼農,沒想到兩年後出現了這個事情。
他們家裡人都後悔死了,距離事發當日到現在已經過去了半年,當事者還被關在監獄中。不管這件事如何收尾,對這名程式設計師和他的家庭都是一個很大的打擊。
以下內容根據部分推測和網上資料整理而出,可能會有細微偏差。
02.一個爬蟲引發的案件
某一個知名網際網路公司,突然發現公司的伺服器連續幾天壓力倍增,導致公司內部系統崩潰不能訪問,公司領導責令技術部儘快解決。
該公司系統平時訪問量一直比較平穩,但不知為何這幾天系統壓力突然大增,經過技術人員幾天調查發現了一個驚人的真相,公司客戶資訊被抓取,並且某個介面訪問量巨大。
隨著技術人員的深入調查發現的現象更加震驚,入侵者利用這個入口已經竊取了大量的客戶資訊,並且所有的線索都指向了一家大資料公司。
這家公司的主要業務就是,出售簡歷資料庫。經核查該公司出售的簡歷資料中,就包含自己家客戶的簡歷資訊。
技術部上報領導之後,公司開會商議後決定報案。
03.案發現場
案發前一段時間,小明(化名)接到了技術部領導的需求,要求寫一段爬蟲批量從網上的一個介面抓取資料,爬蟲開發完後測試沒有問題,小明就將程式上傳到了公司伺服器。
程式執行了一段時間後,也許是有了新的需求,也許是小明想對爬蟲程式進行進一步的優化,將爬蟲的執行緒數,由原來比較小的值調到一個比較大的值。
完善後的程式上傳到伺服器後,小明跟蹤了下爬蟲的進展,執行平穩並且速度快了很多。提交之後像往常一樣,小明就把這件事情忘了。
小明沒想到自己這次提交的爬蟲程式,竟然能把對方的服務搞掛了,也沒想到自己因為寫了一段程式碼而坐牢。
04.整個公司被抓
2019年的某一個工作日,公司員工像往常一樣忙忙碌碌,某個程式設計師和產品經理正在為了一個需求爭吵,小明帶著耳機正坐在辦公室敲程式碼。
突然就來了一大群警察,要求所有人離開工位,雙手離開電腦、手機等裝置。整個公司的人都懵了,不知道發生了什麼事情,但也都照辦了。
警察很快查封了公司的所有辦公用品,問技術部相關人員要了伺服器的資訊,公司全體上下 200 多人無差別的全部送到看守所瞭解情況。
在去看守所的路上,大家都還心裡想這是不是搞錯了,我們只是一個科技公司公司又沒有騙人,怎麼就集體被抓了。
小明也一直認為自己沒有犯罪,自己只是一名技術人員而已,所有的工作也都是按照領導要求來執行的,應該很快就會把我們釋放了吧。
隨後,公司非核心人員都被釋放了出來,主要集中在 HR、行政人員。最後確認公司 36 人被捕,其中大部分是程式設計師。
被捕後小明委託的律師事務所,就是和我們交流的兩位律師的事務所,據說小明入獄後就一直不認為自己有罪,也因一直拒絕認罪從而錯過了取保候審的機會。
目前小明還在等待最後的審判。。。
05.涉事公司背景
巧達科技號稱是中國最大的使用者畫像關鍵資料服務提供商,專注於大資料及人工智慧領域前瞻性產品研發,客戶覆蓋網際網路行業及泛金融領域。
高管多為百度出身,公司2017年淨賺1.86億元。
公司2014年7月成立,B輪估值2億美元,目前已經到了C輪融資階段,投資者包括李開復創新工場、百度風投齊玉傑、中信產業基金、人工智慧產業基金等等。
巧達的創始人成予曾經是百度第一任產品部負責人、聯合創始人沈毅曾經是百度電子商務事業部技術總監和百度愛樂活技術副總裁。
公司曾宣稱通過整合多達2.2億份自然人簡歷、100億個使用者識別ID組合和1000億+使用者綜合資料,繪製出了涉及中國8億人口的多維度資料。其中,包含個人隱私與非隱私資訊。
此外,巧達科技還有超過10億份通訊錄,並且掌握著與此相關的社會關係、組織關係、家庭關係資料。結合簡歷、通訊錄,以及外部獲取的超過千億條其他使用者資料,巧達科技自稱擁有超過8億自然人的認知資料。
也就是說,超過57%的中國人的資訊都在巧達科技的資料庫裡面。
“基本上所有你能數的上名的大型網際網路公司,都是巧達科技的客戶。”一位之前簡歷中介生意的從業者。
06.近期多個大資料公司被查
最近的大資料行業,風聲鶴唳。
在中秋節前一天,中國電信控股的子公司天翼徵信傳出風聲,其總經理、副總經理以及市場人員被警察帶走,原因是與其合作的大資料公司被警方調查。
在天翼之前,新顏科技CEO黃向前被警方帶走、魔蠍科技公司CEO周江翔涉事被查、公信寶公司門口被貼了封條、知名第三方資料服務公司聚信立宣佈將暫停對外提供使用者授權的運營商爬蟲服務……
此外,國內大資料風控平臺龍頭同盾科技也被曝爬蟲部門已解散,CEO蔣韜已出國避風頭,對此,同盾科技昨日發表闢謠宣告表示,子公司杭州信川科技有限公司確實停止爬蟲業務,但其他言論均屬不實。
.....
據內部訊息,最近監管對資料亂象出手,開始清理行動,15家公司被列入調查名單,其中幾家估值都超幾十億。
國內很多大資料公司的資料來源多多少少都有一定的問題,隨著我國今年6月1日起,《中華人民共和國網路安全法》將實施,所有的網上行為將越來越嚴格,如果還按照之前的慣性去操作,遲早會出問題。
07.程式設計師謹慎使用技術
不知道大家是否發現,隨著國家經濟的不斷髮展,以前可能處於灰色階段的行業,現在幾乎都慢慢不能做了。寫這篇文章的目的,也是為了警示大家技術是無罪的,但是用到了錯的地方代價也是非常巨大的。
我之前看過這樣一個報導,一個程式設計師因為愛好寫了一個程式(入侵工具),並且把此程式上傳到了網際網路上,沒想到過了兩年之後,有人利用這個小程式非法獲利500多萬。
雖然這名程式設計師並沒有因為這個程式而獲利,但是間接給犯罪人員提供了犯罪的工具,最後被判刑 2 年緩期 2 年執行。
程式設計師的生活是簡單的,工作大概也只關心程式碼和BUG。小明也從來沒有把自己的職業和犯罪聯絡在一起。
技術本身是不違法的,就好像一把水果刀,如果用來削蘋果削梨沒有任何問題,但是用來傷人就是凶器,就要被列入物證list。
爬蟲也是如此,在大多數情況下,只是採集網際網路上的公開資訊,很難說是違法行為。但是一旦涉及入侵到別人系統去獲取資料,那必然存在著法律風險。
可能很多同學是懵的,很多網際網路公司就是靠抓取資料活著的。他只是正常執行公司安排的工作任務,怎麼就涉嫌犯罪了呢?
這裡結合律師朋友給出的一些建議,這裡摘錄出來僅供參考。
08.單位犯罪和個人犯罪的關係
首先了解一下單位犯罪。除了自然人犯罪,還有單位犯罪,是指公司、企業、事業單位、機關、團體為單位謀取利益,經單位決策機構或者負責人決定實施的,法律規定應當負刑事責任的危害社會的行為。
我國刑法對單位犯罪原則上採取雙罰制度,即單位犯罪的,對單位判處罰金,並對其直接負責的主管人員和其他直接責任人員判處刑罰。相關司法解釋規定,在審理單位故意犯罪案件時,對其直接負責的主管人員和其他直接責任人員,可不區分主犯、從犯,按照其在單位犯罪中所起的作用判處刑罰。
因此,公司犯罪有可能會牽連員工,尤其是案件中對非法獲取資料有直接責任的爬蟲工程師。這也是為什麼當事人在公司人小言微但還是被批捕的原因。
其次,是否可以“不知者不為罪”來辯解?刑法原則之一是法無明文規定不為罪,並沒有“不知者不為罪”。主觀上的惡意是衡量犯罪的要素之一,結合客觀上的行為來推理主觀惡意。破解別人的伺服器,獲取別人不公開的資訊,不能說沒有惡意,不能以不懂法來搪塞。
09.重點:什麼樣的爬蟲是違法?
如果爬蟲程式採集到公民的姓名、身份證件號碼、通訊通訊聯絡方式、住址、賬號密碼、財產狀況、行蹤軌跡等個人資訊,並將之用於非法途徑的,則肯定構成非法獲取公民個人資訊的違法行為。
除此之外,根據相關規定,對於違反國家有關規定,向他人出售或者提供公民個人資訊,情節嚴重的,竊取或者以其他方法非法獲取公民個人資訊的,均可構成成“侵犯公民個人資訊罪”,處三年以下有期徒刑或者拘役,並處或者單處罰金;情節特別嚴重的,處三年以上七年以下有期徒刑,並處罰金。
重點關注:下列情況下,爬蟲有可能違法,嚴重的甚至構成犯罪。
爬蟲程式規避網站經營者設定的反爬蟲措施或者破解伺服器防抓取措施,非法獲取相關資訊,情節嚴重的,有可能構成“非法獲取計算機資訊系統資料罪”。
爬蟲程式干擾被訪問的網站或系統正常運營,後果嚴重的,觸犯刑法,構成“破壞計算機資訊系統罪”
爬蟲採集的資訊屬於公民個人資訊的,有可能構成非法獲取公民個人資訊的違法行為,情節嚴重的,有可能構成“侵犯公民個人資訊罪”。
10.最後
最後提醒大家敬畏法律,熱愛生活。
願每一個程式設計師都可以用自己的技術去改變世界,讓我們的社會變得更加美好!
參考:
燃財經:利用爬蟲獲取簡歷 36人被批捕
支付百科:現金貸風控遇至暗時刻:整個行業快被抓完!
推薦閱讀:
作者簡介:純潔的微笑,一個有故事的程式設計師。曾在網際網路金融,第三方支付公司工作,現為一名自由職業者,和你一起用技術的角度去看這個世界。我的微訊號puresmile2,歡迎大家找我聊天,記錄你我的故事。
< END >
純潔的微笑
一個有故事的程式設計師
微信掃描二維碼,關注我的公眾號
相關文章
- Python 爬蟲、抓包Python爬蟲
- 【爬蟲】網頁抓包工具--Fiddler爬蟲網頁
- “來我公司寫爬蟲嗎?會坐牢的那種!”爬蟲
- 爬蟲技術成就了這些商業公司的爬蟲
- Python爬蟲入門教程 61-100 寫個爬蟲碰到反爬了,動手破壞它!Python爬蟲
- 寫個爬蟲唄爬蟲
- 用一段爬蟲程式碼爬取高音質音訊示例爬蟲音訊
- 聽說你好不容易寫了個爬蟲,結果沒抓幾個就被封了?(附工具)爬蟲
- 【爬蟲】網頁抓包工具--Charles的使用教程爬蟲網頁
- 3 行寫爬蟲 - 使用 Goribot 快速構建 Golang 爬蟲爬蟲Golang
- Python爬蟲:手把手教你寫迷你爬蟲架構Python爬蟲架構
- 防止爬蟲被反爬的幾個主要策略爬蟲
- 如何防止網路爬蟲被限制?爬蟲
- 【Python學習】爬蟲爬蟲爬蟲爬蟲~Python爬蟲
- 爬蟲技術不只是用來抓資料爬蟲
- 爬蟲分析利器:谷歌Chrome F12抓包分析爬蟲谷歌Chrome
- 不用寫程式碼的爬蟲爬蟲
- 新手寫的視訊爬蟲爬蟲
- 為什麼很多人入門選擇Python爬蟲?Python爬蟲
- 爬蟲基本功就這?早知道幹爬蟲了爬蟲
- python爬蟲總是爬不到資料,你需要解決反爬蟲了Python爬蟲
- 手把手教你寫網路爬蟲(2):迷你爬蟲架構爬蟲架構
- 什麼是網路爬蟲?為什麼用Python寫爬蟲?爬蟲Python
- 防止爬蟲被限制的三種方法爬蟲
- 你有自己寫過爬蟲的程式嗎?說說你對爬蟲和反爬蟲的理解?爬蟲
- APP爬蟲-雙向認證抓包的兩種方法APP爬蟲
- 新一代爬蟲平臺!不寫程式碼即可完成爬蟲...爬蟲
- python爬蟲是什麼?為什麼用python語言寫爬蟲?Python爬蟲
- Python為什麼叫爬蟲?Python為什麼適合寫爬蟲?Python爬蟲
- 爬蟲(03)物件導向寫爬蟲(函式,類)2020-12-14爬蟲物件函式
- 基於nodejs編寫小爬蟲NodeJS爬蟲
- 使用JavaScript編寫的爬蟲程式JavaScript爬蟲
- 用Golang寫爬蟲(六) - 使用collyGolang爬蟲
- 工程化爬蟲的寫法爬蟲
- 爬蟲行動被限制?一招破解!爬蟲
- 導致爬蟲被限制的原因有哪些?爬蟲
- 爬蟲是如何被網站識別的?爬蟲網站
- 手把手教你寫網路爬蟲(3):開源爬蟲框架對比爬蟲框架