趙丹(Diana):消滅碼農才是正經事(圖靈訪談)

盼盼姐發表於2013-06-19

圖靈訪談之四十八(2):女程式設計師特輯

趙丹(Diana):1973年生於天津,1996年畢業於廈門大學法律系,長期從事軟體設計開發工作,現任天津海量資訊科技有限公司首席架構師。業餘時間愛好戶外運動,曾攀登過5000米雪山,完成過北京馬拉松全程。

enter image description here

最早接觸程式設計是什麼時候?

我上小學的時候,我爸爸的廠子裡有一個計算室,他經常帶我去那裡玩。計算室裡有兩臺Apple II,所以我經常趁人不在的時候擺弄機器,玩玩遊戲什麼的。所以我從小學5年級的時候就開始程式設計了,我經常用Apple II上自帶的Basic寫點程式。後來他們廠子又來了一臺很小的可程式設計計算器,夏普的PC1500,上面也可以敲Basic程式,旁邊還有一個小印表機,可以在小紙捲上打出程式執行結果,畫出各種各樣的圖。更妙的是那個印表機還能打顏色:紅的、藍的、綠的、黑的,能畫出漂亮的圖。因為這個機器很小,所以我在家的時候也能玩。

後來是怎麼成為一位碼農的?

我大學學的是法律。畢業以後我在政府機關呆了兩年,覺得太沒意思了,所以經常在論壇上討論各種技術問題,後來在論壇上的一位老大要招人,問我願不願意來,還好我還有一個高階程式設計師證,於是我流竄到北京來,在當時很大的一家網際網路公司瀛海威找了一份工作。

99年的時候其實機會還挺好的,後來被一幫炒作概念的人給搞砸了。當時銀海威和新浪、網易、搜狐都打算去美國上市。但是瀛海威比其他公司都複雜一點,它起步比較早,另外股東關係比較複雜。後來大股東把創始人和小股東都趕走了,找了一家香港做上市運作的公司來做上市之前的準備。這些香港人把瀛海威的概念包裝到自己的公司上,在香港把自己公司的股票炒高了幾倍。後來瀛海威自己也不搞技術,也不建設平臺,倒是花了很多錢裝修,在東方廣場租了一層樓,場面上做得很大,沒有任何實質的東西。當時我就感覺到這個公司太不靠譜了,於是就離開了。

後來我創業搞了一家小公司,當時我們本來是做電子商務的,但是為了補貼花銷我們也接了一些開發的活兒。後來雖然電子商務的公司死掉了,但是我們開發這邊還有專案在做。後來我又接了一些奇奇怪怪的專案,曾經想過把一些專案做成開源,擴大影響,但是因為我個人身體原因,精力跟不上了,還住了一段時間醫院,所以也不能進行下去了,畢竟還是命重要啊。

於是我又變成了打工一族。這比一個人扛一個專案輕鬆太多了,給人打工是件很容易的事情,既不用哄客戶,也不用催款,什麼都不用擔心。我現在仍然在一線開發,我總不能要求我們部門人人都要程式設計,然後自己什麼都不幹吧。但是我團隊裡的小孩子們現在都很給力,所以我現在也很省心。

你現在的工作內容是什麼?

我是我們公司一個有點科研味道的部門Leader。我們做的是資料分析的一些相關技術,我們在網上抓文字,在文字里抽取一些結構化資料,然後再把這些資料添到分析化模型裡面做分析,然後為客戶生成分析報告。

對於現在的專案,我未來打算開源其中的一部分,開源是一個很好的形式。如果我們做的東西有水準,就會吸引有水準的人和我們一起做,這些人分佈在世界各地,把這些人都招進來是不可能的。但是他們可以和我們一起工作,可以幫我們提意見,也會貢獻很多思想。全世界想做這件事的人應該有很多。

你從什麼時候開始覺得碼農是個不人道的職業的?

我從中學的時候就覺得程式設計這件事太沒有技術含量了,我就想,怎麼會有人做這種傻事呢?這種事不應該由人來做,而應該相辦法讓它自動完成。當然那時候想法也不很系統,但是這個想法卻一直留在我腦子裡。現在仍然需要人來做很多重複的工作,而且這些事還很容易出錯,這是主要的問題。“消滅碼農”已經變成我人生中一個遠大的目標了。當然,我有生之年也未必實現的了。

我的優勢是會程式設計,還有資源在網上做實驗,另外還有機會接觸大量的資料。我現在做的和智慧相關的工作主要還是分析語義。如果只有好的想法而沒有做實驗條件也是出不來成果的,所以依託這些資源,可能未來會有些成果。但是也不一定,因為要在科研方面出成果就要提出新的理論新的模型,但是作為公司來講,關心的肯定的是要客戶感受到效果。這完全就是兩件事了。所以還是要等公司不太忙的時候我才真正有時間來做。

現有計算機的計算模型有什麼問題嗎?

現在的計算機模型可能只適合解決一部分問題,而面對另外一些問題好像就不太痛快。比如現在的計算機適合完成某些事情,像數值計算,而涉及另外一些邏輯不很清楚、模糊的判斷和決策的計算則不太適合。但是現在很多人在搞的統計學習,就讓這些問題的處理成為可能。所以如果把計算機的體系結構改一改,它就會變得很善於處理另一類問題。比如Google搞的超大規模神經網路,現在可以識別貓臉。這些計算需要一萬多臺計算機,如果換成神經元晶片的計算機,可能一臺就夠。

很多計算模型,比如多層次的無監督學習就能識別出各種東西,Google可以識別貓臉,那它識別花盆也沒問題。但是現在仍然只是停留在識別層面上,也就是隻能把一堆畫素變成視覺形象,而這些只是感覺層面上的第一步。第二步就是需要有一個綜合,就是不同物體之間有什麼關係,這步就沒有做到。第三步就是識別出的關係所構建出的場景間的互動。接下來我們還要進行抽象的思考。比如我可以用語言描述現在我們們所處的場景,這些語言變成了形式化的符號。在描述的過程中需要進行很多抽象思維。如果能做到這個層次的話,智慧就差不多了。也就是說,現在使用的很多識別模型不是分層學習,也不是規則引擎,每一步要用到很多分析工具才能把它說清楚。這些東西都需要自動組合起來,每次組合的方式都不一樣,各個輸出對應的輸入都是什麼?它們是如何自動組合起來的?這時候需要的是一種驅動機制。也就是說怎麼樣“一著急”就把它們組合起來了。

你認為突破性的研究成果缺乏的是什麼?

現在最需要的是各個領域的人才跨學科的合作。搞神經外科的人會覺得搞心理學的是一幫神棍,說的都不靠譜。搞心理的又說你們(搞神經外科的人)只能解決零件的問題,整體裝出來是什麼樣你們都不知道。心理現象肯定有神經機制來支援,問題是怎麼融匯貫通,神經的什麼動作會演變成心理上的某些感覺。

研究神經科學、腦科學、心理學,還有研究計算機、感測器的人,如果這些專家能夠綜合在一起,要實現人工智慧其實沒有想象中的那麼困難。比如人類在胚胎狀態從器官最初的幾個細胞,如何生長成一個複雜的器官——眼,然後眼睛如何把視覺訊號傳遞到腦中,如何形成場景的印象。這些過程其實都已經有人研究過了。現在最缺乏的應該就是學科的綜合。

你說過現在的計算模型是男性思維的產物,你認為女程式設計師數量少是什麼原因?

現代的科學知識體系是男性科學家為主導開創出來的,後人逐漸豐富,變成一個完整的體系。過去基本都是男性來做這件事,女性突破性思維比較少。這主要是因為男性的思維方式比較容易在男性主導的世界獲得認同。女性也會有各種各樣的想法,男的可能搞不懂女性在說什麼,可能會覺得:這個沒用,這不是瞎胡鬧嗎?在以前資訊的傳播很受限制,思想要是不寫下來就沒人知道,而男性總是優先獲得受教育的機會。而思想被記錄下來的成本很高,所以只有主流社會認可的東西才會被記錄下來、傳播開。所以在這樣的社會條件下,女性的思想是很難傳播和留存的。而現在就沒有這個障礙了。但是要想把這些都糾正過來,就需要很長的過程。女性參與進來之後就會製造適合女性的工具、知識體系,以及思維方法,然後才會有慢慢的改變。

你覺得需要鼓勵更多女性加入程式設計師的行列嗎?

程式設計師這種職業無關乎男女,但是至少不需要乾重體力勞動,女生可以勝任。我們的部門女多男少。因為男性的社會壓力比較大,要求待遇也比較急迫,目的比較功利。但是涉及研究的話,思維要開闊一點,不能成天想著這些事,相比之下女生更放得開。

另外,從計算機發展的角度來說,由於男性思維的侷限性,他們能想到的大多數已經都有人想到過了,有一些東西可能只有女性才能想到。因為這行女生比較少,所以還沒人想到,這也是女程式設計師的機會。


更多精彩,加入圖靈訪談微信!

相關文章