本文作者Zavain Dar,Lux Capital風險投資人。Foutainhop 聯合創始人。現任史丹佛大學符號制度課程講師。

1、之前二十多年的工作,主要涉及到數字化大資料集,建設基礎設施來管理大資料集,以及進行大資料集計算的正規化。這些都是主要的驅動誘因,也可以解釋說,我們這個時代,首先強調的其實還是“資料科學”,然後才是“人工智慧”。

2、一旦我們實現數字化資料,並獲得可程式設計的資料,那麼明眼人就能看出,下一步就是利用這些資料在未來實現自動化和預測功能。當我們的預測能力變得越來越好,越來越“智慧”,此時所謂的“資料科學”這個詞,才能逐漸的變成現在人們口中的“人工智慧”。但事實上,兩者之間並沒有很很明顯的區別,“唯二的”區別,可能是在對新穎和難度的感知上有所不同。實際上,所謂新穎和難度,其實都會隨著時間而發生改變,今天的“人工智慧”,就是明天的“資料科學”。

20150708100529467

3、對資料進行學習的人工智慧,被稱之為機器學習。傳統的機器學習使用的均是原始資料,然後提取出可以被人識別的語義(也被人認為是功能),接著,機器學習會從這些功能中再學習,繼而得出一個最終的機器學習模型。

20150708100726274

4、過去的十年,神經網路開始復甦,它是基於在哺乳類動物的大腦中那些鬆散的突觸連結,形成的一種機器學習架構。神經網路提取語義,讓人類進行處理。當然啦,在學習演算法中匯入的都是原始資料,這些資料都是沒有經過人類編輯的,於是,人們看似很隨意地就把它稱之為“機器學習”。

5、深度學習技術和學習模型已經存在了數十年,我們現在看到的,是一波理論創新的大潮,加上現在基礎設施和資料可用性愈發成熟,深度學習在經驗上也獲得了突破。2006年,NVIDIA推出了針對GPU的CUDA計算平臺,這是一個真正的分水嶺。

20150708100821211

6、主要是因為人類構建的功能具有一定獨立性,深度學習是學習的自然工具。在數學推理上,人類技能的開發優先於人類自身能力,比如有一些我們過去學到的技能,比如理解負載的數學和語義構建的能力。有一些人類天生就擁有的技能集合,其實很難以一種高水準功能的形式,來準確地表達出來。

高緯度資料問題,資料的維度越高,那麼它對人類來說,依靠傳統的機器學習技術來靠直覺感知就會變得更加困難,同時構建合適的功能也會變得難度更大。

7、對於那些在我們有能力構建複雜語義之前,已經開發的技能,我們已經在計算機視覺行業裡中看到了令人印象深刻的結果,自然語言處理,甚至是玩兒視訊遊戲。值得注意的是:這裡我們所學習的所有技能都不需要數學推理,因此他們是能滿足獨立意識的高層次語義需要的。

8、在廣義的高緯度深度學習問題上,深度學習已經展示了突破性的成績,舉例包括基因組學,石油和天然氣,數字病理學,甚至是公開市場股市。

9、最近,媒體在大肆宣傳人工智慧,因此人工一般只能也引起了人們的關注,它是一種假想的計算機模擬人類智慧代理。

10、在很大程度上,人工一般智慧是由那些基本擬人技能的深度學習成果尾風所驅動的,到目前為止,我們似乎還沒有什麼有意義的進展,當然也沒有什麼競爭力可言。從零到一,就像是在計算機視覺和自然語言處理上所作的努力一樣,也更好地說明了這個問題。

11、在不久的將來,這些努力似乎只能在筒倉(silos)上存在,在一些特殊的領域裡,一群人會孤立地進行工作。

12、我們開發人工一般智慧(AGI)的速度將不會受到任何一個筒倉的約束,但是我們有能力讓這些筒倉相互操作,並且通過合適的輸入和輸出渠道與外部世界聯絡。首個人工一般智慧可能不會是一個有人體表現的機器人,而是以一種實時線上的形式出現,它可以訪問全世界的知識,並且有能力通過網路來進行交流。

13、人工一般智慧將會模擬人類級別的智慧,但是不會表現的“像人類”,知道我們瞭解、學習自己內部更多的“目標函式”。目前,計算機正在被訓練,它們會有專門的域來指定目標函式,這樣能把錯誤減少到最小。直到我們能夠知道如何將我們自己內部的目標函式校準,實現標準化,人工一般智慧才會變得智慧,甚至還會顯示出一些意識,但不會變得“像人類一樣”。

14、2025年以後出生的孩子,他們會覺得軟體能有意識,這種現象可能會忽然出現,速度也會比我們想象的要快得多。

15、人工一般智慧對好壞區分的能力將會受到一定比例的限制,因為只有人類才能控制輸入和輸出渠道。未來,可能會出現很多有趣的爭論,話題就是人工一般智慧可能存在的潛在惡意行為。最早出現,同時也是一個非常有力的例項就是,我們爭論過自動駕駛汽車。

16、對於人工智慧初創公司來說,我們正處在一個上升的創新週期,同時也能有資金支援。

17、演算法和人工智慧學習技術商品化的速度,可能比我們預想的還要快。如果說這一領域裡的初創公司想要獲得成功,那麼就必須要不斷的用自己的人工智慧模型和使用者、企業進行互動,然後尋找一些獨一無二的資料,並且不斷鞏固自己的初期優勢。最著名的就要數谷歌公司了,他們可以獲取點選流資料,隨著時間,使用者(特別是企業使用者)可以利用這個資料作為私人資料來源,也可以進行學習互動,來提升自己的排名。

18、雖然我們身處在人工智慧的春天,但仍然是在早春階段。一旦有某個小團隊在人工智慧領域裡有所建樹,那麼大型科技公司便會砸下重金,進行收購和兼併。這些人工智慧領域裡的新奇成就,如果說允許外部成熟一些,即便存在一定風險,對於大型科技公司來說也是可控的,因此我們到目前為止,已經看到了在人工智慧領域裡有較大規模的收購或兼併交易出現。

19、人工智慧工具公司將會需要構建更具粘性的平臺,這樣才能在商品化相關產品的時候具有競爭力,同時也能讓風投看到一些有價值的產出。

20、最後,在未來五年,矽谷將會出現轉型過渡。如果那知名投資人Marc AndreeSSEn當初的一句話“軟體正在吞噬世界”來類比形容,那麼就是“資料科學和人工智慧正在吞噬世界”。

自 創業邦