AI到底誰才是行業第一,很多人在追問這個問題,很長一段時間誰也給不出令多數人信服的答案。
作為一個複雜、綜合的未來社會趨勢,評價AI誰最領先很難有全面量化的標準,但大眾與輿論又不免要去論個高低。
現在,當阿里巴巴在杭州雲棲大會上不再像過去那樣藏著掖著、一次放出一點資訊,而第一次完整地、系統地將阿里AI版圖呈現出來時,這個問題似乎已經有了答案——高調亮相“AI完全體”的阿里巴巴,在“雲第一”後已經做好了搶奪“AI第一”的充分準備。
與此同時,從整個行業來看,我們如何認識AI、看待AI、評價AI發展優劣與潛力,或也有了相對客觀、統一的標準。
一枚含光800,折射AI領域的“AI完全體”競爭
整個雲棲大會熱料很多,但達摩院院長、阿里雲智慧總裁張建鋒現場展示的被稱作“全球最強AI晶片”的含光800無疑成為最受關注的亮點之一。
這是平頭哥第三款“晶片類”產品,確切地說,玄鐵910作為IP核挑戰的是晶片基礎架構,而含光800則是完整意義上的晶片,加上為晶片設計者提供助力的一站式晶片設計平臺無劍SoC平臺,阿里至此形成了完整的晶片設計鏈路。
而以“含光800”為關注核心,加上阿里巴巴AI的全系展示,一個“AI完全體”的行業競爭格局也露出水面。
1、AI競賽本質就是“AI完全體”的競賽
阿里這次完整展現出的AI體系,如果非要做一個總結,應當是一個從底層往表層的“倒金字塔體系:
由晶片、雲端計算、邊緣計算、終端等組成基礎層;
由飛天大資料平臺、飛天AI平臺、飛天AIoT平臺組成平臺層,向合作伙伴開放;
平臺上承載AI服務層,提供自然語言處理、視覺計算、智慧語音、自動駕駛等完備的AI服務;
最頂層,AI服務進入產業,構成了我們日常可見的AI對生產、生活的觸達,包括阿里內部AI應用,例如菜鳥智慧物流等,以及外部產業實踐,例如城市大腦等。
問題在於,阿里已經在基礎層有了包括intel在內的戰略合作伙伴,為何還要開發含光800(很明顯未來還會推出更多晶片)?
拋開晶片自主這類宏觀的問題不談,其原因應當在於,作為AI巨頭,阿里必須把AI打造成“AI完全體”。
眾所周知,定製化的NPU比通用晶片更高能效的算力,因為自己設計的NPU可以把自家軟體層面的演算法直接寫入硬體,不像通用晶片還需要經過一道轉碼。在這種情況下,阿里巴巴集團內的影片影像識別/分類/搜尋、城市大腦等基於共同演算法核心的應用,都可以直接透過含光800快速完成。
也即,從基礎層、平臺層、服務層到應用層不僅是承載、托起的關係,它們還有著內在的上下一致性,不是積木結構,而是“魯班鎖”結構——這就是“AI完全體”。所以,含光800不是秀技術的產物,而是阿里AI體系走向更緊密、上下進一步打通的必然結果。
事實上,幾乎所有AI巨頭都建立了這樣一套類似的AI體系,從基礎到平臺到服務到應用,只是內容深淺不一,體系化邏輯別無二致。各類科技新聞中,巨頭們也都在開發自己的XX晶片,構建起專屬於自己的多層融合更緊密、上下打通的“AI完全體”。
脫離宏觀抽象的AI概念,AI競賽的本質,其實就是可見、可觸控的“AI完全體”競賽。
2、“反木桶效應”決定誰能拿下真正的行業“第一”
既然“AI完全體”是體系化概念,那麼自然而然,其競賽會涉及一個很重要的概念“木桶效應”:木桶的短板代表木桶的裝水量。
因此,巨頭們都在拼命補齊每一處木板,可以想見,未來類似含光800的晶片在行業內會以各種名頭出現,而開放平臺、AI服務、產業應用各個AI巨頭都會全面進軍,力求自己沒有遺漏某塊木板。
但是,“木桶效應”只是決定競賽資格的入場券,AI競賽要獲得領先必須依靠“反木桶效應”:木桶的盛水量上限和潛力由木板的長度決定。
“木桶效應”只是提示不足,不能解決優勝的問題。而阿里AI在做的,一直是把更多AI“木板”建設得更“長”。
仍然看含光800,在這款晶片帶來的AI算力在杭州城市大腦的業務測試中是普通GPU的10倍——主城區交通影片處理原來需要40顆傳統GPU的,現在僅需4顆含光800。此外,拍立淘商品庫每天新增10億商品圖片,使用傳統GPU算力識別需要1小時,使用含光800後可縮減至5分鐘。
又例如,算力、演算法、資料等AI“木板”中,各平臺都在建設自己的大資料平臺,而阿里雲不久前釋出的飛天大資料平臺單日資料處理量超過600PB,可擴充套件至10萬臺計算叢集,一出世就已經公認成為國內規模最大的大資料計算平臺。
類似的案例還有更多,可以看出,阿里AI在公眾認知中的曲線沒有平滑過渡,過去是0,一出現就是100,其“AI完全體”的構建,一開始就在遵循”反木桶效應”,力求把每個要素都建設成“長木板”,而不是像很多網際網路科技巨頭做AI那樣“沒有短板”。
也許,只有這樣的“AI完全體”,才能在阿里“雲第一”外匹配上一個對應的“AI第一”。
AI“晚成”,不僅因為阿里商業光輝掩蓋
都說阿里的AI成就被商業光輝所掩蓋,但從“AI完全體”打造“長木板”的角度看,這種說法並不全面。商業光輝的掩蓋是一種被動結果,而阿里AI更主動選擇了一條潤物細無聲的發展道路,當一切呈現出來,才發現它已經超前行業。
1、“No Free Lunch”,度過沉默期的AI才是好AI
在雲棲大會上,阿里巴巴自動駕駛實驗室負責人王剛提出了一個AI領域非常有意思的觀點——No Free Lunch:如果想用通用的演算法解決所有的問題,那麼沒有付出就沒有回報,(AI應用)不可能取得非常好的結果。
也即,AI應用永遠不能盲目相信可以存在一個演算法包打天下,總是要針對不同的細分場景、細分狀況作出對應的演算法最佳化,甚至創造單獨的演算法。
直白地說,雖然有些顛覆性的演算法可以產生神奇的效果,但真正有價值、能夠成為“長木板”的AI沒有捷徑可以走。
以自動駕駛為例,阿里自動駕駛已經有了長足的進步,技術上已經可以實現時速40-50公里時轉彎、躲避障礙物等功能,且已經在末端物流開展應用,就是主動認同“No Free Lunch”的結果。
阿里的自動駕駛將自動駕駛技術做深做細,採用將交通場景深度細化和分類從而進行針對性演算法最佳化的方式,例如,不再採用傳統自動駕駛的高速公路、城區道路、晴天雨天等粗放分類方式,僅“cut in”情境下(粗略理解為正常行駛下前方社會車輛突然變道、加塞),就形成了25種細分情境(例如正常距離cut in、從輔道cut in等),每個小類都對應一個最佳化演算法,Pay for lunch。
可以預見的是,如果有100個場景,阿里的自動駕駛就會去實現這100種細分的最佳化演算法,其結果,是阿里自動駕駛不會憑藉幾個通用演算法就公之於眾,它必須逐步改進和積累,度過漫長的沉默期,在這個過程中默默攻克大量的自動駕駛難題。
2、選擇了準備期長的道路,就選擇了早期的蟄伏
晶片的種類有很多,大到計算機CPU、GPU,小到各種控制單元,某種程度上,很多科技企業都一窩蜂宣稱自己造芯,已經把“晶片”這個概念玩壞了。
有價值的晶片,一定存在著無法壓縮的長時間週期,在魚龍混雜的輿論場中,很多中小科技公司甚至巨頭會拿一些晶片領域較為初級的產品來博取眼球。
阿里不能這麼做,因為有很多“懂行”的眼睛在盯著;阿里也沒有選擇這麼做,在媒體集中採訪環節,達摩院透露含光800的研發週期超過兩年。
對瞬息萬變的網際網路而言,兩年的時間足夠一個新風口起落、一個新賽道的站位,但既然要選擇全長木板式的“AI完全體”打造,阿里只能選擇這種準備期長但價值也更大的晶片道路。
在晶片之外的其他需要長期投入的領域,例如AI平臺、AI引擎框架上都是如此,好在,商業光輝雖然掩蓋了AI技術的光芒,但也提供了足夠大的庇護所。只不過,從輿論和大眾認知角度,阿里的這些選擇,會造成“輿論只有突然爆發沒有平穩上升逐漸顯露”的現象,蟄伏成了過去阿里AI的關鍵詞。
3、選擇“實用”而不是選擇“講故事”,就必須被迫接受價值與認知的錯位
阿里AI在杭州城市大腦的運作已經為人所熟知,不管是城市交通治理,還是政務的全面數字化,已經成為智慧城市的典型。
但是,此次雲棲大會系統講述的阿里雲和蕭山國際機場合作案例,卻給出了看待城市大腦的新穎素材。
作為國際性大型機場,蕭山機場過去在高峰期十分繁忙,一天流量要到數百架次,塔臺工作人員可能同時要控制四五十家航班,因為不允許犯任何錯誤,挑戰可想而知。阿里AI的定製化機坪最佳化還原技術,做到了還原每一架航班從降落、滑行、停靠廊橋、退出、離開各個保障節點,幫助工作人員調控的同時,還能對準點率提出調控建議,最終提升機場的工作效率和安全性。
這種機場交通效率的最佳化,實實在在發生在我們身邊,或許每一次正點飛行就有AI的功勞。
類似地,在工業領域,過去幾年阿里工業大腦已經進入鋼鐵、水泥、石化、環保等細分領域,例如與瀚藍環境的合作中,以AI輔助人工的方式去操作鍋爐,使得鍋爐的燃燒穩定性提高23%,創造了實在的收益,降低了工作疲勞度;又例如與協鑫光伏合作,AI最佳化製造工藝和流程,提升了對科技企業效率至關重要的良品率。
總體而言,阿里AI的應用都選擇了“實用”的路線,而不是一開始就講大道理、大藍圖,這與阿里巴巴電商服務的出身有關,一切服務輸出都必須講究真實的、有價值的效果。
其結果,也造成阿里AI“潤物細無聲”,沒有高調宣揚只有內外部服務物件的認可,過去大眾和輿論對其的認知和其實際創造的價值錯位,價值高而輿論認知弱。
從雲第一到AI第一,是一條早已定好了規則的路
在雲+AI+大資料已經成為標配的時代,AI潤物細無聲,但也需要雲端計算承載並拓寬其應用。雲的輻射能力對AI的落地應用廣度有著不言而喻的價值,某種程度上,“AI完全體”最長的那塊木板就是雲——“雲第一”是“AI第一”的必要條件。
現在,阿里雲頭把交椅位置不可撼動,而與此同時,未來阿里AI的執行軌跡或也顯露出來,從雲第一到AI第一,是一條早已定好了規則的路。
作為龐大的商業帝國,數千億美元市值的阿里旗下有30多家公司,本身就是一個巨大的實踐場所,而多年來阿里系的技術和服務都呈現統一的發展路徑:先服務足夠體量的自家產品,再進行外部平臺化開放,高調露出。
在螞蟻金服獨立估值前,支付和金融科技業務已經在阿里內部發展和服務多年,隨後順勢發展成龐大的平臺化金融科技企業;
阿里雲早期服務於阿里巴巴電商不斷膨脹的計算需求,隨著整個網際網路科技的迅猛發展,最終在內部服務的基礎上開放出去,奪取了龐大的市場份額;其中的飛天大資料平臺,最開始也是服務於阿里電商的產品,尤其是峰值訪問等技術難點的攻克,最終開放出去成為行業首屈一指的大資料平臺。
現在,AI的軌跡也將是如此。
應用視覺AI的拍立淘服務阿里電商平臺的優質產品,為普通消費者提供極大的購物搜尋便利;應用語言識別技術的阿里小蜜,在客服、營銷、直播等領域有大量應用;刷臉應用在支付寶、菜鳥等平臺上進行了廣泛實踐;語音互動的天貓精靈已經成為國內智慧音響行業第一;協同辦公平臺釘釘早已應用智慧客服、實時翻譯等諸多AI技術……
同樣的技術在這個時間點達到成分成熟後,開始大舉進攻外部賦能,例如阿里視覺AI在工業質檢領域開始發力,幫助製造企業尤其是精密製造提升檢測的準確率和效率、降低質檢成本,或者在醫療影像領域攻克除常規肺結節之外更多疾病的鑑定效率難題。
當阿里AI形成可以對外賦能的AI完全體,每天呼叫超1萬億次、服務全球10億人後,可以料想的是下一步將在AI領域藉助阿里雲的輻射能力開啟“規模化複製”的道路。
某些領域,這一切已經開始發生,最典型的杭州城市大腦早已不是孤例,中國人口最多的30個城市中,已經有包括北京、成都、重慶、廣州在內的1/3裝上了城市大腦,可以推測的是,下一步城市大腦將在更多城市規模化擴充。
憑藉幾乎都是“長木板”的“AI完全體”,阿里AI在實現現實價值的同時於公眾認知中將會迎來一波高密度的曝光,畢竟,蟄伏期過去,是到了秀肌肉的時候了。