正在消失的機器視覺公司

naojiti發表於2022-10-15

近兩年,號稱“AI四小龍”的機器視覺公司商湯、曠視、雲從、依圖,資本市場表現和裁員等傳聞,可能讓大眾覺得,機器視覺不是一門好生意,這個領域也沒什麼戲了。

情況顯然不是這樣的。一方面,計算機視覺(簡稱CV)仍是人工智慧技術應用比重最高的領域之一,相關應用是各行業數字化、智慧化的首選,基於機器視覺的工業質檢、巡檢、物流機器人、人臉識別等都在越來越多地落地,沒有道理AI很行、CV不行;另一方面,整個機器視覺市場仍在不斷增長,根據福布斯的預測,到2022年底,計算機視覺技術市場的價值預計將達到480億美元,並可能成為持續創新和突破的源泉。

顯而易見,不是機器視覺的生意不再性感了,而是頭部機器視覺公司講不好這個故事了。

然而,面對地緣政治的打壓、國內房地產基建旅遊等的放緩、海內外資本市場的現實情況,這種情況下,再用刻薄話去奚落“AI四小龍”的窘境,多少有點沒心沒肺。

當然,來自產業使用者和開發者們的真實聲音,也讓我們無法輕佻地說出“風雨過後終會見彩虹”“守得雲開,未來可期”之類的雞湯話。因為現實很可能是,等經濟大環境復甦,有的公司還能翻身,而有的可能就此沉淪。

時世變化之時,機器視覺公司又能朝哪裡走?是否真的看到了產業AI的變幻?如果要求生,目前有哪些急需開展的工作?這是我們想要探討的。

機器視覺還是一個好生意嗎?

以AI四小龍為代表的機器視覺企業表現不佳,被認為是機器視覺乃至AI商業化的破滅。畢竟這些企業在技術能力、商業模式、市場份額上都有絕對的領先優勢,如果連它們都難於盈利,不證明以演算法能力見長的AI獨角獸確實“德不配位”嗎?

讓我們離開一些媒體們“報憂不報喜”的習慣,到更廣大的產業世界去看一看。

過去幾年的時間裡,機器視覺作為AI技術最為成熟、應用最為廣泛的能力,是在積極被產業擁抱的。手機應用中的身份驗證、機場車站的體溫監測、安防領域的主動識別、工業領域的智慧質檢、交通領域的車流車輛識別……可能絕大多數人最先感知到的AI能力都是機器視覺。

以機器視覺作為轉型入口,推動行業/企業智慧化,在今天幾乎是共識。

業內有句吐槽:“AI+工業逃不出機器視覺的窠臼。”這真的是缺點嗎?我們採訪過許多工業企業,大部分人都提出,自家企業首先落地的就是質檢、巡檢這裡機器視覺應用。來自機科發展的一位技術人員告訴我們:這是現在大部分AI或深度學習落地的現狀,以機器視覺落點來推廣AI技術,目前還是一個不錯的戰略。

甚至於在高精尖的航空航天,機器視覺也是一些研究者在嘗試深度學習的首選。我們曾和一位航天領域的AI開發者交流過,為什麼很多航天AI應用都是影像類的,對方表示教育界同樣討論過這個問題。一來,影像處理領域已經形成了一套比較完整的體系,影像分類、目標檢測用得已經很多,可以很快得到不錯的效果。二來,深度學習是資料驅動的,航天領域本身就積累了大量的光學影像資料,其他載荷資料也可以引入AI模型,但效果沒有CV顯著。第三,從航天知識科普的角度來說,影像對於普通人來說是很直觀的,火星探測器或者月球探測器每次拍到的圖片更能引起公眾注意,率先引入CV帶來的社會意義更大一點。所以,目前無論是火星車還是其他航天器,都有很多人在與CV技術相結合去解決各種問題。

可以肯定地說,機器視覺是數字基礎設施中不可或缺的一個。隨著人們工作、娛樂、生活等各領域的影像資料越來越豐富、複雜、劇增,需要分析處理推理的能力也更多,必然會將機器視覺推向一個更大的市場。

或者反向思考一下,如果CV真的不重要、真的沒市場,還會成為對岸鄰居“封鎖”打壓的物件嗎?

正在消失的機器視覺公司
編輯

所以,機器視覺一定是值得大力發展和押注的。那麼新的問題又來了,以機器視覺起家的“AI 四小龍”營收和商業潛力,都不容樂觀,虧損的虧損,破發的破發,裁員的裁員。商湯科技直接在招股書中表示:未來仍有無法盈利的可能。CV公司真的還有前途嗎?

有心的讀者可能看過一些關於AI四小龍的分析文章,將其業績不佳的原因歸為技術研發投入過高、產業化能力欠佳、科技企業和傳統安防企業的圍剿等等。這些因素當然是存在的,但要改變卻讓CV企業左右為難。安防企業轉做機器視覺,投入難道就不高嗎?降低研發投入,原本的技術優勢也沒有了怎麼辦?產業有壁壘,是針對所有純演算法CV企業的,總不能大家都沒有辦法,集體躺平不幹了吧。

既然不能躺平,就要想想怎麼鹹魚翻身。那麼,來自產業客戶和開發者的聲音,或許能夠帶來一些“反常識”的思考。

“反常識”第一點:CV企業研發投入不是過大,而是還不夠

“AI四小龍”是公認在技術研發上投入很大的,但隨著業績走低,這被認為是拖累而非護城河。有一個說法是,“我們的首席投資官覺得,商湯能做的,其他公司其實也能做。雖然商湯技術更先進一些,但可能就相差了3個月到半年”。

技術不是壁壘嗎?大錯特錯,技術絕對是巨大甚至最大的壁壘。因為目前阻礙機器視覺在產業中規模化應用的頭號疑慮,就是CV技術的實際表現,不達預期。

CV落地產業最常見的問題,大概梳理一下就有不少。

1.替換效果不明顯。大家可能會覺得在AI賽事中刷榜就是很厲害的CV了,但需要注意的是,從85分提高到90分,就是學術界的突破了,然而在產業界中,可能要做到95分以上才能夠被應用。而且,比賽只是一群深度學習系統關起門來的比武,到了真實世界中,AI對面對的是企業長期使用、已經非常成熟的演算法。

正在消失的機器視覺公司
編輯

鄭州大學的馬老師,曾受邀為江蘇某無紡布企業開發缺陷檢測,他告訴我們,工業領域本身就有應用非常成熟的檢測演算法Halcon,演算法經過長期的積累和迭代,已經非常穩定了,而且計算量小,還不用標註資料和調參。相比改造和應用成本,機器視覺需要找到非常有吸引力的差異化應用場景和功能。

2.現實應用效能下降。在實驗室中表現很好的演算法“優等生”,一落地生產環境就成了“差生”。馬老師告訴我們,無紡布是以每小時36公里的速度在往外出布,要求機器視覺演算法在高速運動下精準地把缺陷畫出位置,技術挑戰是非常大的。這時候,傳統演算法因為計算量小、演算法成熟,識別速度反而比CV演算法還要快。而且現場環境並不標準、可控,有時候上午光透過玻璃反射,在無紡布上產生光斑,就會影響CV系統的檢測精度,誤報率很高。馬老師及其團隊經過了各種除錯,才讓準確率達到了穩定的數值。對於企業客戶來說,更希望引入的是成熟的技術產品,必須CV企業或研發人員做成了,告訴客戶確實能提高效益,有的企業才願意去嘗試。

3.應用場景的限制。質檢、巡檢可能是CV的關鍵場景,但對於工廠等企業來說,可能只是生產流程的環節之一,所以更多企業在智慧化的過程中,可能選擇以“打包”解決方案的形式去引入AI,而機器視覺可能只是其中一個點。某科技企業告訴我們,在為一個工廠做產線智慧化改造的時候,整個專案額是五千萬,其中視覺可能只有五十到一百萬。而且偏重工業一點的企業比如冶金、軌道交通、製造等對CV質檢的關注度更高,這些領域也是CV企業的紅海。

正在消失的機器視覺公司
編輯

採訪者直言,工信部曾經有某副司長帶隊,帶了十家AI企業去到各個公司一家家轉,尋找商務合作機會,結果發現,有石化公司提出,想用機器視覺檢測代替人工檢測,但對方的塔樓很高,讓機器人爬樓梯上去巡檢,還要保持較高的穩定性,這在當下是不可能完成的任務。最後AI公司們一評估,發現還做不了。類似這種情況還很多,很多企業真正關注的痛點,目前CV技術還無法給到足夠大的實質幫助。

大家想必已經發現了,實驗室和AI賽事上動輒碾壓人類的CV演算法,到了現實世界和產業世界中,依然有大的差距。即使是一些渴望AI、適宜CV的重點行業與落地場景,比如質檢、巡檢,目前仍然存在一些尚未解決的技術難題。

從這個角度來看,CV公司的商業化怎麼可能快速進入指數級增長,而頭部CV企業也並未能在這些產業客戶真正關心的問題上帶來眼前一亮的解法。

CV在內的AI技術並沒有那麼多噱頭和風口,成功應用的前提,就是技術本身的成熟度和價效比而已。研發之路,道阻且長,意義深遠,也是值得堅持並最終能拉開差距的。

“反常識”的第二點:CV企業營收不好,並不是因為不理解產業

很多人覺得純演算法的AI公司,在做B端市場時,容易因為不瞭解行業、不瞭解場景,而導致技術很強、但無法轉化。這固然是一部分原因,但不是最根本的原因。

AI與行業深度結合的難度,是眾所周知的。AI四小龍基本都有自己深耕的行業及場景,也都在積極地嘗試從純機器視覺轉型為更綜合的AI解決方案服務商。比如曠視將端側硬體與AI演算法相結合的物聯網解決方案;依圖重點解決算力問題;商湯的的“1(基礎研究)+1(產業結合)+X(行業夥伴)”模式;雲從聚焦在金融、出行等核心領域……換句話說,沒人比它們更想、也更努力地在瞭解產業。

更深層的原因或許是,瞭解了,但沒完全瞭解,也可能永遠也無法完全瞭解。

其一,在認知上,純演算法公司和實體行業有天然的壁壘。

目前工業領域智慧製造所提出的“智慧”,和AI領域所提出的“智慧”,同一個詞在概念和應用細節上其實是有區別的,比如AI界傾向於針對某個CV任務、構建模型、學習資料特徵,進而讓模型具有解決特定問題的能力,也就是純演算法能力。但工業乃至很多行業所想要的“智慧”其實是偏實體的,比如生產線的柔性化改造、製造裝置的互聯互通、以及數字孿生技術等。這種情況下,當CV企業開始進入產業的時候,就會出現“雞同鴨講”的現象。

正在消失的機器視覺公司
編輯

其二,在實踐中,純演算法公司的高人力成本不符合大規模定製所需要的經濟效益。

企業的數字化轉型需求“千人千面”,不僅僅是不同行業和領域,同行業不同公司之間也有著不同的需求,CV應用的場景是非常碎片化的,需要高度個性定製。這就出現了一個矛盾,CV企業要依靠大量人力成本較高的演算法工程師來解決所有行業需求,顯然是不合實際也成本過高的。

就拿工業來說,工藝、製造需求、專業的不同,都會造成在機器視覺系統所需要的機理模型完全不同,甚至同一領域不同產品間的差異也會很大,複雜度和工藝門檻也比較高。一個工業企業的負責人曾告訴我們,比如冶金鋼卷生產的缺陷檢測,鋼卷又分為冷軋、熱軋,這相當於四個問題,雖然都是機器視覺質檢,但AI要解決的機理問題是完全不一樣的,所以這一個企業、一個場景,都無法做到模型的通用化。而一對一模型的定製開發,又會導致落地成本和實施週期的增加。

腦極體團隊曾走訪過許多智慧化專案,很多細節都是待在實驗室裡根本想象不出來的。有家豬場希望用AI識別來監測豬的體溫,結果系統上線了之後檢測效果就是不好,一番排查發現是因為豬皮太厚了,溫度識別不準。還有家自來水廠,全部換成了智慧攝像頭,但平時卻基本不開,原因是攝像頭拍的高精度影片影像過於龐大,廠裡的網路沒有同步升級,上傳分析的速度很慢。有企業沒通知技術人員就直接在生產線上生產其他顏色的布,一下子就給CV系統整不會了……

正在消失的機器視覺公司
編輯

某AI開發者告訴我們,為一個工廠開發了活塞環檢測的AI硬體產品,其中幾萬個焊點都是他自己手動焊接的,當時的焊接過程還在抖音上直播過,還曾擰過三十萬顆螺絲。他說:不會有任何一個軟體公司會僱一個演算法工程師去擰螺絲,但恰恰因為沒有人做這件事情,所以很多做出來的系統會不符合工廠實際的情況,或者工廠會不信服企業提出來的方案。而正因為他會去跟工廠特別直接地交流,做過這些最基礎枯燥的手工活,所以提出的AI方案工廠一般都還挺信服的。

公開報導中,“AI四小龍”都表示過研發支出的很大一部分資金就在人才招聘上。一方面,收入規模與人力成本不成正比,營收情況不佳;另一方面,碎片化的智慧化需求也決定了企業在努力擴大人力也不可能完全覆蓋、規模化複用。

還是用那位AI開發者的話來說:中國可能有上百上千萬的加工廠都需要來使用AI,一家工廠可能不同產品需要不同的模型,是不可能來靠一些演算法公司的工程師來完成的,可能有大量的一線工人,只要學會用AI,就可以把比較成熟的CV演算法應用到生產一線。

換句話說,千行百業的智慧化必然需要各種各樣的CV應用與模型,當機器視覺技術從通用化、簡單化,走向多元化、個性化、場景化,也註定了頭部或大型CV企業,不可能憑一己之力訓練出所有模型、通吃所有市場。

“反常識”第三點:CV企業看起來被圍獵的是市場,其實是同伴

CV企業的商業化不理想,確實受到了傳統安防巨頭轉型AI、以及一些AI科技巨頭入局CV的衝擊。這些擁有資料、渠道、技術、生態等多方面優勢的巨頭下場後,似乎一些常見的CV細分市場就開始“卷”價格,以至於像“AI四小龍”這樣的機器視覺為主公司很受傷。

但反過來想,CV市場難道是被獨角獸壟斷的特殊行業嗎?

產業智慧化必然是由眾多AI開發者、ISV服務商和CV企業來共同完成的。而CV企業中可不只有巨頭,還有大量中小微企業,對於這些企業來說,來自開放平臺的賦能,恰恰是生存和發展的希望。

有視覺領域的創業者告訴我們,自己根本不會以初創公司的名義去跟甲方打交道,那可能連款都要不回來。他們公司是作為某些大型企業的合作供應商,大型企業為客戶做整體的系統用整合解決方案,這個CV初創公司解決其中一個小的視覺問題。如果一個小小的企業去單獨做專案,可能在專案驗收的時候遭遇到各種各樣的情況。

正在消失的機器視覺公司
編輯

“從我們實施的經驗來看,現在AI視覺面鋪得這麼廣,在很多問題上沒有太好的解決方案的,距離甲方的要求還有一定的距離。舉個例子,客戶的良品率已經接近100%了,驗收階段要求這條生產線跑一週,一週內的錯誤率不能超過三次,超過三次就不給你驗收。而AI模型,從80%調到95%可能好調,但從95%進到96%、97%就很困難,所以收款是非常困難的一件事情。”

除了商業模式上的難題,中小型CV企業還面臨著招人難、建立壁壘難的問題。前面提到,通用性強的CV賽道已經非常擁擠,價格戰明顯,並且透明度很高,很多企業客戶對於AI系統的成本是非常清楚地。“AI四小龍”尚且難受,中小微型企業自然更難以在紅海中建立壁壘。

然而另一方面來看,企業客戶其實並不在乎技術服務商是用什麼技術方法解決問題的,基於深度學習的計算機視覺也可以,傳統的機器視覺也可以,只要能夠滿足應用需求,並且成本可接受。這需要從基礎硬體、演算法、再到產業層的整體配合,這對於中小型CV企業來說也是一個機會,那就是可整合多元化的軟硬體與智慧能力,針對買家的需求來進行定製化滿足。這時候,科技巨頭們的AI開源開放生態、各類機器視覺大模型的推出、演算法市場生態等等,讓它們成為被選擇和被整合的物件,其技術和產品被二次封裝成為各種子產品,從而擴充套件了市場份額。

正在消失的機器視覺公司
編輯

有ISV服務商表示,在開發解決方案的時候選擇了康耐視的相機,這個相機裝置自帶一個面向工業視覺的演算法庫,買回去之後可以直接開發出更針對性的產品,部署的時候再買一個品牌的加密狗就可以了,所以完全沒有必要和動力再去買一套純演算法公司的演算法。

曾幾何時,“AI四小龍”這樣的演算法公司確實透過演算法市場化成為了時代的寵兒,但當產業智慧化的接力棒被交到更多元的開發者和服務商手中時,相比科技巨頭對優秀開發者資源的爭奪,大型CV企業確實反應遲緩、優勢有限。它們為股價痛苦憂慮的時候,已經有更多個人開發者、小微企業開發者在工廠車間、田間地頭開始寫程式碼、擰螺絲了。

正在消失的機器視覺公司

分享了這麼多來自開發者和企業的大實話,我們也得給CV企業支支招。首先,機器視覺將在數字經濟中佔據很重要的份額,這個市場從未停止發展,還有大量場景需要影像處理、影像識別、目標檢測等能力,CV可以大展身手的行業是非常多的。但是,未來或許我們會越來越少看到以純演算法作為核心能力的機器視覺公司。

從技術上,CV需要與其他AI技術相結合,才能解決產業關心但尚未解決的複雜問題。

前面提到,產業中還存在大量AI所無法解決的場景,即便是AI應用相對廣泛的質檢、巡檢領域,也有著大量空白的細節場景,這些都是具有產業價值的。但CV無法作為單一技術去實現突破。比如CV與硬體的結合,替代人去一些高塔、雷區、山區進行作業,需要機器視覺、機器人、晶片等方面的綜合能力。再比如,“AI四小龍”都在深入的智慧醫療領域,也曾有醫生表示,病理影像中包含有很多的影像資訊,AI把這些資訊提取之後,可以和基因組學、蛋白組學更加深入地進行研究,而不只是目前這樣簡單的分割或分類。

正在消失的機器視覺公司
編輯

從商業模式上,對於一些中小微企業來說,透過各大演算法平臺、開發生態提供的開箱即用的工具/介面,未來將成為融合性的AI解決方案供應商,而不僅僅聚焦於機器視覺能力。對於在CV賽道上具備優勢的企業,讓機器視覺能力與攝像頭、處理器、5G、雲等行業所需要的綜合技術與能力相融合,支援更多開發者和行業合作伙伴去打造更具行業價值和複雜度更高的模型,商業模式的重構、成功的平臺化將拓寬機器視覺產業的深度和寬度。

正在消失的機器視覺公司背後,隱藏著這個轉型時代的底色:有人在潮漲潮落中成為過往雲煙,有人在深水靜流中成為人生贏家。


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/31561483/viewspace-2918482/,如需轉載,請註明出處,否則將追究法律責任。

相關文章