AI Pioneers｜星海圖高繼揚：人形機器人不是具身智慧的唯一答案

机器之心發表於2024-04-22

原文網址 : https://www.jiqizhixin.com/articles/2024-04-22-7

AI機器人

人類正在迎來人工智慧領域的爆炸式更新，技術向未知擴充的每一步，幾乎都引起驚人的關注度。

在人工智慧邊界擴張的過程中，重要賽道的技術路線創新與分歧並存。技術先鋒者的判斷和選擇，影響著眾多跟隨者的腳步。

過去一年，機器之心獨家率先將月之暗面、生數科技、愛詩科技、無問芯穹等優秀公司介紹給大家，為他們在網際網路世界留下了第一份 “萬字訪談底稿”。在技術路線尚未收斂的階段，我們看到了到真正擁有信念、勇氣以及系統化認知的 AI 創業者的引領力量。

因此，我們推出 “AI Pioneers” 的專欄，希望繼續尋找和紀錄 AGI 時代人工智慧各細分賽道具有領袖氣質的創業者，介紹 AI 賽道最出眾、高潛的創業公司，分享他們在 AI 領域最前沿、鮮明的認知。

作者：姜菁玲

機器之心報導

具身智慧已經成為人工智慧領域最值得期待的一大賽道之一。現在，智慧機器人已經可以自主實現咖啡拉花、搬箱子、疊被子，甚至能夠像人與人一樣透過自然語言互動，理解人類的意圖並做出調整。

國內外眾多科技公司正在推動機器人變得更加 “智慧”，希望它最終可以完成各種任務，能與環境互動感知，擁有自主規劃、決策、行動、執行能力。

但以終為始，什麼樣的路徑才有可能推動具身智慧產品抵達如此高度的智慧？

近期，機器之心對清華系具身智慧公司「星海圖」進行了訪問。

星海圖 CEO 高繼揚提出了他們的路徑想法：對現階段的具身智慧產品而言，代表智慧的 “大腦” 比代表執行的 “身體” 更為重要。如果要抵達具身智慧的終局，需要針對具體場景推出合適的產品，完成商業閉環，從而得到更多來自物理世界的資料，最終不斷提高機器人的 “智慧” 程度。

這個說法主要區別於行業中存在的兩種其他觀點：1、機器人的 “身體” 比 “大腦” 重要；2、應該儘可能直接做一個完整的人形機器人，用它應對大部分場景需求。

需要解釋一下的是，到目前為止，在行業內人形機器人仍是一個模糊、寬泛的概念，對它最狹義的定義是完全模仿人類的模樣的機器人 —— 有雙足、雙腿、軀幹、頭肩、雙臂、靈巧手。

星海圖認為，在具身智慧產品設計中，並非所有人類構型都具備通用性和效率，比如雖然 “雙臂” 和 “軀幹” 具備，但 “雙足” 結構並不具備。因此，他們提出，應該從具體的需求出發，針對場景去做滿足需求的高自由度關節型機器人，完整人形有時是不必要的。

同時，這樣高度場景化的產品策略，可以機器人儘快實現商業化落地，儘快地從物理世界拿到更多資料，實現飛輪效應，更高效率地提升機器人的 “智慧” 水平。

星海圖提出了他們的 “一腦多形” 的願景，他們認為，未來，具身智慧產品能夠實現用一個智慧去匹配不同場景下需要的各種形態的機器人，而完整人形只是其中的一個可能。

星海圖成立於 2023 年 5 月，四位聯合創始人中，三位出身於清華大學，除 CEO 高繼揚畢業於清華大學電子系，聯合創始人還包括清華大學交叉資訊學院助理教授、MARS Lab 主任趙行，以及清華大學交叉資訊學院助理教授、清華大學具身智慧實驗室主任許華哲。

星海圖 CEO 高繼揚曾以 3.5 年時間完成美國南加洲大學計算機視覺博士學業，成為 USC IRIS Lab35 歷史中最短畢業用時者。博士畢業後，高繼揚先後在自動駕駛公司 Waymo 與 Momenta 工作。星海圖另一位聯合創始人李天威同樣來自 Momenta 公司。

目前，星海圖已完成千萬級美元的融資，參與投資的機構包括 IDG 資本、無限基金 SEE Fund、BV 百度風投、金沙江創投、七熹投資。

1. 從自動駕駛到具身智慧

機器之心：你個人的職業經歷主要在自動駕駛領域，為什麼在去年會想要開始在具身智慧領域創業？

高繼揚：我讀博士是做計算機視覺的，然後畢業之後在 Google 的無人車公司 Waymo 工作兩年多，後來回國在 Momenta 幹了大概 2 年。

我覺得，其實對於我們這一批人來說是一個自然而然的選擇。可能對於外界的人來說，好像自動駕駛和具身智慧是兩件事，但其實是一件事。

我博士畢業以後，想做的是 “AI + 機器人”。而車其實也是機器人的一種，可以理解為自動駕駛是具身智慧在公開道路上的一個應用而已。以特斯拉為代表的自動駕駛公司所做的這一套 FSD 的自動駕駛技術架構方案，其實跟未來具身智慧會用到的技術架構基本上是一致的。

然後對於創業這件事，其實我早就計劃好了。應該是我大學的時候就想，一直琢磨到底幹啥，就是屬於我這一代人的機會到底是什麼。我上大學那會兒 11~15 年是移動網際網路最風生水起的那段時間，當時看著網際網路巨頭覺得很牛逼，但也明顯地感覺到網際網路不是我這一代人的機會。

直到大四的時候開始接觸到 AI 深度學習，我覺得這個東西特別好、有前途，而且我自己也很感興趣，覺得這是能夠徹底改變世界的，因為它跟網際網路不一樣，網際網路是改變了生產關係，而 AI 讓生產力再次得到提高。

所以後來就去做這個方向的博士研究。Waymo 和 Momenta 的兩段經歷讓我覺得自己為創業的準備基本已經做好了，第一有足夠的技術積累，然後產品怎麼做，團隊怎麼管理，都有一定的經驗了。我覺得就在那個時間點，內部環境和外部都 OK 了。23 年 5 月我就提了離職，6 月底正式離職，然後 8 月初開始融資，11 月份首輪融資就完成了。

機器之心：離開 Waymo 和 Momenta 的原因分別是什麼？

高繼揚：我很感謝 Waymo 教了我很多東西，比如用 AI 做機器人的大框架、思維方式、工程體系。不過 Waymo 當時在做的 L4 級別的自動駕駛有一個很大的問題 —— 也就是 AI 產品的失效成本問題，這也是我們後來決定創業的商業根基。

我們認為，任何一個以 AI 作為核心驅動力的產品或商業模式背後都是 4 個要素的迴圈，商業價值、資料規模與質量、智慧程度、產品力。這 4 個要素能夠迴圈起來，這個產品就能夠產生運營剩餘。什麼叫運營剩餘？就是它單次失效的成本小於兩次失效之間的收益，這個就算有剩餘了。

簡單來說就是要有用。舉一個具體例子，比如 Robotaxi，假設它失效一次，我們給他算算成本是多少。如果發生碰撞，大概損失的量級會在 10 萬人民幣浮動。按現在網約車司機大約一公里賺 1 塊錢去計算。如果說自動駕駛要 “有用”，那意味著這個車需要能夠連續無事故地開大於 10 萬公里，才能把兩次 “失效” 下的收益做正。

這個失效成本太大了，這也是為什麼 Robotaxi 自動駕駛搞這麼多年搞不成的原因。這也是我 2020 年下半年離開 Waymo 準備回國的一個主要原因，我覺得它的商業模式和 AI 的發展規律是背道而馳的，因為產品的失效成本控制不下來。

後來我加入了 Momenta 去做量產，我覺得量產可以控制整個產品的失效成本。因為 Momenta 是 L2 模式，Waymo 是 L4，從法律的角度來講，L2 的責任在人，L4 的責任在車，所以兩者的失效成本是不一樣的。

後來我在 Momenta 先後負責了感知規劃控定位，包括整個的泊車系統、行車系統。這個過程裡，我覺得確實是解決了失效成本的阻礙了，但是它又有新的問題，資料自主權。

一個 AI 公司的發展需要依靠資料，沒有資料就沒有智慧，但資料的獲取成本和渠道是非常重要的兩點。這個方面上，目前模式下的自動駕駛軟體供應商其實是不太有利的。你去跟車廠去合作，在過程裡面資料能不能回來，這裡邊有一點博弈的關係。

所以這也是為什麼我們做具身智慧，我們強調的兩個基本原則：第一個就是特別關注產品失效成本，因為這是你商業模式能成立的前提。第二個就特別關注資料的獲取成本，因為資料獲取成本如果居高不下的話，（AI）轉不起來對吧？

然後在這個基礎之上，我們要軟硬體一體。AI 永遠是核心競爭力，將 AI 核心能力搭載在一個硬體產品上面交付給使用者，直接向終端的使用者建立閉環商業閉環，我們才有可能掌握資料自主權。

所以這也是過去這兩段經歷給我的啟發，就是要關注失效成本和資料成本。你看 ChatGPT 為什麼能成，因為它的失效成本僅僅只是浪費了使用者 20 秒時間，失效成本很低，同時它的資料成本也是低的，大量的資料都是來自網際網路。這兩點也是我們在做具身智慧場景選擇和產品設計的底層邏輯。

2. 一腦多形，人形不是唯一答案

機器之心：基於上面兩種原則，你們首先選擇的場景和產品是什麼？

高繼揚：具體的場景和產品我們會在下半年正式去介紹。但我們的目標是明確的，是端到端地去提供某些藍領勞動力崗位的供給。

什麼叫端到端？我們拆解任意一個崗位，它都由多個任務去構成，比如說做奶茶的，它會包括打奶昔、搖晃製作、遞給客人、跟客人做溝通等一系列任務。

那一個具身智慧型的機器人產品有商業價值，是因為他把這個崗位給完整的替代掉了。在商業社會里面，人是崗位的勞動力供給，崗位是任務的集合體。所以在這個裡面我們就強調的是，瞄準這個現實世界商業社會當中的崗位，然後做能夠去端到端替代的機器人產品。

我們做具身智慧不去創造 PMF（Product Market Fit，產品市場匹配），因為 PMF 遍地都是。對於藍領崗位，我們端到端的任務替代率越高，我的商業價值就越大。未來的具身智慧體與人類融合後構成的世界，肯定會創造出新的工作流程和配合方式，不僅僅是對現有工種的替代，這個新世界的豐富性可能超過了我們所有人的想象。

機器之心：具體打算怎麼切入？

高繼揚：相對於靠腦力吃飯的 “白領”，藍領更多依靠透過體力勞動改變物理世界，比如服務員、外賣員、工廠裡面的工人。藍領的工種很多，範疇很大。

至於第一步選什麼工種去做，這裡面有很多要素去考慮。在現在的商業化上，我們不會直接去懟狹義的人形機器人，當然它會是具身智慧未來的重要形態之一。

如果說為什麼國內很多公司在做人形機器人，我認為他們在 follow 一個基本邏輯，那就是因為 Elon Musk 在做。但你問他們為什麼特斯拉做，為什麼馬斯克做，最後基本說不出來一個一二三。這個就意義不大。

這裡面有一個很基本的點，很多人形機器人公司忽略了特斯拉的起點和終點。特斯拉的起點是什麼？第一它不缺錢，第二，它在智慧車上面迭代出了完整的智慧系統，剛才我說的自動駕駛是具身智慧的一個應用，它現在透過這一個應用把大腦總結迭代出了一部分，這個重要基礎是別的公司不具備的。

而我們去看這個基礎要迭代出來需要花多少錢？10 億美金。現在我就不具體點名國內這些融的最猛的具身智慧公司融到 10 億美金了嗎是吧？這個就是沒有特斯拉的起點。

然後第二個就是沒有特斯拉的終點。（現在這些機器人）在工廠裡邊做線束裝配等等，這些應用會是特斯拉做人形機器人的終點嗎？不，只是它的路徑而已。它的終點是，馬斯克為了要實現火星移民，最終要把機器人放到火星這種完全陌生的環境裡，人形是最有通用性的，這沒問題。

可是我們面對的世界是什麼？我們面對的世界是經過人類改造的世界，是人這個靈長類動物的基因在大自然環境下強化學習的結果，對吧？如果機器人在咱們這個世界裡邊再強化學習一遍，還會是一樣的結果嗎？我覺得畫一個大大的問號。

機器之心：你的意思是，其實不需要（完整）人形就可以做那些事情？

高繼揚：對，還是回到需求。人之所以有 “人” 這個形是為了開始適配大自然的環境，可以去改造大自然。但我們現在面對的環境已經是人類改造過的社會環境。在這個社會環境裡的一系列的需求，我們應該去思考什麼形可以滿足它。事實上，只要它有足夠大的商業價值，演算法進入了工程階段我們就可以去做它。

我們認為，如果是圍繞需求去做產品設計的話，那最終的本體應該是一個高自由度的關節機器人，人形可能是其中一種，但不會是唯一一種。

也就是說，具身智慧的未來應該是 “一腦多形” 的，可能最終會出現的形式是，一個通用具身智慧基礎模型，然後能夠適配到不同構型的身體上，可以對應解決現實世界的各種需求場景。

而在這個路徑往前走的過程裡面，對於具身智慧公司來說，本體不應該是目的，而是手段。

機器之心：你們認為其實有價值的具身智慧可能有很多形。選擇 “先不懟人形” 的理由是什麼？

高繼揚：這裡邊涉及一個更基礎的問題要去分析：構成具身智慧產品的兩個部分，機電系統和智慧系統，什麼是更重要的？有些公司在這個點上可能還在爭論，但我們的結論很清晰，就是智慧系統。

人形機器人在沒有智慧的情況下，它就是一堆鐵疙瘩。而假設智慧的部分由人代替，一個人去遙控機械臂，我們可以做非常多工。因此，具身智慧產品的關鍵不在硬體而在於智慧。

而如何產生智慧，核心就是又回到咱們剛才說的把 4 要素迴圈，然後運營剩餘時效成本就這一套。對，所以關鍵就是要選好你的商業閉環場景。透過足夠便宜的本體，實現良好的商業閉環，然後降低資料獲取成本，推動演算法進入規模化階段，實現智慧的提升。

但你會發現狹義的人形機器人是不符合這個鏈路的，它是一個死迴圈。如果你直接去做人形，很現實的問題馬上就來了，因為人形成本高，意味著我進入商業場景的門檻就高，對吧？大家付不起。那麼，沒有商業閉環就沒有資料閉環，所以就沒有智慧。

我們需要找到一條破解這個死迴圈的路徑。人形機器人未來大機率會真的進入到人類社會，但是這個是目標，我們現在要關注的是這個路徑應該長成什麼樣，如何實現這個目標。所以這就是為什麼剛才我說，對於一個具身智慧公司來說，形是手段，而目的應該是發展智慧。

機器之心：之後可能會去做人形機器人嗎？

高繼揚：如果說，我們看任何行為它是手段，它不是目的。既然是手段，我們就要審時度勢了。未來當機電系統的足夠成熟，智慧系統已經非常的發達了，我覺得人形可能是一個還蠻不錯的選擇。但是當機電系統不夠成熟的時候，它的邊際成本還沒有降下來的時候，2024 年這個時候可能它就不是一個正確答案。

3. 商業閉環驅動智慧發展

機器之心：那你們的答案是什麼？在 2024 年。

高繼揚：我們會認為，具身智慧需要為人服務、跟人生活在一起，最終要超過人，這是具身智慧發展的主旋律。在無人的環境裡我們不需要智慧，需要的是自動化。

那商業是什麼，就是有用的打敗無用的，高效地打敗低效的，謙虛的打敗驕傲的。我們要思考的就是，在這個地方我們到底有沒有需求，滿足需求的最好方法是什麼。我們很多問題都會有答案。

機器之心：具體一點呢？

高繼揚：我們初步的答案會是針對元場景研發的具有移動能力的操作型機器人（Mobile Manipulator）。機器人分為移動和操作兩個維度，如果把動作看作一個平面，那這就是一個 X 軸一個 Y 軸。拆完之後，你會發現大量的問題還是科學問題，只有少部分問題是工程問題，我們做產品的話，我們不能帶著科學假設去做產品設計，這會是有巨大風險的。

機器之心：什麼是科學問題，什麼是工程問題？

高繼揚：工程問題是前面這個路徑已經很清晰了，我就往前幹往前走，我一定有結果，這叫工程問題。科學問題是什麼？現在我面前有 5 條路，可能還有第 6 條路我不知道，哪條路能幫我走到終局我也不清楚，我得先試一試搞一搞看一看，這就叫科學問題。

我們不能在有科學問題的情況下，把這種納入產品設計的過程裡面，這對於一個初創公司來說會是一個巨大的成本巨大化，風險非常大，這是在賭，賭你不知道你會贏還是輸。在認知不清晰的情況下，這不是一個好的選擇。

機器之心：好的選擇是什麼？

高繼揚：好的選擇是我的產品一定是有技術空間和商業空間的可行性。

第一、技術上，所有的演算法要素要進入工程階段，不能帶著科學的問題做產品策劃。

第二、商業上存在巨大的需求空間，能夠完全端到端去替代某一個藍領崗位。你不要跟我說這 30% 機器做，那 70% 人做，這種到了商業社會都搞不通了。第三個，就是成本三年左右的時間進入到可控階段，跟人能對比。第四，能夠支援最大化去在物理世界採集資料用來數字化。

ChatGPT 能做出來，是因為他們花了 20 年的時間，透過網際網路把人的知識數字化了，但是對於具身智慧行業，我們對於物理世界的數字化，還沒有人在做。

所以我們說，具身智慧，它是物理世界的數字化和智慧化交替進行協同發展的一個過程，這跟大語言模型還不太一樣。以剛才這 4 條因素，就是我們去做產品選擇和定位設計時候的關鍵 4 條。如果說你用這 4 條去卡一下的話，會發現現在大量的市面上的這些公司都會可能有這樣那樣的問題。

機器之心：跟大語言模型的智慧相比，機器人的智慧區別是什麼？

高繼揚：不太一樣，大語言模型的智慧是說機器人的理解能力，具身智慧解決的是機器人的執行問題。一個是理解，一個是執行，執行是眼睛，移動是操作，理解的話更多是邏輯思維。

我們看大語言模型和具身智慧的關係，第一個大語言模型會這個在具身智慧在邏輯層的推理理解面起到很大的幫助。同時具身智慧也會是未來多模態大語言模型最重要的資料入口，因為網際網路上的資料就這麼多，真正的資料還得來自物理世界。

機器之心：具身智慧的 L0 到 L3 分別是怎麼樣的？

高繼揚：如果是對操作分級的話，我們一個基本的分級就是從操作的觀測、操作的物件和操作結果去看。操作觀測有沒有遮擋（比如從抽屜拿一個東西出來，是有遮擋的）、操作物件是否是柔性物件，操作結果的精度夠不夠。在這三個維度做累加，去構成 0-3 的級別。

比如，L0 級別的，是簡單的拿東西、放東西。L1 級別，疊衣服，因為它是一個柔性物件，（對機器人）有一定的精度要求，但精度可能沒有那麼高。L2 級別，可能是畫油畫、捏橡皮泥；L3 最後集大成的場景比如是通用烹飪，從切菜、到炒，到裝盤，機器人需要面臨過程中的環境劇烈變化。炒完之後把它裝到盤子裡，最後用筷子嘗。現在還是 L1 級別。

機器之心：目前整體上行業的水平還在什麼階段？在移動和操作兩個維度呢？

高繼揚：L1 附近。移動方面，機器人已經基本解決了對困難地形的透過和複雜場景規劃方面的問題，通用移動這件事已經馬上要來了。意思是，即使前面的路再亂再複雜，可能又是臺階又是水坑，機器人都能邁的過去。

但是操作這個裡邊有大量問題沒解決。它是一個階梯式上升的過程。在階梯式上升的步驟裡面，我們需要設計不同的商業閉環，推動它一步一步向上走。透過商業閉環，去做資料閉環，有了資料閉環，去發展智慧。有了 L0 級別的智慧，再往 L1 和 L2 級別的往上走。

機器之心：你們的第一個商業閉環設計在哪裡？

高繼揚：我們會在今年下半年做披露。我們認為現在已經是一個被新技術開啟了新的供需關係的局面，而創業公司所競爭的，也並不是技術制高點，而是新技術開啟的新供需關係。而技術只有在有供需關係的時候，它才是一個有價值的東西，不然它就是實驗室 demo。

具身智慧也需要落地，回到剛才的邏輯，具身智慧需要資料，資料需要商業，商業需要落地。每天在實驗室裡搞 demo 的人，公司是不可能走到底的，因為它違背了 AI 的兩個基本規律，第一個資料獲取的成本夠不夠低，第二個產品失效的成本夠不夠低。如果這兩個基本規律你沒有滿足，你永遠不會有突破，永遠是一個實驗室。

機器之心：你說到需要落地。而人形機器人有些產品能做出來，但是沒有辦法落地，因為它的邊際成本太高了。你們場景下機器人的邊際成本是怎樣的？

高繼揚：我只能先宏觀的來說。首先邊際成本初期看有兩部分，就是這個場景下的失效成本和硬體成本，但最終看的只有一部分，也就是隻會有硬體的邊際成本。因為具身智慧的關鍵就在於通用泛化，通用和泛化在經濟上的表達就是邊際成本無限期限於 0。

所以這就是說按這個東西需要一個過程，我們在這個過程裡面要保證的是什麼？發展的過程當中，資料和智慧的這部分邊際成本要有效的做累積，轉化到我們研發的固定成本上面去，然後最終我們剩下的就是場景下硬體的邊際成本。

另外的方面，產品的成本一定程度上還取決於在場景裡創造的價值。如果說客戶能為這個場景付 100 元，那麼我 80 元的成本就是低的，如果這場景我只能付 10 塊錢，我 20 塊錢都嫌高。

所以硬體的成本還取決於在場景裡面創造的價值。在這方面，中國市場有一個獨特的挑戰，那就是人工太便宜。所以對於具身智慧公司來說，出海可能是必須的。

機器之心：現在你們覺得具身智慧賽道它的技術路線是分散的還是收斂的？

高繼揚：挺分散的。因為腦、形、還有產品商業化其實它不是割裂的，它是一個融合在一起的東西。腦要和形配合，腦加形才是產品。然後適配什麼樣的場景，如果處理好失效成本，資料獲取成本這些東西。所以我覺得這個事最後能做成，它不是單點的，一定是這些東西你都想清楚了，然後找到一個好的目標才可以。

但是大家現在對於這個事兒可能就是說認知不一樣，形成的路徑也不一樣，做的產品也不一樣，所以你很難講說大家現在有收斂的結果。

機器之心：對於具身智慧落地的場景，以及什麼樣的技術路徑去匹配這樣的場景，這些問題都沒有一個比較共識的答案？

高繼揚：如果有共識的話也不需要創業了，大公司就搞了，是吧？創業其實就是說因為有非共識，大家的觀點不一樣是吧？然後同時正確的觀點又掌握在少數人手裡邊，這就是機會。

4. 相信的場

機器之心：成立至今，一腦多形的路線想法，有沒有遇到一些挑戰？

高繼揚：我們這個路線肯定是有挑戰的。因為跟特斯拉不一樣，跟主流的人形機器人不一樣。不過，這其實既是我們的挑戰也是我們的機會。如果我們能夠重新在這個市場上幫助大家建立一些認知，我們會收穫一批相信這個路線的人，這些也會變成我們做這件事的很好助力。

如果我們開始去講類似的故事，用我們團隊背景去講其他人講過的故事去融錢，也肯定能融到。但我覺得我沒有辦法做到我不相信的東西。我之所以能一遍遍地講，就是因為這些東西是我所相信的，即使別人不相信，我也要一遍一遍的去講。

機器之心：現在技術迭代這麼快，你對自己選擇的技術方向和戰略有沒有過懷疑？

高繼揚：我覺得對於新東西，尤其是對於自己之前沒認識到的邊界以外的東西，肯定得保持開放心態。然後要把新東西還是要放回到你建立的框架裡面。

最怕的是什麼，沒有框架。這樣的話，他給我來一句我就信了，另外一個人又給我來一句我又信了。那這個人肯定就不適合做一個 CEO，也不適合去創業。

所以我覺得最關鍵的是有框架，然後這個這個框架的建立要從過去的實踐過程當中總結規律，同時又要對新的事物新的資訊保持開放。

對於豐富框架這件事來說，所有個人的認知都是有限的，我覺得這也是我們這個團隊很有優勢的一點，因為團隊很全面。我們團隊一起共同思考和麵對這些新資訊，用邏輯去推演，不斷建立起我們自己的框架。並且，在實踐的過程中所遇到的問題，我們也用自己的框架去檢驗它。我們目前覺得還是 OK 的。

機器之心：你這半年多以來你覺得進展相對順利嗎？最大的問題是什麼問題？

高繼揚：我覺得還行。最大問題我覺得就是說真正的問題不是我已經意識到的，而是我還沒有意識到的問題，可能視野之外的問題是比較大的問題。我相信，只要問題進入視野之內，只要我們用正確的方法，去開始解決這個問題，慢慢地這個問題都會變小。

比如，怎麼做融資，怎麼在商業上做 BD。可能我是技術工程師出身，我會認為，當你認識到這個問題之後，解決方法基本都是類似的 —— 拆解加測量，比如去看這 1 個大問題怎麼去拆解成 5 個小問題，然後每個小問題都去測量一下，然後這 5 個小問題都在變好，那麼大問題一定就在變好。

所以當問題已經成為問題的時候，反倒不是問題，但危險的是那些你覺得挺好，但其實他有問題的地方才是真問題。

機器之心：聽下來的話，你們創始團隊組建的過程是蠻順利的。

高繼揚：比較順利，主要我覺得還是大家都有共同的夢想。我們的團隊過去都互相認識、互相合作過，互相信任，並且大家年齡相仿，價值觀也是一樣的。

具身智慧發展最重要就是人才。人對了方向才能對，方向對了，有正確的有足夠的資源，我們才能在正確的方向上去迭代。

所以有的機構投資人也好，或者是媒體也好，經常喜歡去看說某一個什麼又突然搞了一個大新聞。但其實 AI 裡面不會存在魔法，都是在正確的方向上高速迭代，然後累積出來的東西就是曾國藩的 6 個字，“結硬寨打呆仗”，這是我們做 AI 最大的感受。

機器之心：如果說如果沒有魔法，“在正確的方向上高速迭代” 是一個成功公式的話，失敗的原因也有可能就是沒有找到正確的路線和迭代速度過慢。

高繼揚：對，就是你的方向不對。你沒有把握住 AI 的基本規律，那是你有沒有關注你的產品的失效成本，你有沒有關注你這個資料的獲取成本，你不關注這些你方向很有可能是錯的。

機器之心：你們看看現在的競爭情況是怎麼樣的？

高繼揚：我覺得現在還沒什麼競爭，大家都沒什麼產品，談不上競爭，只有在資本市場存在一定競爭。但是我覺得這裡邊這些公司各自的業務模式和商業上的策略都不一樣，然後咱不一個個評價了。只是說，我覺得大家都不一樣，即使在融資上有競爭也沒有非常的大。

投資是為了賺錢，那麼只要我們這個模式能夠去說服大家，這是一個有希望的模式，那麼對於投資人來講為什麼不投？也不會說是，投了別人就不投你了，不存在這個情況。

機器之心：所以你覺得自己去說服投資人最重要的一個點是，現在的模式是可以大機率確保他們是可以賺錢的，是這個點嗎？

高繼揚：不是。我覺得是說本身具身智慧這事一定短期不賺錢，這個賺錢是長週期的範疇上，我們能把事做成，因為你事做成了就會賺錢了。

我覺得這本質上是一個相信的遊戲 —— 你相信還是不相信？然後相信有兩種相信，第一種相信叫做從規律出發選擇相信，第二種相信叫做因為別人相信，所以我相信。

我們很顯然是從規律出發做判斷，就相信做選擇，然後開始能夠吸引到被我們說服的投資人，也一定是基於規律出發的。

回到現實，我們一定會面臨的問題，就是我們剛才我講的這條路徑不是主流路徑，因為大家認為主流路徑是人形機器人，是吧？在這個裡面，我們要把這個事做成，就得讓更多的人相信。怎麼讓更多的人相信，一方面靠吸引前期的相信規律的人先加入我們，第二個用現實的結果讓更多的人相信我們，相信是一個場。在這個場裡面人和人之間是會影響的，我們要去努力構建這個場。

機器之心：你覺得說接下來最重要的事情是什麼？

高繼揚：以一年週期去看的話，最重要的事情就是要去影響更多的人加入我們的團隊，獲取更多的資金支援，如果拉長週期的話，我覺得還是要堅持自己所相信的東西。

AI Pioneers｜星海圖高繼揚：人形機器人不是具身智慧的唯一答案

相關文章