為什麼ChatGPT不是誕生在中國?
來源:慕楓技術筆記
2021年,中國以全球AI頂級會發表的論文數27.6%的比例高居榜首,而歐盟和英國以19.0%緊隨其後,美國以16.9%位居第3。無論AI人工智慧論文發表量還是專利申請量,中國在全世界範圍內都名列前茅,那麼按道理來說中國在AI人工智慧領域的研究既廣泛又深入,像ChatGPT這樣具有里程碑意義的人工智慧應用應該在中國誕生才對。雖然說自然語言理解和生成是人工智慧研究領域的一座高峰,想要攀登和征服就需要持續不斷地高質量資源投入,而阿里達摩院、華為以及清華大學等研究機構也在做類似的事情。不過很遺憾,最終還是美國的OpenAI率先發布了強大的ChatGPT。今天我們試圖客觀的分析下是什麼原因造成了我們沒有成為新一代技術革命的發起人,以後我們應該怎麼做才能成為未來技術的引領者而不是跟隨者。
原因分析
過度關注商業模式,忽視底層技術研究
對比中美兩國技術發展路線,我們可以發現一個有意思的現象。在中國,技術的發展大都是圍繞業務進行,也就是說當一個業務模式被推出來之後,如果想要支撐這樣的業務規模就需要發展什麼樣的技術,那就研究和發展什麼技術,透過商業模式的創新、業務的發展推動技術向前發展演進。
但是美國好像正好相反,常常是一項技術的發展進步反向催生出新的商業形態。就拿推出ChatGPT的OpenAI公司來說,它原本就是一個非營利性的技術組織,集結了AI人工智慧界的各路大佬,初衷就是讓人工智慧向著友好的方向發展,核心宗旨在於“實現安全的通用人工智慧(AGI)”,使其有益於人類。GPT模型經過不斷的迭代升級最終搞出來了ChatGPT,有望成為未來人工智慧應用技術的基礎底座,因此未來可能將會有海量的上層應用都是基於ChatGPT來進行構建,可以毫不誇張地說,ChatGPT或者說通用大模型也許就是人工智慧領域的作業系統,將來會誕生多少新的的商業模式以及業務形態不可估量,這種技術革命是自下而上的顛覆性創新將會對未來的產業形態產生深遠的影響。
缺乏長期主義
但是實際上無論是ChatGPT還是GPT4這樣的人工智慧應用,都不是橫空出世的,它們都是在GPT、GPT2以及GPT3基礎上逐步迭代發展而來的,這其中耗費了多少頂尖人工智慧專家長期堅持的心血以及大量資金的持續投入。OpenAI在獲得微軟投資之前的三四年裡燒掉將近1億美元,才搞出來一個以GPT第一代模型為基礎的雛形,當時還遠遠達不到ChatGPT今天的效果。基礎技術研究不是一朝一夕就能完成的事情,它需要不斷的試錯,需要對未來技術發展趨勢的獨到眼光,更加需要長期主義的堅持。不過讓我們感到欣慰的是,阿里巴巴、華為在技術研究上的投入已經每年超過1000億,相信在不遠的將來一定會有新的技術突破出現。
缺乏技術體系支撐
也就是說,通用大模型的訓練需要一個完整的人工智慧技術體系來進行支撐,否則即便有先進的演算法,但如何獲得高質量的訓練資料,到哪裡去找龐大的訓練算力資源,這些都是擺在通用大模型訓練面前必須要解決的問題,否則沒有高質量的資料以及算力支撐也是巧婦難為無米之炊。
如何破局
通用大模型是未來人工智慧的重要發展方向,我們肯定要加大資源投入力度才能有機會在未來人工智慧前沿技術的競爭中佔有一席之地。那我們應該怎麼做才能破局呢?我想可以從以下幾個方面入手。
資料方面
雖然當前中文線上聯網資料也算是海量,但是資料質量普遍不高,同時資料孤島問題比較嚴重。如果我們想基於中文資料來訓練通用大模型,就必須對中文線上資料進行治理提高中文線上資料質量,解決資料孤島問題,推動實現資料的共享和互聯互通。
算力建設方面
結合國家東數西算工程,協調各個區域的算力中心,形成全國通用算力基礎設施,加快構建國家級一體化新型算力網路體系,為通用大模型訓練提供源源不斷的強大算力支撐。只有這樣,才能滿足大模型訓練所需要的算力要求,同時為強人工智慧時代的到來做好算力資源儲備。
意識方面
和別人的技術差距,我們當然要盡力彌補。不過我們需要注意的是我們在進步,別人也在進步,所以我們光追趕別人不行,還要有更加長遠的眼光,要有對於未來準確的判斷力,進行提前技術驗證以及產業佈局,為下一次技術革命做準備,真正成為未來技術發展的引領者而不是追隨者。
總結
科技的發展進步不是一朝一夕就能實現的,它可能需要一代又一代技術人員孜孜不倦地追求。雖然我們在很多領域都已經取得了長足的進步,但是同時我們也要清醒地認識到,在計算機領域、網際網路技術領域以及人工智慧技術領域我們還有不小的差距需要彌補。因此少一點網紅、明星的曝光,多一點科技工作者勤懇務實地宣傳,努力營造技術為先、科技為先的社會氛圍才是未來科技行業蓬勃發展的社會環境基礎。我相信如果我們可以少一點浮躁,多一點純粹,也許下一次的科技革命就是在中國這片土地上誕生。最後和大家分享下馬老師曾經說過的一段話,我覺得對我們當下思考未來技術發展非常有幫助。
我一直覺得填補空白這句話是有問題的,不是因為歐美的就是先進的,就是我們要去填補的。其實今天我們不應該要和哪個東西接軌,適應哪國的標準,填補哪個空白,今天我們要思考的是怎麼和未來接軌,怎麼適應未來的標準,怎麼彌補未來的空白,我們要想明白未來是如何的,以及自己到底要做成一個什麼樣的體系,然後再去看看別人怎麼做,如果永遠重複別人的語言,討論別人設定的主題,我們不但會迷失現在,而且會錯失未來。
來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/70027828/viewspace-2943441/,如需轉載,請註明出處,否則將追究法律責任。
相關文章
- 為什麼ChatGPT採用SSE協議而不是Websocket?ChatGPT協議Web
- 所以,chatGPT為什麼這麼火?ChatGPT
- 英礴中國製作總監包波:開放世界3A遊戲將誕生在中國遊戲
- 晉升的為什麼不是你
- 為什麼想做副業???還不是因為窮
- 《全戰三國》與梗:誕生在還原和無厘頭之間
- 數字孿生在智慧消防中能夠發揮什麼作用?
- 為什麼說區塊鏈也不是什麼好東西?區塊鏈
- 心態:晉升的為什麼不是你
- 為什麼range不是迭代器?range到底是什麼型別?型別
- 最流行的國家級域名是什麼?不是.cn 也不是.uk
- 為什麼DNS使用UDP而不是TCP詳解!DNSUDPTCP
- Python為什麼不是傳值或傳引用? - mathsppPython
- 居中為什麼用transform,而不是margin top/leftORM
- 為什麼 Go 語言能在中國這麼火?Go
- 為什麼很多人排斥中國女生嫁去外國?
- 為什麼你應當選擇 PostgreSQL 而不是 Oracle?SQLOracle
- 為什麼遊戲第一股不是鬥魚?遊戲
- 為什麼 HTTP PATCH 方法不是冪等的及其延伸HTTP
- 中國程式設計師為什麼要跳槽?程式設計師
- 為什麼中國的 996 幹不過美國的 955996
- SPC控制圖為什麼是±3σ,而不是±2σ或±4σ?
- 為什麼VSCode是程式碼編輯器而不是IDE?VSCodeIDE
- 為什麼爬蟲語言選擇Python而不是Java?爬蟲PythonJava
- 分散式鎖為什麼要選擇Zookeeper而不是Redis?分散式Redis
- 網際網路公司為什麼普遍996而不是666?996
- 火爆全球的ChatGPT是什麼?ChatGPT
- 為什麼其他文明沒有誕生古希臘的科學?
- GroupM:全球83%的廣告欺詐發生在中國
- 【與ChatGPT的有趣對話】什麼是Adobe國際認證?ChatGPT
- gRPC為什麼使用截止時間而不是超時時間?RPC
- GPT-3為什麼不是通用人工智慧AGI! - cmswireGPT人工智慧
- [譯] 為什麼我更喜歡物件而不是switch語句物件
- 為什麼精益生產在中國水土不服?
- 華為對中國半導體意味著什麼?
- 為什麼中國人沒有自己的程式語言?
- Java中多執行緒啟動,為什麼呼叫的是start方法,而不是run方法?Java執行緒
- 中想雨信:移動辦公系統的誕生,到底為企業帶來了什麼?