人工智慧與智慧計算的發展
我國應走出適合自己的人工智慧賦能實體經濟的高質量發展道路—孫凝暉
1. 計算技術的發展歷程
機械計算時代:算盤的出現;
電子計算時代:電子器件與電子計算機的出現;
網路計算時代:網際網路的出現;
智慧計算時代:AI 的出現;
現代計算機的科學基礎
- 數學:布林數學,描述程式和硬體的底層邏輯;
- 計算模型:圖靈機,通用的計算模型;
- 結構:馮諾依曼體系結構,採用二進位制,程式儲存執行,計算機由運算器,儲存器,輸入裝置和輸出裝置五個基本單元組成;
- 器件:電晶體,構成邏輯與儲存電路的基本元件;
2. 智慧計算的發展歷程
2.1 智慧計算發展的起點-通用計算裝置
1946
1946 年出現的通用計算裝置,用於計算自動化問題。1956 年,AI 的概念誕生。此後所有人工智慧技術的發展都是建立在新一代計算裝置與更強的計算能力之上。
2.2 智慧計算發展的第二階段-邏輯推理專家系統
1990
1990 年的邏輯推理專家系統。符號智慧學派科學家以邏輯和推理能力自動化為主要目標,提出了能將知識符號進行邏輯推理的專家系統。
人的先驗知識以符號的形式進入計算機,使得計算機能在特定領域輔助人類進行判斷和決策。但是專家系統嚴重依賴於手工生成的知識庫或規則庫。
符號計算系統的侷限性
- 符號計算系統對於高維問題存在計算複雜度爆炸的現象,因此只能解決線性增長問題,而對於高維複雜空間問題無法求解;
- 符號計算系統基於知識規則建立,無法列舉所有的常時,應用受限;
2.3 智慧計算發展的第三階段-深度學習計算系統
2014
中科院計算技術研究所 2013 年提出了國際首個深度學習處理架構。2014 年左右,智慧學派以學習能力自動化為目標,產生了深度學習等 AI 演算法。
2.4 智慧計算發展的第四階段-大模型計算系統
2020
- 小模型+判別式 >> 大模型+生成式(AIGC);
- 傳統的人臉識別,目標檢測,文字分類 >> 文字生成,影像生成,語音生成等;
- 大模型在對話系統領域的一個典型應用:GPT-3 採用給定一個輸入,預測下一個 token 來訓練模型,最後在大模型的基礎上進行微調與人類價值觀對齊;
- 大模型具有引數大,訓練資料大,算力需求大等特點;
大模型系統帶來的技術變革
- Scaling Law
當 AI 模型引數達到某個閾值後,模型的能力快速提升。模型的效能與模型引數規模、資料集大小、算力成對數線性關係。目前來說,透過增加引數規模可以顯著提高模型的智慧性;
- 算力需求急劇增長
模型訓練過程中對算力的急劇需求,使得算力相關的企業高速發展,NVIDIA 市值不斷增長。
- 勞動市場衝擊
根據《AI大模型對我國勞動力市場潛在影響研究》內容,財會、銷售、文書等職業受 AI 衝擊的程度位於前列,而需要與人打交道並提供服務的體力勞動型工作,如人力資源、行政、後勤等反而相對更安全。
2.5 大模型的發展方向
多模態
同一個模型,接受多個不同的 token 序列,採用與 LLM 模型相同的方法學習。
影片生成大模型
解析度、畫面真實度、時序一致性。OpenAI 於 2024 年 2 月 15 日釋出生成影片模型 SORA,具備世界模型的基本特徵—即人類觀察世界並進一步預測世界的能力。世界模型是建立在理解世界的基本物理常識之上,然後預測接下來發生的事件。
具身智慧
具有人造身體並支援與物理世界的互動。藉助多模態大模型處理輸入的資料,大模型的輸出結果作為智慧體的執行指令。可以說,具身智慧的機器人包括:以神經網路為代表的連線主義,以知識工程為代表的符號主義,與控制論相關的行為主義。
AI4R
AI for Research
使用 AI 進行科學發現和技術說明,提升人類的科學研究效率,實現從推斷(inference)到推理(reasoning)的躍升。
AI 在科學研究的一些應用:
- 預測蛋白質結構;
- 高效合成新藥;
- 設計高效能的晶片;
- 得到最佳化的結構;
AGI
Artificial General Intelligence
AI 大模型當前主要是透過資料驅動等研究宏觀世界的方法進行發展。AI 的變革性發展,還需要到神經系統的微觀世界中尋找答案。
3. 人工智慧安全風險
加強安全監管技術與可信的大模型;
安全風險
- 虛假資訊氾濫,數字分身;
- 偽造影片新聞,引發輿論事件,導致新聞媒體行業的社會信任倒退;
- 用於詐騙,AI 換臉變聲;
- 生成不雅圖片;
可信度
- AI 產生事實性錯誤;
- 以西方價值觀為主,輸出政治偏見和錯誤言論;
- 易被誘輸出有害內容;
- 資料安全問題,大模型成為重要敏感資料的誘捕器;
4. 發展困境與道路選擇
4.1 發展困境
困境一
美國在 AI 核心能力上處於領先地位,包括:
- AI 高階人才數量;
- AI 基礎演算法創新;
- 生成大模型能力;
- 大模型訓練資料;
- 大模型訓練算力;
困境二
訓練的高階算力晶片被禁售(A100,H00,B200等),國核心心算力晶片落後國際 2-3 代;
困境三
國內 AI 生態發展不足,而 NVIDIA 的 CUDA(Compute Unified Device Architecture,通用計算裝置架構)生態完備,具有 550 個 SDk(Software Development Kit,軟體開發工具包)。
國內企業間無法形成一個深度適配的強競爭力技術體系,難以形成合力。
困境四
AI 從網際網路行業向非網際網路行業遷移的難度較大,單次使用成本較高,且 AI 人才數量明顯不足。
4.2 道路選擇
選擇一—智慧計算體系的發展道路
智慧計算體系發展的三條道路:
- 追趕美國主導 AI 技術的相容體系;
- 構建專用的封閉體系,形成完整可控的技術體系與生態;
- 全球共建開源生態體系;
選擇二—智慧計算產業的中國方案
智慧計算的一個核心特徵就是用演算法在算力池中加工海量資料,得到智慧模型,再嵌入到資訊和物理世界的各個過程中,網路上傳輸的智慧流是算力對資料進行深度加工與精煉後的模型化抽象。
對於市場中絕大多數的中小微企業,需要的低門檻,低價格的智慧服務。因此中國智慧產業率先實現新型基礎設施(資料,演算法,算力)建設工作,類比與二十世紀初美國的資訊高速公路計劃中資訊基礎設施的建設。
- 資料:大力建設國家資料樞紐與資料流通基礎設施;
- 演算法:以通用大模型為基座,構建大模型研發與應用的基礎設施;
- 算力:作為算力基礎設施化建設的全國一體化算力網,算力基礎設施的中國方案需要具備“兩低一高”,即供給側降低算力的總成本,消費側降低算力的使用門檻,服務效率方面實現低熵高通量;
選擇三—人工智慧賦能的實體經濟
在”AI+“成效中,美國傾向於回報率高的虛擬經濟,輕視投資成本高且經濟回報率低的實體經濟。而中國更傾向於實體經濟與虛擬經濟同步發展,更加重視發展實體經濟。
中國的優勢在實體經濟,製造業全球產業門類最齊全,體系最完整,特點是場景多、私有資料多。在"AI+"賦能相關產業中,其成功的關鍵在於能否讓一個行業或一個產品的成本大幅下降,從而將使用者數與產業規模擴大數倍。