科技愛好者週刊(第 328 期):AI 模型不是一門好生意

阮一峰發表於2024-12-06

本雜誌開源,歡迎投稿。另有《誰在招人》服務,釋出程式設計師招聘資訊。合作請郵件聯絡[email protected])。

封面圖

上海南站正在改造,車站的北半部在施工,南半部正常運營,中間用巨大的簾布隔開。

AI 模型不是一門好生意

微軟的 Microsoft 365 最近漲價了,漲幅最高的地區為41%。

微軟解釋,漲價原因是多了 AI 助手 Copilot 的成本。中國大陸因為沒有 Copilot,所以不漲價。

無獨有偶,OpenAI 也說要漲價,漲幅更誇張。新模型的訂閱費可能從現在的每月20美元,漲到每月2000美元

(最新訊息是,昨晚釋出的 ChatGPT Pro 已經上漲到每月200美元。)

這兩條新聞證明了一件事:AI 模型太燒錢,即使世界最有錢的公司都承受不起,只能大幅漲價。

不止微軟和 OpenAI,所有經營 AI 模型的公司其實日子都不好過,目前都是虧本賣 AI 服務,爭奪市場佔有率。

這種運營壓力恐怕將長期存在,因為以下的原因,註定了 AI 模型不是一門好生意。

(1)AI 模型需要投入大量資金

OpenAI 每年的執行經費據報導是70億美元,Anthropic 今年預計支出27億美元,Facebook 向 AI 部門最近增加了數十億美元的投入。

這麼高的投入,要有上億的付費使用者,才可能獲利,談何容易。

(2)模型成本沒有規模經濟

絕大多數行業,規模越大,單位成本越低。但是,AI 模型正好相反,模型越大,單位成本可能更貴。

因為隨著模型變大,進一步改進可能更加困難,訓練新模型所需的計算量也在增加。這就像攀登珠穆朗瑪峰,到了8000米以後,每一步都越發艱難。2024年訓練一個頂級模型,要比2023年訓練頂級模型,計算量更大更貴。

偏偏 AI 模型的效果與規模有關,規模和計算量越大、模型效果越好。因此,大模型公司的運營費用無法下降,只會變大。

(3)AI 模型快速貶值

AI 模型公司為了市場份額和投資回報,必須不斷推出更好、更快、更強的新模型。

如果行業不斷推出新模型,那麼舊模型就會快速貶值。當你可以使用 GPT-4 時,還會有人想使用 GPT-3 嗎?如果競爭對手推出了更好的模型,還會有人用你的模型嗎?

為了始終在市場佔有一席之地,你必須始終是市場最好的 AI 模型之一。這意味著,你的投入始終無法減少。

即使由於接近了技術極限,AI 行業無法繼續推出更強的新模型,舊模型依然會快速貶值。因為市場上存在開源模型,比如 Llama 和 Mistral,如果商業模型停止進步,開源模型就將迅速縮小差距,那麼舊的商業模型也就不值錢了。

舉例來說,Anthropic 公司歷史上開發過十個模型,為此陷入嚴重虧損。其中八個模型現在已經毫無價值,第九個模型是開源的,第十個模型讓它現在能保持微弱的技術優勢和市場活力。

它只有繼續開發第十一個模型,才有可能在未來生存下去。

(4)AI 模型公司無法保持壟斷優勢

OpenAI 是目前的市場領先者,它的優勢建立在大量計算的基礎上。這些計算所需的物理資源,都是租用雲服務商的裝置,而不是自家的。只要有足夠的錢,任何人都可以使用相同的資源。不難想象一小群高階工程師離開 OpenAI,籌集大量資金,租用計算資源,在幾個月內就能對 OpenAI 的核心業務構成威脅。

換句話說,雲服務商花費數十億美元建設的資料中心是一種護城河,OpenAI 花費數十億美元構建的 GPT 早期版本(比如 GPT-2 和 GPT-3)不是護城河,因為現在有更好的模型已經在 Github 上免費提供。

大模型公司搭建自己的機房,也無濟於事。因為對手可以租用雲服務商的機房,投入更少,效果是一樣的。

綜上所述,AI 模型似乎是一個可怕的行業:每年必須不斷地鉅額投資,應對持續上升的模型成本,以及當前模型一兩年後就會被淘汰的競爭壓力。你也沒有防止競爭對手的有效手段,你最好的員工可能會離開,你的技術專長很難成為持久的優勢。

所以,那些還在考慮推出 AI 模型的商業公司,進入這個行業之前,需要三思。

至於已經走上這條路、現在正運營 AI 模型的公司,由於模型如此燒錢,籌集最多資金的公司會贏(活得最久),所以當務之急應該是儘可能多、儘可能快地籌集資金。

此外,應對之策還包括,讓你的模型差異化,以便留住使用者。比如,記住使用者的個人資料,可能是一種對策。模型應該可以記住使用者的問題,從而更好地瞭解使用者。使用者使用它越多,就越難切換,因為它知道所有你的歷史、你提出的問題、你關心的事情。

豆包 MarsCode 系列活動

豆包 MarsCode 是專業的大模型程式設計助手,位元組旗下的產品。

它與稀土掘金技術社群(juejin.cn)合作,本月14日在深圳,19日在上海,將舉行兩場系列活動,讓更多同學一起參與進來,探索 AI 程式設計的潛力。

(1)12月14日,深圳將舉辦"豆包 MarsCode 動手實驗室",讓大家親手參與 AI 程式設計。

參與者以"隊"為單位(最多三人,也可單人成隊),現場直接用 AI 程式設計,完成一個小遊戲。豆包 MarsCode 的同學會當場指導,與大家深度交流,並評出優勝作品。

透過現場 AI 技術交流實踐,大家可以看看創意怎樣透過 AI 快速落地

點選這裡,或者掃描上方海報二維碼,瞭解詳情並報名。

(2)12月19日,上海舉行豆包 MarsCode 程式設計挑戰賽。參賽者藉助 AI,在規定時間內完成4道演算法題。

這可以作為面試練習,如果獲獎還可以當作個人資歷。點選這裡瞭解詳情並報名參賽。

科技動態

1、樹莓派掌上電腦

一支國外團隊推出了"樹莓派掌上電腦",看上去很酷。

它就是一個全功能的 Linux 系統,帶有7小時續航。

它還有一個可組裝版本,螢幕是單獨分離的。

下面可以配上鍵盤,也可以配上手柄。

它是開源的,製作團隊希望將成本控制在250美元。

2、超聲波洗澡機

1970年的大阪世博會,三洋公司展出了一臺超聲波洗澡機。

人坐進去,頭露在外面,機器裡面是水。

按下按鈕,機器就會釋放出超聲波,透過震動達到清潔的目的。

它與現在市場上的"超聲波清潔機"的原理是一樣的,只不過它用來給人洗澡。

這臺機器從未投入生產。明年2025年,大阪將再次舉辦世博會,一家公司重新生產了這臺機器,專門用於醫療保健領域。

3、升縮鞋

青少年的鞋子往往只能穿一年,然後就穿不下了。

一家美國公司設計了升縮鞋,鞋會跟著腳一起長。

它的做法就是把鞋底分成兩塊,中間使用彈性材料連線。

如果腳變大了,鞋也會隨之被撐開。

為了穿著舒適,鞋面也採用升縮材料,編織成襪子狀的網眼結構,穿進去也比較容易。

這種鞋的另一個好處,就是不用區分腳碼,一雙鞋適合多個腳碼。

4、其他

(1)三星工程師做出了一個"拍照機器人",只要你告訴它想拍什麼樣的照片,它就會自動擺出最佳姿勢,為你拍照。

文章

1、我們為什麼轉向 Astro(英文)

作者原來使用 Next.js 框架,因為受不了 React 和 Next.js 的種種問題(主要是複雜性),轉向了 Astro 框架,本文是使用感受。

2、Phoenix LiveView 1.0.0 釋出了(英文)

Phoenix LiveView 是 Elixir 語言的 Web 開發框架,(目標是)用更簡單的模型,實現 React 框架的所有功能,同時還支援高併發。本文是它的介紹。

3、我如何用機上 WiFi 獲知飛機方位(英文)

作者乘坐飛機時,利用航空公司的伺服器,繪出了當前飛機的飛行路線。

4、如何用 Cloudflare 重定向 URL(英文)

作者的個人網站更換了域名,他就用 Cloudflare 將舊網址重定向到新網址,完全免費。

5、不要用 SQL 的 count(*) 語句與 0 比較(英文)

一篇 SQL 科普文章,不要用 count(*) 等於 0,來判斷不存在符合條件的記錄。

6、如何用手機遠端解鎖 Windows(英文)

Windows 11 有一項功能,允許你用手機的指紋識別或人臉識別,解鎖 Windows。

7、如何用 Docker Compose 安裝 phpMyAdmin(英文)

一篇初學者教程,關於怎麼用 Docker Compose 在本機架設資料庫應用。

工具

1、Bananas

一款跨平臺的桌面應用,利用點對點連線與其他人共享您的螢幕,無需帳戶或任何伺服器(初始連線除外)。

2、jsontr.ee

一個 JS 網頁庫,將 JSON 資料轉成視覺化的樹狀圖。

3、WatchAlert

開源的輕量級監控告警系統,基於 Go + React。(@Cairry 投稿)

4、Easy Resizer

一個線上工具,批次調整圖片的大小。(@mywebtools 投稿)

5、IconEase

開源的跨平臺桌面應用,用來管理本地的圖示檔案。(@JiuRanYa 投稿)

6、X.Ryder

一套網站後臺的 UI 開發模板。(@pipijoe 投稿)

7、Peninsula

基於 macOS 劉海的視窗管理器和訊息中心。(@Celve 投稿)

8、Summary Cat

使用者提交一個 YouTube 影片網址,它會用文字總結出該影片的內容。

9、ubicloud

一個可以自己搭建的雲環境,能夠直接執行 GitHub Actions 指令碼。

10、matcha.css

一個加強瀏覽器的網頁預設樣式的 CSS 庫。

AI 相關

1、Bylo.ai

免費的 AI 影像生成網站。(@aaamomo64 投稿)

2、Color Diffusion

一個開源的 Python 程式,使用 Diffusion 模式對黑白照片上色。

3、AI 聚合搜尋引擎

該網站聚合多個 AI 搜尋引擎入口,可以切換不同的搜尋引擎進行搜尋。(@ovelv 投稿)

資源

1、Hi Speaking

一個英語跟讀網站,你按照課本讀一句,它會自動播放下一句,省去了手動點選。(@jiweiyuan 投稿)

2、In Pieces - 30 endangered Species

一個很有創意的網站,用30個碎片拼出30種瀕危動物,只使用 CSS。

3、資料視覺化目錄

這個網站按照用途,將資料視覺化分類,便於查詢你需要的圖表型別。

圖片

1、樂高皮膚

樂高積木可以搭建各種機器和宇宙飛船,所以有很多控制檯單元,使用了各種各樣的設計。

從中可以學習,怎樣的控制檯設計才是好的。

下面是一些糟糕的設計,你根本分不清,什麼操作用什麼按鈕。

如果將功能相近的按鈕,分成幾個區塊,辨識度就會大幅提高。

上圖中,最右邊的設計辨識度最好。

下面三個控制檯最簡單幹淨,帶有視覺化元素,屬於最好的設計。

2、為什麼老照片的人們不微笑?

19世紀末和20世紀初的老照片,人們的表情往往很嚴肅,即使微笑,也非常輕微。

一個主要原因是,那時的照相機需要長時間曝光,人們必須靜坐好幾分鐘才能拍照。

微笑是一種快速反應,而不是一種持續的表情狀態。當你必須靜止幾分鐘才能拍照時,你根本不可能保持微笑那麼久。

文摘

1、10億次心跳

哺乳動物隨著體型變大,心跳逐漸放慢,這是為什麼?

比如,倉鼠的心跳是每分鐘450次,貓是150次,豬是70次,大象是30次,鯨是20次。

原因可以這樣理解,假定貓的體積是倉鼠的10倍,那麼貓的新陳代謝率(它燃燒能量的強度)也應該是倉鼠的10倍,畢竟貓有10倍的細胞在消耗能量。

但是這不可能,如果真的這樣,貓就會因為體溫過高而死亡。因為新陳代謝會產生熱量,需要散熱,但是貓的表面積並沒有倉鼠的10倍,必定有一部分熱量無法散發出去,導致體溫過高。

為什麼貓的表面積沒有倉鼠的10倍?

中學數學告訴我們,表面積增長的速度,慢於體積增長的速度。舉例來說,如果球體的體積增長一倍,變成原來的兩倍,表面積只是原來的1.59倍。

既然無法散發所有的熱量,所以大型動物的新陳代謝必然慢於小型動物。相應的表現就是心跳放慢,降低新陳代謝的強度。

這就是為什麼體型越大,心跳越慢。

動物學家還發現一個有趣的現象,哺乳動物不管體型大小,一生的總心跳大概在10億次左右。

倉鼠的壽命是3年,貓是15年,豬是25年,大象是70年,鯨是80年。

結合它們的心率,不難算出,倉鼠一生的總心跳是7.1億次,貓是11.8億次,豬是9.2億次,大象是11億次,鯨是8.4億次。

這些動物的總心跳都在10億次左右。

奇怪的是,人類不符合這條規律。人每分鐘心跳60次,平均壽命70年,總心跳是22.1億次。

言論

1、

薩爾瓦多政府將比特幣作為國家儲備,目前擁有5,940個比特幣,價值5.82億美元。

但是,他們怎麼保管錢包的金鑰呢?萬一金鑰洩漏,國家豈不是破產了。

-- Hacker News 讀者

2、

19世紀的德國哲學家尼采,以前的寫作風格是不斷的長句,複雜的推理和解釋。

後來,他用上了打字機,寫作風格逐漸從長篇論證變成短篇的格言警句,變得像電報那樣。

-- 《打字機如何改變尼采》

3、

內部平臺效應(inner-platform effect)指的是,程式設計師傾向於建立一個可定製的內部系統,成為他們正在使用的外部軟體的複製品,而且通常是一個糟糕的複製品。

-- 維基百科

4、

我愛那些渴望不可能的人。

---- 歌德

5、

我通常不願意對技術做出預測,但我感到相當有信心的是,因為 AI 如此善於寫文章,幾十年後懂得如何寫文章的人一定不會很多。

-- 保羅·格拉漢姆,矽谷創業導師

往年回顧

新基建的政策選擇(2023 #281)

網際網路公司需要多少員工?(2022 #231)

移動支付應該怎麼設計?(2021 #181)

你的頭腦是二值邏輯,還是三值邏輯?(2020 #131)

(完)

相關文章