科技愛好者週刊(第 332 期):西蒙·威利森的年終總結,梁文鋒的訪談

阮一峰發表於2025-01-03

本雜誌開源,歡迎投稿。另有《誰在招人》服務,釋出程式設計師招聘資訊。合作請郵件聯絡[email protected])。

封面圖

世界最長的高速公路隧道"天山勝利隧道"本週貫通,長達22.13公里,汽車要在裡面開20分鐘。它連線了被天山隔斷的南疆和北疆。(via

西蒙·威利森的年終總結,梁文鋒的訪談

英國程式設計師西蒙·威利森(Simon Willison)最近兩年非常出名,他的個人網站有很多文章,介紹 AI 的最新進展。

本週,他發表了很長一篇的2024年大模型回顧(非官方的中譯),非常精彩。

他提到,AI 的發展速度快得難以想象。

一年前的2023年底,排名第一的 AI 模型是 OpenAI 公司的 GPT-4,沒有其他模型能超過它。

一年過去了,大家猜猜,GPT-4 現在排名多少?

答案是第69位(上圖),已經有18家公司的大模型超過了它。其中的一些模型,甚至可以在膝上型電腦執行。

短短一年,榜首模型就被大量競爭者輕鬆超過,家用硬體就能達到它的執行效果。AI 的進化速度就是這麼驚人。

西蒙·威利森特別提到了來自中國的大模型 DeepSeek V3

DeepSeek V3 是2024年12月25日釋出的,來自杭州的量化基金公司幻方量化。一經發布,它就引起了國際範圍的轟動。

它在多個引數上,擊敗了 OpenAI 公司最新的 o1 模型。目前,它在大模型排行榜上排名第7,要知道前十名裡面,只有它是開源模型,而且是最少限制的 MIT 許可證,其他都是大公司的專有模型。

而且,它的執行效率很高,訓練成本估計只有 Meta 公司的 Llama 3.1 405B 模型的11分之一,而後者的效果還不如它。這就是說,DeepSeek 找到了高效使用硬體、提高模型效果的方法。

西蒙·威利斯說:"DeepSeek V3 的訓練成本不足600萬美元,是一個極好的跡象,表明 AI 模型的訓練成本可以而且應該會繼續下降。"

西方媒體就非常好奇,DeepSeek 是怎麼做到的?

幻方量化創始人梁文鋒,跟其他 AI 模型的研究者不同,沒有海外經歷,畢業於浙江大學電子工程系人工智慧方向。

西方媒體對他充滿了好奇,專門將他以前的訪談譯成了英文

我覺得,原始的中文訪談( Part 1Part 2)很值得一讀,我分享他說的幾段話,展示了中國頂級研究者的視野和抱負。

(1)我們要做的不是生成式 AI,而是通用人工智慧 AGI。前者只是後者的必經之路,AGI 會在我們有生之年實現。

(2)任何 AI 公司(短期內)都沒有碾壓對手的技術優勢,因為有 OpenAI 指路,又都基於公開論文和程式碼,大廠和創業公司都會做出自己的大語言模型。

(3)在顛覆性的技術面前,閉源形成的護城河是短暫的。即使 OpenAI 閉源,也無法阻止被別人趕超。我們把價值沉澱在團隊上,我們的同事在這個過程中得到成長,積累很多know-how,形成可以創新的組織和文化,就是我們的護城河。

(4)我們不會閉源。我們認為先有一個強大的技術生態更重要。

(5)當前階段是技術創新的爆發期,而不是應用的爆發期。大模型應用門檻會越來越低,創業公司在未來20年任何時候下場,也都有機會。

(6)過去很多年,很多的中國公司習慣了別人做技術創新,拿過來做應用變現,自己等著摩爾定律從天而降,躺在家裡18個月就會出來更好的硬體和軟體。我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。中國也要逐步成為貢獻者,而不是一直搭便車。

(7)大部分中國公司習慣 follow,而不是創新。中國創新缺的不是資本,而是缺乏信心以及不知道怎麼組織高密度的人才。我們沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。

(8)我們每個人對於卡和人的調動是不設上限的。如果有想法,每個人隨時可以呼叫訓練叢集的卡無需審批。同時因為不存在層級和跨部門,也可以靈活呼叫所有人,只要對方也有興趣。

(9)我們選人的標準一直都是熱愛和好奇心,所以很多人會有一些奇特的經歷,很有意思。很多人對做研究的渴望,遠超對錢的在意。

(10)我們在做最難的事。對頂級人才吸引最大的,肯定是去解決世界上最難的問題。其實,頂尖人才在中國是被低估的。因為整個社會層面的硬核創新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們就是有吸引力的。

(11)中國產業結構的調整,會更依賴硬核技術的創新。很多人發現過去賺快錢很可能來自時代運氣,現在賺不到了,就會更願意俯身去做真正的創新。

(12)我是八十年代在廣東一個五線城市長大的。我的父親是小學老師,九十年代,廣東賺錢機會很多,當時有不少家長覺得讀書沒用。但現在回去看,觀念都變了。因為錢不好賺了,連開計程車的機會可能都沒了。一代人的時間就變了。以後硬核創新會越來越多,因為整個社會群體需要被事實教育。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。

科技動態

1、AirTag 充電盒

蘋果公司的 AirTag 可以追蹤物品,但如果沒電,就無法追蹤了。

一位國外程式設計師就遇到了這個問題。他的1萬美元裝備的相機包放在車後座被偷了,當他開啟追蹤時,才發現裡面的 AirTag 忘了換電池,已經無法追蹤了。

他痛定思痛,發明了一個 AirTag 充電盒,把兩節五號電池跟 AirTag 封裝在一起,為後者充電。

據他說,這個充電盒可以持續工作10年,完全不用擔心沒電。

只要把這個小盒子跟你要追蹤的物品,放在一起,就不用管它了,一直可以追蹤。

2、無護照過海關

從2024年9月30日開始,新加坡公民透過樟宜機場出入境,不再需要護照了。

機場會使用人臉識別和虹膜識別,來代替護照。這樣更省時、成本更低。

紙製護照已經過時了,也許不久將來就會消失。

3、世界最大 3D 列印社群

美國得克薩斯州即將完工世界最大的 3D 列印社群,共有100幢住宅。

這些房子都是一個巨大的 3D 印表機生成的。

房屋的列印材料是混凝土粉末、水、沙子、新增劑的混合物,噴嘴將混合物像牙膏一樣擠出,沿著預先程式設計的路徑層層堆疊,形成牆壁。

建築公司表示,3D 列印房屋更快、更便宜,現場只需要一個操作員,並且最大限度地減少了建築材料浪費。

單層的三居室或四居室住宅,大約需要三週才能列印好所有牆壁,然後再用傳統方式加固地基和安裝屋頂。

4、其他

(1)網友發現,Spotify 歌單裡面,有些音樂家根本不存在,他們的作品很可能是 AI 生成的,Spotify 以此減少付出的版權費。

(2)百度推出"Ai 搜",彙集了各種 AI 相關功能。

文章

1、2024年 Linux 發行版推薦(英文)

作者介紹他心目中,各種用途最佳的 Linux 發行版。

2、中美工作感想(中文)

"過去四年五個月,我隨著工作從 SF 搬到北京,再搬到上海,後來搬回美國在洛杉磯住了一年半。"本文是國內做工程師和美國做工程師的對比。(@wukan 投稿)

3、開發者應該知道的10個終端命令(英文)

本文簡單介紹10個終端命令,比如 grep、awk、sed、find 等。

4、Meta 四次面試經歷(中文)

"這些年,我一共面試了四次 Facebook/Meta。雖然都未成功,但收穫頗多。"(@DoctorLai 投稿)

5、演算法面試心得(中文)

本文是作者對如何應付一般的演算法面試的知識總結和心得。(@javayhu 投稿)

6、我們用 React 取代了 Next.js(英文)

作者難以忍受 Next.js 的龐雜和效能,改為直接使用 React,不再用基於它的框架了。

7、Windows 的增強剪貼簿(英文)

我很少用 Windows,現在才知道它的剪貼簿有同步功能,還能永久儲存。

工具

1、Ghostty

一個終端模擬器,使用 GPU 渲染 UI,支援 mac 和 Linux。作者是 HashiCorp 公司創始人,參見介紹文章

2、Black Candy

一個自搭建的音樂流媒體伺服器,自帶手機和 Web 客戶端,相當於自己的雲音樂平臺。

3、curl-impersonate

一個 curl 的改寫版,使其發出的 HTTP 請求就像 Chrome/Firefox 發出的。

4、RSS.Beauty

將普通的 RSS/Atom 訂閱源轉換成美觀的閱讀介面,程式碼開源。(@ccbikai 投稿)

5、AI Shadcn 主題生成器

輸入關鍵詞,就可以免費生成 Shadcn 主題。(@meetqy 投稿)

6、懶貓書籤

開源的 Chrome 外掛,一鍵清理失效連結和空資料夾。(@Alanrk 投稿)

類似外掛還有 Bookmark Pro。(@wincatcher 投稿)

7、Nping

Rust 語言開發的 Ping 工具,支援多個地址併發 Ping,並附帶實時折線圖展示。(@hanshuaikang 投稿)

8、peepDB

一個命令列工具,連線各種主流的關係型資料庫,檢視錶內容。

9、File Pilot

非官方的 Windows 檔案管理器,號稱可以取代官方的資源管理器。

10、Doggo

一個易用的 DNS 命令列查詢工具。

它的官網首頁還提供 DNS 線上查詢。

AI 相關

1、DeepSeek Coder

根據提示生成 App,基於 DeepSeek V3 模型。(@sing1ee 投稿)

2、GodView

語義化地圖,用自然語言查詢地圖,比如輸入"請展示上海的前10大圖書館"。

3、對話 CEO

與馬斯克、張一鳴、任正非對話,效果還可以。(@5A59 投稿)

4、ithy

AI 模型聚合網站,輸入關鍵詞,同時返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成結果。

5、AutoMouser

開源的 Chrome 瀏覽器外掛,將滑鼠操作透過 AI 轉為 Selenium Python 指令碼,需要 OpenAI key。(@guoriyue 投稿)

資源

1、search the arXiv

arXiv 論文庫的搜素引擎,使用自然語言搜尋。

2、《演算法(第4版)》的 C++ 實現

這個倉庫包含《演算法(第4版)》教科書介紹的演算法的 C++ 語言實現,與原書的 Java 實現相對應,(@landerrosette 投稿)

3、EmojiClick

使用自然語言搜尋 Emoji 符號。(@yijianbo 投稿)

4、獨立開發者工具

該倉庫收集獨立開發者出海技術棧和工具。(@yaolifeng0629 投稿)

圖片

1、世界最美鈔票

2023年,國際鈔票協會評選當年的"世界最美鈔票"。得獎者是東加勒比中央銀行發行的2元紙幣。

這張鈔票色彩繽紛,確實非常漂亮。正面是當地板球明星,以及銀行標誌、烏龜和魚。

背面是魚、珊瑚、海龜、藍色島嶼地圖。

2、行業聖誕樹

上週聖誕節,美國媒體貼出了,各行各業搭建自己聖誕樹的照片。

披薩店的外賣盒聖誕樹。

裝潢店的玻璃聖誕樹。

修路隊的交通錐聖誕樹。

書店的聖誕樹。

電腦店的聖誕樹

超市的香蕉聖誕樹

文摘

1、亞馬遜河為什麼沒有橋?

南美洲的亞馬遜河是世界第二長的河流,僅次於非洲的尼羅河。

但是,這條河沒有一座橋,是唯一一條沒有任何橋樑的世界主要河流。這是為什麼呢?

首先,每年的雨季,亞馬遜河都會氾濫,河流的寬度會從旱季的5公里變成50公里,就像下圖那樣,很難造橋。

其次,亞馬遜河沿岸人煙稀少,只有很少幾個城鎮。最大一個城市的人口只有50萬,不存在前往河對岸的強烈需求。

最後,亞馬遜河兩岸都是原始森林,並沒有現成道路。如果造橋就需要砍伐大量森林,修建引橋和公路,環境代價很大。近年來,環保意識逐漸高漲,反對造橋的呼聲也就越來越大。

言論

1、

由於 AI 的出現,英語正在成為最熱門的新程式語言。

-- Andrej Karpathy,著名的 AI 科學家

2、

除非手機可以當成電腦使用,否則我不打算再為效能升級手機了,不再為越來越快的 CPU 買單了。

-- Android Authority 專欄作家

3、

保護海底光纜不出事是不可能的,你唯一能做的就是建立大量冗餘,在不同位置鋪設數十根光纜可能比保護它們更便宜。

-- Hacker News 讀者

4、

強大的工程師不在於速度快或產出高,而在於能夠完成其他工程師無法完成的任務。弱小的工程師幾乎任何任務都完成不了。

如果你和一個弱小的工程師一起工作,你可以幫他,但一定要保護好你的時間,防止他把你的時間都消耗光。

-- 《強大的工程師與弱小的工程師》

5、

人工智慧並不是釋放我們的想象力,而是外包它們。

-- 英國《衛報》

往年回顧

為什麼 PPT 不如備忘錄(#285)

青年失業率與選擇創業(#235)

美國憲法拍賣,一個區塊鏈案例(#185)

什麼行業適合創業?(#135)

(完)

相關文章