推薦一枚寶藏Up主,順便聊聊感想

xiaoxi666發表於2024-07-13

眾所周知,B站是學習網站😄

最近發現一寶藏Up主,主要做科普,主題包括但不限於:大模型的底層演算法、量子計算底層原理和硬體設計,以及其他物理或者自然科學主題,總體偏向於理工科。

值得推薦的理由:Up主對底層技術的瞭解非常透徹,因此舉的例子也非常生動(即使如傅立葉變換這類複雜的數學公式,也能用生活中的例子類比)。

Up主的名字:新石器公園

推薦一看。

接下來聊聊感想

我是怎麼發現這枚寶藏Up主的呢?

源於最近使用metaso.cn搜了一下2024年熱點研究方向:


然後挑了幾個計算機領域比較相近的研究方向,挨個兒去B站搜尋相關領域的影片,順其自然就找到啦,然後科普影片就看得停不下來,感觸比較深的是:

從去年開始,大模型爆發,很明顯的一個現象是,隨著國內相關政策的不斷完善,開源生態也越來越成熟,產業界的跟進落地速度與也越來越快,相關的產品層出不窮。不過,大多數開發人員更關注上層使用,而對底層的細節關注比較少,比如下面幾個問題看看你是否能夠回答:

1. 大模型的引數是指什麼?它和傳統的神經網路有什麼不同?

2. transformer的自注意力機制是指什麼?

3. 擴散模型底層原理是怎樣的?大模型為什麼能生成影片?

向下擴充套件到底層技術:

1. 之前頻頻上新聞的室溫超導技術,究竟有啥用?

2. 量子計算機是科學還是玄學?它如何提高計算效率?又會與大模型擦出怎樣的火花?

3. 憶阻器與常見的模電器件有何不同?

這些問題,在Up主的科普影片都有解答,對於概念理解而言,是非常好的入門渠道。如果你說,這和我有啥關係?這難道不是科學家要關心的嘛?那向上擴充套件到應用層,看看以下問題你能否回答:

1. 大模型在工業中是如何發揮作用的?比如之前華為用在了採礦,現在又用在了鍊鋼,究竟是怎麼做的?

2. 大模型在計算機業界,最常用的架構是怎樣的?除了RAG,還有其他形式嗎?大模型效果評價體系有哪些?

3. 內容向量化是指什麼?維度又是什麼含義?選取多少維度比較合適?

4. 文字的語義切分怎麼做,才能保證效果最優?傳統的chunk+overlap是否還有最佳化空間?用大模型直接做語義切分怎麼樣?

5. prompt調優有哪些手段?如何評估它們的效果?

是不是發現很多知識明明用了,但是不清楚背後的原理?或者知道原理但不知道如何表達出來?

其實,這都屬於知識體系構建不完整的一種體現,很多知識都是一個個孤島,沒有連點成線,更別提連線成面了。

所以,我們要做的是:

1. 在工作之餘,花點時間瞭解平時用到的技術底層原理,慢慢提升認知。這是向下紮根的過程;

2.多關注行業發展趨勢,多接觸業務領域人員,瞭解他們對於技術演化趨勢的看法,這也很重要,往往決定了技術是否能夠搭載產品被推廣出去。這是向上生長的過程。

既然談到了知識體系的構建,那就

再聊聊資訊收集和處理的方法

最近逛知乎偶然看到的一個話題:

於是有幸拜讀了回答的一篇長文,該文從各種角度分析了資訊的獲取、處理以及分析方式,具體可以去知乎檢視,本文不再展開。

還有一本北大博士論文神作,名叫《中縣幹部》,網上有資源,可以學習下。

總體而言,可以理解為文章講述了一套概念:找到渠道、瞭解各類實體、獲取各類實體之間的互動關係,並持續關注實體互動關係的動態變化。這與電腦科學中常常提到的知識圖譜或者圖資料庫的構建和更新操作非常相似。

你看,這個世界的很多東西都是相通的,所以多多思考,任督二脈就慢慢打通了。

時間有限,今天就先聊到這裡吧,希望能給大家帶來一些啟發。

相關文章