科技愛好者週刊(第 284 期):YouTube 有多少個影片?

阮一峰發表於2023-12-29

本雜誌開源,歡迎投稿。另有《誰在招人》服務,釋出程式設計師招聘資訊。合作請郵件聯絡[email protected])。

封面圖

一位義大利攝影師,苦苦嘗試了6年,終於在本月拍到了一張難以置信的照片:大教堂、山峰、月亮處於一條直線,並且地球反射的太陽光,透過長曝光,可以照亮月亮頂部。(via

YouTube 有多少個影片?

YouTube 是世界最大影片網站,全世界的人都在上傳影片。

但是,它沒有透露過,內部一共有多少個影片。

上週,網上出現了一篇有趣的文章,使用機率方法,估計 YouTube 的影片總數。

這篇文章非常有啟發意義,面試可能也會出這一類的題目。下面,我就分享作者是怎麼做的。

我們知道,每一個 YouTube 影片都有唯一編號,放在 URL 裡面。

比如,某個影片的 URL 是https://www.youtube.com/watch?v=NJHG0yuBabQ&,那麼它的影片編號就是NJHG0yuBabQ&

YouTube 也沒有透露過,這個編號是怎麼產生的。

但是根據觀察,可以得知它是一個11位字串,前十位字元的取值範圍是64個值([a-zA-Z0-9_-]),最後的第十一位字元的取值範圍只有16個值。

這意味著,所有的編號一共有 2^64 種可能,這是一個超級巨大的數字,足以容納過去和將來所有可能生成的影片。

顯然,不是每一個編號,都有對應的影片,絕大部分是空號,而且空號遠遠多於實際影片。如果我們假定,YouTube 一共有10億個影片,那麼你大概猜184億次,才會猜中一個有效的編號(前提是這些編號為均勻分佈)。

那麼,我們可以反推,透過抽中有效編號的機率,判斷出 YouTube 一共有多少個影片

這就好比,某個地區的電話號碼是從 843-000-0000 到 843-999-9999,一共有1000萬個號碼。我們隨機撥打100個號碼,如果其中10個可以接通(即10%的接通率),我們就可以判斷出,大概有100萬人擁有843號碼,其他900萬個都是空號。

那篇文章的作者就使用這種方法,隨機構造影片編號,看看命中多少個,然後得到了一個結論:2023年 YouTube 的影片總數估計為 133.25 億

他們不僅估計了影片總數,還估計了其他很多指標,全部公開在網站 tubestats.org 上面。

根據這些資料,可以得到一些有趣的觀察。

  • 2023年 YouTube 共有133億個影片,2022年是93億個,年增長率超過40%。
  • 4.5% 的影片一次也沒有播放過。
  • 72% 的影片一條評論也沒有。
  • 60% 的影片是 Vlog(個人生活)。
  • 9分鐘到16分鐘的影片最多,佔到20%。

如果你對長影片的資料感興趣,可以去這個網站挖掘。

最後,我看到網友提到,這種判斷方法並不新鮮。生物學家早就用它,瞭解湖泊中魚的總數。

你在池塘裡釣到100條魚,全部做好了標識,然後放生。過了一個星期,你又去釣了100條魚,發現其中有30條是上週釣到過的,請問這個池塘一共有多少條魚?

科技動態

1、自動駕駛燈

賓士汽車最近獲得批准,在車輛上新增綠松石燈光。

這種燈光亮起時,就表示車輛處於自動駕駛狀態。即使駕駛座上有司機,他此時也沒有控制方向盤。

根據上圖,該燈光出現在多個部位,包括車前燈、車後燈和後視鏡上。

這個設計可能會成為所有車輛的共同標準。以後,我們透過車燈,就能區分自動駕駛車輛和人類駕駛車輛。但是那樣,未來的馬路上會不會都是一片青綠色?

2、64核筆記本

國內某廠商居然將伺服器的64核 AMD EPYC CPU,放進了筆記本,並配上 RTX4080 顯示卡和液冷降溫。

這可能是史上效能最強的筆記本了,因為用的是伺服器配置。目前市場上效能最強的筆記本,不過是16核 CPU,而它是64核。

它的厚度為4.6釐米,其實還可以,但這造型太像板磚了,工業設計未免簡陋了。

3、Cybertruck 涉水模式

馬斯克在推特上宣佈(下圖),Cybertruck 將有一個套裝,可以變成船,在水裡至少開100米。

早先媒體已經確認,Cybertruck 的選單裡面確實有一個"涉水模式"(ward mode)(下圖),看來真的可以在水裡開。

但是,這個車非常重,很難想象可以浮在水面上,更大可能是溯溪,車輪可以接觸到水底。

有的媒體惡搞,猜測馬斯克所說的"套裝"是一個氣墊船的底盤,可以裝在 Cybertruck 的下面,還畫了想象圖。

4、GitHub 貢獻牆

有些國外的 HR 招聘人員,會檢視求職者的 GitHub 貢獻牆。

一篇文章透露,像下圖這樣的貢獻牆,可能會讓招聘官留下不好的印象,導致求職被拒。

上圖這位程式設計師,週末兩天基本不提交程式碼,聖誕假期、春假、暑假、秋假也很少提交。

5、綿羊除草

為了保持草坪整潔,除草機是必需的。但是,它的噪音很大,與安寧的環境不太協調。

加州大學戴維斯分校最近引入了綿羊,嘗試用綿羊除草,而不是除草機。

最初這只是一個實驗,看看綿羊能否替代除草機。但是後來發現,綿羊除了吃草,本身也是一道風景,並具有自然療法的效果,讓人們感到心靈平靜。

現在,每天放出羊群到草坪上吃草,已經成了該校的固定做法。許多學生表示,綿羊讓他們減輕了壓力。

但是,綿羊需要額外的管理。每天早上,運輸車將綿羊運入校園,晚上再運回穀倉,這是非常麻煩的,恐怕很難推廣開來。

文章

1、為什麼手機最後1%的電可以用很久?(中文)

本文介紹手機剩餘電量的計算方法。

2、如何在 Windows 刪除 Edge(中文)

微軟為了遵守歐元區的監管規定,允許該區域的使用者解除安裝 Edge 並移除 Bing。網友找到了變通方法,讓非歐元區的使用者也能解除安裝 Edge。(@WFANG12719 投稿)

3、iPhone 允許應用追蹤使用者(中文)

iPhone 有一個 API,能夠獲取使用者的 WiFi 接入點,從而在使用者無感知的情況下對其精確定位,該功能還無法關閉。

4、瞭解圖形系統 X(中文)

Linux 圖形環境的底層是 X 圖形系統,本文對它進行一個通俗的介紹。(@silaoA 投稿)

5、開源公司的生與死(英文)

一個外國人程式設計師購買了中國產的 3D 印表機 Bambu Lab A1。他很喜歡這臺印表機,感嘆中國公司基於其他人的開源軟體,做出了更好的產品,威脅到了原始的開源公司的生存。

6、如何用 Node.js 寫一個命令列工具(英文)

本文介紹如果用 Node.js 的標準庫,不載入任何外部模組,寫一個命令列工具。

7、如何複製 Windows 不能複製的文字(英文)

本文介紹三種方法,在 Windows 複製那些無法複製的文字,比如視窗皮膚上的文字(上圖)。

8、Firefox 的多賬戶容器(英文)

Firefox 允許新建容器,在容器裡面訪問某個網站。這不僅可以保護隱私,還可以同時登入單個網站的多個賬戶。

工具

1、Score In URL

一個線上編輯和分享樂譜的網站,樂譜儲存在 URL 之中。

2、Teamlinker

一個開源的團隊協作平臺,包含專案、Wiki、日曆、會議、聊天和網盤等功能。(@xbdsky 投稿)

3、Rspress

基於 Rspack 的靜態站點生成器,內建了 Rust 工具鏈,效能優秀,上手簡單。(@sanyuan0704 投稿)

4、AudioCut

一個 Web 工具,可以自動剪輯音訊檔案,去除噪音和重複內容,刪除選中的單詞和句子,適合編輯播客。(@tangpanqing 投稿)

5、Tianji

一個開源工具,網站流量分析 + 業務監控告警 + 伺服器監控三合一,三種服務做在了一起。(@moonrailgun 投稿)

7、Memo Card

一個 Web 工具,用來生成文字分享的卡片圖。(@ivone-liu 投稿)

8、vocal-separate

一款極簡的人聲和背景音樂分離工具,將音影片檔案分離為單獨的人聲檔案和伴奏檔案,完全本地化作業,無需連線外網。(@jianchang512 投稿)

9、DouyinLiveRecorder

一款免費的直播錄製工具,支援錄製抖音、Tiktok、快手、虎牙、鬥魚、B站、小紅書等多平臺的直播影片。(@ihmily 投稿)

10、Drawing Prompt

一個文生圖的輔助工具,可以自動擴充套件提示語,將簡短的提示(非英語也可以)變成詳盡豐富的英語提示,免費且無需登入。還支援生成隨機的提示詞 tag 組合,並內嵌 Fast SDXL 模型,用於預覽效果。(@dongan-beta 投稿)

11、cloudflare-ai-web

透過免費的 Cloudflare Worker,搭建一個你自己的 AI 平臺,支援切換多個 AI 模型,試用 Demo。(@Jazee6 投稿)

12、Penumbra

一種配色方案,有明暗兩個主題。據說是透過數學計算得到的、最有利於感知的配色方案。

資源

1、電腦科學熱門論文(英文)

該網站按照動態排名,列出計算機領域的最新熱門論文。

2、駭客新聞電訊

這個網站使用 AI,將"駭客新聞"每天的熱點寫成一篇篇報導,以後的"內容農場"大概就是這種樣子。

3、老式電腦紙模型

該網站提供各種老式電腦的摺紙模型下載。

4、Kickass markdown

這個倉庫收集各種 GitHub Markdown 技巧,比如顯示紅底白字(上圖)。

5、Hugging Face 課程

著名 AI 平臺 Hugging Face 的官方學習頻道,目前有三門課程:NLP、深度學習和 AI 音訊處理。

圖片

1、波浪牆

英國的很多磚牆砌成波浪形。

表面上看,這樣既浪費土地,又費工,但是它也有顯著的優點。

它採用拱橋的曲面結構,具有更強的抗壓力,所以比直牆更牢固,因此它可以修得很薄,比較節省材料。

文摘

1、夏農與愛因斯坦

資訊理論奠基人夏農的傳記裡面,記錄了一段他與愛因斯坦的趣事。

博士畢業以後,夏農來到普林斯頓高等研究院,愛因斯坦也在那裡。

當時,夏農只是一個小講師,而愛因斯坦已經是名滿世界的大科學家。

有一次,夏農正在研究院給一群數學家上課,教室的後門開啟了,愛因斯坦走了進來。

愛因斯坦站著聽了幾分鐘課,然後與後排的一個聽課者耳語一番,就離開了教室。

課程結束後,夏農匆匆忙忙地趕到教室後排,找到那個與愛因斯坦耳語的人,迫切想要知道這名偉大的科學家對他的講課內容有哪些評價。

那個人告訴他:"愛因斯坦只是問了洗手間怎麼走。"

言論

1、

直到有一天,你意識到了你會死,手頭的事情做不完,一切就都發生了改變。從那一天開始,你花費的時間才是真正花出去的時間。

-- 馬丁·斯科塞斯,美國著名電影導演,今年80歲

2、

亞歷山大大帝建立馬其頓帝國後,有一天突然哭了,因為他感到沒有更多的世界可以征服了。

-- 古羅馬作家普魯塔克

3、

普通人很難理解天才的思考過程,因為天才一方面很難向他人解釋自己的想法,另一方面也不屑於這樣做。

-- 喬治·亨利·劉易斯,英國哲學家

4、

專利流氓利用 AI 生成大量想法,然後逐一申請專利,這只是時間問題。

-- Hacker News 讀者

5、

作家總是與一張白紙(或一個空白螢幕)進行對抗,通常是白紙獲勝。

ChatGPT 的使用者總是與一個空白文字框進行對抗,通常是空白文字框獲勝。

-- dbreunig.com

往年回顧

真實方位是如何暴露的?(2022 #237)

元宇宙會成功嗎(2021 #187)

Slack 被收購,以及企業的技術選型(2020 #137)

新人要為團隊寫文件(2019 #87)

(完)

相關文章