Github上的有趣事實:"BigQuery驅動下的資料世界"

發表於2016-08-01

近日看到了Google的BigQuery技術,用類似SQL的語言來做一些資料的分析。而Github也加入了進來。閒來無事,就去體驗了一把。https://cloud.google.com/bigquery/public-data/github 這是相關文章的地址。

BigQuery語法

整體的語法都和SQL非常接近,鑑於點進來的人很多都是衝著“有趣”這兩個字來的,就不過多介紹程式碼了。這段程式碼的作用是找到github倉庫中,使用Python語言的倉庫中,前10個被引用的庫。

BigQuery的介面也非常有Google風…… github_20160702000047.png

這是通過剛剛的分析做出來的前幾名的Python庫的列表。 a5037d6edd3b9ca5 (2).png

a5037d6edd3b9ca5 (3).png

一些其它有趣的事情

例如大家都在用什麼協議來發布作品,有接近150萬個倉庫使用MIT協議來發布。 a5037d6edd3b9ca5 (4).png

關注tensorflow的人都在關注什麼? a5037d6edd3b9ca5 (5).png

最受歡迎的語言 1-_uxwTTOd1oRXjmloZ5Qi0g.png

提交次數和時間的關係 1-Ud8ZAz1xoVWK9DfiX6_hBg.png

相關文章