隨著AI,大資料這些技術的快速發展,與此有關的知識也普及開來。如何在眾多網站中尋找最有價值的資訊,如何在最短的時間內獲得最新的技術資訊?筆者在這裡整理出大資料和人工智慧領域最實用,質量最高的10大技術網站資訊,既可以用於豐富技術知識,也可以用於學術研究,僅供參考。
1. Google AI Blog
- 名稱:Google AI Blog
- 連結:research.googleblog.com
- 內容:AI
- 例文:SLING: A Natural Language Frame Semantic Parser
- 更新速度:未知
- 科學上網(此處是指需要連線VPN,下同):Yes
- 競爭強度:高
筆者有話說:該網站釋出的文章為谷歌的最新研究成果,極具權威性和學術性。根據筆者經驗,該網站的文章一出,就會受到各大微信公眾號的瘋搶,不到24個小時便能搜尋到譯文,由此可以看出該網站的水準的確很高。
2. Towards Data Science
- 名稱:Towards Data Science
- 連結:towardsdatascience.com/
- 內容:Data Science
- 例文:Building an Altcoin Market Sentiment Monitor
- 更新速度:平均每日三至四篇
- 科學上網:Yes
- 競爭強度:中等
筆者有話說:這是一個內容非常豐富的資料科學學習網站。大多數的文章都是以案例展開,並附有程式碼和配圖,文字嚴謹且具有良好的邏輯性,手把手教讀者如何去操作,對於資料科學的初學者非常友好。就選文渠道而言,它的更新速度很快,因此關注該渠道可以獲得源源不斷的優質文章,可選擇的餘地非常大,但是要注意去甄別文章的內容,並不是所有文章都那麼出色。
3. Analytics Vidhya
- 名稱:Analytics Vidhya
- 連結:www.analyticsvidhya.com/blog/
- 內容:AI & Data Science
- 例文:The Essential NLP Guide for data scientists (with codes for top 10 common NLP tasks)
- 更新速度:平均每週一篇
- 科學上網:No
- 競爭強度:低
筆者有話說:與Towards Data Science一樣,這也是一個優秀的資料科學教育網站。在它的blog裡面,大多數的文章以教程的方式展開,並附有程式碼。除此之外,還有一些純乾貨型文章,例如:The Essential NLP Guide for data scientists (with codes for top 10 common NLP tasks)。
4. Kdnuggets
- 名稱:Kdnuggets
- 連結:www.kdnuggets.com
- 內容:Computer Science
- 例文:PySpark SQL Cheat Sheet: Big Data in Python
- 更新速度:優質選文成批發放,兩至三週一更新
- 科學上網:No
- 競爭強度:高
筆者有話說:這是一個內容覆蓋非常廣泛的網站,不論是就職乾貨還是技術難題,它總會有相關的文章。該網站的文章質量非常高,因此是各大公眾號的“兵家必爭之地”。建議多掛住網站左下角的“Most Popular”和“Most Shared”裡的文章,快捷高效地獲取優質文章。
5. Pete Warden’s Blog
- 名稱:Pete Warden’s Blog
- 連結:https://petewarden.com/
- 內容:AI
- 例文:How do CNNs Deal with Position Differences?
- 更新速度:平均兩月一篇
- 科學上網:No
- 競爭強度:高
筆者有話說:這是技術牛人Pete Warden的個人部落格。他的文章更新較慢,但是內容嚴謹且具權威性。文章大都附有圖片和程式碼進行解釋。該網站是一個很好的研究性資訊來源,和Google Research Group一樣,文章一出,非常容易遭到瘋搶。另外,文章的內容比較艱深,同時篇幅長,比較適合學術研究使用。
6. Revolution Analytics
- 名稱:Revolution Analytics
- 連結:http://blog.revolutionanalytics.com/
- 內容:News & Learning Resource
- 例文:Compare outlier detection methods with the OutliersO3 package
- 更新速度:優質文章成批發放,平均每月一次
- 科學上網:No
- 競爭強度:低
筆者有話說:這是一個雜文網站,文章種類繁多。平時會發布一些結構較小的文章,而每個月都會出現一次Roundup。這個Roundup通常分兩個部分: 新聞和學習資源。建議主要關注這個Roundup裡的學習資源,有許多技術性的文章質量很高。
7. DZONE
- 名稱:DZONE
- 連結:https://dzone.com/
- 內容:各種計算機相關資訊
- 例文:NLP in Python
- 更新速度:平均每日每種類別都會更新一到兩篇文章
- 科學上網:No
- 競爭強度:低
筆者有話說:筆者在“內容”一欄填寫了“各種計算機相關資訊”,是因為這個網站的內容對於計算機領域的知識覆蓋簡直讓人驚訝。不論是AI、雲端計算、資料安全還是計算機效能、IoT和網站設計,這網站都有相關的文章,並且分好了類別。該網站的更新速度很快,而且每次都會對各個類別的文章進行大量更新。但是,對於文章質量來講,還需要認真甄別。
8. Codementor
- 名稱:Codementor
- 連結:https://www.codementor.io/community/topic/data-science
- 內容:各種附程式碼技術類乾貨
- 例文:Introducing pydbgen: A random dataframe/database table generator
- 更新速度:每月一篇
- 科學上網:No
- 競爭強度:低
筆者有話說:這是一個對於文章管理不是特別好的網站,它的文章沒有分類,因此很難摸清楚它發文章的具體套路。根據筆者經驗,這個網站所發的文章基本都是技術性文章,幫助解決各種技術性問題的。文章大都附有程式碼,因此比較乾貨。
9. Data+Science
- 名稱:Data+Science
- 連結:https://www.dataplusscience.com/insights.html
- 內容:資料視覺化
- 例文:Finding the Nearest Ocean Coast or any Nearest Point on a Map in Tableau
- 更新速度:每月兩篇
- 科學上網:No
- 競爭強度:低
筆者有話說:這個網站的主題是資料視覺化。因此,它的所有文章都是資料視覺化案例,其中比較多見的就是Tableau的case。這個網站文章的最大特點就是其運用到極致的版面設計美學(筆者有點誇張(#^.^#))。文章的排版、配圖還有操作解說都安排得整潔美觀,對於讀者來說也格外賞心悅目,文章的內容也是乾貨滿滿。
10. Edwin Chen’s Blog
- 名稱:Edwin Chen’s Blog
- 連結:http://blog.echen.me/
- 內容:AI
- 例文:Exploring LSTMs
- 更新速度:未知
- 科學上網:No
- 競爭強度:高
筆者有話說:關注這個Blog,很大程度上是因為一篇爆熱文:Exploring LSTMs。這篇文章在剛剛發出來以後,被各大公眾號爭相翻譯和轉發。筆者個人對於這個技術大牛的網站就八個字的評價:“不鳴則已,一鳴驚人”。它的文章質量非常高,同時討論的也是非常前沿的話題,因此稱之為“篇篇熱門”並不為過。但是它的缺點也非常明顯,大牛更文更得非常慢,文章之間隔了幾個月是常有的事。另外該網站釋出的文章篇幅較長,內容艱深,對於讀者的英文水平和AI專業知識要求非常高。
原文:http://bigdata.51cto.com/art/201808/581431.htm