4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

AI前線發表於2018-05-08

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

作者|PRANAV DAR
編譯|zongmumask
編輯|Debra
AI 前線導讀:當涉及到資料科學和機器學習時,GitHub 和 Reddit 是最受歡迎的兩個平臺。 前者是程式碼分享和協同工作的絕佳工具,而後者則是與全球資料科學愛好者交流的最佳平臺。今年,我們每個月都會討論最熱門的 GitHub 開源專案,從本月起,我們將包括 Reddit 上機器學習領域最有趣的話題。

更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)

4 月份一些很酷的 Python 專案開源了。 從 Deep Painterly Harmonization,一個使合成圖片很真實的庫,到 Swift for TensorFlow,這篇文章涵蓋了上個月最出色的開源專案。

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

我們來看看四月關於資料科學和機器學習最熱門的開源專案和 Reddit 上最有趣的討論。

下面連結可以檢視過去三個月裡最熱門的開源專案:

  • 二月

    https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018/

  • 三月

    https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/

  • 四月

    https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/

GitHub 開源專案
Deep Painterly Harmonization

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

https://github.com/luanfujun/deep-painterly-harmonization

使合成影象看起來更加真實的技術已經發展了有些年頭。 通過深度學習,這個任務將變得更有效率,合成效果也更真實。 開發人員提出新演算法,可以使外部元素與手繪完美融合,最終合成效果幾乎與原始繪圖無法區分。

上面的三張圖片 - 第三幀是最終輸出,如果沒有前面的兩張圖片,是很難知道氣球是後來合成進來的。 該演算法比手動合成更精細,迄今為止,其精細程度手動編輯也很難實現。

你可以在這裡 AVBytes 瞭解關於 Deep Painterly Harmonization 的更多資訊。

https://www.analyticsvidhya.com/blog/2018/04/add-objects-paintings-images-seamlessly-amazing-python-script/

Swift For TensorFlow

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

https://github.com/tensorflow/swift


在上個月的 TensorFlow 開發者峰會上亮相,現在已經在 GitHub 上向整個社群開源。 開發團隊的目標是為 TensorFlow 提供一個新的平臺,這建立在 TensorFlow 強大的功能基礎上,同時將其可用性提升到一個全新的水平。

由於該專案仍處於初始階段,還不適合用於構建深度學習模型。 團隊承認截止到開源面向社群,該專案離設想中的目標還有一定距離。 但其中還有很多潛力尚未開發。

我們在這裡

https://www.analyticsvidhya.com/blog/2018/04/swift-tensorflow-now-open-sourced-github/介紹了 Swift for TensorFlow 以供參考。

MUNIT: 多模態無監督影象轉換

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

https://github.com/NVlabs/MUNIT

康奈爾大學的一個研究小組提出了多模態無監督影象到影象轉換(MUNIT)框架,用於將影象從一個領域轉換到另一個領域。 其目的是將影象轉換成指定領域的新影象(例如,將狗的影象轉換為貓)。

先前存在的方法能夠僅執行給定影象的一對一對映,不能對同一張影象產生不同的輸出。 然而,MUNIT 能夠產生多個輸出。 激動吧!

我們在 AVBytes 上

https://www.analyticsvidhya.com/blog/2018/04/framework-for-unsupervised-image-to-image-translation/ 介紹了它的工作原理。

GluonNLP

4月份最熱門的資料科學和機器學習GitHub開源庫和Reddit話題

https://github.com/dmlc/gluon-nlp

深度學習在自然語言處理領域取得了長足進步。 在網際網路上出現過的有很多文字可以追溯到幾個世紀! GluonNLP 是一個工具包,旨在讓 NLP 任務變得更簡單。 通過海量資料和構建的深度學習神經模型讓文書處理更加容易。 這使得 NLP 研究變得更加高效。

該庫擁有一個很好的文件,以及詳細的使用示例。 該庫還有一個針對新手的 60 分鐘速成課程。

PyTorch GAN

https://github.com/eriklindernoren/PyTorch-GAN

該庫是一個金礦。 該庫收集了已經發表的關於 GAN(或生成敵對網路)研究論文的 PyTorch 實現。 目前列出了 24 種不同的實現,每種實現都有其獨特之處。 該列表包含 Adversarial Autoencoders,CycleGAN,Least Squares GAN,Pix2Pix 等實現。

Reddit 討論話題
幫助使用者理解研究論文

https://www.reddit.com/r/MachineLearning/comments/8b4vi0/d_anyone_having_trouble_reading_a_particular/

如果在理解任何研究論文時遇到困難,那麼 Reddit 機器學習社群可以提供幫助。 這是一個非常棒的想法,它已經幫助很多人在快要放棄的時候找到了問題的答案並繼續下去。

但是當你想要發帖時,要確保提供儘可能詳細的資訊,比如文章摘要,被卡住的地方,你自己發現了什麼,等等。這條評論總結得很好 - “把自己當做寫論文的研究小組成員,而不是等待別人給你答案”。

關於機器智慧的宣告

https://www.reddit.com/r/MachineLearning/comments/8fmtr9/d_statement_on_nature_machine_intelligence/

關於研究應該是開源還是封閉的爭論已經持續了數十年。 最近,受歡迎的“自然”雜誌宣佈它將釋出封閉式期刊。 這導致了一場針對他們的重大運動,許多有影響力的人(Jeff Dean, Ian Goodfellow 等)在一份請願書中加入了他們的簽名,宣告他們不會向這樣的出版物投稿。

關於研究結果是否應該開源給社群有不同的見解。 這是一個值得了解的話題,強烈建議閱讀整個主題,看看 ML 社群對這個主題的看法。

Michael Jordan 關於 AI 現狀的演講

https://www.reddit.com/r/MachineLearning/comments/8daqki/d_very_sobering_presentation_on_the_current_state/

Michael Jordan 是伯克利的著名教授,在最近的一次演講中他詳細地談了我們離真正的機器智慧還有多遠。 這是一個思路清醒的演講,聽完會讓人對這個問題產生思考。

這個主題已經產生了超過 100 條評論,使用者充分發表了他們關於 AI 現狀的想法。 使用者的深入討論讓這個話題變得更有意思。 這個話題仍在討論中,加入他們吧。

科學家計劃建立巨型歐洲 AI 中心與美國競爭

https://www.reddit.com/r/MachineLearning/comments/8ekmqy/scientists_plan_huge_european_ai_hub_to_compete/

這個問題裡面也有很多幹貨。 來自歐洲和美國各地的資料科學家和機器學習研究人員參與了關於 ML 的結構以及薪資的激烈討論。這裡可以獲得關於 ML 專案和潛在薪酬架構的很多觀點。

測量目標景觀的內在維度

https://www.reddit.com/r/MachineLearning/comments/8f9dvm/ruberai_measuring_the_intrinsic_dimension_of/

這個主題是從 Uber 的視訊中發展出來的,它將內在維度發展為神經網路的基本屬性。 如果你對視訊中提供的內容有任何疑問,社群已經詳細回答了這些問題。 最棒的似乎是人們喜歡將一篇研究論文轉化為一段視訊,這使得研究更容易理解。


更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)


相關文章