更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)
4 月份一些很酷的 Python 專案開源了。 從 Deep Painterly Harmonization,一個使合成圖片很真實的庫,到 Swift for TensorFlow,這篇文章涵蓋了上個月最出色的開源專案。
我們來看看四月關於資料科學和機器學習最熱門的開源專案和 Reddit 上最有趣的討論。
下面連結可以檢視過去三個月裡最熱門的開源專案:
二月
https://www.analyticsvidhya.com/blog/2018/02/top-5-github-repositories-january-2018/
三月
https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/
四月
https://www.analyticsvidhya.com/blog/2018/04/top-7-github-repositories-march-2018/
https://github.com/luanfujun/deep-painterly-harmonization
使合成影象看起來更加真實的技術已經發展了有些年頭。 通過深度學習,這個任務將變得更有效率,合成效果也更真實。 開發人員提出新演算法,可以使外部元素與手繪完美融合,最終合成效果幾乎與原始繪圖無法區分。
上面的三張圖片 - 第三幀是最終輸出,如果沒有前面的兩張圖片,是很難知道氣球是後來合成進來的。 該演算法比手動合成更精細,迄今為止,其精細程度手動編輯也很難實現。
你可以在這裡 AVBytes 瞭解關於 Deep Painterly Harmonization 的更多資訊。
https://www.analyticsvidhya.com/blog/2018/04/add-objects-paintings-images-seamlessly-amazing-python-script/
https://github.com/tensorflow/swift
在上個月的 TensorFlow 開發者峰會上亮相,現在已經在 GitHub 上向整個社群開源。 開發團隊的目標是為 TensorFlow 提供一個新的平臺,這建立在 TensorFlow 強大的功能基礎上,同時將其可用性提升到一個全新的水平。
由於該專案仍處於初始階段,還不適合用於構建深度學習模型。 團隊承認截止到開源面向社群,該專案離設想中的目標還有一定距離。 但其中還有很多潛力尚未開發。
我們在這裡
https://www.analyticsvidhya.com/blog/2018/04/swift-tensorflow-now-open-sourced-github/介紹了 Swift for TensorFlow 以供參考。
https://github.com/NVlabs/MUNIT
康奈爾大學的一個研究小組提出了多模態無監督影象到影象轉換(MUNIT)框架,用於將影象從一個領域轉換到另一個領域。 其目的是將影象轉換成指定領域的新影象(例如,將狗的影象轉換為貓)。
先前存在的方法能夠僅執行給定影象的一對一對映,不能對同一張影象產生不同的輸出。 然而,MUNIT 能夠產生多個輸出。 激動吧!
我們在 AVBytes 上
https://www.analyticsvidhya.com/blog/2018/04/framework-for-unsupervised-image-to-image-translation/ 介紹了它的工作原理。
https://github.com/dmlc/gluon-nlp
深度學習在自然語言處理領域取得了長足進步。 在網際網路上出現過的有很多文字可以追溯到幾個世紀! GluonNLP 是一個工具包,旨在讓 NLP 任務變得更簡單。 通過海量資料和構建的深度學習神經模型讓文書處理更加容易。 這使得 NLP 研究變得更加高效。
該庫擁有一個很好的文件,以及詳細的使用示例。 該庫還有一個針對新手的 60 分鐘速成課程。
https://github.com/eriklindernoren/PyTorch-GAN
該庫是一個金礦。 該庫收集了已經發表的關於 GAN(或生成敵對網路)研究論文的 PyTorch 實現。 目前列出了 24 種不同的實現,每種實現都有其獨特之處。 該列表包含 Adversarial Autoencoders,CycleGAN,Least Squares GAN,Pix2Pix 等實現。
https://www.reddit.com/r/MachineLearning/comments/8b4vi0/d_anyone_having_trouble_reading_a_particular/
如果在理解任何研究論文時遇到困難,那麼 Reddit 機器學習社群可以提供幫助。 這是一個非常棒的想法,它已經幫助很多人在快要放棄的時候找到了問題的答案並繼續下去。
但是當你想要發帖時,要確保提供儘可能詳細的資訊,比如文章摘要,被卡住的地方,你自己發現了什麼,等等。這條評論總結得很好 - “把自己當做寫論文的研究小組成員,而不是等待別人給你答案”。
https://www.reddit.com/r/MachineLearning/comments/8fmtr9/d_statement_on_nature_machine_intelligence/
關於研究應該是開源還是封閉的爭論已經持續了數十年。 最近,受歡迎的“自然”雜誌宣佈它將釋出封閉式期刊。 這導致了一場針對他們的重大運動,許多有影響力的人(Jeff Dean, Ian Goodfellow 等)在一份請願書中加入了他們的簽名,宣告他們不會向這樣的出版物投稿。
關於研究結果是否應該開源給社群有不同的見解。 這是一個值得了解的話題,強烈建議閱讀整個主題,看看 ML 社群對這個主題的看法。
https://www.reddit.com/r/MachineLearning/comments/8daqki/d_very_sobering_presentation_on_the_current_state/
Michael Jordan 是伯克利的著名教授,在最近的一次演講中他詳細地談了我們離真正的機器智慧還有多遠。 這是一個思路清醒的演講,聽完會讓人對這個問題產生思考。
這個主題已經產生了超過 100 條評論,使用者充分發表了他們關於 AI 現狀的想法。 使用者的深入討論讓這個話題變得更有意思。 這個話題仍在討論中,加入他們吧。
https://www.reddit.com/r/MachineLearning/comments/8ekmqy/scientists_plan_huge_european_ai_hub_to_compete/
這個問題裡面也有很多幹貨。 來自歐洲和美國各地的資料科學家和機器學習研究人員參與了關於 ML 的結構以及薪資的激烈討論。這裡可以獲得關於 ML 專案和潛在薪酬架構的很多觀點。
https://www.reddit.com/r/MachineLearning/comments/8f9dvm/ruberai_measuring_the_intrinsic_dimension_of/
這個主題是從 Uber 的視訊中發展出來的,它將內在維度發展為神經網路的基本屬性。 如果你對視訊中提供的內容有任何疑問,社群已經詳細回答了這些問題。 最棒的似乎是人們喜歡將一篇研究論文轉化為一段視訊,這使得研究更容易理解。
更多幹貨內容請關注微信公眾號“AI 前線”,(ID:ai-front)