Github 2019 年最值得關注的資料科學專案 Virgilio(維吉爾) 中文版

jiaxianhua發表於2019-04-03

map.png

專案地址:github.com/clone95/vir…

目前為止: [7,128] star [1,303] fork,希望你看到之後能給它新增一個 star

這個專案首次提交在 2019 年 3 月 12 日,原名叫github.com/clone95/Dat…,一個月的時間就有 6k+ 個 star,經常排在 github.com/explorer 的前幾位。當然最近被榜單被 996icu 佔了。

關於專案改名:

Virgilio.png

專案作者把專案名改成維吉爾(Virgilio),這是 13 世紀末義大利詩人但丁所著長詩《神曲》中旦丁的導師。

這是什麼地方?

通過網際網路進行學習意味著在無限的混亂資訊叢林中游泳,在快速變化的創新領域更是如此。

當你試圖接近一個沒有真正 “路徑” 的新主題時,你有沒有感到不知所措?你是否妨礙獲得深厚的知識和應用它的能力?

嗨,我是 維吉爾(Virgilio) 。

就像幾年前我和 但丁(Dante) 一樣,在你的網際網路旅程中,我將成為你的導師和參考點,為你提供完整的有機學習途徑,包括多個領域,工具,技能等。

我是怎麼做到的?

我試圖簡明扼要,以避免資訊開銷。

我按層次結構和複雜程度組織了內容,以便你對事物的運作方式有一個連貫的想法。

你將學習如何通過實踐專案理解和應用理論,並仔細遵循我的提示和技巧,你將從頭開始掌握新技能。

你不需要任何先前的主題知識,但對程式設計和高中數學有信心,以理解和實現大多數概念。

此處列出的每個來源都是免費或開源的。

我最感興趣的是資料科學,因為我試圖預測耶路撒冷的隕落,但是你知道,那時我們沒有那麼多的計算能力!

你能在這裡找到什麼?

我為你打包了幾種型別的指南:

  • 職業:完整的學習路徑,指導你從頭開始掌握新技能。
  • 主題:關於由子領域組織的特定主題,方法和現實應用的綜合指南。
  • 專業化:個人技能的垂直指南。
  • 工具:單一工具或技術的深入指南。
  • 研究:對最新論文和技術檔案的最新審查和解釋。
  • 元(Meta):這些主要是關於如何學習和接近新概念的指南。

如果你發現此 repo 有用,我請你 star 一下,與你的朋友和同事分享,然後點選 watch,因為每天都會有更新!

我的目的是什麼?

我的目標主要是幫助人們開始使用創新的領域和技術,即使你從未嘗試過編寫程式碼,或者你需要深入的數學評介,我也會給你這樣的基礎。因此,你可以成為一名學生,另一個領域的工作人員或經理,你將在這裡找到你需要做好準備,以應對未來幾年肯定會發生的破壞性和不可預測的市場和社會轉型。

我的價格:我在這裡等你,免費。如果你發現我在某種程度上有所幫助,我只要求你留下一個 star ,點選 watch,每次你有機會時請分享我。讓我們開始我們的旅程!

新接觸資料科學?

基礎 Python

基礎數學 - 即將推出

高階 Python - 即將推出

高階數學 - 即將推出

Python 資料科學

數學資料科學 - 即將推出

完整的學習路徑

機器學習研究路徑

商業智慧研究路徑 - 即將推出

雲端計算研究路徑 - 即將推出

專業化

資料預處理

資料收集 [即將推出 - 下一步]

資料視覺化 [即將推出]

有效溝通 [即將推出]

有效陳述 - 

實用決策 [即將推出]

工具

Latex

Wolfram Alpha

GeoGebra

正規表示式

即將推出

主題

DialogFlow 和 Flask 打造 ChatBot

研究

Zotero

最新論文 [即將推出]

關於專業化

你可以按順序選擇它們或選擇最適合你的那個,但我建議你至少要一次把它們都看完。

我計劃了兩種型別的專業化:硬技能和軟技能

前者是關於技術流程,是每個處理資料的人的核心工具包。使用資料是一種藝術形式,經驗法則和最佳實踐將幫助你瞭解處理它們的方式。你需要對如何處理資料產生一種 “感覺”,這種 “感覺” 主要是由情況和經驗驅動的。因此,這些專業將強烈關注練習和練習。

後者是關於... 所有未寫在技術書籍中的東西。使用和掌握它們,因為它們是你真正的價值促成者。你可以成為世界上最好的開發人員或工程師,但如果你無法向受眾傳達你的建議和發現,或者使用資料來建議現實世界中的實際行動,那麼你對公司來說就毫無用處。

關於主題

單個主題將按欄位分割,它們可以觸及實際應用程式,方法,技術棧,最佳實踐等。

關於工具

“工具” 部分將提供有關你需要了解的特定技術 / 語言 / 方法的所有指南!它們將為你提供徹底探索和掌握手頭工具的方法。

訂閱我們新聞釋出和更新的FACEBOOK組

翻譯人員

@jiaxianhua (iOSDevLog)

在我準備翻譯之前就已經有中國人準備翻譯成中文,後來共有 4 箇中國人想要翻譯成中文。

我們重新建了一個 telegram.org/ 中文聊天群 Virgilio_cn,並把 @Clone95 拉進群,準備我們的翻譯計劃。

一開始人打算可以使用有團隊協作功能的 螞蟻筆記 Leanote,它具有以下特性。

  • Markdown 編輯器 實時同步預覽,你只需使用鍵盤專注於書寫文字內容,就可以生成印刷級的排版格式。
  • 詳細歷史紀錄 每次儲存都在後端備份,輕鬆查詢,一鍵恢復。
  • 實時同步 - 雲協作版 豐富的團隊許可權管理完整的文件樹型結構 支援Docker,私有云部署實時IM群聊討論

最重要的是它是開源的:github.com/leanote

於是我把它部署在伺服器。

後來 @Clone95 找到了 WebLate

Weblate 是一個基於網路自由軟體持續本地化系統。

WebLate

這個也是開源的,我把它也部署在伺服器上http://67.218.132.50/

部署過程:www.jianshu.com/p/f3cd7dfd4…

Weblate 支援多種翻譯格式,我選擇把 md 檔案改換成 xliff 再上傳。

Weblate 還支援機器翻譯docs.weblate.org/en/latest/a…

大多數翻譯 API 要收費,也包括流行的 Google Translate。最終我選用了 Baidu API machine translation ,每月翻譯字元數低於200萬,享免費服務;超過200萬字元,需按照49元人民幣/百萬字元支付當月全部翻譯字元數費用(包括之前免費的200萬字元)。

轉換幾個檔案後,翻譯群裡的小夥伴們就開始翻譯。之後又發現 Xliff 要把 md 檔案裡的 "<>&" 這些符號替換成佔位符。好麻煩,還不如直接用 json 格式。

轉換方式:www.jianshu.com/p/323a5d033…

最終還是用 google translate api 直接翻譯 md 檔案。

轉換過程:www.jianshu.com/p/5835eb34c…

用 vscode 一邊英文,一邊中文對照著改通順。

vscode.png

翻譯中肯定有許多不專業的地方,特別是 WolframAlpha 的翻譯,請大家將不準確的地方提出,或者加入我們的 Telegram / 微信翻譯群。

微信公眾號:AI開發日誌(AIDevLog)

AI開發日誌

最後還是請大家 star 並分享給你的好友們!

github.com/clone95/vir…

相關文章