雖然收集和分析“大資料”存在一些分析和技術方面的挑戰,但事實上大部分公司已經能夠應對這種挑戰。這是因為有一些非常強大的分析工具都是免費、開源的,可以充分利用這些工具來提升自己的能力。

Alex Jones推薦了10個針對企業的大資料分析工具,這些工具不僅免費、使用方便,而且具有強大的功能和良好的資源。

1、Tableau Public

這是一個簡單直觀的視覺化工具。它在商業活動中表現的很強大,因為它通過視覺化來表達。它有足夠的空間和免費使用時長讓你體驗,在分析的過程中,Tableau的圖片呈現可以讓你快速的調查一個假設、驗證你的直覺,做更好的商業決策。

640.webp_

2、OpenRefine

它是以前的GoogleRefine,OpenRefine是一款資料清理軟體,可以對準備好的一切資料進行分析。例如最近我清理了一個含有化學名稱的資料庫,並且各行有不同的拼寫、大小寫、空格等,用計算機來處理非常困難,幸運的是, OpenRefine包含許多聚類演算法,對這個問題可以快速解決。

640.webp-1

Tip:可以用 IncreaseJava Heap Space 處理檔案。

3、KNIME

KNIME可以通過視覺化程式設計的方式來操作、分析和建模。不僅可以寫程式碼。你還可以在操作中建立聯絡節點。基本上你只需要將功能模組拖拽到工作區,並將模組按照執行流程連線起來,就可以實現以往程式設計才能實現的工作。更重要的是,KNIME可以擴充套件到執行R, python, text mining,chemistry data等等,這可以讓你選擇用更先進的編碼來分析。

Tip:讀取CSV檔案時需要用“File Reader”代替CSV閱讀器。

640.webp-2

4、RapidMiner

和KNIME類似, RapidMiner通過視覺化程式設計操作,建模和分析資料。最近,RapidMiner贏得kdnuggets的軟體調查。

640.webp-3

5、GoogleFusion Tables

這是針對資料分析、大資料集的視覺化和對映的一個非常強大的工具,谷歌的地圖軟體在其中起著重要作用。拿下面這張圖來說,這是一張墨西哥灣石油生產平臺的圖,我只需要上傳資料,Google Fusion Tables確認維度和經度的資料之後就開始工作了。

640.webp-4

6、NodeXL

NodeXL是針對網路和關係的視覺化分析軟體。想想科技巨頭地圖上代表LinkedIn或Facebook的連線,NodeXL提供了進一步精確的計算。如果你在不需要那麼先進的東西,你可以看看Google Fusion Tables,或者嘗試用Gephi。

640.webp-5

7、import.io

從網上抓取網頁和資訊曾經是技術人員的專利,現在用import.io,每個人都可以從網站和論壇獲取資料。簡單提出你想要的資料,幾分鐘之後import.io就可以通過你的搜尋知道你在找什麼,從而會挖掘、提供資料用於你的分析或輸出。

640.webp-6

8、Google Search Operators

不可否認谷歌最初是一個強大的資源和搜尋公司,運營商可以讓你快速過濾掉谷歌的結果得到的最有用的和相關的資訊。比如說,你正想從ABC諮詢裡尋找一個今年的資料科學報告。如果我們認為該報告可能是PDF格式的,可以搜尋

“資料科學報告”網站::ABCConsulting.com Filetype:PDF

然後在下面的搜尋欄,使用“搜尋工具”來遮蔽去年的結果。這在發現新的資訊或市場研究方面非常有用。

640.webp-7

9、Solver

Solver是一個在excel中做優化和線性規劃的工具,允許你設定一些約束條件(例如不超過什麼價格,要在哪天之前完成之類)。雖然更有效的優化可能會需要另一個程式(例如R的優化包),但是Solver應用範圍比較廣。

10、WolframAlpha

Wolfram Alpha的搜尋引擎是一個隱藏的寶石,可以媲美蘋果的Siri。WolframAlpha類似於不那麼智慧的Google,對科技搜尋提供詳細的回覆,對微積分作用也能快速的搜尋。對企業使用者來說,它提供了資訊圖表,對歷史價格、商品資訊、主題概述。

640.webp-8

雖然這些工具使得分析更簡單,但他們只是把資訊放進去然後進行分析,這些你自己也可以做到。所以用一點時間來學習新的技巧,用這些工具來提高自己完成工作。