大資料需要掌握的數學基礎

阿里雲大學小百科發表於2018-09-14

線性代數這部分數學知識與大資料技術開發的關係也很密切,矩陣、轉置、秩 分塊矩陣、向量、正交矩陣、向量空間、特徵值與特徵向量等在大資料建模、分析中也是常用的技術手段。

在網際網路大資料中,許多應用場景的分析物件都可以抽象成為矩陣表示,大量Web頁面及其關係、微博使用者及其關係、文字集中文字與詞彙的關係等等都可以用矩陣表示。比如對於Web頁面及其關係用矩陣表示時,矩陣元素就代表了頁面a與另一個頁面b的關係,這種關係可以是指向關係,1表示a和b之間有超連結,0表示a,b之間沒有超連結。著名的PageRank演算法就是基於這種矩陣進行頁面重要性的量化,並證明其收斂性。

以矩陣為基礎的各種運算,如矩陣分解則是分析物件特徵提取的途徑,因為矩陣代表了某種變換或對映,因此分解後得到的矩陣就代表了分析物件在新空間中的一些新特徵。所以,奇異值分解SVD、PCA、NMF、MF等在大資料分析中的應用是很廣泛的。

課程連結:【大資料學習】數學基礎及應用

本課程主要介紹大資料中的數學基礎:

一、向量、矩陣介紹 

二、向量在遊戲引擎中的應用

三、矩陣奇異值分解及其應用 

四、導數、梯度介紹 

五、最優化方法及其應用

更多精品課程:

阿里雲大學官網(阿里雲大學 - 官方網站,雲生態下的創新人才工場

相關文章