張量（Tensor）、標量（scalar）、向量（vector）、矩陣（matrix）

VipSoft發表於2023-05-10

原文網址 : https://www.cnblogs.com/vipsoft/p/17361876.html

張量（Tensor）：Tensor = multi-dimensional array of numbers 張量是一個多維陣列，它是標量，向量，矩陣的高維擴充套件，是一個資料容器，張量是矩陣向任意維度的推廣

注意，張量的維度（dimension）通常叫作軸（axis）, 張量軸的個數也叫作階（rank）］

標量（scalar）：只有一個數字的張量叫標量（也叫標量張量、零維張量、0D 張量）

x = np.array(12)
print(x.ndim) 可以用 ndim 屬性來檢視一個 Numpy 張量的軸的個數。標量張量有 0 個軸（ ndim == 0 ）。

向量（vector）：數字組成的陣列叫作向量（vector）或一維張量（1D 張量）。一維張量只有一個軸。下面是一個 Numpy 向量

np.array([12, 3, 6, 14, 7])
這個向量有 5 個元素，所以被稱為 5D 向量。不要把 5D 向量和 5D 張量弄混！ 5D 向量只有一個軸，沿著軸有 5 個維度，而 5D 張量有 5 個軸（沿著每個軸可能有任意個維度）

矩陣（matrix）：是一個按照長方陣列排列的複數或實數集合，矩陣是二維張量(2D 張量)

np.array([[5, 78, 2, 34, 0], [6, 79, 3, 35, 1], [7, 80, 4, 36, 2]])
向量組成的陣列叫作矩陣（matrix）或二維張量（2D 張量）。矩陣有 2 個軸（通常叫作行和列）。你可以將矩陣直觀地理解為數字組成的矩形網格。下面是一個 Numpy 矩陣。

3D 張量與n 維張量
將多個矩陣組合成一個新的陣列，可以得到一個 3D 張量，你可以將其直觀地理解為數字組成的立方體。下面是一個 Numpy 的 3D 張量。

np.array([[[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]],

          [[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]],

          [[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]]])

將多個 3D 張量組合成一個陣列，可以建立一個 4D 張量，以此類推。深度學習處理的一般是 0D 到 4D 的張量，但處理影片資料時可能會遇到 5D 張量。

張量屬性

張量是由以下三個關鍵屬性來定義的。

軸的個數（階）：例如，3D 張量有 3 個軸，矩陣有 2 個軸。這在 Numpy 等 Python 庫中也叫張量的 ndim 。
形狀（shape）：這是一個整數元組，表示張量沿每個軸的維度大小（元素個數）。例如，前面矩陣示例的形狀為 (3, 5) ，3D 張量示例的形狀為 (3, 3, 5) 。向量的形狀只包含一個元素，比如 (5,) ，而標量的形狀為空，即 () 。(張量的形狀)
資料型別（dtype）：這是張量中所包含資料的型別，例如，張量的型別可以是 float32 、 uint8 、 float64 等。在極少數情況下，你可能會遇到字元（ char ）張量。注意：Numpy（以及大多數其他庫）中不存在字串張量，因為張量儲存在預先分配的連續記憶體段中，而字串的長度是可變的，無法用這種方式儲存。

data:    Tensor的值；
dtype:    Tensor的資料型別；
shape:    Tensor的形狀；
device:    Tensor所在的裝置(CPU/GPU)；
requires_grad:    是否需要梯度；
grad:    Tensor的梯度；
grad_fn:    建立Tensor的函式；
is_leaf:    是否是葉子節點

資料張量

向量資料：2D 張量，形狀為 (samples, features)

這是最常見的資料。對於這種資料集，每個資料點都被編碼為一個向量，因此一個資料批次就被編碼為 2D 張量（即向量組成的陣列），其中第一個軸是樣本軸，第二個軸是特徵軸。
例子：

人口統計資料集，其中包括每個人的年齡、郵編和收入。每個人可以表示為包含 3 個值的向量，而整個資料集包含 100 000 個人，因此可以儲存在形狀為 (100000, 3) 的 2D張量中。
文字文件資料集，我們將每個文件表示為每個單詞在其中出現的次數（字典中包含20 000 個常見單詞）。每個文件可以被編碼為包含 20 000 個值的向量（每個值對應於字典中每個單詞的出現次數），整個資料集包含 500 個文件，因此可以儲存在形狀為(500, 20000) 的張量中。

時間序列資料或序列資料：3D 張量，形狀為 (samples, timesteps, features)

當時間（或序列順序）對於資料很重要時，應該將資料儲存在帶有時間軸的 3D 張量中。每個樣本可以被編碼為一個向量序列（即 2D 張量），因此一個資料批次就被編碼為一個 3D 張量（見下圖）

根據慣例，時間軸始終是第 2 個軸（索引為 1 的軸）。

我們來看幾個例子。

股票價格資料集。每一分鐘，我們將股票的當前價格、前一分鐘的最高價格和前一分鐘的最低價格儲存下來。因此每分鐘被編碼為一個 3D 向量，整個交易日被編碼為一個形狀為 (390, 3) 的 2D 張量（一個交易日有 390 分鐘），而 250 天的資料則可以儲存在一個形狀為 (250, 390, 3) 的 3D 張量中。這裡每個樣本是一天的股票資料。
推文資料集。我們將每條推文編碼為 280 個字元組成的序列，而每個字元又來自於 128個字元組成的字母表。在這種情況下，每個字元可以被編碼為大小為 128 的二進位制向量（只有在該字元對應的索引位置取值為 1，其他元素都為 0）。那麼每條推文可以被編碼為一個形狀為 (280, 128) 的 2D 張量，而包含 100 萬條推文的資料集則可以儲存在一個形狀為 (1000000, 280, 128) 的張量中。

影像：4D張量，形狀為 (samples, height, width, channels) 或 (samples, channels,height, width) 。

影像通常具有三個維度：高度、寬度和顏色深度。雖然灰度影像（比如 MNIST 數字影像）只有一個顏色通道，因此可以儲存在 2D 張量中，但按照慣例，影像張量始終都是 3D 張量，灰度影像的彩色通道只有一維。因此，如果影像大小為 256×256，那麼 128 張灰度影像組成的批次可以儲存在一個形狀為 (128, 256, 256, 1) 的張量中，而 128 張彩色影像組成的批次則可以儲存在一個形狀為 (128, 256, 256, 3) 的張量中。
影像張量的形狀有兩種約定：通道在後（channels-last）的約定（在 TensorFlow 中使用）和通道在前（channels-first）的約定（在 Theano 中使用）。Google 的 TensorFlow 機器學習框架將顏色深度軸放在最後： (samples, height, width, color_depth) 。與此相反，Theano將影像深度軸放在批次軸之後： (samples, color_depth, height, width) 。如果採用 Theano 約定，前面的兩個例子將變成 (128, 1, 256, 256) 和 (128, 3, 256, 256) 。Keras 框架同時支援這兩種格式。

如下圖所示是一張普通的水果圖片，按照RGB三原色表示，其可以拆分為紅色、綠色和藍色的三張灰度圖片，如果將這種表示方法用張量的形式寫出來，就是圖中最下方的那張表格

圖中只顯示了前5行、320列的資料，每個方格代表一個畫素點，其中的資料[1.0, 1.0, 1.0]即為顏色。假設用[1.0, 0, 0]表示紅色，[0, 1.0, 0]表示綠色，[0, 0, 1.0]表示藍色，那麼如圖所示，前面5行的資料則全是白色

用四階張量表示一個包含多張圖片的資料集，其中的四個維度分別是：圖片在資料集中的編號，圖片高度、寬度，以及色彩資料。

影片：5D張量，形狀為 (samples, frames, height, width, channels) 或 (samples,frames, channels, height, width)

影片資料是現實生活中需要用到 5D 張量的少數資料型別之一。影片可以看作一系列幀，每一幀都是一張彩色影像。由於每一幀都可以儲存在一個形狀為 (height, width, color_depth) 的 3D 張量中，因此一系列幀可以儲存在一個形狀為 (frames, height, width,color_depth) 的 4D 張量中，而不同影片組成的批次則可以儲存在一個 5D 張量中，其形狀為(samples, frames, height, width, color_depth) 。

舉個例子，一個以每秒 4 幀取樣的 60 秒 YouTube 影片片段，影片尺寸為 144×256，這個影片共有 240 幀。4 個這樣的影片片段組成的批次將儲存在形狀為 (4, 240, 144, 256, 3)的張量中。總共有 106 168 320 個值！如果張量的資料型別（ dtype ）是 float32 ，每個值都是32 位，那麼這個張量共有 405MB。好大！你在現實生活中遇到的影片要小得多，因為它們不以float32 格式儲存，而且通常被大大壓縮，比如 MPEG 格式。

標量碼與向量碼（Scalar code & Vector code）及一些後續知識
2024-04-23
基礎｜什麼是張量、資料立體、矩陣、向量和純數
2018-07-24
矩陣
matlab標量或矩陣比較
2020-10-13
Matlab矩陣
百度飛槳(PaddlePaddle)- 張量（Tensor）
2023-05-11
Pytorch入門：tensor張量的構建
2024-08-11
PyTorch
【矩陣乘法】Matrix Power Series
2020-12-19
矩陣
向量和矩陣的座標變換7
2024-10-07
矩陣
Cellular Matrix 蜂窩矩陣（一）
2020-04-06
矩陣
第四個OpenGL程式，vector 向量（矩陣變換之旋轉，縮放）
2024-04-07
矩陣
向量和矩陣的座標變換(下標記法)7
2024-10-07
矩陣
基向量變換矩陣
2024-07-10
矩陣
6.5陣列--模擬、偏移量-螺旋矩陣
2024-06-05
陣列矩陣
機器學習中的矩陣向量求導(五) 矩陣對矩陣的求導
2019-05-27
機器學習矩陣求導
矩陣的特徵值和特徵向量
2024-05-07
矩陣特徵
flutter佈局-5-Matrix4矩陣變換
2018-11-07
Flutter矩陣
動手畫混淆矩陣(Confusion Matrix)（含程式碼）
2022-08-10
矩陣
機器學習中的矩陣向量求導(四) 矩陣向量求導鏈式法則
2019-05-07
機器學習矩陣求導
張量tensor：機器學習的基本資料結構介紹 - Santiago
2020-12-28
機器學習資料結構Go
向量和矩陣求導公式總結
2024-03-12
矩陣求導公式
torch中向量、矩陣乘法大總結
2020-12-10
矩陣
STL---vector（向量）
2020-04-04
python-Vector向量
2024-09-16
Python
OpenGL 學習 07 向量矩陣變換投影
2018-06-02
矩陣
笛卡爾座標張量簡介7
2024-10-07
PyTorch張量
2020-11-25
PyTorch
非科班程式設計師才不知道的矩陣Matrix
2021-09-09
程式設計師矩陣
第四個OpenGL程式，vector 向量（矩陣變換之旋轉，縮放）後續繪製多個圖形
2024-04-07
矩陣
計算機視覺必知 - 用Python將任一圖片轉換為向量矩陣 image2vector
2020-11-29
計算機視覺Python矩陣
Eigen教程(3)之矩陣和向量的運算
2020-12-09
矩陣
TensorFlow之張量
2020-09-22
Pytorch——張量 Tensors
2021-10-20
PyTorch
向量化實現矩陣運算最佳化(一)
2023-09-28
矩陣
詞向量word to vector通俗理解
2020-11-01
[namespace hdk] 向量 direct_vector
2024-07-13
namespace
POJ 3233 Matrix Power Series （矩陣快速冪+等比數列二分求和）
2020-04-06
矩陣
SciTech-Matrix Analysis of Management+Theory-管理科學的“矩陣式分析”
2024-07-22
矩陣
Vector用陣列下標訪問的條件
2020-04-06
陣列
矩陣運算與相抵標準型
2024-06-15
矩陣