【原創】開源Math.NET基礎數學類庫使用(03)C#解析Matlab的mat格式

資料之巔發表於2015-02-13

原文網址 : http://www.cnblogs.com/asxinyu/p/4265972.html

開源Math.NET基礎數學類庫使用總目錄：【目錄】開源Math.NET基礎數學類庫使用總目錄

前言

　　本人在09年使用該元件的時候，主要原因也是為了替代Matlab，進行相關數學計算，現在依然有很多人關注Matlab計算，特別是學生，而很多也在使用C#，所以這些人通常由於個人能力有限(無法精通某一個門語言來解決綜合問題)，無法單純的通過C#或者Matlab來解決問題，就想通過混合程式設計來呼叫完成，其實本人也做過大量的Matlab.NET混合程式設計研究，而且也個人製作了一套視訊教程，編寫過很多文章，可以參考如下文章：

1.國內第一部Matlab和C#.Net混合程式設計入門級視訊教程【完全免費】

2.Matlab.NET混合程式設計呼叫Figure窗體

3.Matlab.NET混合程式設計技巧之——直接呼叫Matlab內建函式(附原始碼)

4.Matlab.NET混合程式設計技巧之——找出Matlab內建函式

5.Matlab與.NET基於型別安全的介面混合程式設計入門

6.Matlab與.NET混合程式設計解決人臉識別問題

　　鑑於此，我也提醒過很多人，在.NET中可以使用Math.NET元件來替代Matlab的相關工作，可能效果不太好。今天就來介紹一個比較適用的功能，利用Math.NET提供的功能，使用C#來讀寫Matlab的mat資料格式，這個功能的使用場景也很廣泛，當然可能是研究偏多，大家思想可以放得更遠。

　　如果本文資源或者顯示有問題，請參考本文原文地址：http://www.cnblogs.com/asxinyu/p/4265972.html

1.Mat資料格式

　　用過一段matlab的人都知道，在matlab的工作空間中，可以將變數儲存為mat資料格式，下次在程式中直接讀取和進行計算，非常方便。以前也沒有具體研究過這個格式，也趁這個寫部落格的機會，一起來看看這個東西的作用和組成。雖然使用Math.NET提供的程式讀取和寫入Mat檔案都很簡單，但簡單之餘，瞭解一點其他知識也是不錯的。

　　Mat檔案格式，實際上使用的是一種通用的數值資料儲存格式Hierarchical Data Format(HDF)，該格式最先是由美國國家超級計算應用中心開發的，後來由HDF非盈利組織資助，進行不但完善和推廣。這個格式的使用是非常廣泛的(使用BSD許可證)，例如一些大名鼎鼎的商業和非商業軟體LabVIEW,MATLAB,Scilab,Octave,Mathematica等都支援該格式，該格式目前主要有HDF4和HDF5。 Mat檔案格式最新的7.3版是基於HDF5的。

有關HDF檔案格式和Mat格式的資料如下：

wikipedia：http://en.wikipedia.org/wiki/Hierarchical_Data_Format

Matlab官方：http://cn.mathworks.com/help/matlab/import_export/mat-file-versions.html

HDF官方：http://www.hdfgroup.org/

　　Mat檔案格式分為2個等級(目前我知道的) Level 4和 Level 5。Level 4 Mat檔案格式支援只支援2維矩陣和字串；而Level 5支援更多，如多維陣列，字串陣列，Cell陣列，稀疏矩陣，物件，結構等都支援。本文介紹的MathNet.Numerics.Data.Matlab是直接支援Level-5型別的，所有更強大。

2.Mat格式在Matlab中的使用

　　Matlab中mat資料的儲存和讀取非常簡單，只需要使用Save和load命令即可。對Matlab熟悉的朋友可以隨便開啟matlab敲幾個命令就可以了，由於電腦太慢，前段時間把Matlab解除安裝了，這裡就只介紹mat格式讀取和儲存的語法，實際的使用也是比較簡單的。

http://www.ilovematlab.cn/thread-78257-1-1.html

●save：將工作區中的所有變數儲存在當前工作區中的檔案中，檔名為 matlab.mat，MAT檔案可以通過load函式再次匯入工作區，MAT函式可以被不同的機器匯入，甚至可以通過其他的程式呼叫。
●save('filename')：將工作區中的所有變數儲存為檔案，檔名由filename指定。如果filename中包含路徑，則將檔案儲存在相應目錄下，否則預設路徑為當前路徑。
●save('filename', 'var1', 'var2', ...)：儲存指定的變數在 filename 指定的檔案中。
●save('filename', '-struct', 's')：儲存結構體s中全部域作為單獨的變數。
●save('filename', '-struct', 's', 'f1', 'f2', ...)：儲存結構體s中的指定變數。
● save('-regexp', expr1, expr2, ...)：通過正規表示式指定待儲存的變數需滿足的條件。
● save('..., 'format')，指定儲存檔案的格式，格式可以為MAT檔案、ASCII檔案等。

MATLAB中匯入資料通常由函式load實現，該函式的用法如下：
●load：如果matlab.mat檔案存在，匯入matlab.mat中的所有變數，如果不存在，則返回error。
●load filename：將filename中的全部變數匯入到工作區中。
●load filename X Y Z ...：將filename中的變數X、Y、Z等匯入到工作區中，如果是MAT檔案，在指定變數時可以使用萬用字元“*”。
●load filename -regexp expr1 expr2 ...：通過正規表示式指定需要匯入的變數。
●load -ascii filename：無論輸入檔名是否包含有副檔名，將其以ASCII格式匯入；如果指定的檔案不是數字文字，則返回error。
●load -mat filename：無論輸入檔名是否包含有副檔名，將其以mat格式匯入；如果指定的檔案不是MAT檔案，則返回error。

3.C#讀取Mat資料格式

　　Math.NET中有關Mat資料格式讀寫的元件是MathNet.Numerics.Data.Matlab,Mat資料格式的讀取主要用MatlabReader類，解析的功能函式就是下面這段程式碼：

 1 /// <summary>Extracts all matrix blocks in a format we support from a stream.</summary>
 2 internal static List<MatlabMatrix> ParseFile(Stream stream)
 3 {
 4     var matrices = new List<MatlabMatrix>();
 5 
 6     using (var reader = new BinaryReader(stream))
 7     {
 8         // skip header (116 bytes)
 9         // skip subsystem data offset (8 bytes)
10         // skip version (2 bytes)
11         reader.BaseStream.Position = 126;
12 
13         // endian indicator (2 bytes)
14         if (reader.ReadByte() != LittleEndianIndicator)
15         {
16             throw new NotSupportedException(Resources.BigEndianNotSupported);
17         }
18 
19         // set position to first data element, right after full file header (128 bytes)
20         reader.BaseStream.Position = 128;
21         var length = stream.Length;
22 
23         // for each data element add a MATLAB object to the file.
24         while (reader.BaseStream.Position < length)
25         {
26             // small format: size (2 bytes), type (2 bytes), data (4 bytes)
27             // long format: type (4 bytes), size (4 bytes), data (size, aligned to 8 bytes)
28 
29             DataType type;
30             int size;
31             bool smallBlock;
32             ReadElementTag(reader, out type, out size, out smallBlock);
33 
34             // read element data of the size provided in the element header
35             // uncompress if compressed
36             byte[] data;
37             if (type == DataType.Compressed)
38             {
39                 data = UnpackCompressedBlock(reader.ReadBytes(size), out type);
40             }
41             else
42             {
43                 data = new byte[size];
44                 reader.Read(data, 0, size);
45                 SkipElementPadding(reader, size, smallBlock);
46             }
47 
48             if (type == DataType.Matrix)
49             {
50                 using (var matrixStream = new MemoryStream(data))
51                 using (var matrixReader = new BinaryReader(matrixStream))
52                 {
53                     matrixReader.BaseStream.Seek(20, SeekOrigin.Current);
54                     var matrixDim = matrixReader.ReadInt32()/8;
55                     if (matrixDim > 2)
56                     {
57                         continue;
58                     }
59 
60                     matrixReader.BaseStream.Seek(10, SeekOrigin.Current);
61                     int matrixSize = matrixReader.ReadInt16();
62                     if (matrixSize == 0)
63                     {
64                         matrixSize = matrixReader.ReadInt32();
65                     }
66 
67                     var matrixName = Encoding.ASCII.GetString(matrixReader.ReadBytes(matrixSize));
68 
69                     matrices.Add(new MatlabMatrix(matrixName, data));
70                 }
71             }
72         }
73     }
74 
75     return matrices;
76 }

View Code

　　C#呼叫就更簡單了，上面那些實現只是一個幫助，大家以後可以瞭解解析其他類似的資料格式。看看呼叫的程式碼：

 1 using MathNet.Numerics.LinearAlgebra;
 2 using MathNet.Numerics.Data.Matlab;
 3 
 4 //從collection.mat檔案中，讀取第一個double矩陣
 5 Matrix<double> m = MatlabReader.Read<double>("collection.mat");
 6 
 7 //從collection.mat中讀取一個名稱為 vd 的特定矩陣
 8 Matrix<double> m = MatlabReader.Read<double>("collection.mat", "vd");
 9 
10 //直接選擇轉換為其他格式
11 Matrix<Complex> m = MatlabReader.Read<Complex>("collection.mat");
12 
13 //將一個檔案的所有矩陣及其名稱存入字典中
14 Dictionary<string,Matrix<double>> ms = MatlabReader.ReadAll<double>("collection.mat");
15 
16 //讀取名為 Ad和vd 的矩陣到字典
17 var ms = MatlabReader.ReadAll<double>("collection.mat", "vd", "Ad");

　　這樣就可以直接在C#中進行相關計算了，也不用混合程式設計那麼麻煩了。

4.C#儲存Mat資料格式

　　Mat資料格式的寫入主要用MatlabWriter類，核心功能函式就是下面程式碼：

 1 /// <summary>Writes all matrix blocks to a stream.</summary>
 2 internal static void FormatFile(Stream stream, IEnumerable<MatlabMatrix> matrices)
 3 {
 4     using (var buffer = new BufferedStream(stream))
 5     using (var writer = new BinaryWriter(buffer))
 6     {
 7         // write header and subsystem data offset (116+8 bytes)
 8         var header = Encoding.ASCII.GetBytes(HeaderText + DateTime.Now.ToString(Resources.MatlabDateHeaderFormat));
 9         writer.Write(header);
10         Pad(writer, 116 - header.Length + 8, 32);
11 
12         // write version (2 bytes)
13         writer.Write((short)0x100);
14 
15         // write little endian indicator (2 bytes)
16         writer.Write((byte)0x49);
17         writer.Write((byte)0x4D);
18 
19         foreach (var matrix in matrices)
20         {
21             // write data type
22             writer.Write((int)DataType.Compressed);
23 
24             // compress data
25             var compressedData = PackCompressedBlock(matrix.Data, DataType.Matrix);
26 
27             // write compressed data to file
28             writer.Write(compressedData.Length);
29             writer.Write(compressedData);
30         }
31 
32         writer.Flush();
33         writer.Close();
34     }
35 }

View Code

　　C#呼叫也很簡單,呼叫的程式碼如下：　　

 1 var matrices = new List<MatlabMatrix>();
 2 m.Add(MatlabWriter.Pack(myFirstMatrix, "m1");
 3 m.Add(MatlabWriter.Pack(mySecondMatrix, "m2");
 4 MatlabWrier.Store("file.mat", matrices);
 5 
 6 //寫入單個的"myMatrix"矩陣，並命名為"m1".
 7 MatlabWriter.Write("file.mat", myMatrix, "m1");
 8 
 9 //寫入多個矩陣，注意 矩陣列表 和 名稱列表
10 MatlabWriter.Write("file.mat", new[] { m1, m2 }, new[] { "m1", "m2" });
11 
12 //寫入字典矩陣，和讀取的原理類似
13 var dict = new Dictionary<string, Matrix<double>>();
14 dict.Add("m1", m1);
15 dict.Add("m2", m2);
16 MatlabWriter.Write("file.mat", dict);

5.資源

　　接下來的文章將繼續介紹Math.NET的其他功能。　

　　如果本文資源或者文章顯示有問題，請參考本文原文地址：http://www.cnblogs.com/asxinyu/p/4265972.html

【原創】開源Math.NET基礎數學類庫使用(12)C#隨機數擴充套件方法
2021-09-09
C#隨機套件
乘風破浪，遇見最佳跨平臺跨終端框架.Net Core/.Net生態 - 開源數學庫Math.NET，替代Matlab最佳元件
2024-10-19
框架Matlab元件
在matlab中如何將圖片（png和jpg）轉成mat格式
2018-03-22
Matlab
matlab實現人臉識別（數學基礎原理）
2020-10-21
Matlab
C# 基礎知識系列-13 常見類庫（三）
2020-04-28
C#
C#使用開源操作庫MiniExcel操作Excel
2024-05-20
C#Excel
matlab 基礎
2020-09-27
Matlab
OkHttp 開源庫使用與原始碼解析
2019-03-09
HTTP原始碼
《機器學習數學基礎》已開源，附完整下載！
2020-02-04
機器學習
c#(解析xml檔案基礎方法)
2020-10-02
C#XML
03 AMD規範的基礎使用詳解
2020-07-20
使用 C# 入門深度學習：Pytorch 基礎
2024-11-12
C#深度學習PyTorch
基礎類庫積累--ExeclHelper類
2020-08-13
C# 基礎知識系列- 13 常見類庫介紹（一）
2020-04-25
C#
【Matlab】基礎教程
2024-08-22
Matlab
Java基礎類庫【Java】
2018-10-13
Java
c#農曆開源庫
2024-08-08
C#
C# 基礎知識系列- 13 常見類庫介紹（二）日期時間類
2020-04-26
C#
03 - Python 基礎
2018-08-05
Python
03 shell基礎
2024-06-26
使用cJSON庫對JSON格式進行解析
2024-06-13
JSON
Go 語言開源 Excelize 基礎庫影片教程
2022-05-31
GoExcelize
推薦一個markdown格式轉html格式的開源JavaScript庫
2018-10-04
HTMLJavaScript
數學基礎
2024-08-19
C#基礎之checked與 unchecked的使用
2021-06-13
C#
Python類的基礎--設計、使用
2020-10-24
Python
C#解析Matrix Marke資料格式
2021-09-09
C#
【0基礎學爬蟲】爬蟲基礎之網路請求庫的使用
2023-03-26
爬蟲
mybatis基礎03(介面中的多個引數處理)
2020-09-23
MyBatis
Python基礎03 序列
2020-01-11
Python
Mybatis框架基礎-03
2020-11-05
MyBatis框架
Python基礎(03)：列表
2019-02-02
Python
[C#] （原創）一步一步教你自定義控制元件——03，SwitchButton（開關按鈕）
2020-10-22
C#控制元件
【Spring】【03】解析配置類註冊BeanDefination
2020-11-13
SpringBean
C#版本LINQ增強開源庫
2023-04-13
C#
03 . Vue基礎之計算屬性,元件基礎定義和使用
2020-11-14
Vue元件
JockeyJS——優秀的WebView與JS互動開源庫使用和解析
2018-06-15
JSWebView
軟體測試學習資源—Git 基礎使用
2019-08-14
Git
人工智慧必備數學基礎：高等數學基礎（2）
2020-12-22
人工智慧