優酷真實視訊地址解析

天地玄黃發表於2014-10-08

序:優酷之前更新了次演算法(很久之前了,呵呵。。。),故此很多部落格的解析演算法已經無法使用。很多大牛也已經更新了新的解析方法。我也在此寫篇解析過程的文章。(本文使用語言為C#)

由於優酷視訊地址時間限制,在你訪問本篇文章時,下面所屬連結有可能已經失效,望見諒。

例:http://v.youku.com/v_show/id_XNzk2NTI0MzMy.html

1:獲取視訊vid

在視訊url中標紅部分。一個正規表示式即可獲取。

1 string getVid(string url)
2 {
3     string strRegex = "(?<=id_)(\\w+)";
4     Regex reg = new Regex(strRegex);
5     Match match = reg.Match(url);
6     return match.ToString();
7 }

2:獲取視訊元資訊

http://v.youku.com/player/getPlayList/VideoIDS/XNzk2NTI0MzMy/Pf/4/ctype/12/ev/1

將前述vid嵌入到上面url中訪問即可得到視訊資訊檔案。由於視訊資訊過長不在此貼出全部內容。下面是部分重要內容的展示。(獲取檔案為json檔案,可直接解析)

 1 { "data": [ {
 2             "ip": 1991941296,
 3             "ep": "MwXRTAsbJLnb0PbJ8uJxAdSivUU11wnKXxc=",
 4             "segs": {
 5                 "hd2": [
 6                     {
 7                         "no": "0",
 8                         "size": "34602810",
 9                         "seconds": 205,
10                         "k": "248fe14b4c1b37302411f67a",
11                         "k2": "1c8e113cecad924c5"
12                     },
13                     {
14                         "no": "1",
15                     },] }, } ],}

上面顯示的內容後面都會使用到。其中segs包含hD3,hd2,flv,mp4,3gp等各種格式,並且每種格式下均分為若干段。本次選用清晰度較高的hd2(視訊格式為flv)

3:拼接m3u8地址

http://pl.youku.com/playlist/m3u8?ctype=12&ep={0}&ev=1&keyframe=1&oip={1}&sid={2}&token={3}&type={4}&vid={5}

以上共有6個引數,其中vid和oip已經得到,分別之前的vid和json檔案中的ip欄位,即(XNzk2NTI0MzMy1991941296),但是ep,sid,token需要重新計算(json檔案中的ep值不能直接使用)。type比較簡單,後面會說。

3.1計算ep,sid,token

計算方法單純的為數學計算,下面給出計算的函式。三個引數可一次性計算得到。其中涉及到Base64編碼解碼知識,點選檢視

 1      private static string myEncoder(string a, byte[] c, bool isToBase64)
 2         {
 3             string result = "";
 4             List<Byte> bytesR = new List<byte>();
 5             int f = 0, h = 0, q = 0;
 6             int[] b = new int[256];
 7             for (int i = 0; i < 256; i++)
 8                     b[i] = i;
 9             while (h < 256)
10             {
11                 f = (f + b[h] + a[h % a.Length]) % 256;
12                 int temp = b[h];
13                 b[h] = b[f];
14                 b[f] = temp;
15                 h++;
16             }
17             f = 0; h = 0; q = 0;
18             while (q < c.Length)
19             {
20                 h = (h + 1) % 256;
21                 f = (f + b[h]) % 256;
22                 int temp = b[h];
23                 b[h] = b[f];
24                 b[f] = temp;
25                 byte[] bytes = new byte[] { (byte)(c[q] ^ b[(b[h] + b[f]) % 256]) };
26                 bytesR.Add(bytes[0]);
27                 result += System.Text.ASCIIEncoding.ASCII.GetString(bytes);
28                 q++;
29             }
30             if (isToBase64)
31             {
32                 Byte[] byteR = bytesR.ToArray();
33                 result = Convert.ToBase64String(byteR);
34             }
35             return result;
36         }
37         public static void getEp(string vid, string ep, ref string pNew, ref string token, ref string sid)
38         {
39             string template1 = "becaf9be";
40             string template2 = "bf7e5f01";
41             byte[] bytes = Convert.FromBase64String(ep);
42             ep = ystem.Text.ASCIIEncoding.ASCII.GetString(bytes);
43             string temp = myEncoder(template1, bytes, false);
44             string[] part = temp.Split('_');
45             sid = part[0];
46             token = part[1];
47             string whole = string.Format("{0}_{1}_{2}", sid, vid, token);
48             byte[] newbytes = System.Text.ASCIIEncoding.ASCII.GetBytes(whole);
49             epNew = myEncoder(template2, newbytes, true);
50         }

計算得到ep,token,sid分別為diaVGE+IVMwB5CXXjz8bNHi0cCEHXJZ0vESH/7YbAMZuNaHQnT/Wzw==, 4178, 441265221168712cdf4f8。注意,此時ep並不能直接拼接到url中,需要對此做一下url編碼ToUrlEncode(ep)。最終ep為diaVGE%2bIVMwB5CXXjz8bNHi0cCEHXJZ0vESH%2f7YbAMZuNaHQnT%2fWzw%3d%3d

3.2計算type

Type值和選擇的segs有密切關係。如本文選擇的hd2,type即為flv,下面是segs,type和清晰度的對照。

“segs”,”type”,”清晰度”
"hd3", "flv", "1080P"
"hd2", "flv", "超清"
"mp4", "mp4", "高清"
"flvhd", "flv", "高清"
"flv", "flv", "標清"
"3gphd", "3gp", "高清"

3.3拼接地址

最後的m3u8地址為

http://pl.youku.com/playlist/m3u8?ctype=12&ep=diaVGE%2bIVMwB5CXXjz8bNHi0cCEHXJZ0vESH%2f7YbAMZuNaHQnT%2fWzw%3d%3d&ev=1&keyframe=1&oip=1991941296&sid=441265221168712cdf4f8&token=4178&type=flv&vid=XNzk2NTI0MzMy

4:獲取視訊地址

將上述m3u8檔案下載後,其中內容即為真實地址,不過還需要稍微處理一下。部分內容如下:

 1 #EXTM3U
 2 #EXT-X-TARGETDURATION:12
 3 #EXT-X-VERSION:3
 4 #EXTINF:6,
 5 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=0&ts_end=5.9&ts_seg_no=0&ts_keyframe=1
 6 #EXTINF:5.533,
 7 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=5.9&ts_end=11.433&ts_seg_no=1&ts_keyframe=1
 8 #EXTINF:5.467,
 9 http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv?ts_start=11.433&ts_end=16.9&ts_seg_no=2&ts_keyframe=1
10 #EXTINF:9.267,

其中每條url只包含6s左右視訊,但是可將url中引數部分去掉即可得到實際的長度。但是每條去掉後需合併一下相同的url,如上述列表可得到url片段

http://59.108.137.14/696CD107FE4D821FFBF173EB3/03000208005430B01849631468DEFEC61C5678-3A78-37BA-1971-21A0D4EEA0E7.flv

將m3u8中所有的url片段全部下載即可大功告成。

相關文章