使用python判斷流媒體mp3格式

pythontab發表於2016-12-23

專案中使用mp3格式進行音效播放,遇到一個mp3檔案在程式中死活播不出聲音,最後發現它是wav格式的檔案,卻以mp3結尾。要對資源進行mp3格式判斷,那麼如何判斷呢,用.mp3字尾肯定不靠譜,我們知道副檔名是可以任意修改的,得從編碼格式判斷,方法如下:


  1. mp3編碼

MP3檔案是一種流媒體檔案格式,所以沒有檔案頭。像AVI、WAV這種有檔案頭的格式,很好判斷,他們都是RIFF開頭的,只要進行RIFF字串對比,就可以查出是否是AVI、WAV,而mp3就只能分析編碼格式了。這裡大概說mp3編碼規則一下,詳細的可用參考這篇文章

MP3 檔案大體分為三部分:TAG_V2(ID3V2),音訊資料,TAG_V1(ID3V1)

a). ID3V2 在檔案開始的位置,以ID3開頭,包含了作者,作曲,專輯等資訊,長度不固定,擴充套件了ID3V1 的資訊量,非必需

b). 一系列的音訊資料的幀,在檔案的中間位置,個數由檔案大小和幀長決定;每個幀都以FFF開頭,的長度可能不固定,也可能固定,由位率bitrate決定;每個幀又分為幀頭和資料實體兩部分;幀頭記錄了mp3 的位率,取樣率,版本等資訊,每個幀之間相互獨立 。

c). ID3V1在檔案結尾的位置,以TAG開頭,包含了作者,作曲,專輯等資訊,長度為128Byte,非必須。

ID3V2

包含了作者,作曲,專輯等資訊,長度不固定,擴充套件了ID3V1的資訊量。

Frame

.

.

.

Frame

一系列的幀,個數由檔案大小和幀長決定

每個FRAME的長度可能不固定,也可能固定,由位率bitrate決定

每個FRAME又分為幀頭和資料實體兩部分

幀頭記錄了mp3的位率,取樣率,版本等資訊,每個幀之間相互獨立。

ID3V1

包含了作者,作曲,專輯等資訊,長度為128BYTE。 

 也就是說,根據TAG_V2(ID3V2),音訊資料,TAG_V1(ID3V1)三結構中的開頭資訊,便可以判斷出是不是mp3編碼的檔案。


2.python程式碼

# coding: utf-8
import os
#mp3filePath是否是mp3格式的
def isMp3Format(mp3filePath):
 #讀取檔案內字串
 f = open(mp3filePath, "r");
 fileStr = f.read();
 f.close();
 head3Str = fileStr[:3];
 #判斷開頭是不是ID3
 if head3Str == "ID3":
  return True;
 #判斷結尾有沒有TAG
 last32Str = fileStr[-32:];
 if last32Str[:3] == "TAG":
  return True;
 #判斷第一幀是不是FFF開頭, 轉成數字
 # fixme 應該迴圈遍歷每個幀頭,這樣才能100%判斷是不是mp3
 ascii = ord(fileStr[:1]);
 if ascii == 255:
  return True;
 return False;
#遍歷folderPath看看是不是都是mp3格式的,
#是就true,不是就是false, 並返回是mp3的list,不是MP3的list
def isMp3FolderTraverse(folderPath):
 mp3List = [];
 notMp3List = [];
 isAllMpFormat = True;
 for dirpath, dirnames, filenames in os.walk(folderPath):
  for filename in filenames:
   path = dirpath + os.sep + filename;
   isMp3 = isMp3Format(path);
   #判斷是不是mp3結尾的 並且 是mp3格式的
   if isMp3 == False and str.endswith(path, ".mp3") == True:
    # print("--warning: file " + path + " is not mp3 format!--");
    notMp3List.append(path);
    isAllMpFormat = False;
   else:
    mp3List.append(path);
 return isAllMpFormat, mp3List, notMp3List;
if __name__ == '__main__':
 isMp3Format("s_com_click1.mp3");
 isAllMp3, mp3List, notMp3List = isMp3FolderTraverse("sound");
 print isAllMp3;
 print mp3List;
 print notMp3List;


相關文章