專案中使用mp3格式進行音效播放,遇到一個mp3檔案在程式中死活播不出聲音,最後發現它是wav格式的檔案,卻以mp3結尾。要對資源進行mp3格式判斷,那麼如何判斷呢,用.mp3字尾肯定不靠譜,我們知道副檔名是可以任意修改的,得從編碼格式判斷,方法如下:
mp3編碼
MP3檔案是一種流媒體檔案格式,所以沒有檔案頭。像AVI、WAV這種有檔案頭的格式,很好判斷,他們都是RIFF開頭的,只要進行RIFF字串對比,就可以查出是否是AVI、WAV,而mp3就只能分析編碼格式了。這裡大概說mp3編碼規則一下,詳細的可用參考這篇文章
MP3 檔案大體分為三部分:TAG_V2(ID3V2),音訊資料,TAG_V1(ID3V1)
a). ID3V2 在檔案開始的位置,以ID3開頭,包含了作者,作曲,專輯等資訊,長度不固定,擴充套件了ID3V1 的資訊量,非必需
b). 一系列的音訊資料的幀,在檔案的中間位置,個數由檔案大小和幀長決定;每個幀都以FFF開頭,的長度可能不固定,也可能固定,由位率bitrate決定;每個幀又分為幀頭和資料實體兩部分;幀頭記錄了mp3 的位率,取樣率,版本等資訊,每個幀之間相互獨立 。
c). ID3V1在檔案結尾的位置,以TAG開頭,包含了作者,作曲,專輯等資訊,長度為128Byte,非必須。
ID3V2
包含了作者,作曲,專輯等資訊,長度不固定,擴充套件了ID3V1的資訊量。
Frame
.
.
.
Frame
一系列的幀,個數由檔案大小和幀長決定
每個FRAME的長度可能不固定,也可能固定,由位率bitrate決定
每個FRAME又分為幀頭和資料實體兩部分
幀頭記錄了mp3的位率,取樣率,版本等資訊,每個幀之間相互獨立。
ID3V1
包含了作者,作曲,專輯等資訊,長度為128BYTE。
也就是說,根據TAG_V2(ID3V2),音訊資料,TAG_V1(ID3V1)三結構中的開頭資訊,便可以判斷出是不是mp3編碼的檔案。
2.python程式碼
# coding: utf-8 import os #mp3filePath是否是mp3格式的 def isMp3Format(mp3filePath): #讀取檔案內字串 f = open(mp3filePath, "r"); fileStr = f.read(); f.close(); head3Str = fileStr[:3]; #判斷開頭是不是ID3 if head3Str == "ID3": return True; #判斷結尾有沒有TAG last32Str = fileStr[-32:]; if last32Str[:3] == "TAG": return True; #判斷第一幀是不是FFF開頭, 轉成數字 # fixme 應該迴圈遍歷每個幀頭,這樣才能100%判斷是不是mp3 ascii = ord(fileStr[:1]); if ascii == 255: return True; return False; #遍歷folderPath看看是不是都是mp3格式的, #是就true,不是就是false, 並返回是mp3的list,不是MP3的list def isMp3FolderTraverse(folderPath): mp3List = []; notMp3List = []; isAllMpFormat = True; for dirpath, dirnames, filenames in os.walk(folderPath): for filename in filenames: path = dirpath + os.sep + filename; isMp3 = isMp3Format(path); #判斷是不是mp3結尾的 並且 是mp3格式的 if isMp3 == False and str.endswith(path, ".mp3") == True: # print("--warning: file " + path + " is not mp3 format!--"); notMp3List.append(path); isAllMpFormat = False; else: mp3List.append(path); return isAllMpFormat, mp3List, notMp3List; if __name__ == '__main__': isMp3Format("s_com_click1.mp3"); isAllMp3, mp3List, notMp3List = isMp3FolderTraverse("sound"); print isAllMp3; print mp3List; print notMp3List;