PHP實現基於文字的莫斯電碼生成器

2016-01-08    分類:WEB開發、程式設計開發、首頁精華1人評論發表於2016-01-08
我最近遇到一個基於輸入文字生成摩斯程式碼音訊檔案的需求。幾番搜尋無果之後,我決定自己編寫一個生成器。

下載原始碼 – 2.63 KB

codegen_screen.png

因為我希望通過web的方式訪問我的摩斯程式碼音訊檔案,所以我決定採用PHP作為我主要的程式語言。上面的截圖顯示了一個開始生成莫斯程式碼的網頁。在下載的zip檔案中,包含了用於提交文字的網頁以及用於生成和展現音訊檔案的PHP原始檔。如果你想測試PHP程式碼,你需要將網頁和相關的PHP檔案複製到啟用了PHP的伺服器上。

對於許多人來說,莫斯程式碼就像一些老電影中表現的那樣,就是一些“點”和“橫線”的序列,或者一連串的嗶嗶聲。顯然,如果你想用計算機程式碼來生成莫斯程式碼,這樣的瞭解是遠遠不夠的。這篇文章將會介紹生成莫斯程式碼的要素,如何生成WAVE 格式的音訊檔案,以及如何用PHP將莫斯程式碼轉化成音訊檔案。

莫斯程式碼

莫斯程式碼是一種文字編碼方式。它的優點是編碼方便,而且用人耳就能夠方便的解碼。本質上,是通過音訊(或者無線電頻)的開和關,從而形成或短或長的音訊脈衝,一般稱作點(dot)和線(dash),或者用無線電術語稱作“嘀”和“嗒”。用現代數字通訊術語,莫斯程式碼是一種振幅鍵控(amplitude shift keying ,ASK)。

在莫斯程式碼中,字元(字母,數字,標點符號和特殊符號)被編碼成一個“嘀”和“嗒”的序列。所以為了把文字轉化成莫斯程式碼,我們首先要確定如何來表示“嘀”和“嗒”。一個很顯然的選擇就是,用0表示“嘀”,用1表示“嗒”,或者反過來。不幸的是,莫斯程式碼採用的是可變長編碼方案。所以我們也必須要使用一種可變長序列,或者採取一種方式,把資料打包成一種計算機記憶體通用的固定位寬(fixed bit-size)的格式。另外,需要特別注意的是,莫斯程式碼並不區分字母大小寫,而且對一些特殊符號無法編碼。在我們這個實現中,未定義的字元和符號將會被忽略。

在這個專案中,記憶體佔用並不是一個需要特別考慮的問題。所以,我們提出一個簡單的編碼方案,即用“0”來表示每個“嘀”,用“1”來表示每個“嗒”,並且把他們放在一個字串關聯陣列中。定義莫斯程式碼編碼表的PHP程式碼就像下面這樣:

需要注意的是,如果你特別在意記憶體佔用的話,上面的程式碼可以解釋為位(bit)。給每個程式碼增加一個開始位,就可以形成一個位的模式,每個字元就可以用一個位元組來儲存。同時,當解析最終編碼的時候,要刪除開始位左邊的位(bit),從而獲得真正的變長編碼。

儘管許多人沒有意識到,事實上“時間間隔”是定義莫斯程式碼的主要因素,所以理解這一點是生成莫斯程式碼的關鍵。所以,我們要做的第一件事,就是定義莫斯程式碼的內部碼(即“嘀”和“嗒”)的時間間隔。為了方便起見,我們定義一個“嘀”的聲音長度為一個時間單位dt,“嘀”和“嗒”之間的間隔也是一個時間單位dt;定義一個“嗒”的長度為3個dt,字元(letters)之間的間隔也是3個dt;定義單詞(words)之間的間隔是7個dt。所以,總結起來,我們的時間間隔表就像下面這樣:

專案 時間長度
dt
“嘀”/“嗒”之間的間隔 dt
“嗒” 3*dt
字元之間的間隔 3*dt
單詞之間的間隔 7*dt

在莫斯程式碼中,編碼聲音的“播放速度”通常用 單詞數/分鐘(WPM) 來表示。由於英文單詞有不同的長度,而且字元也有不同數量的“嘀”和“嗒”,所以,從WPM轉化成(音訊)數字取樣並不是看上去那樣簡單。在一份被國際組織採用的方案中,採用5個字元作為單詞的平均長度,同時,一個數字或標點符號被當做2個字元。這樣,平均一個單詞就是50個時間單位dt。這樣,如果你指定了WPM,那麼我們總的播放時間就是 50 * WPM的時間單位/分鐘,每個“嘀”(即一個時間單位dt)的長度等於1.2/WPM秒。這樣,給出一個“嘀”的時間長度,其他元素的時間長度很容易就能夠計算出來。

你可能已經注意到,在上面顯示的網頁中,對於低於15WPM的選項,我們使用了“Farnsworth spacing”。那麼這個“Farnsworth spacing”又是個什麼鬼?

當報務員學習用耳朵來解碼莫斯程式碼的時候,他就會意識到,當播放速度變化的時候,字元出現的節奏也會跟著變化。當播放速度低於10WPM的時候,他能夠從容的識別“嘀”和“嗒”,並且知道傳送的哪個字元。但是當播放速度超過10WPM的時候,報務員的識別就會出錯,他識別出來的字元會多於實際的“嘀”和“嗒”。當一個學習的時候習慣低速莫斯程式碼的人,在處理高速播放程式碼的時候,就會出現問題。因為節奏變了,他潛意識的識別就會出錯。

為了解決這個問題,“Farnsworth spacing”就被髮明出來了。本質上來講,字母和符號的播放速度依然採取高於15WPM的速度,同時,通過在字元之間插入更多的空格,來使整體的播放速度降低。這樣,報務員就能夠以一個合理的速度和節奏來識別每個字元,一旦所有的字元都學習完畢,就可以增加速度,而接收員只需要加快識別字元的速度就可以了。本質上來說,“Farnsworth spacing”這個技巧解決了節奏變化這個問題,使接收員能夠快速學習。

所以,在整個系統中,對於更低的播放速度,都統一成15WPM。相對應的,一個“嘀”的長度是0.08秒,但是字元之間和單詞之間的間隔就不再是3個dit或者7個dit,而是進行的調整以適應整體速度。

生成聲音

在PHP程式碼中,一個字元(即前面陣列的索引)代表一組由“嘀”、“嗒”和空白間隔組成的莫斯聲音。我們用數字取樣來組成音訊序列,並且將其寫入到檔案中,同時加上適當的頭資訊來將其定義成WAVE格式。

生成聲音的程式碼其實相當簡單,你可以在專案中PHP檔案中找到它們。我發現定義一個“數字振盪器”相當方便。每呼叫一次osc(),它就會返回一個從正玄波產生的定時取樣。運用聲音取樣和聲頻規範,生成WAVE格式的音訊已經足夠了。在產生的正玄波中的-1到+1之間是被移動和調整過的,這樣聲音的位元組資料可以用0到255來表示,同時128表示零振幅。

同時,在生成聲音方面我們還要考慮另外一個問題。一般來講,我們是通過正玄波的開關來生成莫斯程式碼。但是你直接這樣來做的話,就會發現你生成的訊號會佔用非常大的頻寬。所以,通常無線電裝置會對其加以修正,以減少頻寬佔用。

在我們的專案中,也會做這樣的修正,只不過是用數字的方式。既然我們已經知道了一個最小聲音樣本“嘀”的時間長度,那麼,可以證明,最小頻寬的聲幅發生在長度等於“嘀”的正玄波半週期。事實上,我們使用低通濾波器(low pass filter)來過濾音訊訊號也能達到同樣的效果。不過,既然我們已經知道所有的訊號字元,我們直接簡單的過濾一下每一個字元訊號就可以了。

生成“嘀”、“嗒”和空白訊號的PHP程式碼就像下面這樣:

WAVE格式的檔案

WAVE是一種通用的音訊格式。從最簡單的形式來看,WAVE檔案通過在頭部包含一個整數序列來表示指定取樣率的音訊振幅。關於WAVE檔案的詳細資訊請檢視這裡Audio File Format Specifications website。對於產生莫斯程式碼,我們並不需要用到WAVE格式的所有引數選項,僅僅需要一個8位的單聲道就可以了,所以,so easy。需要注意的是,多位元組資料需要採用低位優先(little-endian)的位元組順序。WAVE檔案使用一種由叫做“塊(chunks)”的記錄組成的RIFF格式。

WAVE檔案由一個ASCII識別符號RIFF開始,緊跟著一個4位元組的“塊”,然後是一個包含ASCII字元WAVE的頭資訊,最後是定義格式的資料和聲音資料。

在我們的程式中,第一個“塊”包含了一個格式說明符,它由ASCII字元fmt和一個4倍位元組的“塊”。在這裡,由於我使用的是普通脈衝編碼調製(plain vanilla PCM)格式,所以每個“塊”都是16位元組。然後,我們還需要這些資料:聲道數、聲音取樣/秒、平均位元組/秒、一個區塊(block)對齊指示器、位(bit)/聲音取樣。另外,由於我們不需要高質量立體聲,我們只採用單聲道,我們使用 11050取樣/秒(標準的CD質量音訊的取樣率是 44200取樣/秒)的取樣率來生成聲音,並且用8位(bit)儲存。

最後,真實的音訊資料儲存在接下來的“塊”中。其中包含ASCII字元data,一個4位元組的“塊”,最後是由位元組序列(因為我們採用的是8位(bit)/取樣)組成的真實音訊資料。

在程式中,由8位音訊振幅序列組成的聲音儲存在變數$soundstr中。一旦音訊資料生成完畢,就可以計算出所有的“塊”大小,然後就可以把它們合併在一起寫入磁碟檔案中。下面的程式碼展示瞭如何生成頭資訊和音訊“塊”。需要注意的是,$riffstr表示RIFF頭,$fmtstr表示“塊”格式,$soundstr表示音訊資料“塊”。

相關文章