PHP實現基於文字的莫斯電碼生成器

2016-01-08 分類：WEB開發、程式設計開發、首頁精華1人評論發表於2016-01-08

我最近遇到一個基於輸入文字生成摩斯程式碼音訊檔案的需求。幾番搜尋無果之後，我決定自己編寫一個生成器。

因為我希望通過web的方式訪問我的摩斯程式碼音訊檔案，所以我決定採用PHP作為我主要的程式語言。上面的截圖顯示了一個開始生成莫斯程式碼的網頁。在下載的zip檔案中，包含了用於提交文字的網頁以及用於生成和展現音訊檔案的PHP原始檔。如果你想測試PHP程式碼，你需要將網頁和相關的PHP檔案複製到啟用了PHP的伺服器上。

對於許多人來說，莫斯程式碼就像一些老電影中表現的那樣，就是一些“點”和“橫線”的序列，或者一連串的嗶嗶聲。顯然，如果你想用計算機程式碼來生成莫斯程式碼，這樣的瞭解是遠遠不夠的。這篇文章將會介紹生成莫斯程式碼的要素，如何生成WAVE 格式的音訊檔案，以及如何用PHP將莫斯程式碼轉化成音訊檔案。

莫斯程式碼

莫斯程式碼是一種文字編碼方式。它的優點是編碼方便，而且用人耳就能夠方便的解碼。本質上，是通過音訊（或者無線電頻）的開和關，從而形成或短或長的音訊脈衝，一般稱作點（dot）和線（dash），或者用無線電術語稱作“嘀”和“嗒”。用現代數字通訊術語，莫斯程式碼是一種振幅鍵控（amplitude shift keying ，ASK）。

在莫斯程式碼中，字元（字母，數字，標點符號和特殊符號）被編碼成一個“嘀”和“嗒”的序列。所以為了把文字轉化成莫斯程式碼，我們首先要確定如何來表示“嘀”和“嗒”。一個很顯然的選擇就是，用0表示“嘀”，用1表示“嗒”，或者反過來。不幸的是，莫斯程式碼採用的是可變長編碼方案。所以我們也必須要使用一種可變長序列，或者採取一種方式，把資料打包成一種計算機記憶體通用的固定位寬（fixed bit-size）的格式。另外，需要特別注意的是，莫斯程式碼並不區分字母大小寫，而且對一些特殊符號無法編碼。在我們這個實現中，未定義的字元和符號將會被忽略。

在這個專案中，記憶體佔用並不是一個需要特別考慮的問題。所以，我們提出一個簡單的編碼方案，即用“0”來表示每個“嘀”，用“1”來表示每個“嗒”，並且把他們放在一個字串關聯陣列中。定義莫斯程式碼編碼表的PHP程式碼就像下面這樣：

$CWCODE = array ('A'=>'01','B'=>'1000','C'=>'1010','D'=>'100','E'=>'0',
     'F'=>'0010','G'=>'110','H'=>'0000','I'=>'00','J'=>'0111',
     'K'=>'101','L'=>'0100','M'=>'11','N'=>'10', 'O'=>'111',
     'P'=>'0110','Q'=>'1101','R'=>'010','S'=>'000','T'=>'1',
     'U'=>'001','V'=>'0001','W'=>'011','X'=>'1001','Y'=>'1011',
     'Z'=>'1100', '0'=>'11111','1'=>'01111','2'=>'00111',
     '3'=>'00011','4'=>'00001','5'=>'00000','6'=>'10000',
     '7'=>'11000','8'=>'11100','9'=>'11110','.'=>'010101',
     ','=>'110011','/'=>'10010','-'=>'10001','~'=>'01010',
     '?'=>'001100','@'=>'00101');

$CWCODE = array ('A'=>'01','B'=>'1000','C'=>'1010','D'=>'100','E'=>'0',

'F'=>'0010','G'=>'110','H'=>'0000','I'=>'00','J'=>'0111',

'K'=>'101','L'=>'0100','M'=>'11','N'=>'10', 'O'=>'111',

'P'=>'0110','Q'=>'1101','R'=>'010','S'=>'000','T'=>'1',

'U'=>'001','V'=>'0001','W'=>'011','X'=>'1001','Y'=>'1011',

'Z'=>'1100', '0'=>'11111','1'=>'01111','2'=>'00111',

'3'=>'00011','4'=>'00001','5'=>'00000','6'=>'10000',

'7'=>'11000','8'=>'11100','9'=>'11110','.'=>'010101',

','=>'110011','/'=>'10010','-'=>'10001','~'=>'01010',

'?'=>'001100','@'=>'00101');

需要注意的是，如果你特別在意記憶體佔用的話，上面的程式碼可以解釋為位（bit）。給每個程式碼增加一個開始位，就可以形成一個位的模式，每個字元就可以用一個位元組來儲存。同時，當解析最終編碼的時候，要刪除開始位左邊的位（bit），從而獲得真正的變長編碼。

儘管許多人沒有意識到，事實上“時間間隔”是定義莫斯程式碼的主要因素，所以理解這一點是生成莫斯程式碼的關鍵。所以，我們要做的第一件事，就是定義莫斯程式碼的內部碼（即“嘀”和“嗒”）的時間間隔。為了方便起見，我們定義一個“嘀”的聲音長度為一個時間單位dt，“嘀”和“嗒”之間的間隔也是一個時間單位dt；定義一個“嗒”的長度為3個dt，字元（letters）之間的間隔也是3個dt；定義單詞（words）之間的間隔是7個dt。所以，總結起來，我們的時間間隔表就像下面這樣：

專案	時間長度
嘀	dt
“嘀”/“嗒”之間的間隔	dt
“嗒”	3*dt
字元之間的間隔	3*dt
單詞之間的間隔	7*dt

在莫斯程式碼中，編碼聲音的“播放速度”通常用單詞數/分鐘(WPM) 來表示。由於英文單詞有不同的長度，而且字元也有不同數量的“嘀”和“嗒”，所以，從WPM轉化成（音訊）數字取樣並不是看上去那樣簡單。在一份被國際組織採用的方案中，採用5個字元作為單詞的平均長度，同時，一個數字或標點符號被當做2個字元。這樣，平均一個單詞就是50個時間單位dt。這樣，如果你指定了WPM，那麼我們總的播放時間就是 50 * WPM的時間單位/分鐘，每個“嘀”（即一個時間單位dt）的長度等於1.2/WPM秒。這樣，給出一個“嘀”的時間長度，其他元素的時間長度很容易就能夠計算出來。

你可能已經注意到，在上面顯示的網頁中，對於低於15WPM的選項，我們使用了“Farnsworth spacing”。那麼這個“Farnsworth spacing”又是個什麼鬼？

當報務員學習用耳朵來解碼莫斯程式碼的時候，他就會意識到，當播放速度變化的時候，字元出現的節奏也會跟著變化。當播放速度低於10WPM的時候，他能夠從容的識別“嘀”和“嗒”，並且知道傳送的哪個字元。但是當播放速度超過10WPM的時候，報務員的識別就會出錯，他識別出來的字元會多於實際的“嘀”和“嗒”。當一個學習的時候習慣低速莫斯程式碼的人，在處理高速播放程式碼的時候，就會出現問題。因為節奏變了，他潛意識的識別就會出錯。

為了解決這個問題，“Farnsworth spacing”就被髮明出來了。本質上來講，字母和符號的播放速度依然採取高於15WPM的速度，同時，通過在字元之間插入更多的空格，來使整體的播放速度降低。這樣，報務員就能夠以一個合理的速度和節奏來識別每個字元，一旦所有的字元都學習完畢，就可以增加速度，而接收員只需要加快識別字元的速度就可以了。本質上來說，“Farnsworth spacing”這個技巧解決了節奏變化這個問題，使接收員能夠快速學習。

所以，在整個系統中，對於更低的播放速度，都統一成15WPM。相對應的，一個“嘀”的長度是0.08秒，但是字元之間和單詞之間的間隔就不再是3個dit或者7個dit，而是進行的調整以適應整體速度。

生成聲音

在PHP程式碼中，一個字元（即前面陣列的索引）代表一組由“嘀”、“嗒”和空白間隔組成的莫斯聲音。我們用數字取樣來組成音訊序列，並且將其寫入到檔案中，同時加上適當的頭資訊來將其定義成WAVE格式。

生成聲音的程式碼其實相當簡單，你可以在專案中PHP檔案中找到它們。我發現定義一個“數字振盪器”相當方便。每呼叫一次osc()，它就會返回一個從正玄波產生的定時取樣。運用聲音取樣和聲頻規範，生成WAVE格式的音訊已經足夠了。在產生的正玄波中的-1到+1之間是被移動和調整過的，這樣聲音的位元組資料可以用0到255來表示，同時128表示零振幅。

同時，在生成聲音方面我們還要考慮另外一個問題。一般來講，我們是通過正玄波的開關來生成莫斯程式碼。但是你直接這樣來做的話，就會發現你生成的訊號會佔用非常大的頻寬。所以，通常無線電裝置會對其加以修正，以減少頻寬佔用。

在我們的專案中，也會做這樣的修正，只不過是用數字的方式。既然我們已經知道了一個最小聲音樣本“嘀”的時間長度，那麼，可以證明，最小頻寬的聲幅發生在長度等於“嘀”的正玄波半週期。事實上，我們使用低通濾波器（low pass filter）來過濾音訊訊號也能達到同樣的效果。不過，既然我們已經知道所有的訊號字元，我們直接簡單的過濾一下每一個字元訊號就可以了。

生成“嘀”、“嗒”和空白訊號的PHP程式碼就像下面這樣：

while ($dt  (0.5*$DitTime)) {
    // For a dah, the second part of the dit-time is constant amplitude
    $dahstr .= chr(floor(120*$x+128));
    // For a dit, the second half decays with a sine shape
    $x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));
    $ditstr .= chr(floor(120*$x+128));
    }
  else {
    $ditstr .= chr(floor(120*$x+128));
    $dahstr .= chr(floor(120*$x+128));
    }
  // a space has an amplitude of 0 shifted to 128
  $spcstr .= chr(128);
  $dt += $sampleDT;
  }
// At this point the dit sound has been generated
// For another dit-time unit the dah sound has a constant amplitude
$dt = 0;
while ($dt  (0.5*$DitTime)) {
    $x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));
    $dahstr .= chr(floor(120*$x+128));
    }
  else {
    $dahstr .= chr(floor(120*$x+128));
    }
  $dt += $sampleDT;
  }

while ($dt (0.5*$DitTime)) {

// For a dah, the second part of the dit-time is constant amplitude

$dahstr .= chr(floor(120*$x+128));

// For a dit, the second half decays with a sine shape

$x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));

$ditstr .= chr(floor(120*$x+128));

}

else {

$ditstr .= chr(floor(120*$x+128));

$dahstr .= chr(floor(120*$x+128));

}

// a space has an amplitude of 0 shifted to 128

$spcstr .= chr(128);

$dt += $sampleDT;

}

// At this point the dit sound has been generated

// For another dit-time unit the dah sound has a constant amplitude

$dt = 0;

while ($dt (0.5*$DitTime)) {

$x = $x*sin((M_PI/2.0)*($DitTime-$dt)/(0.5*$DitTime));

$dahstr .= chr(floor(120*$x+128));

}

else {

$dahstr .= chr(floor(120*$x+128));

}

$dt += $sampleDT;

}

WAVE格式的檔案

WAVE是一種通用的音訊格式。從最簡單的形式來看，WAVE檔案通過在頭部包含一個整數序列來表示指定取樣率的音訊振幅。關於WAVE檔案的詳細資訊請檢視這裡Audio File Format Specifications website。對於產生莫斯程式碼，我們並不需要用到WAVE格式的所有引數選項，僅僅需要一個8位的單聲道就可以了，所以，so easy。需要注意的是，多位元組資料需要採用低位優先（little-endian）的位元組順序。WAVE檔案使用一種由叫做“塊（chunks）”的記錄組成的RIFF格式。

WAVE檔案由一個ASCII識別符號RIFF開始，緊跟著一個4位元組的“塊”，然後是一個包含ASCII字元WAVE的頭資訊，最後是定義格式的資料和聲音資料。

在我們的程式中，第一個“塊”包含了一個格式說明符，它由ASCII字元fmt和一個4倍位元組的“塊”。在這裡，由於我使用的是普通脈衝編碼調製（plain vanilla PCM）格式，所以每個“塊”都是16位元組。然後，我們還需要這些資料：聲道數、聲音取樣/秒、平均位元組/秒、一個區塊（block）對齊指示器、位（bit）/聲音取樣。另外，由於我們不需要高質量立體聲，我們只採用單聲道，我們使用 11050取樣/秒（標準的CD質量音訊的取樣率是 44200取樣/秒）的取樣率來生成聲音，並且用8位（bit）儲存。

最後，真實的音訊資料儲存在接下來的“塊”中。其中包含ASCII字元data，一個4位元組的“塊”，最後是由位元組序列（因為我們採用的是8位(bit)/取樣）組成的真實音訊資料。

在程式中，由8位音訊振幅序列組成的聲音儲存在變數$soundstr中。一旦音訊資料生成完畢，就可以計算出所有的“塊”大小，然後就可以把它們合併在一起寫入磁碟檔案中。下面的程式碼展示瞭如何生成頭資訊和音訊“塊”。需要注意的是，$riffstr表示RIFF頭，$fmtstr表示“塊”格式，$soundstr表示音訊資料“塊”。

$riffstr = 'RIFF'.$NSizeStr.'WAVE';
$x = SAMPLERATE;
$SampRateStr = '';
for ($i=0; $i<4; $i++) {
  $SampRateStr .= chr($x % 256);
  $x = floor($x/256);
  }
$fmtstr = 'fmt '.chr(16).chr(0).chr(0).chr(0).chr(1).chr(0).chr(1).chr(0)
          .$SampRateStr.$SampRateStr.chr(1).chr(0).chr(8).chr(0);
$x = $n;
$NSampStr = '';
for ($i=0; $i<4; $i++) {
  $NSampStr .= chr($x % 256);
  $x = floor($x/256);
  }
$soundstr = 'data'.$NSampStr.$soundstr;

$riffstr = 'RIFF'.$NSizeStr.'WAVE';

$x = SAMPLERATE;

$SampRateStr = '';

for ($i=0; $i<4; $i++) {

$SampRateStr .= chr($x % 256);

$x = floor($x/256);

}

$fmtstr = 'fmt '.chr(16).chr(0).chr(0).chr(0).chr(1).chr(0).chr(1).chr(0)

.$SampRateStr.$SampRateStr.chr(1).chr(0).chr(8).chr(0);

$x = $n;

$NSampStr = '';

for ($i=0; $i<4; $i++) {

$NSampStr .= chr($x % 256);

$x = floor($x/256);

}

$soundstr = 'data'.$NSampStr.$soundstr;

基於句子嵌入的無監督文字摘要（附程式碼實現）
2020-02-04
基於雪花演算法的 PHP ID 生成器
2019-08-14
演算法PHP
基於PHP擴充套件的WAF實現
2020-08-19
PHP套件
實現基於內容的電影推薦系統—程式碼實現
2024-04-07
PHP實現摩斯電碼加密解密
2021-12-22
PHP加密解密
基於註解的 PHP 列舉類實現
2018-07-09
PHP
莫比烏斯
2021-09-09
php基礎，php自動載入的實現程式碼示例
2021-05-16
PHP
薩繆爾·莫爾斯：電報之父的傳奇人生
2022-03-29
基於 HTML5 Canvas 實現的文字動畫特效
2018-04-02
HTMLCanvas動畫特效
莫比烏斯反演
2024-10-27
基於vs外掛的abp程式碼生成器
2019-05-16
基於SSM風格的Java原始碼生成器
2022-02-16
SSMJava原始碼
基於 HTML5 Canvas 實現文字動畫特效
2020-04-06
HTMLCanvas動畫特效
莫比烏斯函式
2024-05-30
函式
Mybatis自動程式碼生成器的實現
2018-11-27
MyBatis
Mybatis-plus程式碼生成器的實現
2020-11-11
MyBatis
比較典的莫比烏斯反演
2024-06-13
基於 “typesys” 實現序列指令碼框架
2020-07-08
指令碼框架
PHP基於Redis訊息佇列實現的訊息推送的方法
2018-12-16
PHPRedis佇列
基於php的校園通訊錄電話號碼查詢系統
2020-10-29
PHP
基於MybatisPlus程式碼生成器（2.0新版本）
2022-06-16
MyBatis
基於Netty實現Redis協議的編碼解碼器
2018-03-19
NettyRedis協議
PHP 核心特性 - 生成器基礎篇
2019-11-13
PHP
PHP非同步程式設計: 基於 PHP 實(chao)現(xi) NODEJS web框架 KOA
2018-12-25
PHP非同步程式設計NodeJSWeb框架
基於node實現Vue打包部署指令碼
2020-03-20
Vue指令碼
教你如何基於python實現指令碼加密
2020-01-08
Python指令碼加密
php基於redis的list型資料結構實現ip限流操作
2021-02-08
PHPRedis資料結構
Brow.sh：現代的基於文字的瀏覽器
2020-11-18
瀏覽器
Hackerrank GCD Product(莫比烏斯反演)
2019-01-04
GC
3.基於LSTM+CTC實現不定長文字圖片OCR
2018-12-18
基於jquery實現的Excel
2019-04-06
jQueryExcel
JsonUtil（基於Jackson的實現）
2019-07-15
JSON
基於JVMTI的Agent實現
2019-03-04
JVM
基於YARP實現的FastGithub
2021-07-19
ASTGithub
基於 Laravel 命令列開發 API 程式碼生成器
2019-11-18
Laravel命令列API
基於PHP + TRIE樹實現敏感詞過濾演算法
2019-04-16
PHP演算法
基於MySql主從分離的程式碼層實現
2020-07-28
MySql
200 行程式碼實現基於 Paxos 的 KV 儲存
2022-05-20
行程

PHP實現基於文字的莫斯電碼生成器

莫斯程式碼

生成聲音

WAVE格式的檔案

相關文章