資料型別和Json格式

阮一峰發表於2009-05-30

前幾天,我才知道有一種簡化的資料交換格式,叫做yaml

我翻了一遍它的文件,看懂的地方不多,但是有一句話令我茅塞頓開。

它說,從結構上看,所有的資料(data)最終都可以分解成三種型別

第二種型別是序列(sequence),也就是若干個相關的資料按照一定順序並列在一起,又叫做陣列(array)或列表(List),比如"北京,上海"。

第三種型別是對映(mapping),也就是一個名/值對(Name/value),即資料有一個名稱,還有一個與之相對應的值,這又稱作雜湊(hash)或字典(dictionary),比如"首都:北京"。

我恍然大悟,資料構成的最小單位原來如此簡單!難怪在程式語言中,只要有了陣列(array)和物件(object)就能夠儲存一切資料了。

2.

我馬上想到了json

21世紀初,Douglas Crockford尋找一種簡便的資料交換格式,能夠在伺服器之間交換資料。當時通用的資料交換語言是XML,但是Douglas Crockford覺得XML的生成和解析都太麻煩,所以他提出了一種簡化格式,也就是Json。

Json的規格非常簡單,只用一個頁面幾百個字就能說清楚,而且Douglas Crockford聲稱這個規格永遠不必升級,因為該規定的都規定了。

2) 對映用冒號(": ")表示。

3) 並列資料的集合(陣列)用方括號("[]")表示。

4) 對映的集合(物件)用大括號("{}")表示。

上面四條規則,就是Json格式的所有內容。

比如,下面這句話:

寫成json格式就是這樣:

如果事先知道資料的結構,上面的寫法還可以進一步簡化:

由此可以看到,json非常易學易用。所以,在短短几年中,它就取代xml,成為了網際網路上最受歡迎的資料交換格式。

我猜想,Douglas Crockford一定事先就知道,資料結構可以簡化成三種形式,否則怎麼可能將json定義得如此精煉呢!

3.

學習javascript的時候,我曾經一度搞不清楚"陣列"(array)和"物件"(object)的根本區別在哪裡,兩者都可以用來表示資料的集合。

比如有一個陣列a=[1,2,3,4],還有一個物件a={0:1,1:2,2:3,3:4},然後你執行alert(a[1]),兩種情況下的執行結果是相同的!這就是說,資料集合既可以用陣列表示,也可以用物件表示,那麼我到底該用哪一種呢?

我後來才知道,陣列表示有序資料的集合,而物件表示無序資料的集合。如果資料的順序很重要,就用陣列,否則就用物件。

4.

當然,陣列和物件的另一個區別是,陣列的資料沒有"名稱"(name),物件的資料有"名稱"(name)。

但是問題是,很多程式語言中,都有一種叫做"關聯陣列"(associative array)的東西。這種陣列中的資料是有名稱的。

比如在javascript中,可以這樣定義一個物件:

但是,也可以定義成一個關聯陣列:

這起初也加劇了我對陣列和物件的混淆,後來才明白,在Javascript語言中,關聯陣列就是物件,物件就是關聯陣列。這一點與php語言完全不同,在php中,關聯陣列也是陣列。

比如執行下面這段javascript:

a['foo']='Hello World';

alert(a.length);

最後的結果是4,也就是說,陣列a的元素個數是4個。

但是,執行同樣內容的php程式碼就不一樣了:

$a=array(1,2,3,4);

$a["foo"]="Hello world";

echo count($a);

?>

最後的結果是5,也就是說,陣列a的元素個數是5個。

(完)

相關文章