下面是契訶夫的小說《套中人》中的一段,描寫一個叫做瓦蓮卡的女子:
(她)年紀已經不輕,三十歲上下,個子高挑,身材勻稱,黑黑的眉毛,紅紅的臉蛋--一句話,不是姑娘,而是果凍,她那樣活躍,吵吵嚷嚷,不停地哼著小俄羅斯的抒情歌曲,高聲大笑,動不動就發出一連串響亮的笑聲:哈,哈,哈!
這段話裡提供了這樣幾個資訊:年齡(三十歲上下)、身高(個子高挑)、相貌(身材勻稱,黑黑的眉毛,紅紅的臉蛋)、性格(活躍,吵吵嚷嚷,不停地哼著小俄羅斯的抒情歌曲,高聲大笑)。有了這些資訊,我們就可以大致想像出瓦蓮卡是個什麼樣的人。推而廣之,只要提供這幾類的資訊,我們也可以推測出其他人的樣子。
這個例子中的"年齡"、"身高"、"相貌"、"性格",就是後設資料,因為它們是用來描述具體資料/資訊的資料/資訊。
當然,這幾個後設資料用來刻畫個人狀況還不夠精確。我們每個人從小到大,都填過《個人情況登記表》之類的東西吧,其中包括姓名、性別、民族、政治面貌、一寸照片、學歷、職稱等等......這一套後設資料才算比較完備。
在日常生活中,後設資料無所不在。有一類事物,就可以定義一套後設資料。
喜歡拍攝數碼照片的朋友應該知道,每張數碼照片都包含EXIF資訊。它就是一種用來描述數碼圖片的後設資料。按照Exif 2.1標準,其中主要包含這樣一些資訊:
我再舉一個例子。在電影資料庫IMDB上可以查到每一部電影的資訊。IMDB本身也定義了一套後設資料,用來描述每一部電影。下面是它的一級後設資料,每一級下面又列出了二級後設資料,總共加起來,可以從100多個方面刻畫一部電影:
Cast and Crew(演職人員)、Company Credits(相關公司)、Basic Data(基本情況)、Plot & Quotes(情節和引語)、Fun Stuff(趣味資訊)、Links to Other Sites(外部連結)、Box Office and Business(票房和商業開發)、Technical Info(技術資訊)、Literature(書面內容)、Other Data(其他資訊)。
後設資料最大的好處是,它使資訊的描述和分類可以實現格式化,從而為機器處理創造了可能。
(完)