zh

第 I 部分:什么是元数据?

2016 年 05 月 10 日

Trang Nguyen

本部分内容不仅提供联合国六种官方语言版本,还提供以下语言版本

null

元数据的概念既简单又复杂。我们很容易理解什么是数据:它们是我们在日益发展的数字化社会中沟通、处理或使用的信息。但什么是元数据呢?

元数据:描述数据的数据

数据,尤其是数字数据,形式多种多样。语音通话、短信或社交媒体都是数据交流。数字银行业务或商业交易涉及到数据传输。各式各样的网络内容、数字和流媒体娱乐、数据库或信息存储库都属于数据发布的范畴。

元数据描述这些数据是什么:它们提供描述这些数字的信息。这很简单。然而,如果我们深入探究就会发现,"描述"数据既是一项严谨的技术活动,又是一个严肃的社会政治问题。在第 I 部分中,我会以一种技术性、偏学术性的方式解释什么是元数据。

哪些类型的数据是元数据?

元数据提供一种分类、组织和表述数据或内容的工具。美国国家信息标准组织 (NISO) 提供了一套分类法,适用于各类数据或从图书馆到网站的数据存储库,这些数据可以是数字或实物形式的文本或非文本数据。

NISO 描述了三种类型的元数据。

描述型元数据包括诸如以下类型的信息:联系人、出版物的标题或作者、著作摘要、著作使用的关键词、地理位置,或者甚至包括方法说明。这些数据可以用于根据资源的共性来发现、收集或分类资源。想要理解描述型元数据是如何与信息数据关联,请访问欧盟委员会经济与金融事务总司网站的企业与消费者调查 (BCS) 页面。除了调查数据之外,您也可以获取每个欧盟成员国的调查的 BCS 元数据,例如法国。元数据文件可以确定每次调查的联系数据、方法和日期,但是它们并不包含在调查进行过程中收集的问题或回复数据。

结构型元数据解释资源的构成或组织方式。例如,一本电子书可以采用单页图片、PDF 或 HTML 文件的形式发布。这些页面或组成部分通常可分组到各个章节中。章节数据、目录或页面布局的详细信息都被视作结构型元数据。页面或网站其他资源的结构图、安全入侵事件记录类型或语音呼叫详细记录也都属于结构型元数据。

管理型元数据用于管理资源。例如,创建或获取日期、访问许可、权利或来源、或是处理准则(包括保留或删除等),这些都是数字档案管理员和馆长的可用权利。对数据库管理员或负责搜集电信或数据网络流量或安全日志和事件数据的管理员来说,相似元数据有一定关联性。

我们仅仅了解了皮毛

现在,您已经看到几种类型的元数据,就可以理解对任何相关方、组织或政府机构而言,大规模收集、综合、管理或保留元数据大有用处。您也可以理解为何涉及大规模收集元数据的活动能够引发争议。我们将在本系列的下一篇文章中探讨这些内容。

Trang Nguyen