Skip to main content

PARTE I: ¿Qué son los metadatos?

Metadata 1000x700 11may16 es

El concepto de metadatos es a la vez simple y complicado. Nosotros entendemos fácilmente qué son los datos: son la información que comunicamos, procesamos o consumimos en nuestra sociedad digitalizada en constante crecimiento. Pero ¿qué son los metadatos?

Metadatos: Datos acerca de datos

Los datos, especialmente los datos digitales, toman muchas formas. Las conversaciones de voz, los mensajes de texto o las redes sociales comunican datos. Las transacciones bancarias o comerciales digitales implican la transferencia de datos. El contenido web, el entretenimiento y las transmisiones digitales, las bases de datos o los repositorios de información, son todos ejemplos de publicaciones de datos.

Los metadatos describen qué son estos datos: ellos brindan información sobre estos datos. Eso es bastante simple. Sin embargo, si profundizamos un poco más, encontramos que "describir" datos es a la vez un ejercicio técnico riguroso y un tema con carga sociopolítica. En esta Parte I, explicaré qué son los metadatos de una manera técnica, cuasi académica.

¿Qué tipo de datos son metadatos?

Los metadatos proporcionan un medio para clasificar, organizar y caracterizar datos o contenido. La Organización Nacional de Información sobre Normas (NISO) proporciona una taxonomía que se puede aplicar a todo tipo de datos o repositorios de datos, desde bibliotecas hasta sitios web, para datos textuales y no textuales, en formas digitalizadas o materiales.

La NISO describe tres tipos de metadatos.

Los metadatos descriptivos incluyen información tal como puntos de contacto, el título o autor de una publicación, un resumen de una obra, palabras clave utilizadas en una obra, una ubicación geográfica o incluso una explicación de la metodología. Estos datos son útiles para descubrir, recabar o agrupar los recursos de acuerdo a las características que ellos comparten. Para apreciar cómo se relacionan los metadatos descriptivos con los datos informativos, visite las páginas de Encuestas de negocios y consumidores alojadas por la Dirección General de Asuntos Económicos y Financieros de la Comisión Europea. Además de los datos de encuesta, también se pueden obtener los Metadatos de BCS (Servicios de conectividad empresarial) para la encuesta de cada país miembro de la Unión Europea, por ejemplo, Francia. Los archivos de metadatos identifican los datos de contacto, la metodología y la fecha de cada encuesta, aunque no contienen los datos de la pregunta o respuesta compilados durante la realización de la encuesta en sí misma.

Los metadatos estructurales explican cómo un recurso está compuesto u organizado. Un libro digitalizado, por ejemplo, puede ser publicado como imágenes de páginas individuales, archivos en formato PDF o HTML. Estas páginas o partes componentes pueden típicamente estar agrupadas en capítulos. Los datos de los capítulos, la tabla de contenido o los detalles del diseño de la página se consideran metadatos estructurales. Un mapa estructural de las páginas u otros recursos de un sitio web, los tipos de registro de eventos de intrusiones de seguridad o los registros detallados de llamadas de voz también son tipos de metadatos estructurales.

Los metadatos administrativos se utilizan para gestionar un recurso. La fechas de creación o adquisición, los permisos de acceso, derechos o procedencia, o las pautas para disposiciones como retenciones o retiros, son ejemplos de los derechos que un archivero digital, curador, podría emplear. Metadatos similares serían relevantes para un administrador de base de datos o para los administradores responsables de la captura de flujos de tráfico de redes de datos o telecomunicaciones, o de datos de registros y eventos de seguridad.

Sólo hemos arañado la superficie

Ahora que ya hemos visto varios tipos de metadatos, se puede apreciar cómo los metadatos pueden ser de utilidad para cualquier parte, organización o agencia gubernamental que recaba, agrupa, gestiona o mantiene metadatos a gran escala. También es posible apreciar cómo las actividades que implican la recolección de metadatos a gran escala pueden ser fuente de controversia. Cubriremos eso en la próxima publicación de blog de esta serie.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."