Skip to main content

Часть I. Что такое метаданные?

Metadata 1000x700 11may16 ru

Концепция метаданных проста и в то же время сложна. Мы без труда понимаем, что такое данные: это информация, которой мы обмениваемся, которую обрабатываем и потребляем в постоянно развивающемся цифровом обществе. Но что такое метаданные?

Метаданные: данные о данных

Данные, в особенности цифровые, могут принимать различные формы. Обычные разговоры, текстовые сообщения или социальные сети – все это способы передачи данных. Цифровой банкинг или торговые транзакции подразумевают передачу данных. Веб-содержимое, цифровые и потоковые развлечения, базы данных или информационные репозитории любого рода – это примеры публикации данных.

Метаданные описывают суть этих данных: они предоставляют информацию об этих данных. Все очень просто. Но если копнуть чуть глубже, мы обнаружим, что «описание» данных представляет собой сложную с технической точки зрения задачу и одновременно социально-политическую проблему. В части I я расскажу, что представляют собой метаданные техническим, квази-научным языком.

Какие типы данных относятся к метаданным?

Метаданные – это средство классификации, упорядочивания и характеристики данных или содержимого. Национальная организация по информационным стандартам (NISO) предлагает классификацию, которую можно применить для всех типов данных или репозиториев данных, от библиотек до веб-сайтов, для текстовых и нетекстовых данных, в цифровой или материальной форме.

NISO описывает три типа метаданных.

Описательные метаданные включают такую информацию, как точки контакта, заголовок или автор публикации, аннотация работы, используемые в работе ключевые слова, географическое местоположение или даже пояснение методологии. Эти данные служат для обнаружения, сбора или группирования ресурсов по общим для них характеристикам. Чтобы понять, как описательные метаданные соотносятся с информационными данными, посетите страницы Деловые и потребительские исследования Европейской комиссии по экономике и финансам. Помимо данных исследований вы можете получить Метаданные BCS по исследованию каждой из стран Евросоюза, например Франции. Файлы метаданных содержат контактные данные, описание методологии и дату каждого исследования, но в них нет вопросов и ответов, полученных в ходе исследования.

Структурные метаданные поясняют состав или организацию ресурсов. Например, цифровую книгу можно публиковать в виде изображений отдельных страниц, файла PDF или HTML. Эти страницы или компоненты обычно группируют в главы. Данные о главах, содержание или сведения о макете страниц считаются структурными метаданными. К структурным метаданным относятся также такие записи, как структурная карта страниц или иных ресурсов веб-сайта, событие вторжения или записи сведений о голосовых вызовах.

Административные метаданные используются для управления ресурсом. Даты создания или получения, права доступа, права или происхождение, либо правила утилизации, такие как хранение или удаление, являются примерами прав, которые может применять цифровой архивист, куратор. Сходные метаданные окажутся полезными для администратора базы данных или для администраторов, отвечающих за получение данных из трафика телекоммуникационных сетей или сетей передачи данных, либо журналов систем безопасности или данных о событиях.

Это лишь верхушка айсберга

Познакомившись с различными типами метаданных, вы можете оценить, насколько полезны они могут быть для любых компаний, организаций или государственных органов, которые занимаются сбором, агрегированием, управлением или хранением метаданных в больших масштабах. Вы можете также понять, что действия по сбору метаданных в больших масштабах могут стать источником полемики. Мы поговорим об этом в следующих публикациях из этой серии.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."