Skip to main content

Максимальный набор кодовых точек, версия 3 (MSR-3) для разработки правил генерирования меток для корневой зоны

Страница также доступна на следующих языках:

ЛОС-АНДЖЕЛЕС – 29 марта 2018 - Сегодня Интернет-корпорация по присвоению имен и номеров (lCANN) объявила о выпуске третьей версии максимального стартового набора (MSR-3). Эта версия совместима с MSR-2 и включает три кодовые точки для латинского алфавита и для набора символов хань. В соответствии с «Процедурой разработки и поддержания правил генерирования меток (LGR) для корневой зоны в отношении IDN-меток» [PDF, 72 KB], MSR - отправная точка для работы Комиссий сообщества по генерированию меток, которые занимаются разработкой предложений для соответствующих алфавитов для Правил генерирования меток (RZ-LGR). Содержание MSR-3 и подробное обоснование порядка его составления описаны в документе «Общее описание и порядок составления MSR-3 – максимального стартового набора» [PDF, 242 KB]. RZ-LGR - механизм для определения допустимых IDN-доменов верхнего уровня и вариантов их меток.

MSR-3 охватывает следующие 28 алфавита: арабский, армянский, бенгальский, кириллица, деванагари, эфиопский, грузинский, греческий, гуджарати, гурмукхи, хань, хангыль, иврит, гирагана, каннада, катакана, кхмерский, лаосский, латинский, малаялам, бирманский, ория, сингальский, тамильский, телугу, тана, тибетский и тайский. MSR-3 включает 33 496 кодовые точки, отобранные из 97 973 кодовых точек PVALID/CONTEXT стандарта Unicode версии 6.3.

При разработке предложений о LGR, в дополнение к подготовке набора из состава MSR, Комиссии по генерированию меток также проведут оценку того, являются ли эти кодовые точки вариантами и изучат необходимость разработки правил для определения дальнейших ограничений в отношении меток, генерируемых при помощи этих кодовых точек. Поступающие от Комиссий по генерированию предложения о LGR будут публиковаться для сбора комментариев общественности, а затем передаваться на рассмотрение Комиссии по внедрению правил генерирования меток на предмет включения в LGR для корневой зоны.

В MSR-3 не вошли кодовые точки, которые уже кодируются более поздними версиями Unicode. Кроме того, Комиссия по внедрению правил генерирования меток следит за работой над различными алфавитами, не включенными в MSR, на предмет необходимости изменения MSR. До выпуска следующей версии MSR за основу LGR берется набор MSR-3. Все будущие версии MSR и LGR должны быть совместимы с предыдущими версиями.

О корпорации ICANN

Миссия ICANN – обеспечение стабильного, безопасного и единого глобального интернета. Для того, чтобы связаться с кем-нибудь в интернете, в компьютер или другое устройство необходимо ввести адрес – имя или номер. Этот адрес должен быть уникальным, чтобы компьютеры могли друг друга находить. ICANN занимается координацией этих уникальных идентификаторов во всем мире. ICANN была сформирована в 1998 году в качестве некоммерческой общественной корпорации и сообщества участников со всего мира.


More Announcements
Domain Name System
Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."