Skip to main content

Максимальный набор кодовых точек, версия 2 (MSR-2) для разработки правил генерирования меток для корневой зоны

Страница также доступна на следующих языках:

По поручению Правления и для обеспечения поддержки меток IDN-доменов, сообщество ICANN приступило к работе над рядом проектов по изучению и составлению рекомендаций об их перспективности и делегировании. В контексте реализации Процедуры ICANN с удовлетворением сообщает о том, что Комиссия по внедрению правил генерирования меток выпустила вторую версию Максимального набора кодовых точек (MSR-2). В эту версию набора MSR-1, совместимую с будущими новыми версиями, включено еще шесть алфавитов. Набор MSR – первый этап работы в рамках «Процедуры разработки и поддержания правил генерирования меток (LGR) для корневой зоны в отношении IDN-меток» [PDF, 772 KB] (Процедура). Он является отправной точкой для работы Комиссий сообщества по генерированию меток, ориентированной на разработку предложений о LGR. LGR для корневой зоны представляет собой механизм создания и выполнения требований правил в отношении IDN-меток для корневой зоны.

В набор MSR-2 входят 28 алфавитов, шесть из которых (помеченных *) были добавлены в MSR в этот раз: арабский, армянский*, бенгальский, кириллица, деванагари, эфиопский*, грузинский, греческий, гуджарати, гурмукхи, хань, хангыль, иврит, гирагана, каннада, катакана, кхмерский*, лаосский, латинский, малаялам, бирманский*, ория, сингальский, тамильский, телугу, тана*, тибетский* и тайский. MSR-2 включает 33 490 кодовые точки, отобранные из 97 973 кодовых точек PVALID/CONTEXT стандарта Unicode версии 6.3.

Выпуск версии MSR-2 положил начало работе Комиссий по генерированию меток. При разработке предложений о LGR, кроме составления набора из состава MSR, Комиссии по генерированию меток также проведут оценку того, являются ли эти кодовые точки вариантами и изучат необходимость разработки правил для определения дальнейших ограничений в отношении меток, генерируемых при помощи этих кодовых точек. Поступающие от Комиссий по генерированию предложения о LGR, будут публиковаться для сбора комментариев общественности, а затем передаваться на рассмотрение Комиссии по внедрению правил генерирования меток на предмет включения в LGR для корневой зоны. В случае возникновения необходимости поэтапного выпуска LGR, например, если не все Комиссии по генерированию смогут направить свои предложения одновременно, предусмотрена возможность выпуска последующих версий LGR.

В MSR-2 не вошли некоторые кодовые точки, которые уже кодируются Unicode 7.0, потому что официальные таблицы для IDNA 2008 для Unicode 7.0 еще не выпущены. Предполагается, что в Unicode 8.0, выпуск которого ожидается в 2015 году, будут добавлены новые кодовые точки, которые вероятно можно будет использовать в корневой зоне. Кроме того, Комиссия по внедрению правил генерирования меток следит за работой над различными алфавитами, не включенными в MSR, на предмет необходимости изменения статуса. В дальнейшем, если появится новый набор, подлежащий включению в MSR, будет разработана еще одна версия MSR. Пока такую более позднюю версию MSR не выпустят, новые LGR, разрабатывающиеся после выпуска MSR-2, будут основаны на наборе MSR-2. Все будущие версии MSR и LGR должны быть совместимы с предыдущими версиями.

Публикация MSR-2 сопровождается следующими документами:


More Announcements
Domain Name System
Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."