Skip to main content

Celebrando un hito importante impulsado por la comunidad al permitir dominios de alto nivel multilingües

Celebrating milestone multilingual tlds 725x343 02mar16 en

El 2 de marzo de 2016, se publicó la primera versión de las Reglas para la Generación de Etiquetas para la Zona Raíz (LGR-1). LGR-1 brinda apoyo al script (código de escritura) arábigo y futuras versiones brindarán apoyo a scripts adicionales. Este logro sigue a las propuestas de LGR para Zona Raíz que presentaron las comunidades de los scripts arábigo y armenio en noviembre de 2015.

El establecimiento de las primeras Reglas para la Generación de Etiquetas es un avance importante en el desarrollo de una Internet multilingüe. Estas reglas brindan un método abierto y transparente para determinar la validez y las variantes de nombres de Dominio de Alto Nivel (TLD), o etiquetas, en los diversos scripts y sistemas de escritura del mundo. LGR-1 es el resultado del arduo trabajo del Panel de Generación de Scripts (códigos de escritura) arábigos basados en la comunidad, el Panel de Integración y muchos otros contribuyentes. El trabajo beneficia a actuales y futuros usuarios de Internet que usan el script arábigo al facilitar la navegación en la Web, y ayuda a abordar cuestiones de seguridad y confusión relativas al uso del Sistema de Nombres de Dominio, especialmente, dominios de alto nivel.

¡Me gustaría felicitar a todos los que contribuyeron para lograr este primer paso monumental!

Viaje hacia LGR-1: Panel de Generación del script arábigo

El Grupo de Acción para los Nombres de Dominio Internacionalizados con Código de Escritura Arábigo (TF-AIDN) comenzó a organizarse en el segundo semestre de 2013 y formalmente empezó a trabajar como el Panel de Generación del script arábigo en febrero de 2014. El arábigo es uno de los scripts (códigos de escritura) más complejos de examinar porque es utilizado por diversos idiomas diferentes en Asia y África, lo que se traduce en muchas variaciones en las formas de sus letras y el uso del script. Variaciones menores en letras parecen similares para los usuarios ingenuos - incluso dentro de la comunidad que utiliza el código de escritura arábigo - que no están familiarizados con la amplitud del uso del script arábigo, lo que genera confusión en las etiquetas. Por ejemplo, los usuarios del script arábigo pueden confundir کتاب (kitab, "libro") con ڪتاب, el último se interpreta como una variación de estilo. Estas variaciones se agregan a la complejidad inherente del script, que ya contiene formas de letras cursivas dependientes del contexto y muchas combinan marcas para indicar contenido consonante y vocálico.

Debido a que el uso del script arábigo es tan geográfica y lingüísticamente diverso, el primer desafío para los miembros iniciales del Panel de Generación del script arábigo fue reclutar expertos representativos de una variedad de disciplinas, entre las que se incluyen, lingüística, tecnología, política y comunidad de usuarios finales. Este grupo trabajó con el equipo de Participación Global de Partes Interesadas de la ICANN para reclutar un total de 33 miembros, que representan 21 países - ¡una increíble variedad de los usuarios del script arábigo!

A continuación, hubo un proceso de desarrollo de dieciocho meses que implicó miles de mensajes de correo electrónico, calificaciones de reuniones en línea, muchas discusiones animadas, algunas transigencias lingüísticas difíciles y un gran arduo trabajo. En su progreso hacia las primeras LGR, el Panel de Generación del script arábigo realizó tres tareas clave:

  1. Analizar los puntos de código Unicode para su inclusión.

    Como primera tarea, el grupo tuvo que determinar qué puntos de código deberían permitirse usar al formar las etiquetas. Como punto de partida, el Panel de Integración preparó una lista corta, que aún así contenía más de 200 puntos de código. Este esfuerzo implicó buscar y documentar fuentes para verificar que cada punto de código se utilizara en idioma activo y contemporáneo, y de no ser así, se excluía. Esta fue una tarea difícil, especialmente en casos de las comunidades cuyo uso del script no está documentado porque sus países formalmente utilizan otros scripts, como cirílico y latino. Se encontraron ejemplos de esto en Asia y África.

  2. Definir variantes de los puntos de código.

    Fue todo un desafío determinar qué sería una variante en script arábigo, porque había muchas formas en que la comunidad que utiliza el código de escritura podía considerar dos puntos de código equivalentes, incluidos homógrafos, variaciones de estilo, y reemplazo y orientación de puntos y otras marcas. Además, algunas variantes están relacionadas semánticamente pero tienen formas gráficamente no relacionadas, motivadas por contextos culturales y consideraciones fonológicas. Si bien es literal en la definición de variantes para administrar la confusión de los usuarios finales, el Panel de Generación para el script arábigo también debió minimizar las etiquetas de variantes "asignables" generadas por estos puntos de código de variantes debido al conservadurismo de la Zona Raíz. Esto fue un verdadero desafío, ya que significó que varias comunidades debían transigir respecto de sus expresiones lingüísticas.

  3. Determinar las reglas para la evaluación completa de etiquetas que permiten solo etiquetas válidas.

    Surgió un nuevo desafío al crear reglas para la generación de etiquetas. No resultaba evidente definir reglas lingüísticas para la verificación de etiquetas a nivel de script (código de escritura). Las reglas ortográficas y otros criterios se basan generalmente en idiomas y no en scripts, y pueden no aplicarse a etiquetas de dominio porque las etiquetas no se limitan a palabras reales en un idioma. El Panel de Generación del script arábigo abordó este desafío al determinar la capacidad de uso de las etiquetas como un criterio limitante. Por ejemplo, desarrolló reglas que invalidaban etiquetas que requerían cambiar entre teclados de diferentes idiomas al usar el script arábigo.

Próximos pasos Las variantes asignables de dominios de alto nivel del script arábigo ahora pueden ser determinadas. La comunidad debe acordar sobre cómo dichos TLD se implementarán y delegarán. Este trabajo está en curso y la ICANN pronto solicitará aportes de la comunidad sobre los mecanismos que se utilizarán para administrar los TLD variantes.

El viaje de las Reglas para la Generación de Etiquetas continúa

Los voluntarios de la comunidad que usan otros scripts y sistemas de escritura están trabajando diligentemente para completar las propuestas de LGR para sus scripts. Aquí se presenta un breve resumen:

  • El Panel de Generación del script armenio también completó su trabajo y presentó su propuesta en noviembre de 2015, terminando en un tiempo récord de seis meses. Sin embargo, debido a las variantes homógrafas con los scripts cirílico, griego y latino, el Panel de Integración pospuso el proceso de integración - el trabajo de los otros paneles de generación ayudarán a comprender mejor el efecto de estas interacciones.
  • Las comunidades china, japonesa y coreana usan una combinación de scripts para escribir sus idiomas. Los paneles de generación están analizando estos idiomas por separado y también están coordinando esfuerzos para garantizar una solución en común para integrar el script Han, que todos ellos comparten.
  • Las comunidades de scripts jemer, lao y tailandés han mostrado un gran progreso. Los paneles de generación de jemer y lao están manteniendo discusiones rígidas con el Panel de Integración para finalizar las complejas reglas para la evaluación completa de etiquetas basadas en scripts (códigos de escritura). Esta característica es compartida con los scripts derivados del complejo sistema de escritura neo-brahmánico.
  • Las comunidades de cirílico, griego y latino se encuentran en varias etapas de sus análisis. Una vez que finalicen con su trabajo interno, comenzarán a coordinar para finalizar las variantes entre los scripts entre ellas y con el script armenio.
  • Se han formado los paneles de generación etíope y brahmánico. Las comunidades han comenzado su trabajo y están conociendo los requisitos del proceso. El Panel de Generación de brahmánico tiene una tarea compleja en sus manos, ya que está trabajando de manera simultánea en nueve scripts diferentes de la región.
  • El personal de la ICANN se está comunicando con las comunidades de los scripts georgiano, hebreo, sinhala y thaana para alentarlas a organizar y comenzar a trabajar en sus respectivas propuestas de LGR.

Estado de trabajo en las LGR de Zona Raíz por los Paneles de Generación (en marzo de 2016)

Bar graph showing status of work on Root Zone LGR by the Generation Panels (in March 2016)

A medida que las comunidades que utilizan códigos de escritura finalicen sus propuestas, se integrarán incrementalmente a las publicaciones posteriores de las LGR, lo que permite que las comunidades relevantes determinen la validez y las variantes de etiquetas en estos scripts.

Estoy entusiasmado por el progreso hasta la fecha y espero con ansias la finalización de más propuestas de LGR. Particularmente, agradezco a todos los voluntarios que comprenden la importancia de esta labor y han realizado tan arduo trabajo para hacer que una Internet multilingüe sea realidad.

Para más información sobre las Reglas para la Generación de Etiquetas, consulte los blogs anteriores sobre LGR de Zona Raíz – Introducción a las LGR de Zona Raíz, se requiere colaboración y Desafíos enfrentados. Para obtener más información sobre el trabajo del Programa de IDN en la ICANN, visite icann.org/idn o envíe un mensaje al siguiente correo electrónico: IDNProgram@icann.org.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."