es

Cómo la comunidad de la ICANN trabajó en pos de una Internet más multilingüe

22 de marzo de 2022
Por Sarmad HussainSarmad Hussain

La misión de la ICANN es ayudar a garantizar una Internet global, unificada, estable y segura. Ahora bien, ¿qué hace falta para respaldar una Internet global? La mayoría de la población mundial no habla inglés como primer idioma ni escribe utilizando solamente las letras de la A a la Z. De hecho, poco más de la tercera parte  de la población mundial utiliza el código de escritura latino e incluso una cantidad menor usa solo las letras de la A a la Z.

La comunidad lleva muchos años trabajando para promover los nombres de dominio internacionalizados (IDN) y lograr que el Sistema de Nombres de Dominio (DNS) sea más diverso e inclusivo para sus usuarios en todo el mundo. Gracias a los IDN, las personas de todo el mundo pueden usar nombres de dominio en idiomas y códigos de escritura locales, tales como el árabe, chino, cirílico, devanagari y tailandés, entre otros.

Para habilitar un IDN completo, incluidas las etiquetas del dominio de alto nivel (TLD), se debe seguir un proceso complejo y extenso que la ICANN ayuda a facilitar. Una parte del proceso consiste en desarrollar un mecanismo uniforme y transparente para determinar las etiquetas de IDN TLD válidas, junto con sus etiquetas variantes en los distintos códigos de escritura utilizados por la comunidad global. En los últimos ocho años, varias comunidades usuarias de distintos códigos de escritura formaron paneles de generación (GP). Estos paneles están integrados por expertos en el DNS, idiomas y códigos de escritura que trabajan en conjunto para desarrollar las reglas que se necesitan para crear TLD en sus correspondientes códigos de escritura de manera estable y segura. Estas reglas se crean según el Procedimiento de las Reglas para la Generación de Etiquetas para la Zona Raíz, el cual la comunidad está considerando como mecanismo para validar nuevos dominios genéricos de alto nivel (gTLD) en la próxima ronda y dominios de alto nivel con código de país (ccTLD), como también para definir sus etiquetas variantes.

En el transcurso de esta semana, la quinta versión de las Reglas para la Generación de Etiquetas para la Zona Raíz (RZ-LGR-5), que contempla la integración de 26 códigos de escritura, se publicará para comentario público. Estos códigos de escritura se utilizan para la comunicación escrita en cientos de idiomas en todo el mundo. Se trata de un logro notable y un verdadero ejemplo de cómo funciona el modelo de múltiples partes interesadas. La organización de la ICANN se enorgullece de haber apoyado el trabajo de las comunidades usuarias de códigos de escritura, ya que las RZ-LGR son una herramienta importante para ampliar el acceso a una Internet global y multilingüe.

A medida que nos acercamos a la publicación de la RZ-LGR-5, la cual incluirá todo el trabajo realizado por los GP en funcionamiento, quiero aprovechar esta oportunidad para reconocer y agradecer su dedicación y sus logros. Desde la creación del primer GP en 2014, la comunidad concretó las siguientes acciones:

  • Creó 17 paneles de generación para 26 códigos de escritura.
  • Convocó a más de 270 expertos en códigos de escritura, provenientes de nuestra comunidad de voluntarios.
  • Aportó más de 10 000 horas de trabajo voluntario.
  • Finalizó su trabajo para 26 códigos de escritura, incluidos en las propuestas para las LGR. Estos son los códigos de escritura al día de hoy: árabe, armenio, bengalí, chino (han), cirílico, devanagari, etíope, georgiano, griego, gujarati, gurmukhi, hebreo, japonés (hiragana, katakana y kanji [Han]), kannada, jemer, coreano (hangul y hanja [Han]), lao, latino, malayalam, birmano, oriya, sinhala, tamil, télugu y tailandés.

Datos interesantes de los GP:

  • Cada GP suele estar formado por entre 7 y 15 miembros voluntarios, pero el número de miembros puede ser mucho mayor en función de cómo se organice el GP.
  • El GP con la mayor cantidad de miembros es el Panel de Generación para el Código de Escritura Bráhmico. Cuenta con 66 miembros provenientes de Bangladés, India, Nepal, Sri Lanka y Singapur. Se dedica a 9 códigos de escritura.
  • El primer GP fue el Panel de Generación para el Código de Escritura Árabe y se creó en 2014.
  • Total de idiomas comprendidos en el trabajo de los GP: más de 386
  • Total de países representados por los miembros de los GP: 44
  • Total de periodos de comentario público realizados por la ICANN a la fecha para desarrollar las RZ-LGR: más de 30

La organización de la ICANN continuará brindando su apoyo a otras comunidades usuarias de códigos de escritura para que formen GP según el procedimiento para las RZ-LGR.

Entonces, ¿qué hacen exactamente los GP y por qué es importante su trabajo? Les presentamos más detalles a continuación.

¿Qué hacen los paneles de generación?

¿Por qué es tan complicado habilitar distintos códigos de escrita en los IDN? Debido a que los códigos y sistemas de escritura utilizados en todo el mundo son esencialmente diferentes, algunos códigos de escritura requieren reglas contextuales para formar una etiqueta sin problemas de representación. También existe la posibilidad de que el usuario final se confunda cuando se trata de caracteres que pueden ser percibidos como equivalentes por los usuarios de sus respectivos códigos de escritura, pero que en realidad son diferentes, y se denominan variantes. Por ejemplo, la "a" minúscula en el código de escritura latino A (U+0061) y la "a" minúscula en el código de escritura cirílico A (U+0430). En algunos códigos de escritura, las etiquetas variantes son necesarias para promover la usabilidad de los IDN, tal como sucede con el idioma chino simplificado y el idioma chino tradicional, los cuales se deben poder asignar.

La tarea de los GP consiste en desarrollar los conjuntos de reglas sobre repertorio, puntos de código variantes y creación de etiquetas. Los GP están integrados por voluntarios que incluyen expertos en lingüística y representantes de las comunidades usuarias de los códigos de escritura, quienes aportan un profundo conocimiento de la cultura, las costumbres y las prácticas locales. También cuentan con miembros familiarizados con el funcionamiento de registros y registradores, expertos en materia de políticas y expertos en el DNS. Estos son los principales objetivos de cada GP:

  • Hacer una lista de los caracteres de un código escritura específico que se pueden utilizar en un nombre de dominio.
  • Identificar los puntos de código que deben considerarse "iguales" o variantes para reducir la confusión del usuario final y favorecer la usabilidad.
  • Definir reglas específicas para cada código de escritura a fin de evitar problemas de seguridad.

Este es un ejemplo de un problema de seguridad que tuvo que resolver un GP:

Caso Puntos de código Glifo*
1 U+0067 U+0303 U+0303 g̃
2 U+0067 U+0303 g̃

*Tal como figura en la barra de direcciones de Chrome. Versión 97.0.4692.71 de Chrome (diseño oficial) (x86_64) para MAC.

En este ejemplo, el caso 1 y el caso 2 tienen distintas secuencias de puntos de código, pero su representación visual es igual. En el caso 1, se repite un número de Unicode (U+0303 U+0303), mientras que en el caso 2 el mismo número aparece una sola vez (U+0303). La propuesta de RZ-LGR para el código de escritura latino en la cual se abordó esta cuestión no incluye U+0303 como punto de código único. Por lo tanto, el caso 1 no se puede formar debido al posible problema de seguridad.

¿Cuánto tiempo insume este trabajo?

Un GP puede tardar años en finalizar su propuesta para un código de escritura. Una vez que la propuesta está lista, pasa por un periodo de comentario público y luego es evaluada por un Panel de Integración cuyos miembros son expertos en lingüística, Unicode, el DNS y los IDN. Después de la evaluación, el Panel de Integración incorpora gradualmente la propuesta para el código de escritura correspondiente a las RZ-LGR. Las RZ-LGR actualizadas se publican para comentario público con el objetivo de verificar el proceso de integración antes de la publicación final.

¿Por qué es importante este trabajo?

El DNS, y sobre todo la zona raíz, es un recurso que se comparte a nivel mundial. Para construir una Internet multilingüe más inclusiva y segura – que pueda ser utilizada por las personas de todo el mundo – la habilitación de los códigos de escritura y, en última instancia, de los IDN, debe llevarse a cabo de manera cuidadosa y estable. Sin el conocimiento y la dedicación de todos los GP y los paneles de integración en los últimos ocho años, no habría sido posible una Internet multilingüe. Los GP sentaron las bases para que los códigos de escritura se utilicen adecuadamente, logrando un equilibrio entre la usabilidad y la seguridad de los nombres de dominio en distintos códigos de escritura.

En nombre de la organización de la ICANN, quiero agradecer nuevamente a todos los miembros de la comunidad y a los participantes de todo el mundo que colaboraron con los GP y con esta iniciativa.

Authors

Sarmad Hussain

Sarmad Hussain

Sr Director IDN & UA Programs
Read biographyRead biography