Skip to main content

Los Once del Sur Asiático - Avance en apoyo a los IDN en códigos de escritura de la región

Recientemente viajamos al sur de Asia para comenzar y brindar apoyo a los esfuerzos de la comunidad para desarrollar el Conjunto de Reglas para la Generación de Etiquetas para la Zona Raíz de Internet (RZ-LGR), que permitirá una Internet aún más multilingüe. Esto incluyó reuniones de los paneles para los códigos de escritura bráhmica, sinhala y thaana.

Maldivas

Comenzamos nuestra serie de encuentros en Maldivas, donde la Autoridad de Comunicaciones de Maldivas (CAM) fue el anfitrión para un evento de participación de dos días sobre el sistema de nombres de dominio y la seguridad cibernética. El siguiente punto de la agenda fue una jornada de capacitación sobre Nombres de Dominio Internacionalizados (IDN), y sobre el propósito y el diseño del RZ-LGR. A esta capacitación asistieron miembros de la Sociedad de Informática de Maldivas, la Academia Dhivehi y expertos locales que trabajan en un software en código de escritura thaana - el código de escritura de Maldivas.

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region

Los participantes explicaron cómo el código de escritura thaana utiliza regularmente signos ortográficos en consonantes y vocales para escribir el lenguaje dhivehi [PDF, 154 KB] en sentido de derecha a izquierda. Curiosamente, también aprendimos que la comunidad mezcla códigos de escritura. Por ejemplo, utilizan los códigos de escritura thaana y árabe para escribir el nombre Abdullah [PDF, 221 KB]. Gracias a nuestras reuniones, ahora existe interés por parte de la comunidad en formar un Panel de Generación (GP) para que el código de escritura thaana desarrolle su propuesta para el RZ-LGR.

Las reuniones en Maldivas fueron productivas y demostraron ser una importante etapa de preparación o práctica pura para la actividad de relacionamiento de cinco días en Colombo, Sri Lanka, donde apoyamos los debates sobre el desarrollo y revisión de propuestas basadas en múltiples códigos de escritura. Durante el fin de semana, nos preparamos para un debate con los miembros del equipo que trabaja en el código de escritura sinhala, muchos de los cuales han participado durante mucho tiempo en cuestiones relacionadas con la estandarización Unicode sinhala y los nombres de dominio de segundo nivel.

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region

Fuimos recibidos por Theekshana, una compañía sin fines de lucro asociada a la Facultad de Informática de la Universidad de Colombo (UCSC), y nuestra sala de reuniones contaba con vista a los hermosos campos de cricket en el campus de UCSC.

Código de escritura sinhala

El código de escritura sinhala (සිංහල) solía escribirse en hojas de palma y se dibuja en curvas porque las líneas rectas podían rasgar las hojas. Se utiliza para escribir textos en sánscrito y pali. Durante las reuniones, explicamos las limitaciones impuestas por el procedimiento para desarrollar el RZ-LGR y discutimos las implicancias del código de escritura sinhala. El panel también brindó información sobre las reglas para el nivel de etiqueta desarrolladas por el panel de generación en idioma bráhmico (NBGP) para el código de escritura devanagari a fin de organizar las limitaciones del Akshara, como ejemplo para organizar los caracteres cingaleses. Finalmente, el panel analizó otros códigos de escritura y halló posibles casos de caracteres con variantes de códigos de escritura combinados en los códigos de escritura kannada, malayalam, birmano y télegu, que continuará investigando con más detalle. La reunión finalizó con una rueda de prensa en la cual el presidente del panel de generación en el código de escritura sinhala, representante de Sri Lanka ante el Comité Asesor Gubernamental (GAC) y la organización de la ICANN hablaron sobre la importancia de los IDN y anunciaron la formación del GP en el código de escritura sinhala.

El panel de generación en código de escritura bráhmico(NBGP) también se reunió en Colombo en forma presencial. Los equipos de los paneles de generación en códigos de escritura brámhico y sinhala comenzaron con una sesión conjunta que se centró en cuestiones de interés mutuo y contaron con la presencia de miembros de India, Nepal y Sri Lanka (esperamos que Bangladesh se sume en breve). Los temas incluyeron el marco uniforme para las reglas del nivel de etiquetas para los códigos de escritura del sur asiático, variantes de códigos de escritura combinados entre el código de escritura sinhala y los códigos de escritura abarcados por el NBGP, y la propuesta para que el código de escritura tamil sea desarrollado por el NBGP.

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region El NBGP había establecido un objetivo contundente para abordar en su reunión. Después de hablar sobre el código tamil, la siguiente reunión contó con un formidable conjunto de expertos que debatieron sobre los códigos de escritura gujarati, gurmukhi, kannada, malayalam y télugu.

El trabajo sobre estos códigos de escritura ha progresado significativamente. Los primeros borradores completos fueron revisados por el panel, que identificó los desafíos y posibles formas de avanzar. Los expertos que trabajan en el código de escritura kannada identificaron caracteres que no se han utilizado en casi 50 años y finalmente los excluyeron de la propuesta para el RZ-LGR.

El panel sostuvo un minucioso debate sobre los caracteres con variantes de códigos de escritura combinados para determinar un mecanismo común para identificarlos: ¿deberían los caracteres con variantes ser estrictamente homoglíficos o deberían incluir también otros caracteres confusos? El panel llegó a una solución para etiquetar cada par de caracteres con variantes de códigos de escritura combinados con uno de los tres coloresThe South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region, en función de los comentarios independientes de los miembros de ambos códigos de escritura relevantes, para caracteres que no se puedan distinguir, sean similares y distintos. El GP identificó varios pares de códigos de escrituras que incluyen devanagari-gurmukhi (देवनागरी - ਗੁਰਮੁਖੀ), kannada-télugu (ಅಕ್ಷರಮಾಲೆ - తెలుగు లిపి) y tamil-malayalam (தமிழ் - മലയാളലിപി) para el análisis de variantes de códigos de escritura combinados.

En retrospectiva

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region Concluimos nuestro viaje con una visita al Cricket Club Café, un famoso restaurante en Colombo. Estuvimos rodeados de nostálgicos recuerdos del cricket, lo que incluye un bate con las firmas de los once representantes de Sri Lanka que ganaron la Copa Mundial de Cricket en 1996. Aunque estábamos tan cansados como si hubiésemos jugado un partido de cricket durante cinco días, también nos entusiasmó la inmensa energía que los miembros de la comunidad aportaron a los vibrantes debates. Nos impulsó su pasión por defender sus idiomas y códigos de escritura. Mientras examinamos el menú, silenciosamente tomamos consciencia de la alineación de los once códigos de escritura abarcados por los tres paneles que habían recibido nuestro apoyo en este viaje. Estos códigos de escritura también exhibieron una gloriosa variedad en su estilo y, al mismo tiempo, arraigaron una cultura de escritura abúgida unificadora en el sur de Asia en un nivel más profundo.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."