| Subscribe: Newsletters & News Alerts | ICANN Blog | Public Comment
Nombres de Dominio Internacionalizados – Glosario
Con el propósito de garantizar que las discusiones sobre dominios IDN sean consistentes, ICANN ha publicado un Glosario de IDN. Los términos del glosario pueden usarse libremente y se espera que el mismo se expanda con el tiempo. Si tiene sugerencias para añadir términos y/o cambiar algo en el glosario, por favor escríbanos a: idn-glossary@icann.org. Los comentarios se publicarán en el foro de discusiones, disponible en: http://forum.icann.org/lists/idn-glossary/.
Históricamente, los nombres de dominio de Internet estaban limitados a un
conjunto de caracteres en ASCII (p. ej. a-z, 0-9 y "-"). Sin embargo,
a medida que el uso de Internet se extiende a todas las regiones y a todos
los distintos grupos lingüísticos del mundo, la demanda de nombres de dominio
en otros idiomas se ha vuelto más intensa. Varios acrónimos se utilizan comúnmente
cuando se habla de la internacionalización de los nombres de dominio. Para
facilitar el entendimiento de este tema, a continuación se muestra una lista
de acrónimos y sus explicaciones respectivas.
ACE (Codificación compatible con ASCII)
ACE es un sistema de codificación de Unicode con el que se puede trasmitir cualquier carácter usando sólo un conjunto de caracteres en ASCII (a-z, 0-9 y "-"). Esta codificación se usa porque es posible que las aplicaciones que utilizan el protocolo del DNS no procesen correctamente otros valores.
ASCII (Código estadounidense estándar para el intercambio de información)
ASCII es un código numérico que usan comúnmente las computadoras y otros aparatos que trabajan con textos. Las computadoras solamente entienden números y el código ASCII es la representación numérica de un carácter como ‘a’ o ‘@’. El código ASCII es relevante, puesto que antes de la internacionalización, solamente se podían usar las letras a-z, los dígitos 0-9 y el guión "-" en los nombres de dominio.
Carácter
En el contexto de los IDNs, se puede considerar a un ”carácter” como la unidad gráfica básica de un sistema de escritura, que consiste en un código y un conjunto de reglas que determinan cómo se utiliza dicho código para representar un lenguaje específico. Sin embargo, las etiquetas de dominios no conllevan en sí información intrínseca sobre el lenguaje al que se les busca asociar, pero sí pueden revelar el código en el que están basadas. Desafortunadamente, esta dependencia del lenguaje no se puede eliminar restringiendo la definición de código, porque en muchos casos (como en los ejemplos de abajo), los lenguajes que comparten el mismo código difieren en la manera en que utilizan sus elementos individuales. Por lo tanto, el término 'carácter' no puede definirse independientemente del contexto en el que se usa.
En los sistemas de escritura basados en fonética, un carácter normalmente es una letra, o bien representa a una sílaba, mientras que en los sistemas ideográficos (o pictográficos, o logográficos), un carácter puede representar a un concepto o una palabra.
Los ejemplos que se mencionan a continuación muestran que la definición de carácter tiene dos sentidos, el primero es una unidad de base lingüística y el otro es el punto de código asociado.
Etiqueta U 酒 : Yiu; en chino significa 'bebida alcohólica'; el punto de código Unicode es U+9152 (conocido también como: IDEOGRÁFICO UNIFICADO CJK-9152); la etiqueta A es xn—jj4
Etiqueta U 北京 : en chino significa ‘Beijing’, los puntos de código Unicode son U+5300 U+4EAC; la etiqueta A es xn—1lq90i
Etiqueta U 東京 : en japonés significa ‘Tokio’, los puntos de código Unicode son U+6771 U+4EAC; la etiqueta A es xn—1lqs71d
Etiqueta U ایكوم: en persa significa ICOM, los puntos de código Unicode son U+0627 U+06CC U+0643 U+0648 U+0645; la etiqueta A es xn—mgb0dgl27d.
Consorcio Unicode
Una organización sin fines de lucro cuyo objetivo es desarrollar, extender y promover el uso del estándar Unicode. Para más información, visite el sitio http://www.unicode.org.
DNS (Sistema de nombres de dominio)
El DNS facilita el uso de Internet, pues permite que se usen cadenas de letras (el "nombre de dominio") en lugar de crípticas direcciones IP. Por tanto, en lugar de escribir 207.151.159.3, se puede escribir www.internic.net.
Etiqueta
La etiqueta es una parte individual del nombre de dominio. Las etiquetas generalmente se muestran separadas por puntos; por ejemplo, el nombre de dominio "ejemplo.com" se compone de dos etiquetas: "ejemplo" y "com".
Idiomas | Códigos | Alfabetos
Los idiomas son usados por comunidades de hablantes. Los códigos se usan para escribir información en los diversos idiomas y, para esto, debe utilizarse el alfabeto correspondiente o algún otro sistema de escritura.
IDNA (Nombres de dominio internacionalizados en aplicaciones)
IDNA es un protocolo definido en la RFC 3490 por el Grupo de Tareas de Ingeniería de Internet (http://www.ietf.org). Gracias a este protocolo, las aplicaciones pueden funcionar con nombres de dominio que tienen caracteres que no están en ASCII. IDNA convierte cadenas de nombres de dominio que tienen caracteres que no son ASCII en etiquetas de nombres de dominio en ASCII, para que las aplicaciones que usan el DNS puedan entenderlas claramente. No todos los caracteres de todos los idiomas del mundo se podrán usar en los nombres de dominio. IDNA no puede convertir todos estos caracteres en etiquetas en ASCII.
IDN (Nombres de dominio internacionalizados)
Los IDNs son nombres de dominio representados por caracteres del idioma local. Estos nombres de dominio pueden contener caracteres con signos diacríticos (usados por muchos idiomas europeos) o caracteres de códigos no latinos, como por ejemplo, el árabe o el chino.
Los IDNs hacen que la etiqueta del nombre de dominio pueda ser vista por el usuario de una forma, aunque ésta se trasmita por el DNS de otra forma. Para evitar confusiones, utilizaremos la siguiente terminología:
La etiqueta A es lo que se trasmite en el protocolo del DNS y es la forma compatible con ASCII (ACE) de una cadena IDNA; por ejemplo "xn--11b5bs1di". La etiqueta U es lo que debería mostrarse al usuario y es la representación del nombre de dominio internacionalizado (IDN) en Unicode, por ejemplo " परीका " ("prueba" en hindi, código Devanagari). Finalmente, la etiqueta LDH se refiere estrictamente a una etiqueta totalmente codificada en ASCII que obedece a los estándares del "nombre de host" (LDH) y que no es un IDN (por ejemplo “icann” en el nombre de dominio “icann.org”).
(La definición de etiqueta mencionada arriba fue extraída de: http://www.ietf.org/internet-drafts/draft-klensin-idnabis-issues-01.txt)
IDN SLDs o IDN 2LDs
Generalmente se usa para referirse a nombres de dominio con caracteres locales en el segundo nivel, mientras que el primer nivel utiliza solamente caracteres en ASCII. Por ejemplo: [παράδειγμα .prueba] ("ejemplo. prueba" en griego).
IDN TLDs
Generalmente, este es el término para referirse a los dominios de primer nivel internacionalizados. En éstos, todo el nombre de dominio puede representarse con caracteres locales. Por ejemplo: [실례.테스트] ("ejemplo.prueba" en hangul, que es el alfabeto coreano).
LDH (Letra-dígito-guión)
El estándar para nombre de host definido en la RFC 952 (modificado después en la RFC 1123), era usado por los registros de dominios de primer nivel antes de la internacionalización. Esto significa que los nombres de dominio sólo podían contener las letras a-z, los dígitos 0-9 y el guión “-“. El término “puntos de código LDH” se refiere a este subconjunto. Con la introducción de los IDNs, esta regla ya no es relevante para todos los nombres de dominio, aunque con el uso del IDNA lo que aparece en el DNS permanece en LDH.
Punycode
Punycode es el algoritmo de codificación compatible con LDH descrito en el estándar de Internet [RFC3492] y que se utiliza actualmente. Este es el método que se usa para codificar los IDNs en secuencias de caracteres en LDH ASCII para que el sistema de nombres de dominio (DNS) entienda y procese los nombres. Lo que se busca es que los usuarios y los registrantes no vean la forma codificada del nombre del dominio. El único objetivo es que el DNS pueda procesar, por ejemplo, un URL con caracteres locales. En la sección 'etiqueta A' que está en la definición de 'IDN' se pueden ver algunos ejemplos.
El prefijo de una etiqueta A en Punycode siempre es "xn--". Se recomienda que este prefijo se reserve únicamente para los registros de dominios de alto nivel para evitar confusiones en caso de que se introduzcan IDNs bajo el dominio de alto nivel respectivo.
Unicode
Unicode es un esquema de codificación individual de uso común, en el cual se asigna un número único a cada uno de los caracteres de una gran variedad de idiomas y códigos. El estándar Unicode contiene tablas que enumeran los 'puntos de código' (números únicos) de cada carácter local identificado. Estas tablas se amplían continuamente a medida que se digitalizan más caracteres.
En Unicode, a los caracteres se les asignan códigos que definen de manera única a cada carácter para usarlo en muchos códigos del mundo. El 'punto de código' es un número particular asignado a un carácter determinado, o algún aspecto de un carácter, como un acento o una diéresis. Unicode admite más de un millón de puntos de código, los cuales se escriben con una "U" seguida de un signo más y un número único en notación hexadecimal; por ejemplo, la palabra, "Hello" se escribe U+0048 U+0065 U+006C U+006C U+006F.
URL
Es el acrónimo de "Uniform Resource Locator" (localizador uniforme de recursos), que es una cadena que describe la dirección del documento u otro recurso en la Internet. Según la definición de la IETF en la RFC 2396, un URL se compone de dos partes separadas por dos puntos (":"). La primera parte de la dirección indica qué protocolo usar, p. ej., http, ftp, etc. y la segunda parte especifica la dirección IP o el nombre de dominio donde se encuentra el recurso.
UTF-8
El UTF-8 (formato de transformación Unicode de 8 bits) es un sistema de codificación de Unicode con el que se puede trasmitir cualquier carácter usando valores numéricos de 8 bits. Este formato se usa comúnmente puesto que la transmisión de datos en 8 bits prevalece en Internet.