ICANN Blogs

Read ICANN Blogs to stay informed of the latest policymaking activities, regional events, and more.

Comemorando um marco significativo da comunidade na habilitação dos Domínios de Primeiro Nível Multilinguísticos

2 March 2016
By

null

Em 2 de Março de 2016, a primeira versão das Regras de Geração de Etiquetas ou Rótulos para a Zona Raiz (LGR-1) foi disponibilizada. A LGR-1 traz o suporte para a Escrita Árabe e as versões futuras suportarão outros padrões de escrita adicionais. Essa conquista segue as propostas da LGR da Zona Raiz enviadas pelas comunidades de escrita árabe e armênia em novembro de 2015.

O estabelecimento das Regras de Geração de Etiquetas da Zona Raiz é um avanço significativo no desenvolvimento de uma Internet multilinguística. Essas regras fornecem um método transparente e aberto para a determinação da validade e das variações de nomes de domínios de primeiro nível (TLD), ou etiquetas/rótulos, nas várias escritas e sistemas de escrita existentes no mundo. O LGR-1 é o resultado de muito trabalho do Painel de Geração da Escrita Árabe baseado na comunidade, do Painel de Integração e de muitos outros contribuintes. O trabalho beneficia os usuários atuais e futuros da Internet que usam a escrita Árabe, facilitando a sua navegação na web e ajudando a resolver questões de segurança e confusão ao usar o sistema de nomes de domínio – especificamente domínios de primeiro nível.

Eu gostaria de parabenizar todos que contribuíram para a conquista deste monumental primeiro passo!

Jornada para a LGR-1: Painel de Geração da Escrita Árabe

A Força Tarefa baseada na comunidade para os Nomes de Domínios Internacionalizados da Escrita Árabe (TF-AIDN) começou se organizar no segundo período de 2013 e passou a funcionar formalmente como um Painel de Geração de Escrita Árabe em fevereiro de 2014. O Árabe é uma das escritas mais complexas de se examinar, pois é usada por diversos idiomas ao redor da Ásia e África, resultando em muitas variações nas formas de suas letras e no uso do padrão de escrita. Pequenas variações nas letras parecem semelhantes para usuários sem experiência (mesmo dentro da comunidade de escrita Árabe) que não estão familiarizados com a amplitude do uso desta escrita, causando confusão nas etiquetas. Por exemplo, os usuários de escrita Árabe podem confundir کتاب (kitab, ou "livro") com ڪتاب, esse último sendo interpretado como uma variação de estilo. Essas variações acrescentam ainda mais complexidade à escrita, que já contêm formas de letras cursivas dependentes do contexto e muitas marcas combinadas para indicar tanto o conteúdo vocálico como consonantal.

Uma vez que o uso da escrita Árabe é tão diverso linguística e geograficamente, o primeiro desafio para os membros inicias do Painel de Geração de Escrita Árabe foi recrutar especialistas representativos de uma variedade de disciplinas, incluindo linguística, tecnologia, política e da própria comunidade de usuários finais. Esse grupo trabalhou com a Equipe de Participação de Partes Interessadas Globais da ICANN para recrutar um total de 33 membros, representando 21 países. Uma variedade impressionante de usuários de escrita Árabe!

O que se seguiu foi um processo de desenvolvimento de 18 meses, envolvendo milhares de e-mails, dezenas de reuniões online, muitas discussões vigorosas, alguns compromissos difíceis de linguística e muito trabalho duro. Em seu progresso rumo à primeira LGR, o Painel de Geração de Escrita Árabe concluiu três tarefas chaves:

  1. Analisar pontos do código Unicode para inclusão.

    Como uma primeira tarefa, o grupo teve que determinar quais pontos do código deveriam ser autorizados para uso ao formar as etiquetas. Como um ponto de partida, o Painel de Integração preparou uma lista resumida, a qual ainda continha mais de 200 pontos de código. Esse empenho envolveu encontrar e documentar fontes para verificar se cada ponto de código era usado na linguagem ativa e contemporânea, e se não o era, para exclui-lo. Essa foi uma tarefa difícil, especialmente nos casos de comunidades em que o uso da escrita não é documentado, por conta de seus países usarem formalmente outras escritas, tais como o alfabeto Cirílico ou Latim. Exemplo destes casos foram encontrados na Ásia e África.

  2. Definindo variações dos pontos de código.

    Foi desafiador determinar o que seria uma variação na escrita Árabe, pois existiam muitas maneiras pelas quais a comunidade de escrita poderia considerar dois pontos de código equivalentes, incluindo os homoglifos, variações de estilo e posicionamento e orientação dos pontos e outras marcações. Além disso, algumas variações estão semanticamente relacionadas, mas possuem formas não relacionadas do ponto de vista gráfico, motivadas por contextos culturais e considerações fonológicas. Apesar da liberalidade na definição da variação para gerenciar eventuais confusões do usuário final, o Painel de Geração da Escrita Árabe também precisou minimizar as variantes de etiquetas "alocáveis" geradas por estes diferentes pontos de códigos, devido ao conservadorismo da Zona Raiz. Esse foi um verdadeiro desafio, uma vez que isso significou diferentes comunidades tendo que ceder em suas expressões linguísticas.

  3. Determinando as regras de avaliação da etiqueta como um todo que permitam apenas etiquetas válidas.

    Um novo desafio surgiu quando da criação de regras de geração de etiquetas. Não estava claro como definir as regras de linguística para a verificação das etiquetas em nível de escrita. Regras de ortografia e outros critérios estão normalmente baseados no idioma, e não na escrita ou script, e podem não ser aplicáveis às etiquetas de domínio, pois as etiquetas não estão limitadas a palavras reais de um idioma. O Painel de Geração de Escrita Árabe abordou este desafio determinando a viabilidade de uso das etiquetas como um critério limitador. Por exemplo, foram desenvolvidas regras que invalidaram etiquetas que demandavam a troca entre teclados de linguagens diferentes ao usar a escrita Árabe.

O que vem a seguir? Variações alocáveis de domínios de primeiro nível com a escrita Árabe já podem ser determinadas. A comunidade deve acordar sobre como tais TLDs serão implementados e delegados. Esse trabalho está em progresso e a ICANN em breve buscará por comentários da comunidade sobre os mecanismos que serão usados para gerenciar os TLDs variantes.

A Jornada das Regras de Geração de Etiquetas Continua

Voluntários da comunidade para outras escritas e sistemas de escrita estão trabalhando com afinco para concluir as propostas de LGR para suas escritas/scripts. Aqui está um breve sumário:

  • O Painel de Geração de Escrita Armênia também concluiu seus trabalhos e enviou sua proposta em novembro de 2015, finalizando-a em um tempo recorde de seis meses. Entretanto, devido às variações de homoglifo com as escritas Cirílica, Grega e Latim, o Painel de Integração adiou o processo de integração. O trabalho de outros painéis de geração ajudará a entender melhor o efeito dessas interações.
  • As comunidades chinesa, japonesa e coreana usam uma mescla de scripts para escrever suas linguagens. Os painéis de geração estão analisando essas linguagens separadamente, e também coordenam esforços para assegurar uma solução comum para integrar o script Han, compartilhado por todas elas.
  • As comunidades de Escrita Khmer, Lao e Thai têm mostrado grande progresso. Os painéis de geração de Lao e Khmer vêm discutindo rigorosamente com o Painel de Integração para finalizar as complexas regras de avaliação de etiquetas como um todo, baseadas na escrita. Essa característica é compartilhada com as escritas derivadas do complexo sistema de escrita Brahmi.
  • As comunidades cirílica, grega e latina estão em fases diversas de suas análises. Uma vez que elas finalizem seus trabalhos internos, começarão a coordenar para concluir as variações cruzadas de scripts entre si e com a escrita Armênia.
  • Painéis de geração da linguagem Etiópica e Neo-Brahmi foram formados. As comunidades iniciaram seus trabalhos e estão aprendendo sobre as exigências do processo. O Painel de Geração Neo-Brahmi tem uma tarefa complexa em mãos, pois está trabalhando simultaneamente em nove diferentes scripts da região.
  • A equipe da ICANN vem se comunicando com as comunidades de escrita Georgiana, Hebraica, Cingalesa e Thaana, para incentivá-las a organizarem e começarem o trabalho em suas respectivas propostas de LGR.

Status de Trabalho na LGR da Zona Raiz pelos Painéis de Geração
(em março de 2016)

Bar graph showing status of work on Root Zone LGR by the Generation Panels (in March 2016)

À medida que essas comunidades de escritas finalizem suas propostas, elas serão integradas gradativamente nos lançamentos subsequentes da LGR, permitindo às comunidades envolvidas determinar a validade e variações das etiquetas em tais escritas.

Eu estou animado com o progresso até o momento e aguardo ansioso pela conclusão de mais propostas de LGR. Gostaria de agradecer particularmente a todos os voluntários que entendem a importância desse empreendimento e vêm se empenhando tanto parar fazer da Internet multilinguística uma realidade.

Para mais informações sobre as Regras de Geração de Etiquetas ou Rótulos, por favor leia os blogs anteriores sobre a LGR da Zona Raiz - Introdução à LGR da Zona Raiz, colaboração necessária e os desafios enfrentados. Para mais informações sobre o trabalho do Programa de IDN na ICANN, visite icann.org/idn ou envie um e-mail para IDNProgram@icann.org.

Authors

Sarmad Hussain

Sarmad Hussain

Senior Director IDN and UA Programs