Skip to main content

Apoiando a diversidade linguística da África para os nomes de domínio de primeiro nível da Internet

Trinta idiomas diferentes – esse foi o resultado de uma pesquisa rápida feita com os vinte participantes do Workshop de IDN pedindo que eles listassem os idiomas que falam. A ICANN organizou o workshop na Cúpula da Internet na África, em Nairóbi, em 28 de maio de 2017. Essa resposta exemplifica a enorme diversidade linguística na África, onde o uso de diversos idiomas, ou multilinguismo, é o padrão. Pelo menos 2.144 idiomas são falados em todo o continente, sendo que alguns países individuais, como a Nigéria, têm até 520 idiomas. Para fazermos uma comparação, 287 idiomas são falados na Europa.

Historicamente, a África é uma das regiões em que a comunicação escrita foi estabelecida primeiro, sendo que os hieróglifos egípcios [PDF, 947 KB] são um dos sistemas de escrita mais antigos descobertos. Mas a maioria dos idiomas africanos usados hoje são apenas falados, sem a forma escrita. Ainda assim, algumas estimativas mostram que mais de 500 idiomas têm uma forma escrita. A diversidade dos sistemas de escrita criados pelos africanos reflete a diversidade encontrada com idiomas escritos: até 29 escritas foram criadas na África, abrangendo quase todos os tipos de escritas, incluindo abjads, abugidas, alfabetos, silabários e logosilabários. Dessas escritas, é possível que 21 talvez ainda estejam em uso e novas escritas estão sendo criadas continuamente, sendo que algumas delas desafiam as atuais classificações linguísticas, como a colorida Oracle Rainbow Script criada em 1999. As escritas mais usadas incluem tifinague, por exemplo, uma escrita antiga usada desde o século III AD, que foi revitalizada no século XX e agora é usada com uma forma padronizada para ensinar idiomas berbere, como o amazigh, para os alunos das escolas primárias do Marrocos. Como um exemplo, veja esta cartilha em amazigh desenvolvida pelo Institut Royal de la Culture Amazighe.

Outros exemplos incluem a escrita etíope [PDF, 189 KB] usada para muitos idiomas na Etiópia e na Eritreia, o silabário vai [PDF, 209 KB] usado para o idioma vai da Libéria, ou o N'ko [PDF, 112 KB], um alfabeto usado para uma família de idiomas chamada mandinga na África Ocidental. Várias escritas agora são históricas e caíram de uso, enquanto outras, como o N'ko, têm comunidades de usuários viáveis e podem ser representadas digitalmente hoje. No entanto, muitas escritas não têm recursos, como fontes ou métodos de entrada, e não são oficialmente reconhecidas nem suportadas.

As escritas mais usadas da África são escritas estrangeiras introduzidas historicamente, como a escrita árabe (conhecida como ajami em algumas comunidades linguísticas) e a escrita latina. Essas escritas foram ampliadas para representar os sons adicionais nos idiomas locais da África. Alguns exemplos incluem sons usados por idiomas nas regiões leste e sul da África cliques laterais (ouça uma pronúncia), escritos com símbolos que não são considerados letras em outros idiomas (como as barras verticais duplas ǁ) ou com sequências muito complexas de letras (como gǁx' ([ᶢǁʢ] no Alfabeto Fonético Internacional) em juǀʼhoansi, um idioma falado na Namíbia e em Botswana. O mesmo também foi feito para a escrita árabe, sendo que novas letras foram criadas para representar sons locais, como a parada pré-nasalizada /mb/ ou /ᵐbʷ/ (ouça uma pronúncia) em chimiini [PDF, 438 KB], um idioma falado na Somália (como o suporte de fonte é limitado para esta letra, veja U+08B6 [PDF, 126 KB] codificado pelo padrão Unicode para exibir a ortografia).

Além disso, o uso de várias escritas pela mesma comunidade linguística, chamado de multiescrita, é muito comum na África. Por exemplo, duas versões do Alfabeto Nacional do Chade (ANT) foram criadas, uma com base na escrita latina e a outra na escrita árabe. As comunidades que usam o idioma sar podem escrever com qualquer uma dessas escritas, por exemplo, a palavra para leão é escrita como “ɓəl” em ANT latimp e ٻّلْ em ANT árabe, conforme mostrado aqui.

Parte extraída o Alfabeto Nacional do Chade. A coluna verde oferece traduções em francês de palavras do idioma chade, listadas na coluna azul nas duas formas, uma baseada na escrita latina (coluna vermelha) e a outra na escrita árabe (coluna amarela). (A tabela foi apresentada em umaproposta de Priest e Hosken [PDF, 4.53 MB] do Décret fixant l'Alphabet National du Tchad, 2010.)

No momento, a ICANN está implementando um programa para apoiar os IDNs (Internationalized Domain Names, Nomes de Domínio Internacionalizados) como TLDs (Top-Level Domains, Domínios de Primeiro Nível). Ela está desenvolvendo regras de geração de etiquetas para a zona raiz (RZ-LGR) para apoiar as diferentes escritas. Esse trabalho é liderado por painéis baseados na comunidade (chamados de GPs [Generation Panels, Painéis de Geração) que documentam o uso da escrita com base no procedimento [PDF, 1.39 MB] finalizado pela comunidade. O GP da escrita árabe já finalizou seu trabalho e apoia a maior parte dos idiomas africanos escritos com a escrita árabe. Mais recentemente, o GP da escrita etíope também finalizou sua proposta para ser integrada na RZ-LGR.

O GP da escrita latina também iniciou seu trabalho e está investigando o uso da escrita na África, além de em outros continentes. É difícil determinar como a escrita latina foi ampliada para atender aos idiomas africanos, já que a documentação disponível é limitada. Sendo assim, a ICANN tem conversado com as comunidades na África para participarem desse trabalho. A ICANN tem realizado workshops anuais de IDN na África para esse objetivo – Congo, em 2015, Adis Abeba, em 2016, e Nairóbi, em 2017.

Embora a ICANN tenha recebido algumas e manifestações de interesse, mais voluntários são necessários da África para o GP de latim para progredir com esse trabalho. Se você tiver interesse de participar ou tiver dúvidas, envie um e-mail para IDNProgram@icann.org.

O projeto de RZ-LGR inclui atualmente as escritas árabe, etíope e latim no contexto da África. ICANN dará suporte a outras escritas na África para TLDs de IDN, se elas forem usadas regularmente pelas comunidades relevantes e se as comunidades puderem coletar declarações de interesse suficientes para formar GPs e desenvolver propostas para a RZ-LGR.

Acesse www.icann.org/idn para mais detalhes sobre o Programa de IDN da ICANN.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."