Skip to main content

支持非洲互联网顶级域名的语言多样性

一项要求二十位 IDN 研讨会参会者列出其所讲语言的快速调查结果显示,共有三十种不同的语言。ICANN 于 2017 年 5 月 28 日在内罗毕召开的非洲互联网峰会上组织了此次研讨会。这一结果表明,非洲的语言十分多样化,该地区通常使用多种语言(即实行多语制)。该洲所使用的语言至少有 2,144 种,尼日利亚等个别国家所使用的语言多达 520 种。相比之下,欧洲仅使用 287 种语言。

历史上,非洲是最先建立文字交流的地区之一,埃及的象形文字 [PDF, 947 KB] 是人类发现的最古老的一种文字系统。但如今,大多数非洲语言仅为口语,并无文字。不过,据估计,共有 500 多种语言拥有文字。这不足为奇,非洲人所创造的文字系统的多样性正反映了其口语的多样性:多达 29 种文字均起源于非洲 — 跨越几乎所有已知的文字类型,包括辅音音素文字、元音附标文字、字母系统、音节文字和意音文字。其中 21 种文字可能仍在使用,而且新的文字还在不断产生,但一些文字偏离了当前的语言分类,比如在 1999 年才创造的彩色甲骨文彩虹文字。例如,使用较为广泛的文字包括提非纳文字,它是一种自公元前 (BCE) 三世纪开始使用的古文字,于 20 世纪复苏,且现在使用的是标准形式,用于向摩洛哥的小学生教授柏柏尔语,比如阿马齐格语。如需查看示例,请参见皇家阿马齐格文化研究所编制的阿马齐格语入门。

更多示例包括埃塞俄比亚和厄立特里亚的许多语言所使用的埃塞俄比亚 [PDF, 189 KB] 文字,利比里亚瓦伊语所使用的瓦伊 [PDF, 209 KB] 音节,或者 N'ko [PDF, 112 KB] — 西非曼丁语族所使用的一种字母系统。尽管多种文字现已成为历史不再使用,但 N'ko 等文字仍然拥有用户群,并且如今已能使用数字形式表示。然而,许多文字缺乏字体或输入法等资源,而且不为官方所支持或认可。

非洲使用最广泛的文字为历史上引入的外国文字,即阿拉伯文(某些语言群体将其称为 Ajami)和拉丁文字。这些文字已被扩展至代表非洲当地语言的其他声音。示例包括南非和东非的语言所使用的搭嘴音,比如齿龈边流搭嘴音(请听发音),使用不被视为其他语言字母的符号书写(比如双竖线 ǁ),或者使用纳米比亚和博茨瓦纳的 Juǀʼhoansi 语中极其复杂的字母串(比如国际音标中的 gǁx' ([ᶢǁʢ])。阿拉伯文同样如此,还创造了一些新的字母来表示当地的声音,比如索马里 Chimiini [PDF, 438 KB] 语中的鼻冠塞音 /mb/ 或 /ᵐbʷ/(请听发音)(由于对该字母的字体支持有限,请参见按照统一码标准编码的 U+08B6 [PDF, 126 KB] 查看其拼写)。

此外,同一语言群体使用多种文字(称为“多语制”)在非洲十分普遍。例如,共创造了两种版本的 Alphabet National du Tchad (ANT),一种基于拉丁文,另一种基于阿拉伯文。使用萨尔语的群体可以使用这两种文字中的任何一种来书写,例如,狮子一词可以使用 ANT 拉丁文写作“ɓəl”,也可以使用 ANT 阿拉伯文写作此处所示的 ٻّلْ 。

摘自 Alphabet National du Tchad。绿色列提供了蓝色列中所列乍得语单词的法语翻译,包括基于拉丁文的形式(红色列)和基于阿拉伯文的形式(黄色列)。(Décret fixant l'Alphabet National du Tchad 的普莱斯特 (Priest) 和霍斯肯 (Hosken) [PDF, 4.53 MB] 的一项提案中提供的表格,2010 年。)

 

目前,ICANN 正在开展一个支持将国际化域名 (IDN) 作为顶级域 (TLD) 的项目。其正在制定根区标签生成规则 (RZ-LGR),以支持不同的文字。此项工作由基于社群的专家组(称为“生成专家组”,GP)领导,负责根据社群敲定的程序 [PDF, 1.39 MB] 记录文字的使用。阿拉伯文 GP 已完成其工作,并支持以阿拉伯文书写的大多数非洲语言。最近,埃塞俄比亚文 GP 也已完成其纳入 RZ-LGR 的提案。

拉丁文 GP 也已开始工作,并开始调查除其他洲以外,该文字在非洲的使用。由于文献资料有限,因此要确定拉丁文是如何扩展至迎合非洲语言的需求极具挑战性。因此,ICANN 已向非洲的社群寻求帮助,请求其参与此项工作。为此,ICANN 已分别于 2015 年(刚果)、2016 年(亚的斯亚贝巴)和 2017 年(内罗比)在非洲召开了 IDN 年度研讨会。

尽管 ICANN 已收到若干意向书,但拉丁文 GP 仍然需要更多非洲志愿者加入才能推进此项重要工作。如果您有意参与或者有任何疑问,请发送电子邮件至 IDNProgram@icann.org

RZ-LGR 项目目前包括非洲的阿拉伯文、埃塞俄比亚文和拉丁文。如果相关社群积极使用其他文字,并且能够召集足够的有意向人士组成 GP 并制定 RZ-LGR 提案,ICANN 将支持将非洲的其他文字作为 IDN TLD。

请访问 www.icann.org/idn,详细了解 ICANN 的 IDN 项目。

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."