ICANN 博文

敬请阅读 ICANN 的博文,了解最新政策制定活动和区域事务等等。

11 种南亚文字——本地区对支持各类文字的国际化域名 (IDN) 而取得的进展

2018 年 02 月 16 日
作者:

我们近期访问了南亚 (South Asia) 地区,启动并支持了一轮社群推动的工作,来制定互联网根区标签生成规则 (Root Zone Label Generation Rules, RZ-LGR),从而进一步促进多语言互联网的发展。这包括新婆罗米文、僧伽罗文和塔安娜文的生成专家组召开的会议。

马尔代夫 (Maldives)

我们在马尔代夫启动了这轮系列活动,受到了马尔代夫通讯管理局 (Communications Authority of Maldives, CAM) 的接待,参加了为期两天的域名系统和网络安全交流合作工作。议程的接下来一个主题就是针对国际化域名 (Internationalized Domain Names, IDN) 开展为期一天的培训,并介绍 RZ-LGR 的目的和设计。这次培训汇集了马尔代夫计算机协会 (Computer Society of Maldives) 的成员、迪维西语学会 (Dhivehi Academy) 的成员和本地塔安娜文(马尔代夫的文字)软件专家们。

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region

参会人解释了塔安娜文字用于从右向左书写的迪维西语[PDF, 154 KB] 中时怎样经常使用辅音和元音标记。有意思的是,我们还发现社群还经常混用这些文字。例如,他们会使用塔安娜文和阿拉伯文来书写人名阿卜杜拉 (Abdullah) [PDF, 221 KB]。会议召开后,我们发现社群有意组建一个塔安娜文生成专家组 (Generation Panel, GP),用于编制这种文字的 RZ-LGR 提案。

这次马尔代夫的会议是富有成效的,并证明是在斯里兰卡科伦坡 (Colombo, Sri Lanka) 召开的五天会议的热身或演练。在斯里兰卡,我们支持了针对多种文字提案编制和审核的讨论工作。周末期间,我们与僧伽罗文团队成员打成一片,他们中的许多人都在很早以前参加了僧伽罗文统一域名编码标准化和二级域的工作。

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region

我们受到了 Theekshana 机构的热情接待。该机构是从属于科伦坡大学计算机学院 (University of Colombo School of Computing, UCSC) 的一个非营利性企业。从会议室中,我们可以眺望 UCSC 美丽的板球运动场。

僧伽罗文

僧伽罗文 (සිංහල) 曾被书写在棕榈叶上,其笔画弯曲,这是因为直线会撕裂棕榈叶。它曾被用于书写梵文和巴利语文本。会议期间,我们解释了 RZ-LGR 流程有哪些限制,并讨论了对僧伽罗文带来的影响问题。专家组还听取了新婆罗米文生成专家组 (Neo-Brahmi Generation Panel, NBGP) 对梵文标签规则所做的介绍,从而整理阿克沙拉用法限制,以此来介绍如何组织僧伽罗文的字符。最终,专家组还审核了其他文字,并发现在埃纳德语、马拉雅拉姆语、缅甸语和泰卢固语有一些跨文字变体字符的情况,该专家组有意对这一主题进行深入研究。会议结束后召开了一场媒体介绍会,僧伽罗文生成专家组主席、政府咨询委员会 (Governmental Advisory Committee, GAC) 斯里兰卡代表和 ICANN 的代表均介绍了 IDN 的重要性,并宣布正式组建僧伽罗文生成专家组。

新婆罗米文生成专家组 (NBGP) 也在科伦坡召开了首次见面会。新婆罗米文和僧伽罗文生成专家组的团队成员还召开了联合会议,其成员来自印度 (India)、尼泊尔 (Nepal) 和斯里兰卡(我们还希望孟加拉 (Bangladesh) 能够尽快加入),专注讨论共同关注的事务。这些事务包括:南亚文字的统一标签规则框架、僧伽罗文和 NBGP 所确定的跨文字变体文字,以及 NBGP 正在编制的泰米尔语提案。

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region NBGP 在本次会议召开时设定了雄心勃勃的目标。讨论了泰米尔语后,下节会议则汇集了一批优秀的专家,讨论古吉拉特语、果鲁穆奇语、埃纳德语、马拉雅拉姆语和泰卢固语的文字。

这些文字的工作也得到了大幅推进。专家组审阅了首批完成的草案,并确定了挑战和前进方向。埃纳德语的文字专家们还发现有些字符近 50 年来都没有使用,并将这些字符从 RZ-LGR 提案中删除了。

专家组还对跨文字变体字符一题进行了详细讨论,确定了一套识别这类字符的共识机制——例如,这些变体字符仅仅严格包括同形异义词呢,还是它们需要包括其他使人混淆的字符呢?专家组还确定了一项解决方案,将每一对跨文字变体字符用三种颜色之一进行标识,The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region具体颜色依照相关文字成员给出的独立反馈意见,按照难以区分、类似和明确三类字符进行标识。生成专家组确定了多种文字对,包括:梵文-果鲁穆奇语 (देवनागरी - ਗੁਰਮੁਖੀ)、埃纳德语-泰卢固语 (ಅಕ್ಷರಮಾಲೆ - తెలుగు లిపి) 和泰米尔语-马拉雅拉姆语 (தமிழ் - മലയാളലിപി),来对跨文字变体进行分析。

回顾

The South Asian Eleven - Progress on Supporting IDNs in Scripts from the Region 本次访问的最后一站是科伦坡的一家著名餐厅板球俱乐部餐厅 (Cricket Club Café)。这家餐厅到处都装饰着令人留恋不已的板球运动纪念品,包括斯里兰卡在 1996 年赢得板球世界杯 (Cricket World Cup) 时所用的签名球棒。尽管我们已经十分疲累,就像打了一场长达五天的板球赛一样,但我们受到了社群成员积极讨论给我们的鼓舞,仍旧亢奋不已。他们愿意使用自己的语言和文字表达思想,我们被这种热情所鼓舞推动着。。当我们阅读菜单时,我们不禁发现本次活动中的三个生成专家组代表了 11 种文字。这些文字从风格迥异、各有千秋,深层次展现了南亚元音附标文字的书写文化。

Authors

Sarmad Hussain

Sarmad Hussain

Senior Director IDN and UA Programs
Champika Wijayatunga

Champika Wijayatunga

Regional Technical Engagement Sr. Manager