国际化域名 词汇表
A 标签
以 ASCII 兼容编码(ACE)表示的国际化域名,即表示其如何根据 DNS 协议在内部传输。A 标签总是以前缀"xn—"开头,以与 U 标签相区别。
ACE(ASCII 兼容编码)
ACE 是用于对 Unicode 进行编码以便仅使用有限的 ASCII 字符集(即:a-z、0-9 和"-")传输每个字符的系统。由于使用 DNS 协议的应用程序有可能不能可靠地处理其他值,因此需要使用 ACE系统。
ASCII(美国信息交换标准码)
ASCII 是计算机和处理文本的其他设备的通用数字代码。计算机只能读懂数字,因此 ASCII 码是字符(例如"a"或"@")的数字表示。当提及域名或字符串时, ASCII 是指在国际化之前,域名中只能使用字母 a-z、数字 0-9 和连字符"-"的情况。
字符
为了讨论IDN,最好将"字符"看作是书写系统的基本图形单元,书写系统是指文字加上一套决定其如何表示特定语言的规则。虽然域标签显示了其文字基础,但是,它并不传达任何与其关联语言有关的内在信息。这种语言依赖性并不能通过限制文字定义而排除,因为在一些情况(参见以上示例)下,使用相同文字的语言对单个元素的理解并不相同。因此,术语字符不能够脱离其上下文来单独定义。
在基于语音学的书写系统中,一个字符通常是一个字母或代表一个音节;在表意文字系统(或者说象形文字或语标系统)中,字符可能代表一个概念或词。
以下示例将说明字符的定义至少是两方面的,一方面是语言基本单位,而另一方面是相关的代码点。
U-label 酒:酒;中文意思是"酒精饮品";Unicode 代码点为 U+9152(也指:CJK UNIFIED IDEOGRAPH-9152);A-label 为 xn—jj4
U-label 北京:中文"北京",Unicode 代码点为 U+5300 U+4EAC;A-label 为 xn—1lq90i
U-label 東京:日语"东京",Unicode 代码点为 U+6771 U+4EAC;A-label 为 xn—1lqs71d
U-label ایكوم;ICOM 的波斯语缩写,Unicode 代码点为 U+0627 U+06CC U+0643 U+0648 U+0645;A-label 为 xn—mgb0dgl27d。
国家和地区代码名称支持组织(ccNSO)
ICANN 政策制定论坛(一个"选区")的组成部分,负责讨论和制定与 ccTLD 如何授权有关的政策。
国家或地区顶级域名(ccTLD)
一类只能分配给代表 ISO 3166-1 标准所列出的国家和地区的顶级域名。目前,这类域名是由两个字母组成的代码,例如".UK"、".DE"等,预计将来还会提供非拉丁文的同义代码。多数针对各个国家或地区顶级域名的政策都是授权当地发起组织制定,这与其他由 ICANN 制定政策的顶级域名不同。需要满足的要求是:ccTLD 在指定的国家或地区范围内使用,因此,当地法律和政府部门对域名的运营拥有发言权。
DNS(域名系统)
DNS 通过允许使用常见的字母字符串("域名")代替晦涩的 IP 地址,使得互联网的使用更加方便。比如,您可以输入 www.internic.net 来代替 207.151.159.3。
DNS 区域
域名系统命名空间的基本单元。在默认设置中,根区域中包含了所有域名,但是在实际应用单元中,根区域以分层结构形式被授权为多个较小区域。例如,".COM"区域即指被授权为以".COM"结尾的 DNS 组成部分。
域名系统安全扩展技术
一种可以添加进域名系统以验证数据真实性的技术。该技术通过将可验证的信任链添加进域名系统来发挥作用。
域名
带一系列属性说明的唯一标识符,便于计算机进行会话。例如,"icann.org"就是一个典型的域名。通常,属性说明就是 IP 地址,例如"208.77.188.103";因此,计算机可以将域名转换为 IP 地址。此外,DNS 还可用于其他目的。域名还可以是一种授权,从而将域名中所有子域名的责任转移到其他实体上。
域名标签
域名的组成部分。域名标签由"."连接。例如,"www.iana.org"包含有三个标签 — "www"、"iana"和"org"。对于国际化域名,标签可以分为 A 标签和 U 标签。
通用顶级域名
一类用于通用目的的顶级域名,ICANN 在这些域名中发挥重要的协调作用(与本地管理的"国家和地区代码顶级域名"相对)。基于政策原因,通用顶级域名通常细分为社区性顶级域名和非社区性顶级域名。
IDN(国际化域名)
国际化域名是包含代表本地语言、书写方式与26个基本拉丁字母"a-z"不同的字符的域名。国际化域名包括在许多欧洲语言中必须使用的带有变音符的拉丁字母,或由非拉丁文字组成的字符,例如阿拉伯文和中文。许多语言中还使用书写方式不同于欧洲"0-9"的书写方式来表示数字。基本的拉丁字母和欧洲-阿拉伯数字在表示域名时被称之为"ASCII字符"(ASCII=美国信息交换标准代码)。它们还囊括在范围更广的"Unicode字符"中,后者则是国际化域名的基础。
"主机名规则"则要求在此谈及的所有这类域名必须仅仅使用上述ASCII字符和"-"连字符来表述,并储存于域名系统之内因此国际化域名的Unicode形式必须在存入域名系统之前采用特殊的编码形式。
在区别不同形式时需要使用以下术语:
域名是由一系列"标签"组成(中间由"."隔开)。国际化域名标签的ASCII形式被称之为"A-标签"域名系统协议中的所有运行均仅仅使用A-标签。用户希望显示的Unicode形式被称之为"U-标签"。其区别可以通过印度语中的"测试"一词展示出来—परीका—此处即为梵文的U-标签。"ASCII兼容编码"的特殊形式(简称ACE)可用于生成该字符的A标签:xn--11b5bs1di。
仅包含ASCII字母、数字和连字符的域名被称为"LDH标签"。尽管A-标签和LDH-标签的定义有所重复,但完全使用LDH标签构成的域名,例如"icann.org"并不能被视为是国际化域名。
IDN 实践方法库
IANA 网站中的方法库,顶级域名注册管理机构在此提供了其使用的 IDN 表。如果其他注册管理机构想使用这些表,即可自行使用。
IDN 二级域名
通常,在域名的引用中,本地字符用在二级域名中,而顶级域名仅使用 ASCII 字符。 例如:[παράδειγμα .test](希腊语"example.test")。
IDN列表
国际化域名 (IDN) 表中列出了特定顶级域名 (TLD) 注册局支持的所有字符。如果这些字符中的一个或多个被视为变体,则会在该/那些字符旁边指出。还会指出特定字符是哪个字符的变体。变体表通常包含代表某一特定语言的字符,或某一具体文字的字符。因此,变体表通常也别称为"语言变体表"、"语言表格"、"文字表格"或其他类似的形式。
IDN顶级域名
通常,在国际化顶级域中要使用简短的引用,这样就允许用本地字符代表整个域名。例如:[실례.테스트](韩语"example.test")。
IDNA(国际化域名应用)
IDNA 是互联网工程工作组 (http://www.ietf.org) 在 RFC 3490 下定义的一个协议,使得非 ASCII 字符域名的应用处理成为可能。IDNA 将非 ASCII 字符的域名字符串转换为使用 DNS 的应用中可准确理解的 ASCII 域名标签。并非世界语言中所使用的所有字符都可用于域名中,因此,IDNA 不能将所有此类字符转换为 ASCII 标签。
互联网号码分配机构(IANA)
ICANN 的一个部门,承担 ICANN 与美国政府所签订合同中说明的职能。这些职能与确保全球单一协议参数分配有关,包括管理域名系统的根和 IP 地址空间。该部门中的 ICANN 工作人员通常被称作"IANA 工作人员"。
互联网协调政策(ICP)
ICANN 于 1999-2000 年间制定的一系列说明管理程序的文件。其中有三份文件在停止使用编码系统前就已发布。ICANN 后续发布的文件还未进行 ICP 编码。
互联网工程指导小组(IESG)
IETF 工作领域的专家委员会,扮演管理委员会的角色。
互联网工程任务组(IETF)
一个关键的互联网标准论坛。IETF 制定的标准作为意见征询( RFC) 发布。IANA 的协议参数注册管理机构紧密配合 IETF 的工作。
第4版互联网协议
第 4 版互联网协议,指支持 32 位 IP 地址的互联网协议版本。该协议允许存在约 40 亿个唯一的 IP 地址;预计未来 5-10 年,该协议中允许的数量将不能满足互联网需求。因此,已制定一份被称为 IPv6 的新协议,该协议大大增加了允许的 IP 地址数量。
第6版互联网协议
第 6 版互联网协议,指支持 128 位 IP 地址的互联网协议版本。该协议还未广泛部署,但该协议所允许的 IP 地址数量比常见的 IPv4 协议多几个数量级。
国际标准化组织
国际标准化组织。由多个国家标准化团体组成的国际性组织。
标签
标签是域名的单独部分。标签通常以点号分隔;例如域名"example.com"由两个标签"example"和"com"组成。
语言 | 文字 | 字母
语言由特定的语言群体使用。文字用来以各种语言记录信息,这是通过使用相应的字母或其它书写系统来完成的。
LDH(字母、数字、连字符)
RFC 952 中定义的主机名规范(后经 RFC 1123 修改)在国际化前用在顶级域名注册中。这意味着域名实际上只能包含字母 a-z、数字 0-9 和连字符"-"。术语"LDH 代码点"指的就是这个子集。随着 IDN 的引入,此规则不再与所有域名相关,不过在使用 IDNA 的情况下,DNS 中显示的仍然是 LDH。
本地互联网社群
国家中受益于国家顶级域名的互联网用户社群。将国家和地区代码顶级域名授权给发起组织,以采用能实现该社群最佳利益的方式(特别是实施该社群已制定的政策)运营域名。
MIME 类型
一个用于识别文件类型的形式文本字符串,包含在电子邮件或网络传输的标题中。IANA 维护 MIME 类型的注册管理机构。
政策制定流程(PDP)
ICANN 及其众多选区采用的正式政策制定流程。
协议
任何形式的计算机间通信,此类通信已被标准化从而确保计算机之间可以相互通信。互联网协议通常在 RFC 中进行标准化。
国际化域名编码(Punycode)
Punycode 是互联网标准 [RFC3492] 中所描述的 LDH-兼容编码算法,现今已为人们所采用。这种方法用于将 IDN 编码为 LDH ASCII 字符序列,以便在使用域名系统 (DNS) 的应用中理解和管理域名。其目的是为了让域名注册人和用户永远看不到这种编码形式的域名。这种算法的唯一目的是让 DNS 能够解析包含本地字符的 URL。例如查看"IDN"下的 A-label。
Punycode A-label 中的前缀始终是"xn--"。因此,为了避免在它们各自的顶级域下引入 IDN 注册时产生混淆,建议顶级域注册中保留该前缀。
注册人
获得使用互联网资源权利的实体。通常,借助注册服务商提供的某种形式的可撤销授权,在注册管理机构列出其注册来获得使用权。
注册商
一个可以根据注册人提出的变更注册局的申请而采取行动的实体。通常,注册商就是运营注册局的实体,尽管对于域名来说,通常情况下会对这两种角色加以区分,以允许在提供不同支持等级的多个注册商之间形成竞争。请同时参阅"域名注册商"。
注册局
关于特定数据集注册的权威记录。通常是指域名注册局,但是 IANA 维护的所有协议参数也属于注册局。
注册局运营商
运营注册局的实体。
意见征询(RFC)
一系列描述互联网标准、讨论文件、信息备忘录和最佳实践的互联网工程文件。在 RFC 中发布的互联网标准来源于 IETF。RFC 系列由 RFC 编辑发布。
根
根区域的权威域名服务器。根服务器被视为非常规域名服务器,部分原因是根服务器通常是最关键且使用最频繁的域名服务器。根服务器之所以特别,还由于根服务器的更改需要在全球每台域名服务器上以提示文件存储更改部分,因此,根服务器不易更换。
根服务器
根区域的权威域名服务器。根服务器被视为非常规域名服务器,部分原因是根服务器通常是最关键且使用最频繁的域名服务器。根服务器之所以特别,还由于根服务器的更改需要在全球每台域名服务器上以提示文件存储更改部分,因此,根服务器不易更换。
根域
域名系统分层结构的顶层。根区域包含所有顶级域名授权和根服务器列表,由 IANA 管理。
文字
文字是用于书写某种语言所用的符号集合。目前主要存在三种文字。第一种是以字母形式表示的(例如:阿拉伯文、西里尔文和拉丁文)文字,其单个符号被称之为"字母"。第二种是象形文字(例如:中文),其单个符号则被称为"表意文字"。第三种是音节文字(例如:朝鲜文),其单个符号则代表各个音节。大多数语言的书写系统仅仅使用一种文字形式,但也有例外,例如日文则使用四种不同的文字,分别体现了上述三种类型。
为了将这些文字用于计算机环境中,则需要对每种文字的每个符号进行数字编码。通过数字形式表示的符号集合被称之为"字符集"。 一个字符可能包含一种以上的文字(例如:"通用字符集",又称Unicode),或仅仅限用一种文字(例如:美国-ASCII,更为准确的说,这种字符集甚至都并未涵盖所有的拉丁文字)。必须明确地区分文字和字符集。
唯一与国际化域名应用相关的字符就是Unicode。这种字符集为每种文字的每个符号均分配了一个数字"码点"和一个"字符名称"。ICANN针对国际化域名使用的基于文字的政策中,将按照Unicode字符名称中显示的文字名称来运行,或按照Unicode编码表中类似文字名称来运行。文字名称请参阅:http://www.unicode.org/charts/。
在快速通道中,申请人必须提供其申请中使用的文字和字符串信息。从实际的角度来看,申请人可从下来菜单中进行选区,从而加快快速通道网络申请系统的进度,后者是基于ISO15924清单来运行的。从评估的角度来看,文字和语言的审核则在《快速通道最终实施计划》中的第3.2节进行了明确说明,提供了申请人可以选用的多种方式。如需详情请参阅:http://icann.org/en/resources/idn/fast-track
值得注意的是,在Unicode编码表中尚未纳入的文字字符不得用于国际化域名中。
子域名
存在于其他域名中的域名。例如,"www.icann.org"是"icann.org"的子域名,而"icann.org"又是"org"的子域名。子域名通过授权流程委托给其他实体。
统一域名编码协会(Unicode Consortium)
该协会是一个非赢利性组织,其目标是发展、扩大及推广 Unicode 标准的应用。如需要了解更多信息,请访问 http://www.unicode.org。
顶级域名(TLD)
域名系统分类中的最高层级。包括".COM"和".UK"在内的顶级域名从 DNS 根区域中授权。顶级域名通常分为两个不同的类别:通用顶级域名和国家或地区顶级域名。
U-标签
以单一码形式表示的国际化域名,即表示其在最终用户面前如何显示。与 A 标签相区别。
统一域名编码(Unicode)
Unicode 是一种广泛使用的单一编码方案,可为各种语言和文字的每一个字符提供唯一的编号。Unicode 标准包含多个表格,这些表格为每个本地字符列出了"代码点"(唯一编号)。随着越来越多的字符被数字化,这些表格也会不断扩大。
在 Unicode 中,为字符指定了代码,这些代码可唯一地定义全球众多文字中的每个字符。这些"代码点"是某个字符或某种字符特征(如重音符号或连字符)的唯一代码。Unicode 支持的代码点超过一百万个,这些代码点的组成结构是字母"U"后面跟随"+"号和一个十六进制的唯一编号;例如,单词"Hello"可以写为 U+0048 U+0065 U+006C U+006C U+006F。
统一资源定位符
"统一资源定位符"的缩写,该字符串描述了互联网上文档和其它资源的地址。URL 根据 RFC 2396 中的 IETF 而定义,每个 URL 由两部分组成,以冒号 (":") 分隔。地址的第一部分指出所使用的协议,如 http、ftp 等;第二部分指明资源的 IP 地址或域名。
UTF-8
UTF-8 位 Unicode 转换格式是用于对 Unicode 进行编码以便可以使用 8 位数值来传输每个字符的系统。随着 8 位数据传输在互联网上的流行,这种格式也被广泛应用。
变体
在国际化域名背景下的一个可注册的替代性域名,或者表示相同含义 的域名,这是由于根据语言使用方式的不同,域名中的某些字符可以通过多种不同的方式进行注册。根据注册管理机构的政策,变体可以同时在一个被称为"变体捆 绑"的地址段中注册。例如,在英语中"internationalise"和"internationalize"可被视为变体。
变体捆绑
由于域名中某些字符被视为其他字符的变体而被分到同一组别的多个域名的组合。
变体表
针对一种特定语言或文本描述变体的 IDN 表。例如,一份变体表可以将简体中文字符映射成繁体中文字符,以构建一个变体捆绑。