fr

Comment la communauté de l’ICANN a contribué à ouvrir la voie à un Internet plus multilingue

22 mars 2022
Par Sarmad HussainSarmad Hussain

La mission de l'ICANN est de garantir un Internet mondial sûr, stable et unifié. Mais que faut-il exactement pour promouvoir un Internet mondial ? Une grande partie de la population du monde ne parle pas l'anglais comme première langue et ne se sert pas des lettres « a à z » pour écrire dans sa propre langue. En fait, à peine un peu plus d'un tiers de la population mondiale utilise l'alphabet latin et un plus petit nombre encore utilise uniquement les lettres « a à z ».

Dans un effort pour rendre l'Internet et le système des noms de domaine (DNS) plus accessibles à un public diversifié et global, la communauté travaille depuis de nombreuses années à l'introduction des noms de domaine internationalisés (IDN). Les IDN permettent aux personnes du monde entier d'utiliser des noms de domaine dans des langues et des écritures locales, comme l'arabe, le chinois, le cyrillique, le devanagari, le thaï et bien d'autres encore.

La mise en route d'un IDN complet, avec ses étiquettes de domaine de premier niveau (TLD), repose sur un processus long et complexe que l'ICANN contribue à faciliter. Une partie de ce processus consiste à développer, pour les différents scripts utilisés par les communautés à l'échelle mondiale, un mécanisme uniforme et transparent permettant de déterminer les étiquettes TLD IDN valides et celles de leurs variantes. Au cours des huit dernières années, différentes communautés linguistiques ont formé des panels de génération (GP). Les panels sont composés d'experts du DNS et de spécialistes des langues et des scripts concernés qui travaillent ensemble pour élaborer les règles nécessaires à la formation des TLD dans leurs scripts respectifs de manière stable et sûre. Ces règles sont mises au point par le biais de la procédure d'élaboration de règles de génération d'étiquettes pour la zone racine (RZ-LGR), qui est actuellement considérée par la communauté comme le mécanisme pour valider les nouveaux domaines de premier niveau génériques (gTLD) de la prochaine série et les domaines de premier niveau géographiques (ccTLD) ainsi que pour définir les étiquettes de leurs variantes.

Plus tard cette semaine, la cinquième version des règles de génération d'étiquettes pour la zone racine (RZ-LGR-5), qui intègre un total de 26 scripts, sera publiée pour consultation publique. Ces scripts sont utilisés pour écrire des centaines de langues à travers le monde. Il s'agit d'une avancée remarquable, qui témoigne de l'efficacité du modèle multipartite. L'organisation ICANN est fière d'avoir soutenu les communautés linguistiques dans ces efforts, car les RZ-LGR sont un outil important pour permettre un accès plus large à un Internet mondial et multilingue.

À la veille de la publication de la cinquième version des RZ-LGR, qui regroupera la totalité du travail effectué par les GP actifs, je veux prendre le temps de saluer et de célébrer le dévouement et les réalisations de ces panels. Depuis la formation du premier GP en 2014, la communauté :

  • a créé 17 panels de génération pour un total de 26 scripts ;
  • a accueilli plus de 270 volontaires des communautés associées à chaque script ;
  • a cumulé plus de 10 000 heures de travail bénévole ;
  • a achevé 26 propositions de LGR  correspondant aux scripts suivants (à aujourd'hui) : arabe, arménien, bengali, chinois (Han), cyrillique, devanagari, éthiopien, géorgien, grec, gujarati, gurmukhi, hébreu, japonais (hiragana, katakana et kanji [Han]), kannada, khmer, coréen (hangeul et hanja [Han]), lao, latin, malayalam, birman, oriya, cingalais, tamoul, télougou et thaï.

Curiosités des panels de génération :

  • Chaque GP est généralement composé de 7 à 15 membres bénévoles, mais le nombre de membres peut être beaucoup plus important en fonction de l'organisation du GP.
  • Le plus grand GP est le panel de génération en écriture néo-brahmique, qui couvre 9 scripts et compte 66 membres originaires du Bangladesh, de l'Inde, du Népal, du Sri Lanka et de Singapour.
  • Le premier GP, le panel de génération en écriture arabe, a été établi en 2014.
  • Le nombre total de langues sur lesquelles porte le travail des GP : plus de 386.
  • Le nombre total de pays représentés par les membres des GP : 44
  • Le nombre total de consultations publiques effectuées jusqu'à présent pour élaborer les RZ-LGR : plus de 30.

L'organisation ICANN continuera à soutenir la création d'autres GP par d'autres communautés, suivant la procédure RZ-LGR.

Alors, que font exactement les GP et pourquoi leur travail est-il important ? Pour en savoir plus, poursuivez votre lecture ci-dessous.

Que font les panels de génération ?

Pourquoi est-il si compliqué que des scripts différents soient intégrés dans les IDN ? En raison de la nature différente des scripts et des systèmes d'écriture utilisés dans le monde, certains scripts nécessitent des règles contextuelles pour former une étiquette sans problèmes de rendu. Il existe également une possibilité de confusion pour l'utilisateur final lorsqu'il s'agit de caractères qui peuvent être perçus comme identiques par l'utilisateur du script mais qui sont en fait différents, ce que l'on appelle des variantes (par exemple, « a » lettre minuscule latine A (U+0061) et « а » lettre minuscule cyrillique A (U+0430)). Dans certains scripts, des étiquettes de variantes sont nécessaires pour promouvoir l'utilisation des IDN (comme pour le chinois simplifié et le chinois traditionnel), qui doivent être attribuables.

Les GP sont chargés d'élaborer des ensembles de règles régissant le répertoire, les points de code des variantes et la formation des étiquettes. Les GP sont composés de volontaires, en particulier de représentants de la communauté du script concerné qui possèdent une connaissance approfondie de la culture, des coutumes et des pratiques locales, ainsi que d'experts linguistiques. Ils comptent également des personnes familiarisées avec le fonctionnement des registres et des bureaux d'enregistrement, ainsi que des spécialistes des politiques et du DNS. Les principaux objectifs des GP sont :

  • Répertorier les caractères qui peuvent être utilisés dans un nom de domaine pour un script spécifique.
  • Identifier les points de code qui doivent être considérés comme « identiques » ou comme des variantes afin de réduire la confusion chez l'utilisateur final et de favoriser la convivialité.
  • Définir des règles spécifiques aux scripts pour éviter des problèmes de sécurité.

Voici un exemple de problème de sécurité rencontré par un GP

Cas Points de code Glyphe*
1 U+0067 U+0303 U+0303 g̃
2 U+0067 U+0303 g̃

*Comme affiché dans la barre d'adresses du navigateur Chrome version 97.0.4692.71 (Official Build) (x86_64) pour MAC.

Dans cet exemple, le cas 1 et le cas 2 ont différentes séquences de points de code, mais le rendu visuel est identique. Le cas 1 a un double tilde combiné (U+0303 U+0303) tandis que le cas 2 en a un seul (U+0303). La proposition de RZ-LGR en script latin qui prend en compte ce problème n'inclut pas U+0303 comme un point de code unique, si bien que le cas 1 ne peut pas être formé en raison d'un éventuel problème de sécurité.

Combien dure ce travail ?

Il faut parfois quelques années à un GP pour mettre au point une proposition de script. Une fois qu'une proposition de script est complète, elle est publiée pour consultation publique et par la suite examinée par un panel d'intégration composé d'experts en linguistique, en Unicode, en DNS et en IDN. Après examen, le groupe d'intégration introduit progressivement la proposition de script dans les RZ-LGR. La version mise à jour des RZ-LGR est à nouveau soumise à consultation publique afin de vérifier le processus d'intégration avant sa publication finale.

Pourquoi ce travail est-il important ?

Le DNS, et en particulier la zone racine, sont des ressources mondiales partagées. Pour construire un Internet multilingue plus inclusif et plus sûr - un Internet accessible aux gens du monde entier - la prise en charge des scripts, et en fin de compte des IDN, doit se faire de manière prudente et conservatrice. Sans le savoir-faire et le travail acharné de tous les membres des panels de génération et d'intégration au cours des huit dernières années, l'Internet multilingue ne serait pas possible. Les GP ont jeté les bases d'une prise en charge correcte des scripts qui permet leur utilisation dans des noms de domaine tout en préservant leur sécurité.

Au nom de l'organisation ICANN, je tiens à remercier une fois de plus les membres de la communauté et les participants engagés dans les GP du monde entier qui ont contribué à ces efforts.

Authors

Sarmad Hussain

Sarmad Hussain

Sr Director IDN & UA Programs
Read biographyRead biography