Skip to main content

دعم التنوع اللغوي لإفريقيا من أجل أسماء نطاقات المستوى الأعلى للإنترنت

ثلاثين لغة مختلفة – كانت هذه نتيجة استطلاع سريع يسأل عشرين مشاركًا يحضرون ورشة عمل IDN من أجل سرد وإدراج اللغات التي يتحدثونها. وقد قامت ICANN بتنظيم ورشة العمل في قمة الإنترنت في أفريقيا في نيروبي في 28 مايو 2017. وهذه الإجابة تجسد التنوع اللغوي الهائل في أفريقيا، حيث إن استخدام اللغات المتعددة – أو التنوع اللغوي – هو التقليد السائد. فهناك على الأقل 2,144 لغة سائدة عبر القارة، بالإضافة إلى وجود دول فردية مثل نيجيريا تضم عددًا يصل إلى 520 لغة. وعن طريق المقارنة، نجد أن 287 لغة يتم التحدث بها في أوروبا.

ومن الناحية التاريخية، فإن إفريقيا من بين الأماكن التي تم فيها إقرار المراسلات المكتوبة للمرة الأولى، حيث كانت الحروف الهيروغليفية المصرية [PDF, 947 KB] هي أقد نظم الكتابة التي تم اكتشافها. إلا أن غالبية اللغات الأفريقية المستخدمة اليوم منطوقة فقد – بدون صيغة مكتوبة لها. وبرغم ذلك، تشير التقديرات إلى أن أكثر من 500 لغة لها شكل مكتوب. ومما لا يدعو للدهشة، أن تنوع نظم الكتابة الذي ابتكره الأفارقة يعكس التنوع المقابل للغات المنطوقة: بعدد يصل إلى 29 نصًا شهدت ابتكارها في أفريقيا – وتتسع لتضم غالبية أنواع النصوص المعروفة، بما في ذلك الأبجدية والأبوجيدا والألفبائية والمقطعية مع المقطعية الرمزية. ومن بين هذه النصوص، قد لات تزال 21 منها مستخدمة ويجري ابتكار نصوص جديدة باستمرار، والبعض منها يواجه التصنيفات اللغوية الحالية، مثل نص قوس قزح من أوراكل المتنوع والذي ابتُكر مؤخرًا في عام 1999. وتشمل النصوص الأكثر تنوعًا على نطاق واسع التيفيناغية، على سبيل المثال، نص قديم مستخدم من ثل القرن الثالث قبل الميلاد (BCE)، وهو ما تم إعادة إحياؤه في القرن العشرين وهو الآن مستخدم بصيغة قياسية من أجل تعليم لغات البربر مثل الأمازيغية لطلاب المدارس الابتدائية في المغرب. على سبيل المثال، راجع تمهيد إلى الأمازيغية الذي وضعه المعهد الملكي للثقافة الأمازيغية.

وتشمل الأمثلة الإضافية، النص الإثيوبي [PDF, 189 KB] المستخدم للعديد من اللغات في إثيوبيا وإريتريا، أو كتابة الفاي [PDF, 209 KB] المقطعية المستخدمة للغة الفاي المستخدمة في ليبريا، أو نوكو [PDF, 112 KB]، وهي أبجدية مستخدمة لمجموعة من اللغات التي يطلق عليها اسم ماندينغ في غرب أفريقيا. وقد أصبحت العديد من النصوص الآن من الماضي كما خرجت من حيز الاستخدام، في حين أن نصوصًا أخرى مثل النوكو لها مجتمعات متاحة من المستخدمين ويمكن تمثليها رقميًا اليوم. وعلى الرغم من ذلك، تفتقر العديد من النصوص لموارد مثل الخطوط أو طرق الإدخال، كما أنها لا تلقى الدعم أو الاعتراف بها رسميًا.

والنصوص الأكثر الأوسع استخدامًا في أفريقيا هي النصوص الأجنبية التي طرحت على النطاق التاريخي، وعلى وجه الخصوص النص العربي (والذي يشار إليه بلفظ عجمي في بعض مجتمعات اللغات) والنص اللاتيني. وقد تم تمديد النصوص بحيث تمثل الأصوات الإضافية في اللغات المحلية في أفريقيا. وتشمل الأمثلة أصوات الطقطقة التي تستخدمها لغات منطقة جنوب وغرب أفريقيا مثل أصوات الطقطقة الجانبية (استمع إلى نطق)، تكتب برموز لا تعد حروفًا في لغات أخرى (مثل الوحدة المزدوجة ǁ )، أو من خلال تتابعات معقدة للغاية من الحروف (مثل gǁx' ([ᶢǁʢ] في الأبجدية الصوتية الدولية) في لهجة زولهوان، وهي لغة ناميبيا وبتسوانا. وقد تم نفس الشيء مع النص العربي، وذلك بابتكار حروف جديدة من أجل تمثيل الأصوات المحلية مثل الوقفة من أمام الأنف /mb / أو / ᵐbʷ / (استمع إلى نطق) في الشيمينية [PDF, 438 KB]، وهي إحدى لغات الصومال (حيث إن هناك دعم محدود للخطوط من هذا الحرف، انظر U+08B6 [PDF, 126 KB] المشفر بمعيار يونيكود من أجل استعراض طريقة الإملاء الخاصة بها).

وعلاوة على ذلك، فإن استخدام العديد من النصوص من خلال نفس مجتمع اللغة – ما يطلق عليه اسم استخدام النصوص المتعددة – أمر شائع للغاية في أفريقيا. على سبيل المثال، تم ابتكار إصدارين من الأبجدية الوطنية لتشاد (ANT ) أحدها يستند إلى النص اللاتيني والآن يستند إلى النص العربي. أما المجتمعات التي تستخدم لغة سار فقد تكتب بأي النصين، على سبيل المثال الكلمة التي ترادف أسد تكتب بشكل “ɓəl” بنظام ANT اللاتيني وأيضًا بشكل ٻّلْ بنظام ANT العربي كما هو موضح هنا.

 

مستخلص من الأبجدية الوطنية لتشاد. يوفر العمود الأخضر ترجمة بالفرنسية للكلمات المقدمة من اللغة التشادية المدرجة في العمود الأزرق، كلاهما بالصيغ المستندة إلى النص اللاتيني (العمود الأحمر)، بالإضافة إلى الصيغ المستندة إلى النص العربي (العمود الأصفر). (الجدول المحدد في المقترح المقدم من بريست وهوسكن [PDF, 4.53 MB] من قرار تعديل الأبجدية الوطنية التشادية، لسنة 2010.)

وتجري ICANN في الوقت الحالي برنامجًا من أجل دعم أسماء النطاقات المدوّلة (IDN ) كنطاقات من المستوى الأعلى (TLD ). وهي تقوم بوضع قواعد استخراج المسميات لمنطقة الجذر (RZ-LGR ) من أجل دعم النصوص المختلفة. ويقود هذا العمل هيئات مستندة إلى المجتمع (يطلق عليها اسم هيئات الاستخراج أو GP ) والتي تقوم بتوثيق استخدام النصوص استنادًا إلى الإجراء [PDF, 1.39 MB] الذي يقوم المجتمع بتنفيذه. وقد انتهت هيئة الاستخراج الخاصة بالنص العربي من عملها وهي تدعم اللغات الأفريقية الأساسية المكتوبة بالنص العربي. وفي الآونة الأخيرة، انتهت هيئة الاستخراج للنص الأثيوبي أيضًا من مقترحها للتكامل مع قواعد استخراج المسميات لمنطقة الجذر.

كما بدأت هيئة استخراج النص اللاتيني من عملها وهي تتقصى عن استخدام النص في أفريقيا، بالإضافة إلى القارات الأخرى. وهي تطالب بتحديد الطريقة التي تم بها تمديد النص اللاتيني من أجل خدمة اللغات الأفريقية حيث توجد وثائق محدودة. ومن ثم، فقد كانت ICANN تتواصل مع المجتمعات في أفريقيا من أجل حملهم على المشاركة في هذا الجهد. وقد دأبت ICANN على عقد ورش عمل IDN سنوية في أفريقيا لهذا الغرض – الكونغو في 2015 وأديس أبابا في 2016 ونيروبي في 2017.

وفي حين حصلت ICANN على بعض خطابات إبداء الاهتمام، لا تزال هناك حاجة لمزيد من المتطوعين من أفريقيا لهيئة الاستخراج اللاتينية من أجل تطوير هذا العمل الهام. برجاء إرسال بريد إلكتروني على العنوان IDNProgram@icann.org إذا كنت مهتمًا بالمشاركة أو كانت لديك أية استفسارات.

يشمل مشروع قواعد استخراج المسميات لمنطقة الجذر في الوقت الحالي النصوص العربية والأثيوبية واللاتينية في سياق أفريقيا. وسوف تدعم ICANN النصوص الأخرى في أفريقيا لنطاقات TLD ذات أسماء IDN ، إذا كانت المجتمعات المعنية تستخدمها حاليًا بنشاط، وإذا كان بإمكان المجتمعات جمع الاهتمام الكافي من أجل تشكيل هيئات استخراج ووضع المقترحات من أجل قواعد استخراج المسميات لمنطقة الجذر.

برجاء زيارة www.icann.org/idn من أجل الحصول على المزيد من التفاصيل حول برنامج IDN في ICANN.

Comments

    Domain Name System
    Internationalized Domain Name ,IDN,"IDNs are domain names that include characters used in the local representation of languages that are not written with the twenty-six letters of the basic Latin alphabet ""a-z"". An IDN can contain Latin letters with diacritical marks, as required by many European languages, or may consist of characters from non-Latin scripts such as Arabic or Chinese. Many languages also use other types of digits than the European ""0-9"". The basic Latin alphabet together with the European-Arabic digits are, for the purpose of domain names, termed ""ASCII characters"" (ASCII = American Standard Code for Information Interchange). These are also included in the broader range of ""Unicode characters"" that provides the basis for IDNs. The ""hostname rule"" requires that all domain names of the type under consideration here are stored in the DNS using only the ASCII characters listed above, with the one further addition of the hyphen ""-"". The Unicode form of an IDN therefore requires special encoding before it is entered into the DNS. The following terminology is used when distinguishing between these forms: A domain name consists of a series of ""labels"" (separated by ""dots""). The ASCII form of an IDN label is termed an ""A-label"". All operations defined in the DNS protocol use A-labels exclusively. The Unicode form, which a user expects to be displayed, is termed a ""U-label"". The difference may be illustrated with the Hindi word for ""test"" — परीका — appearing here as a U-label would (in the Devanagari script). A special form of ""ASCII compatible encoding"" (abbreviated ACE) is applied to this to produce the corresponding A-label: xn--11b5bs1di. A domain name that only includes ASCII letters, digits, and hyphens is termed an ""LDH label"". Although the definitions of A-labels and LDH-labels overlap, a name consisting exclusively of LDH labels, such as""icann.org"" is not an IDN."