جميع أحرف ascii. ترميز المعلومات النصية

💖 هل يعجبك؟شارك الرابط مع أصدقائك

كما تعلم، يقوم الكمبيوتر بتخزين المعلومات في شكل ثنائي، ويمثلها كسلسلة من الآحاد والأصفار. ولترجمة المعلومات إلى نموذج مناسب للإدراك البشري، يتم استبدال كل تسلسل فريد من الأرقام بالرمز المقابل له عند عرضه.

أحد أنظمة ربط الرموز الثنائية بالأحرف المطبوعة وأحرف التحكم هو

في المستوى الحالي لتطور تكنولوجيا الكمبيوتر، لا يُطلب من المستخدم معرفة رمز كل حرف محدد. ومع ذلك، فإن الفهم العام لكيفية تنفيذ الترميز مفيد للغاية، بل إنه ضروري لبعض فئات المتخصصين.

إنشاء ASCII

تم تطوير الترميز في الأصل عام 1963 ثم تم تحديثه مرتين على مدار 25 عامًا.

في الإصدار الأصلي، تضمن جدول أحرف ASCII 128 حرفًا؛ ظهرت لاحقًا نسخة موسعة، حيث تم حفظ أول 128 حرفًا، وتم تعيين الأحرف المفقودة سابقًا للرموز مع تضمين البت الثامن.

لسنوات عديدة، كان هذا الترميز هو الأكثر شعبية في العالم. في عام 2006، احتلت Latin 1252 مكانة رائدة، ومن نهاية عام 2007 حتى الوقت الحاضر، احتلت Unicode مكانة رائدة بقوة.

تمثيل الكمبيوتر لـ ASCII

كل حرف ASCII له رمز خاص به، يتكون من 8 أحرف تمثل صفرًا أو واحدًا. أقل عدد في هذا التمثيل هو الصفر (ثمانية أصفار في النظام الثنائي) وهو رمز العنصر الأول في الجدول.

تم حجز رمزين في الجدول للتبديل بين معيار US-ASCII ومتغيره الوطني.

بعد أن بدأ ASCII في تضمين 256 حرفًا وليس 128 حرفًا، انتشر متغير التشفير على نطاق واسع، حيث تم تخزين النسخة الأصلية من الجدول في أول 128 رمزًا مع البت الثامن صفر. تم تخزين الحروف الوطنية المكتوبة في النصف العلوي من الجدول (المواضع 128-255).

لا يحتاج المستخدم إلى معرفة رموز أحرف ASCII مباشرة. عادةً ما يحتاج مطور البرامج فقط إلى معرفة رقم العنصر في الجدول لحساب الكود الخاص به باستخدام النظام الثنائي إذا لزم الأمر.

اللغة الروسية

بعد تطوير ترميزات اللغات الاسكندنافية والصينية والكورية واليونانية وغيرها في أوائل السبعينيات، بدأ الاتحاد السوفيتي في إنشاء نسخته الخاصة. وسرعان ما تم تطوير نسخة من ترميز 8 بت يسمى KOI8، مع الحفاظ على أول 128 رمزًا لأحرف ASCII وتخصيص نفس عدد المواضع لأحرف الأبجدية الوطنية والأحرف الإضافية.

قبل إدخال Unicode، سيطرت KOI8 على الجزء الروسي من الإنترنت. كانت هناك خيارات ترميز لكل من الأبجدية الروسية والأوكرانية.

مشاكل أسكي

نظرًا لأن عدد العناصر حتى في الجدول الموسع لم يتجاوز 256 عنصرًا، لم تكن هناك إمكانية لاستيعاب عدة نصوص مختلفة في تشفير واحد. في التسعينيات، ظهرت مشكلة "crocozyabr" على شبكة Runet، عندما تم عرض النصوص المكتوبة بأحرف ASCII الروسية بشكل غير صحيح.

كانت المشكلة أن رموز ASCII المختلفة لا تتطابق مع بعضها البعض. دعونا نتذكر أنه يمكن وضع أحرف مختلفة في المواضع 128-255، وعند تغيير أحد الترميز السيريلي إلى آخر، تم استبدال جميع أحرف النص بأحرف أخرى لها رقم مماثل في إصدار مختلف من الترميز.

الوضع الحالي

مع ظهور Unicode، بدأت شعبية ASCII في الانخفاض بشكل حاد.

والسبب في ذلك يكمن في حقيقة أن الترميز الجديد جعل من الممكن استيعاب أحرف من جميع اللغات المكتوبة تقريبًا. في هذه الحالة، تتوافق أول 128 حرفًا من ASCII مع نفس الأحرف في Unicode.

في عام 2000، كان ASCII هو الترميز الأكثر شيوعًا على الإنترنت وتم استخدامه في 60% من صفحات الويب المفهرسة بواسطة Google. وبحلول عام 2012، انخفضت حصة هذه الصفحات إلى 17%، وحل Unicode (UTF-8) محل التشفير الأكثر شيوعًا.

وبالتالي، يعد ASCII جزءًا مهمًا من تاريخ تكنولوجيا المعلومات، لكن استخدامه في المستقبل يبدو غير واعد.

تراكب الأحرف

يسمح حرف BS (مسافة للخلف) للطابعة بطباعة حرف فوق الآخر. نص ASCII على إضافة علامات التشكيل إلى الحروف بهذه الطريقة، على سبيل المثال:

  • بكالوريوس "→ أ
  • أ بكالوريوس ` → à
  • بكالوريوس ^ → â
  • o بكالوريوس / → ø
  • ج بكالوريوس , → ج
  • ن بكالوريوس ~ → ق

ملحوظة: في الخطوط القديمة، تم رسم الفاصلة العليا " بشكل مائل إلى اليسار، وتم إزاحة التلدة ~ لأعلى، لذا فهي تناسب فقط دور حرف التلدة الحاد وعلامة التلدة في الأعلى.

إذا تم تركيب نفس الحرف على حرف، تكون النتيجة تأثير خط غامق، وإذا تم تركيب تسطير على حرف، تكون النتيجة نصًا مسطرًا.

  • بكالوريوس أ → أ
  • أبس_→ أ

ملحوظة: يستخدم هذا، على سبيل المثال، في نظام مساعدة الرجل.

متغيرات ASCII الوطنية

ينص معيار ISO 646 (ECMA-6) على إمكانية وضع الرموز الوطنية في مكانها @ [ \ ] ^ ` { | } ~ . بالإضافة إلى هذا، في الموقع # يمكن نشرها £ ، وفي مكانه $ - ¤ . هذا النظام مناسب تمامًا للغات الأوروبية حيث لا يلزم سوى عدد قليل من الأحرف الإضافية. يُطلق على إصدار ASCII بدون أحرف وطنية اسم US-ASCII، أو "الإصدار المرجعي الدولي".

بعد ذلك، اتضح أنه أكثر ملاءمة لاستخدام ترميزات 8 بت (صفحات الرموز)، حيث النصف السفلي من جدول التعليمات البرمجية (0-127) مشغول بأحرف US-ASCII، والنصف العلوي (128-255) بواسطة شخصيات إضافية منها مجموعة من الشخصيات الوطنية. وهكذا، فإن النصف العلوي من جدول ASCII، قبل اعتماد Unicode على نطاق واسع، تم استخدامه بشكل نشط لتمثيل الأحرف المترجمة، وهي أحرف اللغة المحلية. تسبب عدم وجود معيار موحد لوضع الأحرف السيريلية في جدول ASCII في حدوث العديد من المشكلات في الترميزات (KOI-8 وWindows-1251 وغيرها). كما عانت اللغات الأخرى التي تحتوي على نصوص غير لاتينية من وجود العديد من الترميزات المختلفة.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 د إي
0. NUL سوم إيوا بعثة التقييم اي كيو تي W.R.U. رو جرس BKSP إتش تي LF VT FF سي آر لذا إس.آي.
1. العاصمة 0 العاصمة 1 العاصمة 2 العاصمة 3 العاصمة 4 خطأ مزامنة L. E. M. س 0 س 1 س 2 س 3 س 4 س 5 س 6 س 7
2.
3.
4. فارغ ! " # $ % & " ( ) * + , - . /
5. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
6.
7.
8.
9.
أ. @ أ ب ج د ه ف ز ح أنا ج ك ل م ن يا
ب. ص س ر س ت ش V دبليو X ي ز [ \ ]
ج.
د.
ه. أ ب ج د ه و ز ح أنا ي ك ل م ن س
ف. ص س ص ق ر ش ضد ث س ذ ض خروج ديل

في أجهزة الكمبيوتر التي كان الحد الأدنى لوحدة الذاكرة القابلة للتوجيه فيها هو كلمة 36 بت، تم استخدام أحرف 6 بت في البداية (كلمة واحدة = 6 أحرف). بعد الانتقال إلى ASCII، بدأت أجهزة الكمبيوتر هذه تحتوي على 5 أحرف ذات سبعة بتات (بقيت بتة واحدة إضافية) أو 4 أحرف ذات تسعة بتات في كلمة واحدة.

تُستخدم رموز ASCII أيضًا لتحديد المفتاح الذي يتم الضغط عليه أثناء البرمجة. بالنسبة للوحة مفاتيح QWERTY القياسية، يبدو جدول التعليمات البرمجية كما يلي:

[ترميزات 8 بت: ASCII وKOI-8R وCP1251] لم تستخدم جداول الترميز الأولى التي تم إنشاؤها في الولايات المتحدة البت الثامن في البايت. تم تمثيل النص كسلسلة من البايتات، ولكن لم يتم أخذ البت الثامن في الاعتبار (تم استخدامه للأغراض الرسمية).

أصبح الجدول معيارًا مقبولًا بشكل عام أسكي(الكود القياسي الأمريكي لتبادل المعلومات). تم استخدام أول 32 حرفًا من جدول ASCII (من 00 إلى 1F) للأحرف غير المطبوعة. لقد تم تصميمها للتحكم في جهاز الطباعة، وما إلى ذلك. الباقي - من 20 إلى 7F - عبارة عن أحرف عادية (قابلة للطباعة).

الجدول 1 - ترميز ASCII

ديسمبرعرافةأكتوبرشاروصف
0 0 000 باطل
1 1 001 بداية العنوان
2 2 002 بداية النص
3 3 003 نهاية النص
4 4 004 نهاية الإرسال
5 5 005 سؤال
6 6 006 يُقرّ
7 7 007 جرس
8 8 010 مسافة للخلف
9 9 011 علامة تبويب أفقية
10 أ 012 خط جديد
11 ب 013 علامة تبويب عمودية
12 ج 014 صفحة جديدة
13 د 015 عودة النقل
14 ه 016 التحول خارج
15 ف 017 التحول في
16 10 020 الهروب من رابط البيانات
17 11 021 التحكم بالجهاز 1
18 12 022 التحكم بالجهاز 2
19 13 023 التحكم بالجهاز 3
20 14 024 التحكم بالجهاز 4
21 15 025 الاعتراف السلبي
22 16 026 الخمول متزامن
23 17 027 نهاية العابرة. حاجز
24 18 030 يلغي
25 19 031 نهاية المتوسطة
26 1 أ 032 بديل
27 1 ب 033 يهرب
28 1C 034 فاصل الملف
29 035 فاصل المجموعة
30 1E 036 فاصل السجل
31 1F 037 فاصل الوحدة
32 20 040 فضاء
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2 أ 052 *
43 2 ب 053 +
44 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3 أ 072 :
59 3 ب 073 ;
60 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
ديسمبرعرافةأكتوبرشار
64 40 100 @
65 41 101 أ
66 42 102 ب
67 43 103 ج
68 44 104 د
69 45 105 ه
70 46 106 ف
71 47 107 ز
72 48 110 ح
73 49 111 أنا
74 4 أ 112 ج
75 4 ب 113 ك
76 114 ل
77 4D 115 م
78 4E 116 ن
79 4F 117 يا
80 50 120 ص
81 51 121 س
82 52 122 ر
83 53 123 س
84 54 124 ت
85 55 125 ش
86 56 126 V
87 57 127 دبليو
88 58 130 X
89 59 131 ي
90 5 أ 132 ز
91 5 ب 133 [
92 134 \
93 5 د 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 أ
98 62 142 ب
99 63 143 ج
100 64 144 د
101 65 145 ه
102 66 146 و
103 67 147 ز
104 68 150 ح
105 69 151 أنا
106 6 أ 152 ي
107 6 ب 153 ك
108 154 ل
109 6 د 155 م
110 6E 156 ن
111 6F 157 س
112 70 160 ص
113 71 161 س
114 72 162 ص
115 73 163 ق
116 74 164 ر
117 75 165 ش
118 76 166 ضد
119 77 167 ث
120 78 170 س
121 79 171 ذ
122 7 أ 172 ض
123 7 ب 173 {
124 174 |
125 7 د 175 }
126 7E 176 ~
127 7F 177 ديل

كما هو واضح، يحتوي هذا الترميز على أحرف لاتينية فقط، وتلك المستخدمة في اللغة الإنجليزية. هناك أيضًا رموز حسابية ورموز خدمة أخرى. لكن لا توجد أحرف روسية ولا حتى أحرف لاتينية خاصة بالألمانية أو الفرنسية. من السهل شرح ذلك - تم تطوير الترميز خصيصًا كمعيار أمريكي. مع بدء استخدام أجهزة الكمبيوتر في جميع أنحاء العالم، كان لا بد من تشفير الأحرف الأخرى.

للقيام بذلك، تقرر استخدام البت الثامن في كل بايت. أدى هذا إلى إتاحة 128 قيمة إضافية (من 80 إلى FF) يمكن استخدامها لتشفير الأحرف. أول الجداول المكونة من ثمانية بتات هو "ASCII الممتد" ( ASCII الموسعة) - تتضمن أشكالًا مختلفة من الأحرف اللاتينية المستخدمة في بعض لغات أوروبا الغربية. كما أنها تحتوي على رموز إضافية أخرى، بما في ذلك الصور الزائفة.

تسمح لك الأحرف الزائفة بتوفير بعض مظاهر الرسومات من خلال عرض الأحرف النصية فقط على الشاشة. على سبيل المثال، يعمل برنامج إدارة الملفات FAR Manager باستخدام الرسوم الزائفة.

لم تكن هناك أحرف روسية في جدول Extended ASCII. أنشأت روسيا (اتحاد الجمهوريات الاشتراكية السوفياتية سابقًا) ودول أخرى ترميزاتها الخاصة التي مكنت من تمثيل أحرف "وطنية" محددة في ملفات نصية بحجم 8 بت - الحروف اللاتينية من اللغتين البولندية والتشيكية، والسيريلية (بما في ذلك الحروف الروسية) والحروف الهجائية الأخرى.

في جميع الترميزات التي أصبحت منتشرة على نطاق واسع، فإن أول 127 حرفًا (أي قيمة البايت مع البت الثامن يساوي 0) هي نفس ASCII. لذا فإن ملف ASCII يعمل بأي من هذه الترميزات؛ يتم تمثيل حروف اللغة الإنجليزية بنفس الطريقة.

منظمة ايزواعتمدت (المنظمة الدولية للتقييس) مجموعة من المعايير ايزو 8859. وهو يحدد ترميزات 8 بت لمجموعات لغوية مختلفة. لذا، فإن ISO 8859-1 هو جدول ASCII ممتد للولايات المتحدة الأمريكية وأوروبا الغربية. والمعيار ISO 8859-5 عبارة عن جدول للأبجدية السيريلية (بما في ذلك اللغة الروسية).

ومع ذلك، لأسباب تاريخية، لم يتم ترميز ISO 8859-5. في الواقع، يتم استخدام الترميزات التالية للغة الروسية:

صفحة الكود 866 ( CP866)، ويعرف أيضًا باسم "DOS"، ويعرف أيضًا باسم "ترميز GOST البديل". تم استخدامه على نطاق واسع حتى منتصف التسعينات؛ تستخدم الآن إلى حد محدود. عمليا لا تستخدم لتوزيع النصوص على شبكة الإنترنت.
- كوي-8. تم تطويره في السبعينيات والثمانينيات. إنه معيار مقبول عمومًا لنقل رسائل البريد الإلكتروني على الإنترنت الروسي. كما أنه يستخدم على نطاق واسع في أنظمة التشغيل لعائلة Unix، بما في ذلك Linux. تم استدعاء الإصدار KOI-8 المصمم للغة الروسية كوي-8R; هناك إصدارات للغات السيريلية الأخرى (على سبيل المثال، KOI8-U هو إصدار للغة الأوكرانية).
- صفحة الكود 1251، CP1251،ويندوز-1251. تم تطويره بواسطة Microsoft لدعم اللغة الروسية في Windows.

كانت الميزة الرئيسية لـ CP866 هي الحفاظ على أحرف الرسومات الزائفة في نفس الأماكن كما هو الحال في Extended ASCII؛ لذلك، يمكن أن تعمل برامج النصوص الأجنبية، على سبيل المثال، Norton Commander الشهير، دون تغييرات. يتم الآن استخدام CP866 لبرامج Windows التي تعمل في نوافذ نصية أو وضع نص ملء الشاشة، بما في ذلك FAR Manager.

كانت النصوص الموجودة في CP866 نادرة جدًا في السنوات الأخيرة (ولكنها تُستخدم لتشفير أسماء الملفات الروسية في نظام التشغيل Windows). لذلك، سنركز بمزيد من التفصيل على ترميزين آخرين - KOI-8R وCP1251.



كما ترون، في جدول الترميز CP1251، يتم ترتيب الحروف الروسية حسب الترتيب الأبجدي (باستثناء الحرف E). هذا الترتيب يجعل من السهل جدًا على برامج الكمبيوتر الفرز أبجديًا.

لكن في KOI-8R يبدو ترتيب الحروف الروسية عشوائيًا. ولكن في الواقع هذا ليس هو الحال.

في العديد من البرامج القديمة، يتم فقدان البت الثامن عند معالجة النص أو إرساله. (الآن أصبحت مثل هذه البرامج "منقرضة" عمليًا، لكنها كانت منتشرة على نطاق واسع في أواخر الثمانينيات وأوائل التسعينيات). للحصول على قيمة 7 بت من قيمة 8 بت، ما عليك سوى طرح 8 من الرقم الأكثر أهمية؛ على سبيل المثال، E1 يصبح 61.

قارن الآن KOI-8R مع جدول ASCII (الجدول 1). ستجد أن الحروف الروسية موضوعة في مراسلات واضحة مع الحروف اللاتينية. إذا اختفى الجزء الثامن، تتحول الأحرف الروسية الصغيرة إلى أحرف لاتينية كبيرة، وتتحول الأحرف الروسية الكبيرة إلى أحرف لاتينية صغيرة. لذلك، E1 في KOI-8 هو "A" الروسي، بينما 61 في ASCII هو "a" اللاتيني.

لذلك، يسمح لك KOI-8 بالحفاظ على سهولة قراءة النص الروسي عند فقدان البت الثامن. "مرحبًا بالجميع" تصبح "pRIWET WSEM".

في الآونة الأخيرة، فقد كل من الترتيب الأبجدي للأحرف في جدول الترميز وسهولة القراءة مع فقدان البت الثامن أهميتهما الحاسمة. لا يتم فقدان البت الثامن في أجهزة الكمبيوتر الحديثة أثناء النقل أو المعالجة. ويتم الفرز الأبجدي مع مراعاة التشفير، وليس بمجرد مقارنة الرموز. (بالمناسبة، رموز CP1251 ليست مرتبة أبجديًا بالكامل - الحرف E ليس في مكانه).

نظرًا لوجود ترميزين شائعين، عند العمل مع الإنترنت (البريد، وتصفح مواقع الويب)، يمكنك أحيانًا رؤية مجموعة لا معنى لها من الحروف بدلاً من النص الروسي. على سبيل المثال، "أنا SBYUFEMHEL." هذه مجرد كلمات "مع الاحترام"؛ ولكن تم ترميزها بتشفير CP1251، وقام الكمبيوتر بفك تشفير النص باستخدام جدول KOI-8. وعلى العكس من ذلك، إذا تم تشفير نفس الكلمات في KOI-8، وقام الكمبيوتر بفك تشفير النص وفقًا لجدول CP1251، فستكون النتيجة "U KHBTSEOYEN".

يحدث أحيانًا أن يقوم الكمبيوتر بفك رموز الحروف باللغة الروسية باستخدام جدول غير مخصص للغة الروسية. ثم، بدلا من الحروف الروسية، تظهر مجموعة لا معنى لها من الرموز (على سبيل المثال، الحروف اللاتينية للغات أوروبا الشرقية)؛ غالبًا ما يطلق عليهم اسم "crocozybras".

في معظم الحالات، تتعامل البرامج الحديثة مع تحديد ترميزات مستندات الإنترنت (رسائل البريد الإلكتروني وصفحات الويب) بشكل مستقل. لكن في بعض الأحيان "يخطئون"، وبعد ذلك يمكنك رؤية تسلسلات غريبة من الحروف الروسية أو "krokozyabry". كقاعدة عامة، في مثل هذه الحالة، لعرض نص حقيقي على الشاشة، يكفي تحديد الترميز يدويًا في قائمة البرنامج.

تم استخدام المعلومات من الصفحة http://open-office.edusite.ru/TextProcessor/p5aa1.html لهذه المقالة.

المواد مأخوذة من الموقع:

بالمناسبة، يمكنك على موقعنا تحويل أي نص إلى رمز عشري أو سداسي عشري أو ثنائي باستخدام حاسبة الرموز عبر الإنترنت.

جدول ASCII

ASCII (الرمز القياسي الأمريكي لتبادل المعلومات)

جدول ملخص لرموز ASCII

جدول رموز أحرف Windows ASCII (Win-1251)

رمز

متخصص. جدولة

متخصص. LF (عودة النقل)

متخصص. سي آر (الخط الجديد)

القابض SP (الفضاء)

رمز

جدول رموز ASCII الممتد

رموز التنسيق

مسافة للخلف (إرجاع حرف واحد). يشير إلى أن آلية الطباعة أو مؤشر العرض يتحرك للخلف بمقدار موضع واحد.

الجدولة الأفقية. يشير إلى حركة محرك الطباعة أو مؤشر العرض إلى "علامة التبويب" الموصوفة التالية.

تغذية الخط. يشير إلى حركة آلية الطباعة أو مؤشر العرض إلى بداية السطر التالي (سطر واحد لأسفل).

الجدولة العمودية. يشير إلى حركة محرك الطباعة أو مؤشر العرض إلى مجموعة الأسطر التالية.

تغذية النموذج. يشير إلى حركة محرك الطباعة أو مؤشر العرض إلى موضع البداية للصفحة أو النموذج أو الشاشة التالية.

عودة النقل. يشير إلى حركة آلية الطباعة أو مؤشر العرض إلى الموضع الرئيسي (أقصى اليسار) للخط الحالي.

نقل البيانات.

بداية العنوان. يُستخدم لتحديد بداية الرأس، والتي قد تحتوي على معلومات توجيه أو عنوان.

بداية النص. يظهر بداية النص وفي نفس الوقت نهاية العنوان.

نهاية النص. ينطبق عند إنهاء النص الذي يبدأ بحرف STX.

سؤال. طلب بيانات التعريف (مثل "من أنت؟") من محطة بعيدة.

يُقرّ. يقوم الجهاز المستقبل بإرسال هذا الحرف إلى المرسل كتأكيد لاستقبال البيانات بنجاح.

الاعتراف السلبي ينقل جهاز الاستقبال هذه الشخصية إلى المرسل في حالة رفض (فشل) استقبال البيانات.

متزامن / خامل. تستخدم في أنظمة النقل المتزامنة. عندما لا يكون هناك نقل للبيانات، يرسل النظام باستمرار رموز SYN لضمان المزامنة.

نهاية كتلة الإرسال. يشير إلى نهاية كتلة البيانات لأغراض الاتصال. يستخدم لتقسيم كميات كبيرة من البيانات إلى كتل منفصلة.

علامات التقسيم عند نقل المعلومات.

رموز أخرى.

باطل. (لا يوجد حرف - لا توجد بيانات). يستخدم للإرسال في حالة عدم وجود بيانات.

الجرس (الاتصال). يستخدم للتحكم في أجهزة الإنذار.

التحول للخارج. يشير إلى أنه يجب تفسير جميع كلمات التشفير اللاحقة وفقًا لمجموعة الأحرف الخارجية قبل وصول حرف SI.

التحول في. يشير إلى أنه يجب تفسير مجموعات التعليمات البرمجية اللاحقة وفقًا لمجموعة الأحرف القياسية.

الهروب من وصلة البيانات. تغيير معنى الحروف التالية . يستخدم للتحكم الإضافي أو لنقل مجموعة عشوائية من البتات.

DC1، ​​DC2، DC3، DC4

ضوابط الجهاز. رموز تشغيل الأجهزة المساعدة (الوظائف الخاصة).

يلغي. يشير إلى أنه يجب تجاهل البيانات التي تسبق هذا الحرف في الرسالة أو الكتلة (عادةً في حالة اكتشاف خطأ).

نهاية المتوسطة. يشير إلى النهاية الفعلية للشريط أو أي وسيلة تخزين أخرى

بديل. يستخدم لاستبدال حرف خاطئ أو غير صالح.

الهروب (التوسع). يُستخدم لتوسيع التعليمات البرمجية من خلال الإشارة إلى أن الحرف التالي له معنى بديل.

فضاء. حرف غير قابل للطباعة يستخدم لفصل الكلمات أو تحريك محرك الطباعة أو مؤشر العرض إلى الأمام بمقدار موضع واحد.

يمسح. يستخدم لإزالة (مسح) الحرف السابق في الرسالة

Unicode (Unicode باللغة الإنجليزية) هو معيار لترميز الأحرف. ببساطة، هذا هو جدول المراسلات بين أحرف النص (، الحروف، عناصر علامات الترقيم) الرموز الثنائية. الكمبيوتر يفهم فقط تسلسل الأصفار والواحدات. لكي يعرف بالضبط ما يجب أن يعرضه على الشاشة، فمن الضروري تعيين رقم فريد لكل حرف. في الثمانينات، تم ترميز الأحرف ببايت واحد، أي ثماني بتات (كل بت هو 0 أو 1). وهكذا، اتضح أن جدول واحد (المعروف أيضًا باسم الترميز أو المجموعة) يمكنه استيعاب 256 حرفًا فقط. قد لا يكون هذا كافيًا حتى للغة واحدة. لذلك، ظهرت العديد من الترميزات المختلفة، مما أدى في كثير من الأحيان إلى ظهور بعض الهراء الغريب على الشاشة بدلاً من النص المقروء. كان هناك حاجة إلى معيار واحد، والذي أصبح Unicode. الترميز الأكثر استخدامًا هو UTF-8 (تنسيق تحويل Unicode)، والذي يستخدم من 1 إلى 4 بايت لتمثيل الحرف.

الرموز

يتم ترقيم الأحرف في جداول Unicode بأرقام ست عشرية. على سبيل المثال، الحرف السيريلي الكبير M يُسمى U+041C. وهذا يعني أنه يقع عند تقاطع الصف 041 والعمود C. ويمكنك ببساطة نسخه ثم لصقه في مكان ما. من أجل عدم البحث في قائمة متعددة الكيلومترات، يجب عليك استخدام البحث. عندما تذهب إلى صفحة الرموز، سترى رقم Unicode الخاص بها وكيفية كتابته بخطوط مختلفة. يمكنك إدخال الإشارة نفسها في شريط البحث، حتى لو تم رسم مربع بدلاً من ذلك، على الأقل لمعرفة ما هو عليه. يوجد أيضًا في هذا الموقع مجموعات خاصة (وعشوائية) من نفس نوع الأيقونات، تم جمعها من أقسام مختلفة، لسهولة الاستخدام.

معيار Unicode دولي. يتضمن شخصيات من جميع نصوص العالم تقريبًا. بما في ذلك تلك التي لم تعد تستخدم. الهيروغليفية المصرية والرونية الجرمانية وكتابة المايا والكتابة المسمارية وأبجديات الدول القديمة. يتم أيضًا عرض تسميات الأوزان والمقاييس، والتدوين الموسيقي، والمفاهيم الرياضية.

لا يخترع Unicode Consortium نفسه أحرفًا جديدة. تتم إضافة تلك الرموز التي تجد استخدامها في المجتمع إلى الجداول. على سبيل المثال، تم استخدام علامة الروبل بشكل نشط لمدة ست سنوات قبل إضافتها إلى Unicode. تم أيضًا استخدام الصور التوضيحية للرموز التعبيرية (الرموز التعبيرية) لأول مرة على نطاق واسع في اليابان قبل تضمينها في الترميز. ولكن لا تتم إضافة العلامات التجارية وشعارات الشركة من حيث المبدأ. حتى تلك الشائعة مثل تفاحة Apple أو علم Windows. حتى الآن، تم ترميز حوالي 120 ألف حرف في الإصدار 8.0.



أخبر الأصدقاء