Літера я в двійковому коді. Розшифровка бінарного коду: онлайн інструменти, де застосовується. Перетворення десяткових чисел на двійкові

💖 Подобається?Поділися з друзями посиланням

Термін «бінарний» за змістом – що складається із двох частин, компонентів. Таким чином бінарні коди це коди, які складаються тільки з двох символьних станів, наприклад чорний або білий, світлий або темний, провідник або ізолятор. Бінарний код у цифровій техніці це спосіб представлення даних (чисел, слів та інших) у вигляді комбінації двох знаків, які можна позначити як 0 та 1. Знаки чи одиниці БК називають бітами. Одним з обґрунтувань застосування БК є простота та надійність накопичення інформації в якомусь носії у вигляді комбінації всього двох його фізичних станів, наприклад у вигляді зміни або сталості світлового потоку при зчитуванні з оптичного кодового диска.
Існують різні можливості кодування інформації.

Двійковий код

У цифровій техніці спосіб представлення даних (чисел, слів та інших) як комбінації двох знаків, які можна позначити як 0 і 1. Знаки або одиниці ДК називають бітами.

Одним з обґрунтувань застосування ДК є простота і надійність накопичення інформації в якомусь носії у вигляді комбінації всього двох його фізичних станів, наприклад у вигляді зміни або сталості магнітного потоку в даному осередку носія магнітного запису.

Найбільше, яке може бути виражене двійковим кодом, залежить кількості використовуваних розрядів, тобто. від кількості бітів у комбінації, що виражає число. Наприклад, для вираження числових значень від 0 до 7 достатньо мати 3-розрядний або 3-бітовий код:

числове значення двійковий код
0 000
1 001
2 010
3 011
4 100
5 101
6 110
7 111

Звідси видно, що з числа більше 7 при 3-разрядном коді немає кодових комбінацій з 0 і 1.

Переходячи від чисел до фізичних величин, сформулюємо наведене вище твердження в більш загальному вигляді: найбільша кількість значень m будь-якої величини (температури, напруги, струму та ін.), яка може бути виражена двійковим кодом, залежить від числа використовуваних розрядів n як m= 2n. Якщо n=3, як у розглянутому прикладі, отримаємо 8 значень, включаючи провідний 0.
Двійковий код є багатокроковим кодом. Це означає, що з переході з одного становища (значення) в інше можуть зміняться кілька біт одночасно. Наприклад число 3 у двійковому коді = 011. Число ж 4 у двійковому коді = 100. Відповідно при переході від 3 до 4 змінюють свій стан на протилежний усі 3 біти одночасно. Зчитування такого коду з кодового диска призвело б до того, що через неминучі відхилення (толеранці) при виробництві кодового диска зміна інформації від кожної з доріжок окремо ніколи не відбудеться одночасно. Це, у свою чергу, призвело б до того, що при переході від одного числа до іншого короткочасно буде видано неправильну інформацію. Так при вищезгаданому переході від числа 3 до 4 дуже можлива короткочасна видача числа 7 коли, наприклад, старший біт під час переходу змінив своє значення трохи раніше ніж інші. Щоб уникнути цього, застосовується так званий однокроковий код, наприклад, так званий Грей-код.

Код Грею

Грей-код є так званим однокроковим кодом, тобто. при переході від одного числа до іншого завжди змінюється лише якийсь один із усіх біт інформації. Похибка при зчитуванні інформації з механічного кодового диска при переході від одного числа до іншого призведе лише до того, що перехід від одного положення до іншого буде трохи зміщений за часом, проте видача абсолютно невірного значення кутового положення при переході від одного положення до іншого повністю виключається .
Перевагою Грей-коду є його здатність дзеркального відображення інформації. Так, інвертуючи старший біт можна простим чином змінювати напрямок рахунку і таким чином підбирати до фактичного (фізичного) напрямку обертання осі. Зміна напряму рахунку таким чином може легко змінюватися керуючи так званим входом Complement. Значення, що видається, може таким чином бути зростаючим або спадаючим при тому самому фізичному напрямку обертання осі.
Оскільки інформація, виражена в Грей-коді, має суто кодований характер не несучої реальної числової інформації, він повинен перед подальшою обробкою спершу перетворений на стандартний бінарний код. Здійснюється це за допомогою перетворювача коду (декодера Грей-Бінар), який на щастя легко реалізується за допомогою ланцюга з логічних елементів, що «виключає або» (XOR) як програмним так і апаратним способом.

Відповідність десяткових чисел у діапазоні від 0 до 15 двійкового коду та коду Грея

Двійкове кодування Кодування за методом Грею
Десятковий код
Двійкове значення Шестнадц. значення Десятковий код Двійкове значення Шестнадц. значення
0 0000 0h 0 0000 0h
1 0001 1h 1 0001 1h
2 0010 2h 3 0011 3h
3 0011 3h 2 0010 2h
4 0100 4h 6 0110 6h
5 0101 5h 7 0111 7h
6 0110 6h 5 0101 5h
7 0111 7h 4 0100 4h
8 1000 8h 12 1100 Ch
9 1001 9h 13 1101 Dh
10 1010 Ah 15 1111 Fh
11 1011 Bh 14 1110 Eh
12 1100 Ch 10 1010 Ah
13 1101 Dh 11 1011 Bh
14 1110 Eh 9 1001 9h
15 1111 Fh 8 1000 8h

Перетворення коду Грея на звичний бінарний код можна здійснити, використовуючи просту схему з інверторами та логічними елементами “виключне або” як показано нижче:

Код Gray-Excess

Звичайний однокроковий Грей-код підходить для дозволів, які можуть бути представлені у вигляді числа зведеного в ступінь 2. У випадках, де треба реалізувати інші дозволи зі звичайного Грей-коду, вирізається і використовується середня його ділянка. Таким чином зберігається «однокроковість» коду. Однак числовий діапазон починається не з нуля, а зміщується певне значення. При обробці інформації від сигналу, що генерується, віднімається половина різниці між початковим і редукованим дозволом. Такі дозволи, як, наприклад, 360? для вираження кута часто реалізуються цим способом. Так 9-бітний Грей-код рівний 512 кроків, урізаний з обох сторін на 76 кроків дорівнюватиме 360 °.

Двійковий перекладач - інструмент для перекладу двійкового коду в текст для читання або друку. Ви можете перекласти двійковий файл англійською, використовуючи два методи; ASCII та Unicode.

Двійкова система числення

Система двійкового декодера заснована на числі 2 (основа). Він складається з двох чисел як системи числення base-2: 0 і 1.

Хоча бінарна система застосовувалася в різних цілях у стародавньому Єгипті, Китаї та Індії, вона стала мовою електроніки та комп'ютерів сучасного світу. Це найбільш ефективна система виявлення вимкненого (0) і включеного (1) стану електричного сигналу. Це також основа двійкового коду тексту, який використовується на комп'ютерах для складання даних. Навіть цифровий текст, який ви читаєте зараз, складається з двійкових чисел. Але ви можете прочитати цей текст, тому що ми розшифрували двійковий код перекладу файл, використовуючи двійковий код слова.

Що таке ASCII?

ASCII – це стандарт кодування символів для електронного зв'язку, скорочений від Американського стандартного коду для обміну інформацією. У комп'ютерах, телекомунікаційному обладнанні та інших пристроях коди ASCII представляють текст. Хоча підтримується багато додаткових символів, більшість сучасних схем кодування символів ґрунтуються на ASCII.

ASCII – це традиційна назва для системи кодування; Управління з присвоєння номерів в Інтернеті (IANA) віддає перевагу оновлене ім'я США-ASCII, яке пояснює, що ця система була розроблена в США і заснована на друкарських символах, що переважно використовуються. ASCII одна із основних моментів IEEE.

Бінарний в ASCII

Спочатку заснований на англійському алфавіті, ASCII кодує 128 вказаних семибітних цілих символів. Можна друкувати 95 кодованих символів, включаючи цифри від 0 до 9, малі літери від a до z, великі літери від A до Z та символи пунктуації. Крім того, 33 недрукованих контрольних кодів, отриманих за допомогою машин Teletype, були включені у вихідну специфікацію ASCII; більшість з них в даний час застаріли, хоча деякі ще широко використовуються, такі як повернення каретки, переклад рядки і коди табуляції.

Наприклад, двійкове число 1101001 = шістнадцяткове 69 (i - дев'ята буква) = десяткове число 105 представлятиме рядковий I в кодуванні ASCII.

Використання ASCII

Як згадувалося вище, використовуючи ASCII, можна перевести комп'ютерний текст у людський текст. Простіше кажучи, це перекладач з бінарної англійською. Всі комп'ютери отримують повідомлення у двійковому, 0 та 1 серії. Тим не менш, так само, як англійська та іспанська можуть використовувати один і той же алфавіт, але для багатьох схожих слів у них абсолютно різні слова, комп'ютери також мають свою мовну версію. ASCII використовується як метод, який дозволяє всім комп'ютерам обмінюватися документами та файлами однією мовою.

ASCII важливий, тому що при розробці комп'ютерів було дано спільну мову.

У 1963 році ASCII вперше був комерційно використаний як семибітний код телепринтера для мережі TWX (Teletype Writer eXchange) American Telephone & Telegraph. Спочатку TWX використовував попередню п'ятибітну ITA2, яку також використала конкуруюча телепринтерна система Telex. Боб Бемер представив такі функції, як послідовність втечі. За словами Бемера, його британський колега Х'ю МакГрегор Росс допоміг популяризувати цю роботу - "настільки код, який став ASCII, вперше був названий Кодексом Бемера-Росса в Європі". Через його велику роботу ASCII, Бемер був названий "батьком ASCII".

До грудня 2007 року, коли кодування UTF-8 перевершувало її, ASCII була найпоширенішим кодуванням символів у Всесвітньому павутинні; UTF-8 назад сумісний з ASCII.

UTF-8 (Юнікод)

UTF-8 - кодування символів, яке може бути таким же компактним, як ASCII, але також може містити будь-які символи Юнікоду (з деяким збільшенням розміру файлу). UTF – це формат перетворення Unicode. "8" означає подання символу з використанням 8-бітових блоків. Кількість блоків, які має представляти персонаж, варіюється від 1 до 4. Однією з справді приємних особливостей UTF-8 є те, що він сумісний з рядками з нульовим символом наприкінці. При кодуванні жоден символ не матиме байта nul (0).

Unicode та універсальний набір символів (UCS) ISO/IEC 10646 мають набагато ширший діапазон символів, і їх різні форми кодування почали швидко замінювати ISO/IEC 8859 та ASCII у багатьох ситуаціях. Хоча ASCII обмежено 128 символами, Unicode та UCS підтримують більшу кількість символів за допомогою поділу унікальних концепцій ідентифікації (з використанням натуральних чисел, які називаються кодовими точками) та кодування (до двійкових форматів UTF-8, UTF-16 та UTF-32-бітних). .

Різниця між ASCII та UTF-8

ASCII було включено як перші 128 символів у набір символів Unicode (1991), тому 7-розрядні символи ASCII обох наборах мають однакові числові коди. Це дозволяє UTF-8 бути сумісним з 7-бітним ASCII, оскільки файл UTF-8 з лише символами ASCII ідентичний файлу ASCII з тією ж послідовністю символів. Що ще важливіше, пряма сумісність забезпечується, оскільки програмне забезпечення, яке розпізнає лише 7-бітові символи ASCII як спеціальні та не змінює байти з найвищим встановленим бітом (як це часто робиться для підтримки 8-бітових розширень ASCII, таких як ISO-8859 -1), зберегти незмінені дані UTF-8.

Програми перекладача двійкового коду

Найбільш поширене застосування цієї системи числення можна побачити в комп'ютерних технологіях. Зрештою, основою всієї комп'ютерної мови та програмування є двозначна система числення, що використовується у цифровому кодуванні.

Це те, що складає процес цифрового кодування, беручи дані і зображуючи їх з обмеженими бітами інформації. Обмежена інформація складається з нулів та одиниць двійкової системи. Зображення на екрані комп'ютера є прикладом цього. Для кодування цих зображень кожного пікселя використовується двійковий рядок.

Якщо на екрані використовується 16-бітний код, кожному пікселю будуть дані інструкції, який колір відображати на основі того, які біти дорівнюють 0 і 1. В результаті виходить більше 65 000 кольорів, представлених 2 ^ 16. На додаток до цього ви знайдете застосування двійкової системи числення в математичній галузі, відомої як булева алгебра.

Цінності логіки та істини відносяться до цієї галузі математики. У цьому додатку заявам надається 0 або 1 залежно від того, чи є вони істинними чи хибними. Ви можете спробувати перетворення двійкового в текстове, десяткове на двійкове, двійкове на десяткове перетворення, якщо ви шукаєте інструмент, який допомагає в цьому додатку.

Перевага двійкової системи числення

Система двійкових чисел корисна для низки речей. Наприклад, комп'ютер клацає перемикачами для додавання чисел. Ви можете стимулювати додавання комп'ютера, додаючи двійкові числа до системи. В даний час є дві основні причини використання цієї комп'ютерної системи числення. По-перше, це може забезпечити надійність діапазону безпеки. Вдруге і найголовніше це допомагає мінімізувати необхідні схеми. Це зменшує необхідний простір, споживану енергію та витрати.

Ви можете кодувати або перекладати бінарні повідомлення, написані бінарними числами. Наприклад,

(01101001) (0110110001101111111111011001100101) є декодованим повідомленням. Коли ви скопіюєте та вставите ці цифри в наш бінарний перекладач, ви отримаєте наступний текст англійською мовою:

Я люблю тебе

Це означає

(01101001) (011011000110111110111011001100101) (011110010110111101110101) = Я тебе люблю

таблиці

двійковий

шістнадцятковий

На цьому уроці буде розглянуто тему «Кодування інформації. Двійкове кодування. Одиниці виміру інформації». У ході нього користувачі зможуть отримати уявлення про кодування інформації, способи сприйняття інформації комп'ютерів, одиниці її вимірювання та двійкове кодування.

Тема:Інформація навколо нас

Урок: Кодування інформації. Двійкове кодування. Одиниці виміру інформації

На цьому уроці будуть розглянуті такі питання:

1. Кодування як зміна форми подання інформації.

2. Як комп'ютер розпізнає інформацію?

3. Як виміряти інформацію?

4. Одиниці виміру інформації.

У світі кодів

Навіщо люди кодують інформацію?

1. Приховати її від інших (дзеркальний тайнопис Леонардо да Вінчі, військові шифрування).

2. Записати інформацію коротше (стенографія, абревіатура, дорожні знаки).

3. Для більш легкої обробки та передачі (азбука Морзе, переведення в електричні сигнали - машинні коди).

Кодування - це подання інформації за допомогою певного коду.

Код - це система умовних знаків подання інформації.

Способи кодування інформації

1. Графічний (див. рис. 1) (за допомогою малюнків та знаків).

Мал. 1. Система сигнальних прапорів (Джерело)

2. Числовий (за допомогою чисел).

Наприклад: 11001111 11100101.

3. Символьний (за допомогою символів алфавіту).

Наприклад: НКМБМ ЧДЄУ.

Декодування - це дія щодо відновлення первісної форми подання інформації. Для декодування необхідно знати код та правила кодування.

Засобом кодування та декодування служить кодова таблиця відповідності. Наприклад, відповідність у різних системах числення - 24 - XXIV, відповідність алфавіту будь-яким символам (Рис. 2).


Мал. 2. Приклад шифру (Джерело)

Приклади кодування інформації

Прикладом кодування інформації є абетка Морзе (див. рис. 3).

Мал. 3. Абетка Морзе ()

В абетці Морзе використовується всього 2 символи - точка та тире (короткий і довгий звук).

Ще одним прикладом кодування інформації є прапорцева абетка (див. рис. 4).

Мал. 4. Прапорцева абетка ()

Також прикладом є абетка прапорів (див. рис. 5).

Мал. 5. Абетка прапорів ()

Усім відомий приклад кодування – нотна абетка (див. рис. 6).

Мал. 6. Нотна абетка ()

Розглянемо таке завдання:

Використовуючи таблицю прапорцевої абетки (див. мал. 7), необхідно вирішити наступне завдання:

Мал. 7

Старший помічник Лом складає іспит капітану Врунгелю. Допоможіть йому прочитати наступний текст (див. мал. 8):

Навколо нас існують переважно два сигнали, наприклад:

Світлофор: червоний – зелений;

Питання: так – ні;

Лампа: горить – не горить;

Можна – не можна;

Добре погано;

Істина – брехня;

Вперед назад;

Є немає;

Все це сигнали, що позначають кількість інформації на 1 біт.

1 біт - це така кількість інформації, яка дозволяє нам вибрати один варіант із двох можливих.

Комп'ютер – це електрична машина, що працює на електронних схемах. Щоб комп'ютер розпізнав і зрозумів інформацію, що вводиться, її треба перекласти на комп'ютерну (машинну) мову.

Алгоритм, призначений для виконавця, має бути записаний, тобто закодований мовою, зрозумілою комп'ютеру.

Це електричні сигнали: проходить струм чи не проходить струм.

Машинна двійкова мова - послідовність "0" та "1". Кожне двійкове число може набувати значення 0 або 1.

Кожна цифра двійкового машинного коду несе кількість інформації, що дорівнює 1 біт.

Двійкове число, яке представляє найменшу одиницю інформації, називається б іт . Біт може приймати значення або 0 або 1. Наявність магнітного або електронного сигналу в комп'ютері означає 1, відсутність 0.

Рядок з 8 бітів називається б айт . Цей рядок комп'ютер обробляє як окремий символ (число, букву).

Розглянемо приклад. Слово ALICE складається з 5 букв, кожна з яких мовою комп'ютера представлена ​​одним байтом (див. рис. 10). Отже, Alice можна виміряти як 5 байт.

Мал. 10. Двійковий код (Джерело)

Крім біта та байта, існують й інші одиниці виміру інформації.

Список літератури

1. Босова Л.Л. Інформатика та ІКТ: Підручник для 5 класу. - М: БІНОМ. Лабораторія знань, 2012

2. Босова Л.Л. Інформатика: Робочий зошит для 5 класів. - М: БІНОМ. Лабораторія знань, 2010

3. Босова Л.Л., Босова А.Ю. Уроки інформатики у 5-6 класах: Методичний посібник. - М: БІНОМ. Лабораторія знань, 2010

2. Фестиваль "Відкритий урок" ().

Домашнє завдання

1. §1.6, 1.7 (Босова Л.Л. Інформатика та ІКТ: Підручник для 5 класу).

2. Стор. 28, завдання 1, 4; стор 30, завдання 1, 4, 5, 6 (Босова Л.Л. Інформатика та ІКТ: Підручник для 5 класу).

Всім відомо, що комп'ютери можуть виконувати обчислення з великими групами даних на великій швидкості. Але не всі знають, що ці дії залежать від двох умов: є чи ні струм і яка напруга.

Як комп'ютер примудряється обробляти таку різноманітну інформацію?
Секрет полягає у двійковій системі обчислення. Всі дані надходять у комп'ютер, представлені у вигляді одиниць і нулів, кожному з яких відповідає один стан електропроводу: одиницям - висока напруга, нулям - низька або одиницям - наявність напруги, нулям - його відсутність. Перетворення даних у нулі та одиниці називається двійковою конверсією, а остаточне їх позначення – двійковим кодом.
У десятковому позначенні, заснованому на десятковій системі обчислення, яка використовується в повсякденному житті, числове значення представлене десятьма цифрами від 0 до 9, і кожне місце в числі має цінність у десять разів вищу, ніж місце праворуч від нього. Щоб уявити число більше дев'яти в десятковій системі обчислення, його місце ставиться нуль, але в наступне, більш цінне місце зліва - одиниця. Так само в двійковій системі, де використовуються тільки дві цифри - 0 і 1, кожне місце вдвічі цінніше, ніж місце праворуч від нього. Таким чином, у двійковому коді тільки нуль і одиниця можуть бути зображені як одномісні числа, і будь-яке число більше одиниці вимагає вже два місця. Після нуля і одиниці наступні три двійкові числа це 10 (читається один-нуль) і 11 (читається один-один) і 100 (читається один-нуль). 100 двійкової системи еквівалентно 4 десятковій. На верхній таблиці праворуч показані інші двійково-десяткові еквіваленти.
Будь-яке число може бути виражене у двійковому коді, просто воно займе більше місця, ніж у десятковому позначенні. У двійковій системі можна записати і абетку, якщо за кожною літерою закріпити певне двійкове число.

Дві цифри на чотири місця
16 комбінацій можна скласти, використовуючи темні та світлі кулі, комбінуючи їх у наборах з чотирьох штук. див. верхню таблицю (стор. 27). Навіть із двома видами куль у двійковій системі можна побудувати нескінченну кількість комбінацій, просто збільшуючи число кульок у кожній групі - чи кількість місць у числах.

Біти та байти

Найменша одиниця в комп'ютерній обробці, біт - це одиниця даних, яка може мати одну з двох можливих умов. Наприклад, кожна з одиниць і нулів (праворуч) означає 1 біт. Біт можна уявити й іншими способами: наявністю або відсутністю електричного струму, дірочкою та її відсутністю, напрямом намагнічування вправо чи вліво. Вісім бітів становлять байт. 256 можливих байтів можуть представити 256 символів та символів. Багато комп'ютерів обробляють байт даних одночасно.

Двійкова конверсія. Чотирьохцифровий двійковий код може подати десяткові числа від 0 до 15.

Кодові таблиці

Коли двійковий код використовується для позначення літер алфавіту або пунктуаційних знаків, потрібні кодові таблиці, в яких зазначено, який код символу відповідає. Складено декілька таких кодів. Більшість ПК пристосовані під семицифровий код, що називається ASCII, або американський стандартний код для інформаційного обміну. На таблиці справа показані коди ASCII для англійського алфавіту. Інші коди призначені для тисяч символів та алфавітів інших мов світу.

Частина таблиці коду ASCII

Безліч символів, за допомогою яких записується текст, називається алфавітом.

Число символів в алфавіті – це його потужність.

Формула визначення кількості інформації: N = 2 b,

де N – потужність алфавіту (кількість символів),

b – кількість біт (інформаційна вага символу).

В алфавіті потужністю 256 символів можна помістити практично всі необхідні символи. Такий алфавіт називається достатнім.

Т.к. 256 = 28, то вага 1 символу - 8 біт.

Одиниці виміру 8 біт надали назву 1 байт:

1 байт = 8 біт.

Двійковий код кожного символу в тексті комп'ютера займає 1 байт пам'яті.

Як текстова інформація представлена ​​в пам'яті комп'ютера?

Зручність побайтового кодування символів очевидна, оскільки байт - найменша частина пам'яті, що адресується, і, отже, процесор може звернутися до кожного символу окремо, виконуючи обробку тексту. З іншого боку, 256 символів – це достатня кількість для представлення найрізноманітнішої символьної інформації.

Тепер виникає питання, який саме восьмирозрядний двійковий код поставити у відповідність до кожного символу.

Зрозуміло, що ця справа умовна, можна вигадати безліч способів кодування.

Усі символи комп'ютерного алфавіту пронумеровані від 0 до 255. Кожному номеру відповідає восьмирозрядний двійковий код від 00000000 до 11111111. Цей код є просто порядковим номером символу в двійковій системі числення.

Таблиця, в якій всім символам комп'ютерного алфавіту поставлені у відповідність порядкові номери, називається таблицею кодування.

Для різних типів ЕОМ застосовуються різні таблиці кодування.

Міжнародним стандартом для ПК стала таблиця ASCII(Читається аски) (Американський стандартний код для інформаційного обміну).

Таблиця кодів ASCII поділяється на частини.

Міжнародним стандартом є перша половина таблиці, тобто. символи з номерами від 0 (00000000), до 127 (01111111).

Структура таблиці кодування ASCII

Порядковий номер

Код

Символ

0 - 31

00000000 - 00011111

Символи з номерами від 0 до 31 називають керуючими.
Їхня функція – керування процесом виведення тексту на екран або друк, подача звукового сигналу, розмітка тексту тощо.

32 - 127

00100000 - 01111111

Стандартна частина таблиці (англійська). Сюди входять малі й великі літери латинського алфавіту, десяткові цифри, розділові знаки, всілякі дужки, комерційні та інші символи.
Символ 32 – пробіл, тобто. порожній позиції в тексті.
Решта відбиваються певними знаками.

128 - 255

10000000 - 11111111

Альтернативна частина таблиці (російська).
Друга половина кодової таблиці ASCII, яка називається кодовою сторінкою (128 кодів, починаючи з 10000000 і закінчуючи 11111111), може мати різні варіанти, кожен варіант має свій номер.
Кодова сторінка в першу чергу використовується для розміщення національних алфавітів, відмінних від латинського. У російських національних кодування в цій частині таблиці розміщуються символи російського алфавіту.

Перша половина таблиці кодів ASCII


Звертаю вашу увагу на те, що в таблиці кодування літери (великі та малі) розташовуються в алфавітному порядку, а цифри впорядковані за зростанням значень. Таке дотримання лексикографічного порядку розташування символів називається принципом послідовного кодування алфавіту.

Для літер російського алфавіту також дотримується принципу послідовного кодування.

Друга половина таблиці кодів ASCII


На жаль, в даний час існують п'ять різних кодувань кирилиці (КОІ8-Р, Windows. MS-DOS, Macintosh та ISO). Тому часто виникають проблеми з перенесенням російського тексту з одного комп'ютера на інший, з однієї програмної системи в іншу.

Хронологічно одним із перших стандартів кодування російських букв на комп'ютерах був КОІ8 ("Код обміну інформацією, 8-бітний"). Це кодування застосовувалося ще в 70-ті роки на комп'ютерах серії ЄС ЕОМ, а з середини 80-х почала використовуватися в перших русифікованих версіях операційної системи UNIX.

Від початку 90-х років, часу панування операційної системи MS DOS залишається кодування CP866 ("CP" означає "Code Page", "кодова сторінка").

Комп'ютери фірми Apple, що працюють під керуванням операційної системи Mac OS, використовують своє власне кодування Mac.

Крім того, Міжнародна організація зі стандартизації (International Standards Organization, ISO) затвердила як стандарт для російської мови ще одне кодування під назвою ISO 8859-5.

Найбільш поширеним в даний час є кодування Microsoft Windows, що позначається скороченням CP1251.

З кінця 90-х років проблема стандартизації символьного кодування вирішується запровадженням нового міжнародного стандарту, який називається Unicode. Це 16-розрядне кодування, тобто. в ній на кожен символ відводиться 2 байти пам'яті. Звичайно, при цьому обсяг пам'яті збільшується в 2 рази. Але така кодова таблиця допускає включення до 65536 символів. Повна специфікація стандарту Unicode включає всі існуючі, вимерлі та штучно створені алфавіти світу, а також безліч математичних, музичних, хімічних та інших символів.

Спробуємо за допомогою таблиці ASCII уявити, як виглядатимуть слова у пам'яті комп'ютера.

Внутрішнє уявлення слів у пам'яті комп'ютера

Іноді буває так, що текст, який складається з літер російського алфавіту, отриманий з іншого комп'ютера, неможливо прочитати - на екрані монітора видно якусь "абракадабру". Це відбувається через те, що на комп'ютерах застосовується різне кодування символів російської мови.



Розповісти друзям