Slovo I je u binarnom kodu. Dešifriranje binarnog koda: online alati gdje je primjenjivo. Pretvaranje decimalnih brojeva u binarne

💖 Sviđa li vam se? Podijelite vezu sa svojim prijateljima

Značenje pojma "binarni" je da se sastoji od dva dijela ili komponente. Dakle, binarni kodovi su kodovi koji se sastoje od samo dva simbolička stanja, kao što su crno ili bijelo, svijetlo ili tamno, vodič ili izolator. Binarni kod u digitalnoj tehnologiji je način predstavljanja podataka (brojeva, riječi i drugih) kao kombinacija dva znaka, koji se mogu označiti kao 0 i 1. Znakovi ili jedinice BC nazivaju se bitovi. Jedno od opravdanja za korištenje BC je jednostavnost i pouzdanost pohranjivanja informacija u bilo kojem mediju u obliku kombinacije samo dva njegova fizička stanja, na primjer, u obliku promjene ili konstantnosti svjetlosnog toka kada čitanje s optičkog kodnog diska.
Postoje razne mogućnosti kodiranja informacija.

Binarni kod

U digitalnoj tehnologiji, metoda predstavljanja podataka (brojeva, riječi i drugih) kao kombinacije dvaju znakova, koji se mogu označiti kao 0 i 1. Predznaci ili jedinice DC-a nazivaju se bitovi.

Jedno od opravdanja za korištenje DC je jednostavnost i pouzdanost pohranjivanja informacija u bilo kojem mediju u obliku kombinacije samo dva njegova fizička stanja, na primjer, u obliku promjene ili konstantnosti magnetskog toka u danu ćeliju magnetskog medija za snimanje.

Najveći broj koji se može izraziti binarno ovisi o broju korištenih znamenki, tj. o broju bitova u kombinaciji koja izražava broj. Na primjer, za izražavanje numeričkih vrijednosti od 0 do 7, dovoljno je imati 3-znamenkasti ili 3-bitni kod:

numerička vrijednost binarni kod
0 000
1 001
2 010
3 011
4 100
5 101
6 110
7 111

Iz ovoga možemo vidjeti da za broj veći od 7 s 3-znamenkastim kodom više ne postoje kombinacije koda od 0 i 1.

Prelazeći s brojeva na fizičke veličine, formulirajmo gornju izjavu u općenitijem obliku: najveći broj vrijednosti m bilo koje veličine (temperatura, napon, struja itd.), koji se može izraziti u binarnom kodu, ovisi na broj korištenih bitova n kao m= 2n. Ako je n=3, kao u razmatranom primjeru, tada dobivamo 8 vrijednosti, uključujući vodeću 0.
Binarni kod je kod u više koraka. To znači da se pri prelasku s jedne pozicije (vrijednosti) na drugu može promijeniti nekoliko bitova istovremeno. Na primjer, broj 3 u binarnom kodu = 011. Broj 4 u binarnom kodu = 100. Sukladno tome, pri prelasku s 3 na 4, sva 3 bita istodobno mijenjaju svoje stanje u suprotno. Očitavanje takvog koda s kodnog diska dovelo bi do toga da se, zbog neizbježnih odstupanja (tolerancija) tijekom izrade kodnog diska, promjena informacija sa svake staze posebno nikada neće dogoditi istovremeno. To bi pak dovelo do toga da bi se pri prelasku s jednog broja na drugi nakratko dale netočne informacije. Dakle, tijekom gore spomenutog prijelaza iz broja 3 u broj 4 vrlo je vjerojatan kratkoročni izlaz broja 7 kada je, na primjer, najvažniji bit tijekom prijelaza promijenio svoju vrijednost nešto ranije od ostalih . Da bi se to izbjeglo, koristi se takozvani kod u jednom koraku, na primjer takozvani Gray Code.

Sivi kod

Gray kod je takozvani kod u jednom koraku, tj. Pri prelasku s jednog broja na drugi uvijek se mijenja samo jedan od svih bitova informacija. Pogreška prilikom čitanja informacija s mehaničkog kodnog diska pri prelasku s jednog broja na drugi samo će dovesti do činjenice da će prijelaz s jednog položaja na drugi biti samo malo pomaknut u vremenu, ali izdavanje potpuno netočne vrijednosti kutnog položaja kada pomicanje iz jednog položaja u drugi potpuno je eliminirano .
Još jedna prednost Gray Codea je njegova sposobnost zrcaljenja informacija. Dakle, invertiranjem bita najveće važnosti možete jednostavno promijeniti smjer brojanja i tako uskladiti stvarni (fizički) smjer rotacije osi. Promjena smjera brojanja na ovaj način može se lako promijeniti kontroliranjem takozvanog "komplement" ulaza. Izlazna vrijednost stoga može biti rastuća ili opadajuća za isti fizički smjer rotacije osi.
Budući da su informacije izražene Gray Code-om čisto kodirane po prirodi i ne nose stvarne numeričke informacije, prvo se moraju pretvoriti u standardni binarni kod prije daljnje obrade. To se radi pomoću pretvarača koda (Gray-Binar dekoder), koji se, srećom, lako implementira korištenjem kruga logičkih elemenata isključivog ili (XOR), kako u softveru tako iu hardveru.

Odgovarajući decimalni brojevi u rasponu od 0 do 15 do binarnih i Grayevih kodova

Binarno kodiranje Grey kodiranje
Decimalni kod
Binarna vrijednost Šesnaest značenje Decimalni kod Binarna vrijednost Šesnaest značenje
0 0000 0h 0 0000 0h
1 0001 1h 1 0001 1h
2 0010 2h 3 0011 3h
3 0011 3h 2 0010 2h
4 0100 4h 6 0110 6h
5 0101 5h 7 0111 7h
6 0110 6h 5 0101 5h
7 0111 7h 4 0100 4h
8 1000 8h 12 1100 CH
9 1001 9h 13 1101 Dh
10 1010 Ah 15 1111 Fh
11 1011 bh 14 1110 Eh
12 1100 CH 10 1010 Ah
13 1101 Dh 11 1011 bh
14 1110 Eh 9 1001 9h
15 1111 Fh 8 1000 8h

Pretvaranje Grayeva koda u uobičajeni binarni kod može se izvesti pomoću jednostavnog sklopa s pretvaračima i isključivim ili vratima kao što je prikazano u nastavku:

Šifra Gray-Excess

Uobičajeni Grayev kod u jednom koraku prikladan je za razlučivosti koje se mogu predstaviti kao broj podignut na potenciju 2. U slučajevima kada je potrebno implementirati druga dopuštenja, srednji dio se izrezuje iz uobičajenog Grayeva koda i koristi. Na ovaj način kod ostaje "jednokorak". Međutim, numerički raspon ne počinje od nule, već se pomiče za određenu vrijednost. Prilikom obrade informacija, pola razlike između izvorne i smanjene razlučivosti oduzima se od generiranog signala. Rezolucije poput 360? za izražavanje kuta često se provode ovom metodom. Dakle, 9-bitni Grayev kod jednak 512 koraka, skraćen s obje strane za 76 koraka, bit će jednak 360°.

Binarni prevoditelj je alat za prevođenje binarnog koda u tekst za čitanje ili ispis. Možete prevesti binarni na engleski pomoću dvije metode; ASCII i Unicode.

Binarni brojevni sustav

Sustav binarnog dekodera temelji se na broju 2 (radix). Sastoji se od samo dva broja kao brojčani sustav s bazom 2: 0 i 1.

Iako se binarni sustav koristio u različite svrhe u starom Egiptu, Kini i Indiji, postao je jezikom elektronike i računala u modernom svijetu. To je najučinkovitiji sustav za detekciju isključenog (0) i uključenog (1) stanja električnog signala. Također je osnova binarnog koda u tekst koji se koristi na računalima za sastavljanje podataka. Čak je i digitalni tekst koji sada čitate sastavljen od binarnih brojeva. Ali možete pročitati ovaj tekst jer smo dešifrirali datoteku prijevoda binarnog koda pomoću riječi binarnog koda.

Što je ASCII?

ASCII je standard kodiranja znakova za elektroničke komunikacije, skraćenica za američki standardni kod za razmjenu informacija. U računalima, telekomunikacijskoj opremi i drugim uređajima, ASCII kodovi predstavljaju tekst. Iako su podržani mnogi dodatni znakovi, većina modernih shema kodiranja znakova temelji se na ASCII.

ASCII je tradicionalni naziv za sustav kodiranja; Internet Assigned Numbers Authority (IANA) preferira ažurirani naziv US-ASCII, koji pojašnjava da je sustav razvijen u Sjedinjenim Državama i da se temelji na tipografskim znakovima koji se pretežno koriste. ASCII je jedan od vrhunaca IEEE-a.

Binarno u ASCII

Izvorno temeljen na engleskoj abecedi, ASCII kodira 128 specificiranih sedam-bitnih cijelih znakova. Možete ispisati 95 kodiranih znakova, uključujući brojeve od 0 do 9, mala slova od a do z, velika slova od A do Z i interpunkcijske znakove. Dodatno, 33 neispisna kontrolna koda proizvedena od strane Teletype strojeva uključena su u originalnu ASCII specifikaciju; većina njih je sada zastarjela, iako se neki još uvijek naširoko koriste, kao što su povratak na prvi redak, pomicanje redaka i kodovi kartica.

Na primjer, binarni broj 1101001 = heksadecimalni 69 (i je deveto slovo) = decimalni broj 105 predstavljao bi mala slova ASCII I.

Korištenje ASCII-ja

Kao što je gore spomenuto, koristeći ASCII možete prevesti računalni tekst u ljudski tekst. Jednostavno rečeno, to je binarni prevoditelj na engleski. Sva računala primaju poruke u binarnom obliku, serije 0 i 1. Međutim, baš kao što engleski i španjolski mogu koristiti istu abecedu, ali imaju potpuno različite riječi za mnoge slične riječi, računala također imaju vlastitu jezičnu verziju. ASCII se koristi kao metoda koja svim računalima omogućuje razmjenu dokumenata i datoteka na istom jeziku.

ASCII je važan jer su računala dobila zajednički jezik kada su razvijena.

Godine 1963. ASCII je prvi put komercijalno korišten kao sedmo-bitni teleprinterski kod za mrežu TWX (Teletype Writer eXchange) tvrtke American Telephone & Telegraph. TWX je u početku koristio prethodni pet-bitni ITA2, koji je također koristio konkurentski teleprinterski sustav Telex. Bob Boehmer uveo je značajke kao što je sekvenca bijega. Prema Boehmeru, njegov britanski kolega Hugh MacGregor Ross pomogao je u popularizaciji rada - "toliko da je kôd koji je postao ASCII prvi put u Europi nazvan Boehmer-Ross Code." Zbog svog opsežnog rada na ASCII-ju, Boehmer je nazvan "ocem ASCII-ja".

Do prosinca 2007., kada je UTF-8 bio superiorniji, ASCII je bio najčešći način kodiranja znakova na World Wide Webu; UTF-8 je unatrag kompatibilan s ASCII.

UTF-8 (Unicode)

UTF-8 je kodiranje znakova koje može biti kompaktno kao ASCII, ali također može sadržavati bilo koje Unicode znakove (s nešto povećanom veličinom datoteke). UTF je Unicode format pretvorbe. "8" znači predstavljanje znaka korištenjem 8-bitnih blokova. Broj blokova koje znak mora predstavljati varira od 1 do 4. Jedna od stvarno lijepih značajki UTF-8 je da je kompatibilan s nizovima koji završavaju nultom. Kada je kodiran, nijedan znak neće imati nul(0) bajt.

Unicode i univerzalni skup znakova (UCS) ISO/IEC 10646 imaju mnogo širi raspon znakova, a njihovi različiti oblici kodiranja počeli su brzo zamjenjivati ​​ISO/IEC 8859 i ASCII u mnogim situacijama. Iako je ASCII ograničen na 128 znakova, Unicode i UCS podržavaju više znakova odvajanjem jedinstvenih identifikacijskih koncepata (koristeći prirodne brojeve koji se nazivaju kodnim točkama) i kodiranjem (do UTF-8, UTF-16 i UTF-32-bitnih binarnih formata). .

Razlika između ASCII i UTF-8

ASCII je uključen kao prvih 128 znakova u skup znakova Unicode (1991.), tako da 7-bitni ASCII znakovi u oba skupa imaju iste numeričke kodove. To omogućuje da UTF-8 bude kompatibilan sa 7-bitnim ASCII-jem, jer je UTF-8 datoteka sa samo ASCII znakovima identična ASCII datoteci s istim nizom znakova. Što je još važnije, osigurana je kompatibilnost naprijed jer softver koji prepoznaje samo 7-bitne ASCII znakove kao posebne i ne mijenja bajtove s najvišim postavljenim bitom (kao što se često radi za podršku 8-bitnim ASCII ekstenzijama kao što je ISO-8859 -1) , zadržat će UTF-8 podatke nepromijenjenima.

Aplikacije za prevođenje binarnog koda

Najčešća primjena ovog brojevnog sustava može se vidjeti u računalnoj tehnologiji. Uostalom, osnova svih računalnih jezika i programiranja je dvoznamenkasti brojevni sustav koji se koristi u digitalnom kodiranju.

To je ono što čini proces digitalnog kodiranja, uzimanje podataka i njihovo prikazivanje s ograničenim bitovima informacija. Ograničena informacija sastoji se od nula i jedinica binarnog sustava. Slike na zaslonu vašeg računala primjer su toga. Za kodiranje ovih slika za svaki piksel koristi se binarni niz.

Ako zaslon koristi 16-bitni kod, svakom pikselu će biti dane upute koju boju treba prikazati na temelju toga koji su bitovi 0 i 1. To rezultira s više od 65 000 boja predstavljenih s 2^16. Osim toga, naći ćete upotrebu binarnih brojevnih sustava u grani matematike poznatoj kao Booleova algebra.

Vrijednosti logike i istine pripadaju ovoj oblasti matematike. U ovoj aplikaciji izjavama se dodjeljuje 0 ili 1 ovisno o tome jesu li istinite ili lažne. Možete pokušati pretvoriti binarni u tekst, decimalni u binarni, binarni u decimalni ako tražite alat koji pomaže u ovoj aplikaciji.

Prednost binarnog brojevnog sustava

Binarni brojevni sustav koristan je za brojne stvari. Na primjer, računalo okreće prekidače za dodavanje brojeva. Možete potaknuti dodavanje računala dodavanjem binarnih brojeva u sustav. Trenutno postoje dva glavna razloga za korištenje ovog računalnog brojevnog sustava. Prvo, može osigurati pouzdanost sigurnosnog raspona. Sekundarno i najvažnije, pomaže minimizirati potrebne sklopove. Time se smanjuje potreban prostor, potrošnja energije i troškovi.

Možete kodirati ili prevesti binarne poruke napisane binarnim brojevima. Na primjer,

(01101001) (01101100011011110111011001100101) (011110010110111101110101) je dekodirana poruka. Kada kopirate i zalijepite ove brojeve u naš binarni prevoditelj, dobit ćete sljedeći tekst na engleskom:

Volim te

To znači

(01101001) (01101100011011110111011001100101) (011110010110111101110101) = Volim te

stolovi

binarni

heksadecimalni

Ova lekcija će pokriti temu „Kodiranje informacija. Binarno kodiranje. Mjerne jedinice informacija." Tijekom nje korisnici će moći steći razumijevanje kodiranja informacija, načina na koji računala percipiraju informacije, mjernih jedinica i binarnog kodiranja.

Predmet:Informacije oko nas

Lekcija: Kodiranje informacija. Binarno kodiranje. Jedinice informacija

Ova lekcija će pokriti sljedeća pitanja:

1. Kodiranje kao promjena oblika prezentiranja informacija.

2. Kako računalo prepoznaje informacije?

3. Kako mjeriti informacije?

4. Mjerne jedinice informacija.

U svijetu kodova

Zašto ljudi kodiraju informacije?

1. Sakrijte ga od drugih (ogledalo tajnog zapisa Leonarda da Vincija, vojno šifriranje).

2. Zapišite podatke ukratko (stenografski zapis, kratice, putokazi).

3. Za lakšu obradu i prijenos (Morseov kod, prevođenje u električne signale – strojne kodove).

Kodiranje je predstavljanje informacija pomoću nekog koda.

Kodirati je sustav simbola za predstavljanje informacija.

Metode kodiranja informacija

1. Grafika (vidi sliku 1) (koristeći crteže i znakove).

Riža. 1. Sustav signalnih zastava (izvor)

2. Numerički (pomoću brojeva).

Na primjer: 11001111 11100101.

3. Simbolički (upotrebom abecednih simbola).

Na primjer: NKMBM CHGYOU.

Dekodiranje - ovo je akcija vraćanja izvornog oblika prezentacije informacija. Za dekodiranje morate znati kod i pravila kodiranja.

Sredstvo za kodiranje i dekodiranje je tablica korespondencije kodova. Na primjer, korespondencija u različitim sustavima brojeva je 24 - XXIV, korespondencija abecede s bilo kojim simbolima (slika 2).


Riža. 2. Primjer šifre (Izvor)

Primjeri kodiranja informacija

Primjer kodiranja informacija je Morseov kod (vidi sliku 3).

Riža. 3. Morseov kod ()

Morseov kod koristi samo 2 simbola - točku i crticu (kratki i dugi zvuk).

Drugi primjer kodiranja informacija je abeceda zastavice (vidi sliku 4).

Riža. 4. Abeceda zastave ()

Drugi primjer je abeceda zastava (vidi sl. 5).

Riža. 5. ABC zastava ()

Dobro poznati primjer kodiranja je glazbena abeceda (vidi sliku 6).

Riža. 6. Glazbena abeceda ()

Razmotrite sljedeći problem:

Pomoću tablice abecede zastava (vidi sl. 7) potrebno je riješiti sljedeći problem:

Riža. 7

Stariji časnik Lom polaže ispit kapetanu Vrungelu. Pomozite mu da pročita sljedeći tekst (vidi sliku 8):

Oko nas postoje uglavnom dva signala, na primjer:

Semafor: crveno - zeleno;

Pitanje: da - ne;

Lampa: uključeno - isključeno;

Može se – ne može se;

Dobar loš;

Istina je laž;

Naprijed-nazad;

Da ne;

Sve su to signali koji pokazuju količinu informacija u 1 bitu.

1 bit - to je količina informacija koja nam omogućuje da odaberemo jednu opciju od dvije moguće.

Računalo je električni stroj koji radi na elektroničkim krugovima. Da bi računalo prepoznalo i razumjelo ulaznu informaciju, ona mora biti prevedena na računalni (strojni) jezik.

Algoritam namijenjen izvođaču mora biti napisan, odnosno kodiran, na računalu razumljivom jeziku.

To su električni signali: struja prolazi ili ne prolazi.

Strojni binarni jezik - niz od "0" i "1". Svaki binarni broj može biti 0 ili 1.

Svaka znamenka strojnog binarnog koda nosi količinu informacija jednaku 1 bitu.

Naziva se binarni broj koji predstavlja najmanju jedinicu informacije b to . Bit može imati vrijednost 0 ili 1. Prisutnost magnetskog ili elektroničkog signala u računalu znači 1, odsutnost 0.

Poziva se niz od 8 bita b TO . Računalo taj niz obrađuje kao zaseban znak (broj, slovo).

Pogledajmo primjer. Riječ ALICE sastoji se od 5 slova, od kojih je svako u računalnom jeziku predstavljeno jednim bajtom (vidi sliku 10). Stoga se Alisa može mjeriti kao 5 bajtova.

Riža. 10. Binarni kod (izvor)

Osim bitova i bajtova, postoje i druge jedinice informacija.

Bibliografija

1. Bosova L.L. Računalstvo i ICT: Udžbenik za 5. razred. - M.: BINOM. Laboratorij znanja, 2012. (monografija).

2. Bosova L.L. Informatika: Radna bilježnica za 5. razred. - M.: BINOM. Laboratorij znanja, 2010. (monografija).

3. Bosova L.L., Bosova A.Yu. Satovi informatike u 5.-6. razredu: Metodički priručnik. - M.: BINOM. Laboratorij znanja, 2010. (monografija).

2. Festival "Otvorena lekcija" ().

Domaća zadaća

1. §1.6, 1.7 (Bosova L.L. Informatika i ICT: Udžbenik za 5. razred).

2. Stranica 28, zadaci 1, 4; str. 30, zadaci 1, 4, 5, 6 (Bosova L.L. Informatika i IKT: Udžbenik za 5. razred).

Svi znaju da računala mogu izvoditi izračune na velikim skupinama podataka ogromnom brzinom. Ali ne znaju svi da te radnje ovise samo o dva uvjeta: postoji li struja ili ne i koliki je napon.

Kako računalo uspijeva obraditi tako raznolike informacije?
Tajna leži u binarnom brojevnom sustavu. Svi podaci ulaze u računalo, prikazani u obliku jedinica i nula, od kojih svaka odgovara jednom stanju električne žice: jedinice - visoki napon, nule - nizak ili jedinice - prisutnost napona, nule - njegova odsutnost. Pretvaranje podataka u nule i jedinice naziva se binarna konverzija, a njezino konačno označavanje naziva se binarni kod.
U decimalnom zapisu, koji se temelji na decimalnom brojevnom sustavu koji se koristi u svakodnevnom životu, brojčana vrijednost je predstavljena s deset znamenki od 0 do 9, a svako mjesto u broju ima deset puta veću vrijednost od mjesta desno od njega. Za predstavljanje broja većeg od devet u decimalnom sustavu, nula se stavlja na njegovo mjesto, a jedinica se postavlja na sljedeće, vrijednije mjesto s lijeve strane. Slično tome, u binarnom sustavu, koji koristi samo dvije znamenke - 0 i 1, svako mjesto je dvostruko vrijednije od mjesta desno od njega. Dakle, u binarnom kodu samo nula i jedan mogu biti predstavljeni kao pojedinačni brojevi, a svaki broj veći od jedan zahtijeva dva mjesta. Nakon nule i jedan, sljedeća tri binarna broja su 10 (čita se jedan-nula) i 11 (čita se jedan-jedan) i 100 (čita se jedan-nula-nula). 100 binarno je ekvivalentno 4 decimali. Gornja tablica s desne strane prikazuje druge BCD ekvivalente.
Bilo koji broj može se izraziti u binarnom obliku, samo zauzima više prostora nego u decimalnom. Abeceda se može pisati i u binarnom sustavu ako je svakom slovu dodijeljen određeni binarni broj.

Dvije brojke za četiri mjesta
16 kombinacija može se napraviti pomoću tamnih i svijetlih kuglica, kombinirajući ih u skupove od četiri. Ako se tamne kuglice uzmu kao nule, a svijetle kao jedinice, tada će se ispostaviti da je 16 skupova binarni kod od 16 jedinica, numerička vrijednost. što je od nula do pet (vidi gornju tablicu na stranici 27). Čak i s dvije vrste kuglica u binarnom sustavu, može se sastaviti beskonačan broj kombinacija jednostavnim povećanjem broja kuglica u svakoj grupi - ili broja mjesta u brojevima.

Bitovi i bajtovi

Najmanja jedinica u računalnoj obradi, bit je jedinica podataka koja može imati jedan od dva moguća uvjeta. Na primjer, svaka od jedinica i nula (desno) predstavlja 1 bit. Bit se može prikazati na druge načine: prisutnost ili odsutnost električne struje, rupa ili njezina odsutnost, smjer magnetizacije desno ili lijevo. Osam bitova čini bajt. 256 mogućih bajtova može predstavljati 256 znakova i simbola. Mnoga računala obrađuju jedan po jedan bajt podataka.

Binarna konverzija. Četveroznamenkasti binarni kod može predstavljati decimalne brojeve od 0 do 15.

Tablice kodova

Kada se binarni kod koristi za predstavljanje slova abecede ili interpunkcijskih znakova, potrebne su tablice kodova koje pokazuju koji kod odgovara kojem znaku. Sastavljeno je nekoliko takvih kodova. Većina računala konfigurirana je sa sedmeroznamenkastim kodom koji se zove ASCII ili američki standardni kod za razmjenu informacija. Tablica s desne strane prikazuje ASCII kodove za englesku abecedu. Ostali kodovi su za tisuće znakova i pisama drugih jezika svijeta.

Dio tablice ASCII kodova

Skup znakova kojima je napisan tekst naziva se abeceda.

Broj znakova u abecedi je njegov vlast.

Formula za određivanje količine informacija: N=2b,

gdje je N stepen abecede (broj znakova),

b – broj bitova (informacijska težina simbola).

Abeceda, kapaciteta 256 znakova, može primiti gotovo sve potrebne znakove. Ova se abeceda zove dostatan.

Jer 256 = 2 8, tada je težina 1 znaka 8 bita.

Mjerna jedinica 8 bita dobila je naziv 1 bajt:

1 bajt = 8 bita.

Binarni kod svakog znaka u tekstu računala zauzima 1 bajt memorije.

Kako su tekstualne informacije predstavljene u memoriji računala?

Pogodnost kodiranja znakova bajt po bajt je očita jer je bajt najmanji adresabilni dio memorije i, prema tome, procesor može pristupiti svakom znaku zasebno kada obrađuje tekst. S druge strane, 256 znakova sasvim je dovoljan broj za prikaz najrazličitijih simboličkih informacija.

Sada se postavlja pitanje koji osmobitni binarni kod dodijeliti svakom znaku.

Jasno je da je ovo uvjetna stvar; možete smisliti mnoge metode kodiranja.

Svi znakovi računalne abecede označeni su brojevima od 0 do 255. Svaki broj odgovara osmobitnom binarnom kodu od 00000000 do 11111111. Taj je kod jednostavno serijski broj znaka u binarnom brojevnom sustavu.

Tablica u kojoj su svi znakovi računalne abecede dodijeljeni serijski brojevi naziva se tablica kodiranja.

Različite vrste računala koriste različite tablice kodiranja.

Tablica je postala međunarodni standard za osobna računala ASCII(čitaj aski) (Američki standardni kod za razmjenu informacija).

Tablica ASCII kodova podijeljena je u dva dijela.

Samo prva polovica tablice je međunarodni standard, tj. simboli s brojevima iz 0 (00000000), do 127 (01111111).

Struktura tablice ASCII kodiranja

Serijski broj

Kodirati

Simbol

0 - 31

00000000 - 00011111

Simboli s brojevima od 0 do 31 obično se nazivaju kontrolnim simbolima.
Njihova je funkcija upravljanje procesom prikaza teksta na ekranu ili ispisa, oglašavanje zvučnog signala, označavanje teksta itd.

32 - 127

00100000 - 01111111

Standardni dio tablice (engleski). To uključuje mala i velika slova latinične abecede, decimalne brojeve, interpunkcijske znakove, sve vrste zagrada, reklamne i druge simbole.
Znak 32 je razmak, tj. prazno mjesto u tekstu.
Svi ostali se odražavaju u određenim znakovima.

128 - 255

10000000 - 11111111

Alternativni dio tablice (ruski).
Druga polovica tablice ASCII kodova, nazvana kodna stranica (128 kodova, počevši od 10000000 i završavajući s 11111111), može imati različite opcije, svaka opcija ima svoj broj.
Kodna stranica prvenstveno se koristi za prilagodbu nacionalnih pisama osim latinice. U ruskim nacionalnim kodovima, znakovi ruske abecede smješteni su u ovaj dio tablice.

Prva polovica tablice ASCII kodova


Imajte na umu da su u tablici kodiranja slova (velika i mala) poredana abecednim redom, a brojevi rastućim redoslijedom. Ovo poštivanje leksikografskog reda u rasporedu simbola naziva se načelo sekvencijalnog kodiranja abecede.

Za slova ruske abecede također se poštuje princip sekvencijalnog kodiranja.

Druga polovica tablice ASCII kodova


Nažalost, trenutno postoji pet različitih kodiranja ćirilice (KOI8-R, Windows. MS-DOS, Macintosh i ISO). Zbog toga se često javljaju problemi s prijenosom ruskog teksta s jednog računala na drugo, s jednog softverskog sustava na drugi.

Kronološki, jedan od prvih standarda za kodiranje ruskih slova na računalima bio je KOI8 ("Information Exchange Code, 8-bit"). Ovo kodiranje korišteno je još 70-ih na računalima serije računala ES, a od sredine 80-ih počelo se koristiti u prvim rusificiranim verzijama operativnog sustava UNIX.

Iz ranih 90-ih, vremena dominacije MS DOS operativnog sustava, ostalo je kodiranje CP866 ("CP" znači "Code Page", "kodna stranica").

Apple računala s operativnim sustavom Mac OS koriste vlastito Mac kodiranje.

Osim toga, Međunarodna organizacija za standarde (ISO) odobrila je još jedno kodiranje pod nazivom ISO 8859-5 kao standard za ruski jezik.

Najčešće kodiranje koje se trenutno koristi je Microsoft Windows, skraćeno CP1251.

Od kasnih 90-ih problem standardizacije kodiranja znakova riješen je uvođenjem novog međunarodnog standarda tzv. Unicode. Ovo je 16-bitno kodiranje, tj. dodjeljuje 2 bajta memorije za svaki znak. Naravno, ovo povećava količinu zauzete memorije za 2 puta. Ali takva kodna tablica dopušta uključivanje do 65536 znakova. Kompletna specifikacija Unicode standarda uključuje sve postojeće, izumrle i umjetno stvorene abecede svijeta, kao i mnoge matematičke, glazbene, kemijske i druge simbole.

Pokušajmo pomoću ASCII tablice zamisliti kako će riječi izgledati u memoriji računala.

Interni prikaz riječi u memoriji računala

Ponekad se dogodi da se tekst koji se sastoji od slova ruske abecede primljen s drugog računala ne može pročitati - na zaslonu monitora vidljiva je neka vrsta "abrakadabre". To se događa jer računala koriste različita kodiranja znakova za ruski jezik.



reci prijateljima
Pročitajte također