Typy kódovaných informácií používaných v počítači. Kódovanie informácií v počítači

Rovnaké informácie môžu byť prezentované v niekoľkých formách. Základné metódy kódovania to umožňujú v modernom svete. Po nástupe výpočtovej techniky bolo potrebné zakódovať akýkoľvek typ informácií, s ktorými človek pracuje. Ale riešenie problémov tohto typu začalo dávno pred príchodom počítačov.

Method Navigator

1 spôsob. Binárne kódovanie.

Binárne kódovanie je jednou z najpopulárnejších a najrozšírenejších metód prezentácie informácií. Pri práci s počítačmi, robotmi a obrábacími strojmi s numerickým riadením sa informácie najčastejšie kódujú vo forme slov v binárnej abecede.

zaujímavé: 10 spôsobov, ako vyčistiť disk C

2 spôsobom. Skratka.

Táto metóda sa označuje ako metódy kódovania textových informácií pomocou špeciálnych znakov. Tento spôsob je najrýchlejší pri zaznamenávaní ústneho prejavu. Zručnosti stenografie vlastnia len niektorí špeciálne vyškolení ľudia, ktorí dostali meno stenografi. Takíto ľudia majú čas zapísať si text v synchronizácii s rečou osoby, ktorá hovorí.

3 spôsob. Synchronizácia.

V procese práce s digitálnymi informáciami je synchronizácia mimoriadne dôležitá. V čase čítania alebo zápisu informácií je dôležité presne určiť čas každej zmeny znamienka. Ak nedôjde k synchronizácii, perióda zmeny znamienka nemusí byť určená správne. V dôsledku toho nevyhnutne dôjde k strate alebo poškodeniu údajov.

4 spôsobom. Obmedzená dĺžka behu - RLL.

K dnešnému dňu je jednou z najpopulárnejších metód kódovanie informácií s obmedzením dĺžky poľa záznamu. Vďaka tejto metóde možno na disk umiestniť jedenapolkrát viac údajov ako pri procese záznamu metódou MFM. Pomocou tejto metódy sa nekóduje jeden bit, ale celá skupina.

zaujímavé: 10 spôsobov, ako chrániť súbory pred krádežou

5 spôsobom. prevodné tabuľky.

Vyhľadávacia tabuľka je taká, ktorá obsahuje zoznam kódovaných znakov usporiadaných špeciálnym spôsobom. Podľa toho sa znak prevedie na svoj binárny kód a naopak.

6 spôsobom. maticová metóda.

Princíp maticového kódovania grafické obrázky spočíva v tom, že obrázok je rozdelený na daný počet stĺpcov a riadkov. Potom sa každý prvok výslednej mriežky zakóduje podľa zvoleného pravidla.

Teraz napíšte komentár!

Informácie sa dejú iný druh, napríklad:

Vôňa, chuť, zvuk;

Symboly a znaky.

V rôznych odvetviach vedy, kultúry a techniky boli vyvinuté špeciálne formy na zaznamenávanie informácií.

Kód je skupina symbolov, ktoré možno použiť na zobrazenie informácií.

Proces premeny správy na kombináciu znakov podľa kódu sa nazýva kódovanie.

Existuje tri hlavné metódy kódovania informácie:

  • Numerický spôsob- pomocou čísel.
  • Symbolickým spôsobom - informácie sú zakódované pomocou znakov rovnakej abecedy ako odchádzajúci text.
  • Grafický spôsob - informácie sú zakódované pomocou obrázkov alebo ikon.

Príklady kódovania informácií:

Ak chcete zobraziť zvuky ruskej abecedy, použite písmená(ABVGDEEG...EYUYA);

Použite na zobrazenie čísel čísla (0123456789);

Zvuky sa nahrávajú poznámky a ďalšie symbolov;

Nevidiaci používajú Braillovo písmo, kde písmeno pozostáva zo šiestich prvkov: dier a tuberkulóz.

Braillova abeceda

Treba mať na pamäti, že bez znalosti princípov kódovania informácií možno rovnaký kód chápať rôznymi spôsobmi, napríklad číslo 300522005 možno počítať ako číslo, telefónne číslo alebo populáciu.

Počítač zakóduje zadané informácie: text, obrázky a zvuky. V zakódovanej forme počítač spracováva, ukladá a odosiela informácie. Ak chcete zobraziť informácie z počítača vo forme čitateľnej pre ľudí, musia byť dekódovať .

Šifrovacie metódy sa zaoberajú špeciálnou vedou - kryptografia .

V počítači sa na zakódovanie akejkoľvek informácie používajú iba dva znaky: 0 a 1 , pretože počítačová technológia je jednoduchšie implementovať dva stavy:

0 - žiadny signál (bez napätia alebo prúdu);

1 - existuje signál (tečie napätie alebo prúd).

Tvorba kódu.

Jeden bit môže kódovať dva stavy: 0 a 1 (áno a nie, čiernobiely). Ak zvýšite počet bitov o jeden, získate dvakrát toľko kódov.

Príklad:

Dva bity vytvárajú 4 rôzne kódy: 00, 01, 10 a 11;

tri bity vytvárajú 8 rôznych kódov: 000, 001, 010, 011, 100, 101, 110 a 111.

Kódovanie rôznych druhov informácií

Kódovanie textu

Pri kódovaní textu je každému znaku priradená hodnota, napríklad sériové číslo.

Prvý populárny štandard kódovania počítačového textu je tzv ASCII(American Standard Code for Information Interchange), v ktorej sa na zakódovanie každého znaku používa 7 bitov.

128 znakov je možné zakódovať so 7 bitmi: veľké a malé latinské písmená, čísla, interpunkčné znamienka, ako aj špeciálne znaky, napríklad „§“.

Boli vytvorené rôzne verzie štandardu, ktoré doplnili kód na 8 bitov (256 znakov), aby bolo možné zakódovať národné znaky, napríklad lotyšské písmeno ā.

Ale 256 znakov nestačilo na zakódovanie všetkých znakov rôzne abecedy tak vytvorili nové štandardy. Jedným z najpopulárnejších v súčasnosti je UNICODE. V dôsledku toho sa ukáže, že každý znak je zakódovaný 2 bajtmi 62536 rôznych kódov.

Kódovanie obrazových údajov

Takmer všetky vytvorené a spracované obrázky uložené v počítači možno rozdeliť do dvoch skupín:

Rastrová grafika;

Vektorová grafika.

Akýkoľvek obrázok vytvorený v rastrovej grafike pozostáva z farebných bodiek. Tieto body sa nazývajú pixelov .

Na kódovanie nefarebné obrázky zvyčajne používať 256 odtieňov sivej v rozmedzí od bielej po čiernu. Ak chcete zakódovať všetky farby, 8 bitov(1 bajt).

Na kódovanie farebné obrázky bežne sa používajú tri farby: červená, zelená a modrá. Zmiešaním týchto troch farieb sa získa farebný tón.

Kódovanie zvuku

Zvuky pochádzajú z váhanie vzduchu. Zvuk má dva rozmery:

- amplitúda oscilácie, ktorý poukazuje na objem zvuk;

- frekvencia oscilácií, ktorý poukazuje na kľúč zvuk.

Zvuk je možné premeniť na elektrický signál napríklad pomocou mikrofónu.

Zvuk je kódovaný meraním veľkosti signálu po presnom časovom intervale a priradením binárnej hodnoty. Čím častejšie sa tieto merania vykonávajú, tým lepšia kvalita zvuk.

Príklad:

Na jedno CD s kapacitou 700 MB sa zmestí 80 minút zvuku v CD kvalite.

Kódovanie videa

Film sa skladá zo snímok, ktoré sa rýchlo menia. Zakódovaný film obsahuje informácie o veľkosti snímky, použitých farbách a počte snímok za sekundu (zvyčajne 30), ako aj o spôsobe záznamu zvuku – každá snímka samostatne alebo celý film naraz.

Vo svete prebieha neustála výmena informačných tokov. Ľudia môžu byť zdrojom technické zariadenia, rôzne veci, predmety neživej a živej prírody. Jeden alebo viac objektov môže prijímať informácie.

Pre lepšiu výmenu dát sú informácie súčasne kódované a spracovávané na strane vysielača (dáta sú pripravované a konvertované do formy vhodnej na vysielanie, spracovanie a ukladanie), preposielanie a dekódovanie prebieha na strane prijímača (konverzia kódovaných dát na pôvodné formulár). Toto sú vzájomne prepojené úlohy: zdroj a prijímač musia mať podobné algoritmy spracovania informácií, inak bude proces kódovania a dekódovania nemožný. Kódovanie a spracovanie grafických a multimediálnych informácií sa spravidla realizuje na báze výpočtovej techniky.

Kódovanie informácií v počítači

Existuje mnoho spôsobov, ako spracovať údaje (texty, čísla, grafiku, video, zvuk) pomocou počítača. Všetky informácie spracovávané počítačom sú reprezentované v binárnom kóde - pomocou čísel 1 a 0, nazývaných bity. Technicky je táto metóda implementovaná veľmi jednoducho: 1 - elektrický signál je prítomný, 0 - chýba. Z ľudského hľadiska sú takéto kódy nepohodlné pre vnímanie – dlhé reťazce núl a jednotiek, ktoré sú zakódovanými znakmi, je veľmi ťažké okamžite rozlúštiť. Ale takýto formát záznamu okamžite jasne ukazuje, čo je kódovanie informácií. Napríklad číslo 8 v binárnom osemcifernom tvare vyzerá ako nasledujúca postupnosť bitov: 000001000. Čo je však pre človeka ťažké, pre počítač je jednoduché. Pre elektroniku je jednoduchšie spracovať veľa jednoduchých prvkov ako malý počet zložitých.

Kódovanie textu

Keď stlačíme tlačidlo na klávesnici, počítač dostane špecifický kód pre stlačené tlačidlo a vyhľadá ho v štandardnej tabuľke ASCII znaky(americký kód pre výmenu informácií), „rozumie“, ktoré tlačidlo je stlačené a odovzdá tento kód na ďalšie spracovanie (napríklad na zobrazenie znaku na monitore). Na uloženie znakového kódu v binárnej forme sa používa 8 bitov, takže maximálny počet kombinácií je 256. Prvých 128 znakov sa používa pre riadiace znaky, čísla a latinské písmená. Druhá polovica je určená pre národné symboly a pseudografiku.

Kódovanie textu

Na príklade bude ľahšie pochopiť, čo je kódovanie informácií. Zvážte kódy anglického znaku "C" a ruského písmena "C". Upozorňujeme, že znaky sú veľké a ich kódy sa líšia od malých. Anglický znak bude vyzerať ako 01000010 a ruský ako 11010001. To, čo sa človeku na obrazovke monitora zdá rovnaké, počítač vníma úplne inak. Je potrebné dbať aj na to, že kódy prvých 128 znakov zostávajú nezmenené a od 129 a ďalej môžu jednému binárnemu kódu zodpovedať rôzne písmená v závislosti od použitej kódovej tabuľky. Napríklad desiatkový kód 194 môže zodpovedať písmenu „b“ v KOI8, „B“ v CP1251, „T“ v ISO a v kódovaní CP866 a Mac tomuto kódu nezodpovedá vôbec ani jeden znak. Keď teda pri otváraní textu namiesto ruských slov vidíme písmeno-symbol abrakadabra, znamená to, že takéto kódovanie informácií nám nevyhovuje a musíme zvoliť iný prevodník znakov.

Kódovanie čísel

V dvojkovej sústave sa berú len dva varianty hodnoty - 0 a 1. Všetky základné operácie s binárnymi číslami využíva veda nazývaná binárna aritmetika. Tieto akcie majú svoje vlastné charakteristiky. Vezmite si napríklad číslo 45 napísané na klávesnici. Každá číslica má svoj vlastný osemmiestny kód v tabuľke kódov ASCII, takže číslo zaberá dva bajty (16 bitov): 5 - 01010011, 4 - 01000011 . Aby bolo možné toto číslo použiť vo výpočtoch, je preložené špeciálnymi algoritmami do binárny systém počet v tvare osemmiestneho binárneho čísla: 45 - 00101101.

V 50. rokoch 20. storočia počítače, ktoré sa najčastejšie používali na vedecké a vojenské účely, ako prvé implementovali grafické zobrazovanie údajov. Dnes je vizualizácia informácií prijímaných z počítača bežným a známym javom pre každého človeka av tých časoch znamenala mimoriadnu revolúciu v práci s technológiami. Možno zapôsobil vplyv ľudskej psychiky: vizuálne podané informácie sa lepšie vstrebávajú a vnímajú. Veľký prelom vo vývoji vizualizácie dát nastal v 80-tych rokoch, keď sa výrazne rozvinulo kódovanie a spracovanie grafických informácií.

Analógové a diskrétne grafické znázornenie

Kódovanie zvuku

Kódovanie multimediálnych informácií spočíva v konverzii analógového charakteru zvuku na diskrétny pre pohodlnejšie spracovanie. ADC prijíma na vstupe meranie svojej amplitúdy v určitých časových intervaloch a vydáva digitálnu sekvenciu s údajmi o zmenách amplitúdy na výstupe. žiadne fyzické premeny nedeje sa.

Výstupný signál je diskrétny, preto čím častejšie je frekvencia merania amplitúdy (vzorka), tým presnejšie výstupný signál zodpovedá vstupnému signálu, tým lepšie je kódovanie a spracovanie multimediálnych informácií. Vzorka sa tiež bežne označuje ako usporiadaná sekvencia digitálnych dát prijatých cez ADC. Samotný proces sa nazýva vzorkovanie, v ruštine - diskretizácia.


K spätnej konverzii dochádza pomocou DAC: na základe digitálnych údajov vstupujúcich na vstup sa v určitých časových okamihoch generuje elektrický signál s požadovanou amplitúdou.

Vzorové možnosti

Hlavnými parametrami vzorkovania sú nielen frekvencia merania, ale aj bitová hĺbka – presnosť merania zmeny amplitúdy pre každú vzorku. Čím presnejšie sa počas digitalizácie prenáša hodnota amplitúdy signálu v každej jednotke času, čím vyššia je kvalita signálu po ADC, tým vyššia je spoľahlivosť obnovy vlny pri inverznej konverzii.

Kódovanie textových informácií v počítači je niekedy nevyhnutnou podmienkou pre správnu činnosť zariadenia alebo zobrazenie konkrétneho fragmentu. Ako sa tento proces vyskytuje počas práce počítača s textovými a vizuálnymi informáciami, zvukom - to všetko analyzujeme v tomto článku.

Úvod

Elektronické Počítací stroj(ktorý v bežnom živote nazývame počítač) vníma text veľmi špecifickým spôsobom. Pre ňu je kódovanie textovej informácie veľmi dôležité, keďže každý textový fragment vníma ako skupinu navzájom izolovaných postáv.

Aké sú symboly?

Úlohou symbolov pre počítač nie sú len ruské, anglické a iné písmená, ale aj interpunkčné znamienka, ako aj iné znaky. Aj priestor, ktorým oddeľujeme slová pri písaní na počítači, zariadenie vníma ako symbol. Niečo, čo veľmi pripomína vyššiu matematiku, pretože tam má nula podľa mnohých profesorov dvojaký význam: je to číslo a zároveň nič neznamená. Aj pre filozofov sa môže stať otázka priestoru v texte aktuálny problém. Vtip, samozrejme, ale ako sa hovorí, v každom vtipe je niečo pravdy.

Aké sú informácie?

Aby bolo možné vnímať informácie, počítač musí začať spracovávať procesy. A aké informácie tam sú? Témou tohto článku je kódovanie textových informácií. Tejto úlohe budeme venovať osobitnú pozornosť, ale budeme sa venovať aj iným mikrotémam.

Informácie môžu byť textové, číselné, zvukové, grafické. Počítač musí spustiť procesy, ktoré poskytujú kódovanie textových informácií, aby sa napríklad zobrazilo, čo píšeme na klávesnici. Uvidíme symboly a písmená, to je pochopiteľné. Ale čo vidí auto? Absolútne všetky informácie – a teraz hovoríme nielen o texte – vníma ako určitú postupnosť núl a jednotiek. Tvoria základ takzvaného binárneho kódu. Preto sa proces, ktorý prevádza informácie prijaté zariadením na zrozumiteľné, nazýva „binárne kódovanie textových informácií“.

Stručný princíp binárneho kódu

Prečo je kódovanie informácií v binárnom kóde najrozšírenejšie v elektronických strojoch? Základom textu, ktorý je zakódovaný pomocou núl a jednotiek, môže byť absolútne ľubovoľná postupnosť znakov a znakov. Toto však nie je jediná výhoda, ktorú binárne textové kódovanie informácií má. Ide o to, že princíp, na ktorom je táto metóda kódovania usporiadaná, je veľmi jednoduchý, ale zároveň celkom funkčný. Keď dôjde k elektrickému impulzu, je označený (samozrejme podmienečne) jednotkou. Žiadny impulz - označte nulu. To znamená, že textové kódovanie informácií je založené na princípe konštrukcie sekvencie elektrických impulzov. Logická postupnosť zložená z binárnych znakov sa nazýva strojový jazyk. Kódovanie a spracovanie textových informácií pomocou binárneho kódu zároveň umožňuje vykonávať operácie v pomerne krátkom čase.

Bity a bajty

Obrázok vnímaný strojom obsahuje určité množstvo informácií. Je rovný jednému bitu. To platí pre každú jednu a každú nulu, ktoré tvoria jednu alebo druhú sekvenciu šifrovaných informácií.

V súlade s tým môže byť množstvo informácií v každom prípade určené jednoducho poznaním počtu znakov v sekvencii binárneho kódu. Budú sa navzájom numericky rovnať. 2 číslice v kóde nesú informáciu 2 bity, 10 číslic - 10 bitov atď. Princíp určovania objemu informácií, ktorý leží v konkrétnom fragmente binárneho kódu, je pomerne jednoduchý, ako vidíte.

Kódovanie textových informácií v počítači

Práve teraz čítate článok, ktorý pozostáva, ako veríme, zo sekvencie písmen ruskej abecedy. A počítač, ako už bolo spomenuté, vníma všetky informácie (a aj v tomto prípade) ako sekvenciu nie písmen, ale núl a jednotiek, ktoré označujú neprítomnosť a prítomnosť elektrického impulzu.

Ide o to, že jeden znak, ktorý vidíme na obrazovke, možno zakódovať pomocou konvenčnej mernej jednotky nazývanej bajt. Ako je napísané vyššie, binárny kód má takzvanú informačnú záťaž. Pripomeňme, že číselne sa rovná celkovému počtu núl a jednotiek vo vybranom fragmente kódu. Takže 8 bitov tvorí 1 bajt. V tomto prípade môžu byť kombinácie signálov veľmi odlišné, ako môžete ľahko vidieť nakreslením obdĺžnika na papier, ktorý pozostáva z 8 buniek rovnakej veľkosti.

Ukazuje sa, že je možné kódovať textové informácie pomocou abecedy, ktorá má kapacitu 256 znakov. Aká je pointa? Význam spočíva v tom, že každý znak bude mať svoj vlastný binárny kód. Kombinácie „pripojené“ k určitým znakom začínajú od 00000000 a končia 11111111. Ak prepnete z binárneho na desiatkový číselný systém, potom môžete v takomto systéme kódovať informácie od 0 do 255.

Nezabudnite, že teraz existujú rôzne tabuľky, ktoré používajú kódovanie písmen ruskej abecedy. Ide napríklad o ISO a KOI-8, Mac a CP v dvoch variáciách: 1251 a 866. Dá sa ľahko uistiť, že text zakódovaný v jednej z týchto tabuliek sa v inom kódovaní nezobrazí správne. Deje sa tak v dôsledku skutočnosti, že v rôzne tabuľky rôzne symboly zodpovedajú rovnakému binárnemu kódu.

Toto bol spočiatku problém. V súčasnosti sú však už v programoch zabudované špeciálne algoritmy, ktoré konvertujú text a privedú ho do správnej formy. Rok 1997 sa niesol v znamení vytvorenia kódovania s názvom Unicode. V ňom má každá postava k dispozícii 2 bajty naraz. To vám umožní zakódovať text, ktorý má oveľa väčší počet znakov. 256 a 65536: je v tom rozdiel?

Kódovanie grafiky

Kódovanie textových a grafických informácií má určité podobnosti. Ako viete, na zobrazenie grafických informácií sa používa periférne zariadenie počítač s názvom monitor. Teraz grafika (teraz hovoríme o počítačová grafika) sa široko používa v rôznych oblastiach. Dobré, možnosti hardvéru osobné počítače umožňujú riešiť pomerne zložité grafické problémy.

Bolo možné spracovať video informácie v posledné roky. Text je však zároveň oveľa „ľahší“ ako grafika, čo je v zásade pochopiteľné. Z tohto dôvodu sa musí zväčšiť konečná veľkosť grafických súborov. Takéto problémy je možné prekonať poznaním podstaty, v ktorej sú grafické informácie prezentované.

Poďme najprv pochopiť, do akých skupín sa tento typ informácií delí. Po prvé, je to raster. Po druhé, vektor.

Rastrové obrázky sú dosť podobné kockovanému papieru. Každá bunka na takomto papieri je natretá jednou alebo druhou farbou. Tento princíp trochu pripomína mozaiku. To znamená, že sa ukazuje, že v rastrovej grafike je obrázok rozdelený na samostatné elementárne časti. Nazývajú sa pixely. V preklade do ruštiny znamenajú pixely „bodky“. Logicky sú pixely zoradené relatívne k riadkom. Grafická mriežka pozostáva len z určitého počtu pixelov. Nazýva sa aj raster. S ohľadom na tieto dve definície to môžeme povedať bitová mapa nie je nič iné ako množina pixelov, ktoré sú zobrazené na obdĺžnikovej mriežke.

Raster monitora a veľkosť pixelov ovplyvňujú kvalitu obrazu. Bude to tým vyššie, čím väčší bude raster monitora. Veľkosti rastrov sú rozlíšenie obrazovky, o ktorom už pravdepodobne počul každý používateľ. Jednou z najdôležitejších vlastností počítačových obrazoviek je rozlíšenie, nielen rozlíšenie. Ukazuje, koľko pixelov je v jednej alebo druhej jednotke dĺžky. Rozlíšenie monitora sa zvyčajne meria v pixeloch na palec. Čím viac pixelov na jednotku dĺžky, tým vyššia bude kvalita, pretože „zrnitosť“ sa zníži.

Spracovanie audio streamu

Kódovanie textových a zvukových informácií, podobne ako iné typy kódovania, má určité zvláštnosti. Teraz sa zameriame na posledný proces: kódovanie zvukových informácií.

Prezentáciu audio streamu (ako aj jedného zvuku) je možné vykonať dvoma spôsobmi.

Analógová forma zvukovej informačnej prezentácie

V tomto prípade môže hodnota nadobudnúť naozaj obrovské množstvo rôznych hodnôt. Navyše tieto rovnaké hodnoty nezostávajú konštantné: menia sa veľmi rýchlo a tento proces je nepretržitý.

Diskrétna forma zobrazenia zvukových informácií

Ak hovoríme o diskrétnej metóde, potom v tomto prípade môže mať hodnota len obmedzený počet hodnôt. V tomto prípade k zmene dochádza míľovými krokmi. Je možné diskrétne kódovať nielen zvuk, ale aj grafické informácie. Mimochodom, pokiaľ ide o analógovú formu.

Analógové audio informácie sú uložené na vinylové platne, napríklad. Ale CD je už diskrétny spôsob prezentácie informácií zvukovej povahy.

Na úplnom začiatku sme hovorili o tom, že počítač vníma všetky informácie v strojovom jazyku. Na tento účel sú informácie zakódované vo forme sekvencie elektrických impulzov - núl a jednotiek. Kódovanie zvuku nie je výnimkou z tohto pravidla. Ak chcete spracovať zvuk v počítači, musíte ho najskôr zmeniť na rovnakú sekvenciu. Až potom je možné vykonávať operácie na streame alebo jednom zvuku.

Keď nastane proces kódovania, prúd sa podrobí dočasnému vzorkovaniu. Zvuková vlna je nepretržitá, vyvíja sa v malých úsekoch času. V tomto prípade sa hodnota amplitúdy nastavuje pre každý konkrétny interval samostatne.

Záver

Čo sme teda zistili v priebehu tohto článku? Po prvé, úplne všetky informácie, ktoré sa zobrazujú na monitore počítača, predtým, ako sa tam objavia, sú zakódované. Po druhé, toto kódovanie spočíva v preklade informácií do strojového jazyka. Po tretie, strojový jazyk nie je nič iné ako sled elektrických impulzov – núl a jednotiek. Po štvrté, existujú samostatné tabuľky na kódovanie rôznych znakov. A po piate, predstaviť grafiku a zvuková informácia možné v analógovom a diskrétna forma. Tu sú možno hlavné body, ktoré sme analyzovali. Jedna z disciplín, ktoré študujú danej oblasti, je informatika. Kódovanie textových informácií a jeho základy sa vysvetľujú v škole, keďže na tom nie je nič zložité.

Moderný počítač dokáže spracovať numerické, textové, grafické, zvukové a obrazové informácie. Všetky tieto typy informácií v počítači sú prezentované v binárnom kóde, to znamená, že sa používa abeceda s kapacitou dvoch znakov (0 a 1). Je to spôsobené tým, že je vhodné reprezentovať informácie vo forme sekvencie elektrických impulzov: neexistuje impulz (0), existuje impulz (1). Takéto kódovanie sa zvyčajne nazýva binárne a samotné logické postupnosti núl a jednotiek sa nazývajú strojový jazyk.

Každá číslica strojového binárneho kódu nesie množstvo informácie rovné jednému bitu.

Tento záver možno vyvodiť tak, že sa čísla strojovej abecedy budú považovať za rovnako pravdepodobné udalosti. Pri zápise binárnej číslice je možné realizovať výber len jedného z dvoch možných stavov, čo znamená, že nesie množstvo informácie rovné 1 bitu. Preto dve číslice nesú informáciu 2 bity, štyri číslice - 4 bity atď. Na určenie množstva informácie v bitoch stačí určiť počet číslic v binárnom strojovom kóde.

Kódovanie textových informácií

V súčasnosti väčšina používateľov používa počítač na spracovanie textových informácií, ktoré pozostávajú zo znakov: písmen, číslic, interpunkčných znamienok atď.

Na základe jednej bunky s informačnou kapacitou 1 bit možno zakódovať iba 2 rôzne stavy. Aby každý znak, ktorý je možné zadať z klávesnice v prípade latinky, získal svoj vlastný jedinečný binárny kód, je potrebných 7 bitov. Na základe sekvencie 7 bitov v súlade s Hartleyho vzorcom možno získať N=2 7 = 128 rôznych kombinácií núl a jednotiek, t.j. binárne kódy. Tým, že každému znaku priradíme jeho binárny kód, dostaneme kódovaciu tabuľku. Človek pracuje so symbolmi, počítač so svojimi binárnymi kódmi.

Pre latinské rozloženie klávesnice existuje len jedna takáto kódovacia tabuľka pre celý svet, takže text napísaný pomocou latinského rozloženia sa adekvátne zobrazí na akomkoľvek počítači. Táto tabuľka sa nazýva ASCII (American Standard Code of Information Interchange) v angličtine sa vyslovuje [eski], v ruštine sa vyslovuje [aski]. Nižšie je uvedená celá ASCII tabuľka, ktorej kódy sú uvedené v desatinnej forme. Dá sa použiť na určenie, že keď zadáte povedzme symbol „*“ z klávesnice, počítač ho vníma ako kód 42(10), následne 42(10)=101010(2) – toto je binárne číslo kód symbolu „*“. Kódy 0 až 31 sa v tejto tabuľke nepoužívajú.

Tabuľka znakov ASCII

Na zakódovanie jedného znaku sa použije množstvo informácií rovnajúce sa 1 bajtu, t.j. I \u003d 1 bajt \u003d 8 bitov. Pomocou vzorca, ktorý spája počet možných udalostí K a množstvo informácií I, môžete vypočítať, koľko rôznych znakov je možné zakódovať (za predpokladu, že znaky sú možné udalosti):

K \u003d 2 I \u003d 2 8 \u003d 256,

t.j. na reprezentáciu textových informácií možno použiť abecedu s kapacitou 256 znakov.

Podstatou kódovania je, že každému znaku je priradený binárny kód od 00000000 do 11111111 alebo zodpovedajúci desiatkový kód od 0 do 255.

Treba mať na pamäti, že v súčasnosti Na kódovanie ruských písmen sa používa päť rôznych kódových tabuliek(KOI - 8, СР1251, СР866, Mac, ISO), navyše texty zakódované pomocou jednej tabuľky sa nebudú správne zobrazovať v inom kódovaní. Vizuálne to možno znázorniť ako fragment kombinovanej tabuľky kódovania znakov.

K rovnakému binárnemu kódu sú priradené rôzne symboly.

binárny kód

Desatinný kód

O prekódovanie textových dokumentov sa však vo väčšine prípadov nestará používateľ, ale špeciálne programy- prevodníky, ktoré sú zabudované do aplikácií.

Od roku 1997 najnovšie verzie Microsoft Office podporovať nové kódovanie. Volá sa Unicode. Unicode je kódovacia tabuľka, ktorá používa 2 bajty na zakódovanie každého znaku, t.j. 16 bitov Na základe takejto tabuľky možno zakódovať N=216=65 536 symbolov.

Unicode zahŕňa takmer všetky moderné písma vrátane: arabčiny, arménčiny, bengálčiny, barmčiny, gréčtiny, gruzínčiny, devanagari, hebrejčiny, cyriliky, koptčiny, khmérčiny, latinky, tamilčiny, hangul, han (Čína, Japonsko, Kórea), čerokíjčiny, etiópčiny, Japonci (katakana, hiragana, kanji) a iné.

Na akademické účely bolo pridaných mnoho historických písiem vrátane: starovekej gréčtiny, egyptských hieroglyfov, klinového písma, mayského písma, etruskej abecedy.

Unicode poskytuje širokú škálu matematických a hudobných symbolov, ako aj piktogramov.

V Unicode existujú dva rozsahy kódov pre znaky cyriliky:

Cyrilika (#0400 – #04FF)

Doplnok cyriliky (#0500 - #052F).

Zavedenie tabuľky Unicode v jej čistej forme je však obmedzené skutočnosťou, že ak kód jedného znaku nezaberá jeden bajt, ale dva bajty, na uloženie textu bude trvať dvakrát toľko miesta na disku a dvakrát toľko času. prenášať ho prostredníctvom komunikačných kanálov.

Preto je teraz v praxi bežnejšia reprezentácia Unicode UTF-8 (Unicode Transformation Format). UTF-8 poskytuje najlepšiu kompatibilitu so systémami používajúcimi 8-bitové znaky. Text pozostávajúci iba zo znakov menej ako 128 sa pri napísaní v UTF-8 skonvertuje na obyčajný text ASCII. Zostávajúce znaky Unicode sú reprezentované sekvenciami s dĺžkou 2 až 4 bajty. Vo všeobecnosti, keďže najbežnejšie znaky na svete - latinské znaky - v UTF-8 stále zaberajú 1 bajt, toto kódovanie je ekonomickejšie ako čistý Unicode.

Na určenie číselného znakového kódu môžete použiť tabuľku kódov. Ak to chcete urobiť, vyberte v ponuke položku "Vložiť" - "Symbol", po ktorej sa na obrazovke zobrazí dialógové okno Symbol. V dialógovom okne sa zobrazí tabuľka znakov pre vybraté písmo. Znaky v tejto tabuľke sú usporiadané po riadkoch, postupne zľava doprava, počnúc znakom Medzerník.



Načítava...
Hore