A számítógépben használt kódolási információk típusai. Információk kódolása számítógépben

Ugyanaz az információ többféle formában is bemutatható. Az alapvető kódolási módszerek lehetővé teszik ezt a modern világban. A számítástechnika megjelenése után szükségessé vált bármilyen típusú információ kódolása, amellyel az ember dolgozik. De az ilyen típusú problémák megoldása jóval a számítógépek megjelenése előtt kezdődött.

Method Navigator

1 út. Bináris kódolás.

A bináris kódolás az információ megjelenítésének egyik legnépszerűbb és legelterjedtebb módja. Számítógépekkel, robotokkal és numerikus vezérlésű szerszámgépekkel végzett munka során az információkat leggyakrabban bináris ábécé szavak formájában kódolják.

Érdekes: 10 módszer a C-meghajtó tisztítására

2 út. Gyorsírás.

Ezt a módszert a szöveges információk speciális karakterekkel történő kódolásának módszereiként említik. Ez a módszer a leggyorsabb a szóbeli beszéd rögzítésekor. A gyorsírási ismeretek csak néhány speciálisan képzett ember birtokában vannak, akik a gyorsíró nevet kapták. Az ilyen embereknek van idejük leírni a szöveget a beszélő beszédével szinkronban.

3 út. Szinkronizálás.

A digitális információkkal való munka során a szinkronizálás különösen fontos. Az információk olvasásakor vagy írásakor fontos pontosan meghatározni az egyes jelváltások időpontját. Ha nincs szinkronizálás, akkor előfordulhat, hogy az előjelváltási periódus nincs megfelelően meghatározva. Ennek eredményeként elkerülhetetlenül adatvesztés vagy korrupció következik be.

4 irányú. Futás hossza korlátozott – RLL.

A mai napig az egyik legnépszerűbb módszer az információk kódolása a rekordmező hosszának korlátozásával. Ennek a módszernek köszönhetően másfélszer több adat helyezhető el a lemezen, mint az MFM módszerrel történő rögzítés során. Ezzel a módszerrel nem egy bitet kódolunk, hanem egy egész csoportot.

Érdekes: 10 módszer a fájlok lopás elleni védelmére

5 út. konverziós táblázatok.

A keresési táblázat olyan kódolt karakterek listáját tartalmazza, amelyek speciális módon vannak rendezve. Ennek megfelelően a karakter bináris kódjára konvertálódik, és fordítva.

6 irányú. mátrix módszer.

Mátrix kódolási elv grafikus képek abból áll, hogy a kép adott számú oszlopra és sorra van felosztva. Ezt követően a kapott rács minden eleme kódolásra kerül a kiválasztott szabály szerint.

Most írj egy megjegyzést!

Megtörténik az információ másfajta, Például:

Illat, íz, hang;

Szimbólumok és jelek.

A tudomány, a kultúra és a technika különböző ágaiban speciális formákat fejlesztettek ki az információk rögzítésére.

Kód szimbólumok csoportja, amely információk megjelenítésére használható.

Az üzenet kód szerinti karakterkombinációvá alakításának folyamatát hívják kódolás.

Létezik három fő kódolási módszer információ:

Numerikus módon- számok használatával.
Szimbolikus módon - az információ kódolása a kimenő szöveggel azonos ábécé karaktereivel történik.
Grafikus mód - az információk képek vagy ikonok segítségével vannak kódolva.

Példák az információ kódolására:

Az orosz ábécé hangjainak megjelenítéséhez használja a leveleket(ABVGDEEG…EYUYA);

Számok megjelenítésére szolgál számok (0123456789);

A hangokat rögzítik jegyzetekés mások szimbólumok;

A vakok használnak Braille, ahol a betű hat elemből áll: lyukakból és gumókból.

Braille ábécé

Nem szabad megfeledkezni arról, hogy az információ kódolási elveinek ismerete nélkül ugyanaz a kód többféleképpen is értelmezhető, például a 300522005 szám számként, telefonszámként vagy populációként számolható.

A számítógép kódolja a bevitt információkat: szöveget, képeket és hangokat. Kódolt formában a számítógép feldolgozza, tárolja és küldi az információkat. Ahhoz, hogy a számítógépről származó információkat ember által olvasható formában jelenítse meg, annak ilyennek kell lennie dekódolni .

A titkosítási módszerek egy speciális tudományt folytatnak - kriptográfia .

Egy számítógépben csak két karakter használható bármilyen információ kódolására: 0 És 1 , mert számítógépes technológia két állapotot könnyebb megvalósítani:

0 - nincs jel (nincs feszültség vagy áram);

1 - van jel (feszültség vagy áram folyik).

Kód létrehozása.

Egy bit két állapotot kódolhat: 0 és 1 (igen és nem, fekete-fehér). Ha eggyel növeli a bitek számát, akkor kétszer annyi kódot kap.

Példa:

Két bit 4 különböző kódot hoz létre: 00, 01, 10 és 11;

három bit 8 különböző kódot hoz létre: 000, 001, 010, 011, 100, 101, 110 és 111.

Különféle információk kódolása

Szövegkódolás

Szöveg kódolásakor minden karakterhez hozzárendelnek egy értéket, például egy sorozatszámot.

Az első népszerű számítógépes szövegkódolási szabvány az ún ASCII(American Standard Code for Information Interchange), amelyben 7 bitet használnak az egyes karakterek kódolására.

128 karakter kódolható 7 bittel: nagy és kis latin betűk, számok, írásjelek, valamint speciális karakterek, például "§".

A szabvány különböző változatai készültek, kiegészítve a kódot 8 bitesre (256 karakter), így a nemzeti karakterek, például a lett ā betű kódolhatók.

De 256 karakter nem volt elég a különböző ábécék összes karakterének kódolásához, ezért új szabványokat alkottak. Manapság az egyik legnépszerűbb az UNICODE. Amelyben minden karakter 2 bájttal van kódolva, ennek eredményeként kiderül 62536 különböző kód.

Képadatok kódolása

A számítógépen tárolt szinte minden létrehozott és feldolgozott kép két csoportra osztható:

Raszteres grafika;

vektoros grafika.

Bármely rasztergrafikával készített kép színes pontokból áll. Ezeket a pontokat ún pixel .

A kódoláshoz nem színes képekáltalában használnak 256 szürke árnyalat fehértől feketéig terjed. Az összes szín kódolásához 8 bites(1 bájt).

A kódoláshoz színes képek három színt használnak általában: piros, zöld és kék. E három szín keverésével színtónust kapunk.

Hangkódolás

A hangok innen származnak habozás levegő. A hangnak két dimenziója van:

- oszcillációs amplitúdó, ami arra mutat hangerő hang;

- oszcillációs frekvencia, ami arra mutat kulcs hang.

A hang elektromos jellé alakítható, például mikrofon segítségével.

A hang kódolása úgy történik, hogy egy pontos időintervallum után megmérik a jel méretét, és bináris értéket rendelnek hozzá. Minél gyakrabban végzik ezeket a méréseket, az jobb minőség hang.

Példa:

Egy 700 MB kapacitású CD-n 80 percnyi CD-minőségű hang tárolható.

Videó kódolás

A film gyorsan változó képkockákból áll. A kódolt film információkat tartalmaz a képkocka méretéről, a használt színekről és a másodpercenkénti képkockák számáról (általában 30), valamint a hangrögzítés módjáról – minden képkockát külön-külön vagy a teljes filmet egyszerre.

A világban folyamatos információcsere folyik. Az emberek lehetnek források technikai eszközök, különféle tárgyak, élettelen és élő természeti tárgyak. Egy vagy több objektum információt fogadhat.

A jobb adatcsere érdekében az információt egyidejűleg kódolják és dolgozzák fel az adó oldalon (az adatok előkészítése és továbbításra, feldolgozásra és tárolásra alkalmas formába történő konvertálása), a vevő oldalon a továbbítás és a dekódolás (kódolt adatok átalakítása az eredetire) forma). Ezek egymással összefüggő feladatok: a forrásnak és a vevőnek hasonló információfeldolgozó algoritmusokkal kell rendelkeznie, különben a kódolás-dekódolás folyamata lehetetlenné válik. A grafikus és multimédiás információk kódolása és feldolgozása általában számítástechnikai alapon valósul meg.

Információk kódolása számítógépen

Az adatok (szöveg, szám, grafika, videó, hang) számítógéppel történő feldolgozásának számos módja van. A számítógép által feldolgozott összes információ bináris kódban van ábrázolva - az 1-es és 0-s számokkal, amelyeket biteknek nevezünk. Technikailag ezt a módszert nagyon egyszerűen hajtják végre: 1 - az elektromos jel jelen van, 0 - nincs jelen. Emberi szempontból az ilyen kódok kényelmetlenek az észlelés szempontjából - a hosszú nullák és egyesek, amelyek kódolt karakterek, nagyon nehéz azonnal megfejteni. De egy ilyen rögzítési formátum azonnal világosan megmutatja, mi az információkódolás. Például a 8-as szám bináris nyolcjegyű formában a következő bitsorozathoz hasonlít: 000001000. De ami az embernek nehéz, az egyszerű a számítógépnek. Az elektronika számára könnyebb sok egyszerű elemet feldolgozni, mint kis számú összetettet.

Szövegkódolás

Amikor megnyomunk egy gombot a billentyűzeten, a számítógép a lenyomott gombhoz egy meghatározott kódot kap, amelyet egy szabványos táblázatban keres ASCII karakterek(amerikai kód az információcseréhez), „megérti”, hogy melyik gombot kell megnyomni, és ezt a kódot továbbítja további feldolgozáshoz (például egy karakter megjelenítéséhez a monitoron). A karakterkód bináris formában történő tárolására 8 bitet használnak, így a kombinációk maximális száma 256. Az első 128 karakter a vezérlőkarakterek, számok és latin betűk számára használható. A második fele a nemzeti jelképeknek és álrajzoknak szól.

Szövegkódolás

Egy példa segítségével könnyebb lesz megérteni, hogy mi az információkódolás. Vegye figyelembe az angol "C" karakter és az orosz "C" betű kódjait. Vegye figyelembe, hogy a karakterek nagybetűk, és kódjaik eltérnek a kisbetűktől. Az angol karakter 01000010-nek, az oroszé pedig 11010001-nek fog kinézni. Ami egy embernek ugyanúgy néz ki a képernyőn, azt a számítógép teljesen másképp érzékeli. Arra is figyelni kell, hogy az első 128 karakter kódja változatlan marad, és 129-től kezdve egy bináris kódnak különböző betűk felelhetnek meg a használt kódtáblázattól függően. Például a 194-es decimális kód megfelelhet a „b” betűnek a KOI8-ban, a „B” betűnek a CP1251-ben, a „T”-nek az ISO-ban, és a CP866 és Mac kódolásokban egyetlen karakter sem felel meg ennek a kódnak. Ezért amikor a szöveg megnyitásakor az orosz szavak helyett betű-szimbólum abrakadabra látunk, ez azt jelenti, hogy az információ ilyen kódolása nem felel meg nekünk, és másik karakterkonvertálót kell választanunk.

Számkódolás

A bináris rendszerben csak két értéket vesznek fel - 0 és 1. A bináris számokkal végzett összes alapműveletet az ún. bináris aritmetika. Ezeknek a cselekvéseknek megvannak a sajátosságai. Vegyük például a billentyűzeten begépelt 45-ös számot. Minden számjegynek megvan a maga nyolcjegyű kódja az ASCII kódtáblázatban, így a szám két bájtot (16 bitet) foglal el: 5 - 01010011, 4 - 01000011 . Annak érdekében, hogy ezt a számot felhasználhassuk a számításokban, speciális algoritmusok fordítják le a bináris rendszerbe egy nyolc bites bináris szám formájában: 45 - 00101101.

Az 1950-es években a leggyakrabban tudományos és katonai célokra használt számítógépek valósították meg elsőként az adatok grafikus megjelenítését. Manapság a számítógépről kapott információk megjelenítése minden ember számára általános és ismerős jelenség, és akkoriban rendkívüli forradalmat hozott a technológiával való munkavégzésben. Talán az emberi psziché hatása volt hatással: a vizuálisan bemutatott információ jobban felszívódik és érzékelhető. Az adatvizualizáció fejlődésében nagy áttörés a 80-as években következett be, amikor a grafikus információk kódolása és feldolgozása erőteljes fejlődésen ment keresztül.

Analóg és diszkrét grafikus megjelenítés

Hangkódolás

A multimédiás információk kódolása abból áll, hogy a hang analóg természetét diszkrétre alakítják át a kényelmesebb feldolgozás érdekében. A bemeneten fogadott ADC bizonyos időközönként megméri az amplitúdóját, és a kimeneten egy digitális sorozatot ad ki az amplitúdóváltozások adataival. Egyik sem fizikai átalakulások nem történik meg.

A kimeneti jel diszkrét, ezért minél gyakoribb az amplitúdó mérési frekvencia (minta), minél pontosabban felel meg a kimeneti jel a bemeneti jelnek, annál jobb a multimédiás információ kódolása és feldolgozása. A mintát általában az ADC-n keresztül kapott digitális adatok rendezett sorozatának is nevezik. Magát a folyamatot mintavételnek, oroszul diszkretizálásnak nevezik.

A fordított átalakítás DAC segítségével történik: a bemenetre kerülő digitális adatok alapján meghatározott időpontokban a kívánt amplitúdójú elektromos jel keletkezik.

Mintalehetőségek

A fő mintavételi paraméterek nem csak a mérési frekvencia, hanem a bitmélység is – az amplitúdóváltozás mérésének pontossága minden minta esetében. Minél pontosabban adjuk át a jelamplitúdó értékét az egyes időegységekben a digitalizálás során, minél jobb a jel minősége az ADC után, annál nagyobb a hullámvisszanyerés megbízhatósága az inverz átalakítás során.

A szöveges információk számítógépben való kódolása néha elengedhetetlen feltétele az eszköz megfelelő működésének vagy egy adott töredék megjelenítésének. Hogyan történik ez a folyamat a számítógép munkája során szöveges és vizuális információkkal, hanggal - mindezt ebben a cikkben elemezzük.

Bevezetés

Az elektronikus számítógép (amit a mindennapi életben számítógépnek hívunk) nagyon sajátos módon érzékeli a szöveget. Számára nagyon fontos a szöveges információk kódolása, hiszen minden szövegrészletet egymástól elszigetelt karaktercsoportként érzékel.

Mik a szimbólumok?

A számítógép szimbólumainak szerepe nem csak az orosz, angol és egyéb betűk, hanem az írásjelek és egyéb jelek is. Még azt a teret is, amellyel számítógépen gépeléskor elválasztjuk a szavakat, a készülék szimbólumként érzékeli. Valami nagyon emlékeztet a felsőbb matematikára, mert ott sok professzor szerint a nullának kettős jelentése van: egy szám, ugyanakkor nem jelent semmit. Még a filozófusok számára is válhat a szövegben a tér kérdése aktuális kérdés. Persze vicc, de ahogy mondani szokás, minden viccben van valami igazság.

Mi az információ?

Tehát az információ észleléséhez a számítógépnek el kell kezdenie a folyamatok feldolgozását. És milyen információk vannak? A cikk témája a szöveges információk kódolása. Erre a feladatra kiemelt figyelmet fordítunk, de más mikrotémákkal is foglalkozunk.

Az információ lehet szöveges, numerikus, hangos, grafikus. A számítógépnek el kell indítania a szöveges információk kódolását biztosító folyamatokat, hogy például megjelenítse, amit a billentyűzeten írunk. Szimbólumokat és betűket fogunk látni, ez érthető. De mit lát az autó? Abszolút minden információt - és most nem csak szövegről beszélünk - nullák és egyesek bizonyos sorozataként érzékeli. Ezek képezik az úgynevezett bináris kód alapját. Ennek megfelelően azt a folyamatot, amely az eszköz által kapott információt érthetővé alakítja, „szöveges információ bináris kódolásának” nevezik.

A bináris kód rövid elve

Miért a leggyakoribb elektronikus gépek pontosan megkapta az információ kódolását bináris kódban? A nullákkal és egyesekkel kódolt szövegalap teljesen tetszőleges karakter- és karaktersorozat lehet. Azonban nem ez az egyetlen előnye az információk bináris szöveges kódolásának. A helyzet az, hogy az elv, amelyre ez a kódolási módszer el van rendezve, nagyon egyszerű, de ugyanakkor meglehetősen funkcionális. Ha van elektromos impulzus, azt (természetesen feltételesen) egy egység jelöli. Nincs impulzus - jelölje meg a nullát. Vagyis az információ szöveges kódolása az elektromos impulzusok sorozatának felépítésének elvén alapul. A bináris karakterekből álló logikai sorozatot gépi nyelvnek nevezzük. Ugyanakkor a szöveges információk bináris kóddal történő kódolása és feldolgozása lehetővé teszi a műveletek meglehetősen rövid időn belüli végrehajtását.

Bitek és bájtok

A gép által észlelt ábra bizonyos mennyiségű információt tartalmaz. Egy bittel egyenlő. Ez vonatkozik minden egyes nullára, amely titkosított információ egy vagy másik sorozatát alkotja.

Ennek megfelelően az információ mennyisége minden esetben meghatározható egyszerűen a bináris kódsorozat karakterszámának ismeretében. Számszerűen egyenlőek lesznek egymással. A kód 2 számjegye 2 bites információt hordoz, 10 számjegy - 10 bit stb. Az információmennyiség meghatározásának elve, amely egy adott bináris kódrészletben rejlik, meglehetősen egyszerű, amint láthatja.

Szöveges információk kódolása számítógépen

Jelenleg egy cikket olvas, amely, ahogy hisszük, az orosz ábécé betűinek sorozatából áll. És a számítógép, mint korábban említettük, minden információt (és ebben az esetben is) nem betűk, hanem nullák és egyesek sorozataként érzékel, ami az elektromos impulzus hiányát és jelenlétét jelzi.

A helyzet az, hogy egy karakter, amelyet a képernyőn látunk, kódolható egy hagyományos mértékegységgel, amelyet bájtnak neveznek. Ahogy fentebb írtuk, a bináris kódnak úgynevezett információterhelése van. Emlékezzünk vissza, hogy számszerűen megegyezik a kiválasztott kódrészletben lévő nullák és egyesek számával. Tehát 8 bitből 1 bájt jön létre. Ebben az esetben a jelek kombinációi nagyon eltérőek lehetnek, ezt jól láthatjuk, ha papírra rajzolunk egy téglalapot, amely 8 egyenlő méretű cellából áll.

Kiderült, hogy lehetséges a szöveges információ kódolása egy 256 karakteres ábécével. Mi értelme van? A jelentés abban rejlik, hogy minden karakternek saját bináris kódja lesz. Az egyes karakterekhez „csatolt” kombinációk 00000000-től kezdődnek és 11111111-re végződnek. Ha binárisról decimális számrendszerre váltunk, akkor egy ilyen rendszerben 0-tól 255-ig kódolhatunk információkat.

Ne felejtsük el, hogy most különböző táblázatok vannak, amelyek az orosz ábécé betűinek kódolását használják. Ilyen például az ISO és a KOI-8, a Mac és a CP két változatban: 1251 és 866. Könnyen megbizonyosodhatunk arról, hogy az egyik táblázatban kódolt szöveg nem jelenik meg megfelelően más kódolásban. Ez annak köszönhető, hogy be különböző táblázatok különböző szimbólumok ugyanannak a bináris kódnak felelnek meg.

Ez eleinte probléma volt. Jelenleg azonban már speciális algoritmusok vannak beépítve a programokba, amelyek átalakítják a szöveget, megfelelő formába hozzák. 1997-et az Unicode nevű kódolás megalkotása jellemezte. Ebben minden karakternek egyszerre 2 bájtja van. Ez lehetővé teszi sokkal nagyobb számú karakterből álló szöveg kódolását. 256 és 65536: van különbség?

Grafikus kódolás

A szöveges és grafikus információk kódolásának van néhány hasonlósága. Mint tudják, grafikus információk megjelenítésére használják perifériaeszköz monitor nevű számítógép. Grafika most (most beszélünk számítógépes grafika) széles körben használják különböző területeken. Jó, hardveres képességek személyi számítógépek meglehetősen összetett grafikai problémák megoldását teszi lehetővé.

Lehetővé vált a videó információk feldolgozása utóbbi évek. De a szöveg ugyanakkor sokkal „könnyebb”, mint a grafika, ami elvileg érthető. Emiatt növelni kell a grafikus fájlok végleges méretét. Lehetőség van az ilyen problémák leküzdésére, ha ismerjük a grafikus információk bemutatásának lényegét.

Először nézzük meg, milyen csoportokra osztják az ilyen típusú információkat. Először is raszteres. Másodszor, vektor.

A raszteres képek nagyon hasonlítanak a kockás papírra. Az ilyen papíron minden cellát egy vagy másik színre festenek. Ez az elv némileg mozaikra emlékeztet. Vagyis kiderül, hogy a rasztergrafikában a kép külön elemi részekre van osztva. Ezeket pixeleknek nevezik. Oroszra fordítva a pixel „pontokat” jelent. Logikusan a képpontok a sorokhoz képest vannak rendezve. A grafikus rács csak bizonyos számú képpontból áll. Raszternek is nevezik. Ezt a két definíciót szem előtt tartva azt mondhatjuk bittérkép nem más, mint egy téglalap alakú rácson megjelenő pixelkészlet.

A monitor raszter- és pixelmérete befolyásolja a képminőséget. Minél magasabb lesz, annál nagyobb a monitor rasztere. A raszterméretek olyan képernyőfelbontások, amelyekről valószínűleg minden felhasználó hallott. A számítógép-képernyők egyik legfontosabb jellemzője a felbontás, nem csak a felbontás. Megmutatja, hogy egy vagy másik hosszegységben hány pixel van. A monitor felbontását általában pixel per hüvelykben mérik. Minél több pixel van egységnyi hosszon, annál jobb lesz a minőség, mivel a „szemcsésség” csökken.

Audio stream feldolgozás

A szöveg- és hanginformáció kódolása, akárcsak a többi kódolás, rendelkezik bizonyos sajátosságokkal. Most az utolsó folyamatra összpontosítunk: a hanginformációk kódolására.

Egy hangfolyam (valamint egyetlen hang) bemutatása kétféleképpen történhet.

A hangos információ bemutatásának analóg formája

Ebben az esetben az érték nagyon sok különböző értéket vehet fel. Ráadásul ezek az értékek nem maradnak állandóak: nagyon gyorsan változnak, és ez a folyamat folyamatos.

A hanginformáció-megjelenítés diszkrét formája

Ha diszkrét módszerről beszélünk, akkor ebben az esetben az érték csak korlátozott számú értéket vehet fel. Ebben az esetben a változás ugrásszerűen történik. Lehetőség van diszkréten nem csak a hangok kódolására, hanem arra is grafikus információk. Ami egyébként az analóg formát illeti.

Az analóg audio információk tárolása a következő helyen történik: bakelitlemezek, Például. De a CD már egy diszkrét módja a hangzatos jellegű információk bemutatásának.

A legelején arról beszéltünk, hogy a számítógép minden információt gépi nyelven érzékel. Ehhez az információkat elektromos impulzusok sorozata - nullák és egyesek - formájában kódolják. A hangkódolás sem kivétel e szabály alól. A hang számítógépen történő feldolgozásához először ugyanabba a sorrendbe kell alakítania. Csak ezt követően lehet műveleteket végrehajtani egy adatfolyamon vagy egyetlen hangon.

Amikor a kódolási folyamat megtörténik, az adatfolyamot időbeli mintavételezésnek vetik alá. A hanghullám folyamatos, kis időszakaszokon keresztül fejlődik. Ebben az esetben az amplitúdóértéket minden egyes intervallumhoz külön-külön állítjuk be.

Következtetés

Tehát mit tudtunk meg e cikk során? Először is, abszolút minden információ, amely a számítógép-monitoron megjelenik, mielőtt ott megjelenne, kódolva van. Másodszor, ez a kódolás az információk gépi nyelvre történő fordításából áll. Harmadszor, a gépi nyelv nem más, mint elektromos impulzusok sorozata – nullák és egyesek. Negyedszer a kódoláshoz különféle szimbólumok külön táblázatok vannak. Ötödször pedig egy grafikus és hangos információk lehetséges analóg és diszkrét forma. Talán itt vannak az általunk elemzett fő szempontok. Az egyik tudományág, amely tanul adott terület, az informatika. A szöveges információk kódolását és annak alapjait az iskolában elmagyarázzák, hiszen nincs benne semmi bonyolult.

Egy modern számítógép képes feldolgozni numerikus, szöveges, grafikus, hang- és videoinformációkat. A számítógépben található összes ilyen típusú információ bináris kódban jelenik meg, azaz két karakterből álló ábécét (0 és 1) használnak. Ez annak a ténynek köszönhető, hogy kényelmes az információt elektromos impulzusok sorozata formájában ábrázolni: nincs impulzus (0), van impulzus (1). Az ilyen kódolást általában binárisnak nevezik, magukat a nullák és egyesek logikai sorozatait pedig gépi nyelvnek.

A gépi bináris kód minden számjegye egy bitnek megfelelő mennyiségű információt hordoz.

Ez a következtetés akkor vonható le, ha a gépi ábécé számait egyformán valószínű eseményeknek tekintjük. Egy bináris számjegy írásakor lehetséges a két lehetséges állapot közül csak az egyik választása, ami azt jelenti, hogy az 1 bitnek megfelelő mennyiségű információt hordoz. Ezért két számjegy 2 bites információt hordoz, négy számjegy - 4 bit stb. A bitben lévő információ mennyiségének meghatározásához elegendő meghatározni a számjegyek számát egy bináris gépi kódban.

Szöveges információk kódolása

Jelenleg a legtöbb felhasználó számítógépet használ a szöveges információk feldolgozására, amelyek karakterekből állnak: betűk, számok, írásjelek stb.

Egy 1 bites információs kapacitású cella alapján csak 2 különböző állapot kódolható. Ahhoz, hogy latin esetben minden, a billentyűzetről beírható karakter saját egyedi bináris kódot kapjon, 7 bit szükséges. 7 bites sorozat alapján a Hartley-képletnek megfelelően N=2 7 =128 különböző nullák és egyes kombinációk nyerhetők, azaz. bináris kódok. Ha minden karakterhez hozzárendeljük a bináris kódját, egy kódolási táblázatot kapunk. Az ember szimbólumokkal, a számítógép a bináris kódjaival operál.

A latin billentyűzetkiosztáshoz csak egy ilyen kódolótábla létezik az egész világon, így a latin kiosztással beírt szöveg megfelelően megjelenik bármely számítógépen. Ezt a táblázatot ASCII-nek (American Standard Code of Information Interchange) hívják angolul [eski]-nek, oroszul [aski]-nak ejtik. Az alábbiakban a teljes ASCII táblázat látható, amelyben a kódok decimális formában vannak feltüntetve. Segítségével megállapítható, hogy amikor a billentyűzetről beütjük mondjuk a „*” szimbólumot, a számítógép a 42(10) kódként érzékeli, viszont a 42(10)=101010(2) - ez a bináris a „*” szimbólum kódja. A 0-tól 31-ig terjedő kódok nem szerepelnek ebben a táblázatban.

ASCII karaktertábla

Egy karakter kódolásához 1 bájtnak megfelelő mennyiségű információt használnak fel, azaz I \u003d 1 bájt \u003d 8 bit. Egy olyan képlet segítségével, amely a lehetséges események számát K és az I információ mennyiségét kapcsolja össze, kiszámíthatja, hogy hány különböző karakter kódolható (feltételezve, hogy a karakterek lehetséges események):

K \u003d 2 I = 2 8 = 256,

azaz egy 256 karakter kapacitású ábécé használható a szöveges információk ábrázolására.

A kódolás lényege, hogy minden karakterhez hozzárendelünk egy bináris kódot 00000000 és 11111111 között, vagy a megfelelő decimális kódot 0 és 255 között.

Emlékeztetni kell arra, hogy jelenleg öt különböző kódtáblázatot használnak az orosz betűk kódolására(KOI - 8, СР1251, СР866, Mac, ISO), ráadásul az egyik táblázattal kódolt szövegek nem jelennek meg megfelelően egy másik kódolásban. Vizuálisan ez a kombinált karakterkódolási tábla töredékeként ábrázolható.

Ugyanahhoz a bináris kódhoz különböző szimbólumok vannak hozzárendelve.

bináris kód	Tizedes kód

Azonban a legtöbb esetben nem a felhasználó gondoskodik a szöveges dokumentumok átkódolásáról, hanem speciális programok- alkalmazásokba beépített konverterek.

1997 óta a legújabb verziók Microsoft Office támogatja az új kódolást. Unicode-nak hívják. A Unicode egy olyan kódolási tábla, amely 2 bájtot használ minden karakter kódolásához, pl. 16 bites Egy ilyen táblázat alapján N=2 16 =65 536 szimbólum kódolható.

A Unicode szinte minden modern írást tartalmaz, beleértve: arab, örmény, bengáli, burmai, görög, grúz, dévanagari, héber, cirill, kopt, khmer, latin, tamil, hangul, han (Kína, Japán, Korea), cseroki, etióp, japán (katakana, hiragana, kanji) és mások.

Akadémiai célokra számos történelmi írást adtunk hozzá, köztük: ókori görög, egyiptomi hieroglifákat, ékírást, maja írást, etruszk ábécét.

A Unicode matematikai és zenei szimbólumok, valamint piktogramok széles skáláját kínálja.

A Unicode-ban két kódtartomány létezik a cirill karakterekhez:

Cirill (#0400 - #04FF)

Cirill betűs kiegészítés (#0500 - #052F).

De a Unicode tábla tiszta formájában való bevezetését korlátozza az a tény, hogy ha egy karakter kódja nem egy bájtot, hanem két bájtot foglal, akkor kétszer annyi lemezterületet vesz igénybe a szöveg tárolása, és kétszer annyi időt. kommunikációs csatornákon keresztül továbbítani.

Ezért az UTF-8 (Unicode Transformation Format) Unicode-ábrázolás ma már elterjedtebb a gyakorlatban. Az UTF-8 biztosítja a legjobb kompatibilitást a 8 bites karaktereket használó rendszerekkel. A csak 128-nál rövidebb karakterekből álló szöveget a rendszer egyszerű ASCII-szöveggé alakítja, ha UTF-8-ban írják. A fennmaradó Unicode karaktereket 2–4 bájt hosszúságú sorozatok képviselik. Általában véve, mivel a világon a leggyakoribb karakterek - a latin karakterek - az UTF-8-ban még mindig 1 bájtot foglalnak el, ez a kódolás gazdaságosabb, mint a tiszta Unicode.

A numerikus karakterkód meghatározásához használhatja a kódtáblázatot. Ehhez válassza ki a menüben a "Beszúrás" - "Szimbólum" menüpontot, amely után megjelenik a Szimbólum párbeszédablak a képernyőn. A kiválasztott betűtípus karaktertáblázata megjelenik a párbeszédpanelen. Ebben a táblázatban a karakterek soronként vannak elrendezve, balról jobbra, a szóköz karakterrel kezdve.