Види кодування інформації застосовуються на комп'ютері. Кодування інформації у комп'ютері

Одна й та інформація може представлятися у кількох формах. Основні способи кодування дозволяють це зробити у світі. Після появи комп'ютерних технологій виникла необхідність кодування будь-якого типу інформації, з якими працює людина. Але вирішувати завдання такого типу почали ще до появи комп'ютерів.

Навігатор за способами

1 спосіб. Двійкове кодування.

Одним із найпопулярніших і найпоширеніших методів подання інформації вважається саме двійкове кодування. У роботі з обчислювальними машинами, роботами та верстатами з числовим програмним управлінням найчастіше кодують інформацію у формі слів двійкового алфавіту.

Цікаво: 10 способів очистити диск

2 спосіб. Стенографія.

Цей спосіб відносять до методів кодування текстової інформації за допомогою спеціальних знаків. Цей спосіб найшвидший при записі мовлення. Навички стенографії мають лише деякі спеціально навчені люди, яким і дали назву стенографісти. Такі люди встигають записати текст синхронно з промовою людини, яка виступає.

3 спосіб. Синхронізація.

У процесі роботи з цифровою інформацією особливе значення набуває синхронізації. У момент зчитування чи запису інформації важливим залишається точне визначення часу кожної зміни знака. Якщо синхронізації немає, період зміни знака може визначатися неправильно. У результаті неминучою буде втрата чи спотворення даних.

4 спосіб. Run Length Limited – RLL.

На сьогоднішній день одним із найпопулярніших методів є кодування інформації з обмеженням довжини поля запису. Завдяки цьому способу на диску можна розмістити в півтора рази більше даних, ніж під час запису за методом MFM. Використовуючи цей метод відбувається кодування окремого біту, а цілої групи.

Цікаво: 10 способів захисту файлів від крадіжки

5 спосіб. Таблиці перекодування.

Таблицею перекодування вважається та, що містить перелік символів, що кодуються, упорядкований спеціальним чином. Відповідно до цього відбувається перетворення символу в його двійковий код і назад.

6 спосіб. Матричний метод.

Матричний принцип кодування графічних зображеньполягає в тому, що картинка розбивається на задану кількість стовпців та рядків. Після цього кожен елемент отриманої сітки кодується за вибраним правилом.

А тепер напиши коментар!

Інформація буває різного виду, наприклад:

Запах, смак, звук;

Символи та знаки.

У різних галузях науки, культури та техніки розроблено спеціальні форми для запису інформації.

Код- це група позначень, яку можна використовуватиме відображення інформації.

Процес перетворення повідомлення на комбінацію символів відповідно до коду називається кодуванням.

Існує три основні способи кодуванняінформації:

  • Числовий спосіб- За допомогою чисел.
  • Символьний спосіб - інформація кодується за допомогою символів того ж алфавіту, що і вихідний текст.
  • Графічний спосіб - інформація кодується за допомогою малюнків чи значків.

Приклади кодування інформації:

Для відображення звуків російського алфавіту використовують літери(АБВГДЕІЖ…ЭЮЯ);

Для відображення чисел використовують цифри (0123456789);

Звуки записують нотамита іншими символами;

Сліпі використовують абетку Брайля, де буква складається з шести елементів: дірочок та горбків.

Азбука Брайля

Треба враховувати, що не знаючи принципи кодування інформації, той самий код, можна зрозуміти по-різному, наприклад, число 300522005 можна порахувати за число, номер телефону чи кількість населення.

Комп'ютер кодує введену інформацію: текст, зображення та звуки. У закодованому вигляді комп'ютер обробляє, зберігає та пересилає інформацію. Щоб вивести інформацію з комп'ютера у зрозумілій для людини формі, її треба декодувати .

Методами шифрування займається спеціальна наука криптографія .

У комп'ютері для кодування будь-якої інформації використовуються лише два символи: 0 і 1 , так як комп'ютерної технікипростіше реалізовувати два стани:

0 - сигналу немає (немає напруги чи тече струм);

1 - сигнал є (є напруга або тече струм).

Створення коду.

Одним біт можна кодувати два стани: 0 і 1 (та й ні, чорний і білий). При збільшенні кількості бітів на один вийде вдвічі більше кодів.

Приклад:

Два біти створюють 4 різних коди: 00, 01, 10 і 11;

три біти створюють 8 різних кодів: 000, 001, 010, 011, 100, 101, 110 і 111.

Кодування різних видів інформації

Кодування текстів

При кодуванні тексту кожному символу надається якесь значення, наприклад, порядковий номер.

Перший популярний комп'ютерний стандарт кодування тексту має назву ASCII(American Standart Code for Information Interchange), у якому кодування кожного символу використовуються 7 біт.

7-ма бітами можна закодувати 128 символів: великі і маленькі латинські літери, цифри, розділові знаки, а також спеціальні символи, наприклад, «§».

Стандарт створювали різні варіанти, доповнюючи код до 8 біт (256 символів), щоб можна було кодувати національні символи, наприклад, латиську букву ā.

Але 256 символів забракло, щоб кодувати всі символи різних алфавітів, тому створили нові стандарти. Один з найпопулярніших у наш час, це UNICODE. У якому кожен знак кодують двома байтами, виходить у результаті 62536 різних кодів.

Кодування графічних даних

Майже всі створені та оброблені зображення, що зберігаються на комп'ютері, можна розділити на дві групи:

Растрова графіка;

Векторна графіка.

Будь-яке зображення створене в растровій графіці складається з кольорових точок. Ці точки називають пікселями (pixel) .

Для кодування не кольорових зображеньзазвичай використовують 256 відтінків сірогопочинаючи від білого, закінчуючи чорним. Для кодування всіх кольорів треба 8 бітів(1 байт).

Для кодування кольорових зображеньзазвичай використовують три кольори: червоний, зелений та синій. Кольоровий тон виходить при змішуванні цих трьох кольорів.

Кодування звуків

Звуки з'являються через ваганьповітря. У звуку є дві величини:

- амплітуда коливання, яка вказує на гучністьзвуку;

- частота коливання, яка вказує на тональністьзвуку.

Звук можна переробити на електричний сигнал, наприклад, мікрофоном.

Звук кодують, після точного інтервалу часу, вимірюючи розмір сигналу і присвоюючи йому бінарну величину. Чим частіше проводяться ці виміри, тим краща якістьзвуку.

Приклад:

На одному компакт-диску, з об'ємом 700 Мб, може вміститися 80 хвилин звуку CD якості.

Кодування відео

Фільм складається з кадрів, які швидко змінюються. Кодований фільм містить інформацію про розмір кадру, використовуваних кольорах, і кількість кадрів на секунду (зазвичай 30), як і спосіб запису звуку - кожному кадру окремо чи всьому фільму відразу.

У світі відбувається постійний обмін потоками інформації. Джерелами можуть бути люди, технічні пристрої, різні речі, об'єкти неживої та живої природи. Отримувати відомості може як один об'єкт, так і кілька.

Для більш якісного обміну даними одночасно здійснюється кодування та обробка інформації на стороні передавача (підготовка даних та перетворення їх у форму, зручну для трансляції, обробки та зберігання), пересилання та декодування на стороні приймача (перетворення кодованих даних у вихідну форму). Це взаємопов'язані завдання: джерело і приймач повинні мати подібні алгоритми обробки відомостей, інакше процес кодування-декодування буде неможливий. Кодування та обробка графічної та мультимедійної інформації зазвичай реалізуються на основі обчислювальної техніки.

Кодування інформації на комп'ютері

Існує багато способів обробки даних (тексти, числа, графіка, відео, звук) за допомогою комп'ютера. Вся інформація, що обробляється комп'ютером, представлена ​​в двійковому коді - за допомогою цифр 1 і 0, які називаються бітами. Технічно цей спосіб реалізується дуже просто: 1 – електричний сигнал присутній, 0 – відсутній. З точки зору людини, такі коди незручні для сприйняття - довгі рядки нулів і одиниць, що є кодованими символами, дуже складно відразу розшифрувати. Проте такий формат запису відразу наочно показує, що таке кодування інформації. Наприклад, число 8 у двійковому восьмирозрядному вигляді виглядає як наступна послідовність біт: 000001000. Але те, що складно людині, просто комп'ютеру. Електроніці простіше обробити багато простих елементів, ніж невелика кількість складних.

Кодування текстів

Коли ми натискаємо кнопку на клавіатурі, комп'ютер отримує певний код натиснутої кнопки, шукає його у стандартній таблиці символів ASCII(американський код для обміну інформацією), "розуміє" яка кнопка натиснута і передає цей код для подальшої обробки (наприклад, для відображення символу на моніторі). Для зберігання символьного коду в двійковому вигляді використовується 8 розрядів, тому максимальна кількість комбінацій дорівнює 256. Перші 128 символів використовуються під символи, цифри і латинські літери. Друга половина призначається для національних символів та псевдографіки.

Кодування текстів

Легше буде зрозуміти, що таке кодування інформації на прикладі. Розглянемо коди англійського символу "С" та російської літери "С". Зауважимо, що взяті символи великі, та його коди від малих. Англійська символ буде виглядати як 01000010, а російська - 11010001. Те, що для людини на екрані монітора виглядає однаково, комп'ютер сприймає зовсім по-різному. Необхідно також звернути увагу, що коди перших 128 символів залишаються незмінні, а починаючи від 129 і далі одному двійковому коду можуть відповідати різні літери залежно від використовуваної кодової таблиці. Наприклад, десятковий код 194 може відповідати в КОИ8 букві «б», в СР1251 - «В», ISO - «Т», а в кодуваннях СР866 і Мас взагалі цьому коду не відповідає жоден символ. Тому, коли при відкритті тексту ми замість російських слів бачимо буквено-символьну абракадабру, це означає, що таке кодування інформації нам не підходить і потрібно вибрати інший конвертор символів.

Кодування чисел

У двійковій системі обчислення беруться всього два варіанти значення - 0 і 1. Усі основні операції з двійковими числами використовує наука під назвою двійкова арифметика. Ці дії мають особливості. Візьмемо, наприклад, число 45, набраний на клавіатурі. Кожна цифра має свій восьмирозрядний код кодової таблиці ASCII, тому число займає два байти (16 біт): 5 - 01010011, 4 - 01000011 . Для того щоб використовувати це число у обчисленнях, воно переводиться за спеціальними алгоритмами в двійкову систему обчислення у вигляді восьмирозрядного двійкового числа: 45 - 00101101.

У 50-х роках на комп'ютерах, які найчастіше використовувалися в наукових та військових цілях, вперше реалізували графічне відображення даних. Сьогодні візуалізація інформації, що отримується від комп'ютера, є звичайним та звичним для будь-якої людини явищем, а в ті часи це зробило надзвичайний переворот у роботі з технікою. Можливо, дався взнаки вплив людської психіки: наочно представлена ​​інформація краще засвоюється і сприймається. Великий ривок у розвитку візуалізації даних стався у 80-х роках, коли кодування та обробка графічної інформації набули потужного розвитку.

Аналогове та дискретне подання графіки

Кодування звуку

Кодування мультимедійної інформації полягає у перетворенні аналогової природи звуку на дискретну для зручнішої її обробки. АЦП отримує на вході вимірює його амплітуду в певні проміжки часу і видає на виході цифрову послідовність даних про зміни амплітуди. Жодних фізичних перетвореньне відбувається.

Вихідний сигнал є дискретним, тому чим частіше частота вимірювання амплітуди (семпл), тим точніше вихідний сигнал відповідає вхідному, тим краще проходить кодування та обробка мультимедійної інформації. Семплом також називають упорядковану послідовність цифрових даних, отриманих через АЦП. Сам процес у своїй називається семплюванням, російською — дискретизацією.


Зворотне перетворення відбувається за допомогою ЦАП: на підставі цифрових даних, що надходять на вхід, у певні моменти часу відбувається генерація електричного сигналу необхідної амплітуди.

Параметри дискретизації

Основними параметрами сеплювання є не тільки частота виміру, а й розрядність - точність виміру зміни амплітуди за кожен семпл. Чим точніше передається при оцифруванні значення амплітуди сигналу в кожну одиницю часу, тим вища якість сигналу після АЦП, тим вища вірогідність відновлення хвилі при зворотному перетворенні.

Кодування текстової інформації в комп'ютері - іноді невід'ємна умова коректної роботи пристрою або відображення того чи іншого фрагмента. Як відбувається цей процес у ході роботи комп'ютера з текстом та візуальною інформацією, звуком – все це ми розберемо у цій статті.

Вступ

Електронна обчислювальна машина (яку ми у повсякденному житті називаємо комп'ютером) сприймає текст дуже специфічно. Для неї кодування текстової інформації дуже важливе, оскільки вона сприймає кожен текстовий фрагмент як групу відокремлених один від одного символів.

Які символи бувають?

У ролі символів для комп'ютера виступають не тільки російські, англійські та інші літери, але і ще розділові знаки, а також інші знаки. Навіть пробіл, яким ми поділяємо слова під час друку на комп'ютері, пристрій сприймає як символ. Чимось дуже нагадує найвищу математику, адже там, на думку багатьох професорів, нуль має подвійне значення: він і є числом, і водночас нічого не означає. Навіть для філософів питання прогалини в тексті може стати актуальною проблемою. Жарт, звичайно, але, як кажуть, у кожному жарті є частка правди.

Яка інформація буває?

Отже, сприйняття інформації комп'ютера необхідно запустити процеси обробки. А яка взагалі буває інформація? Темою цієї статті є кодування текстової інформації. Ми приділимо особливу увагу цьому завданню, але розберемося з іншими мікротемами.

Інформація може бути текстовою, числовою, звуковою, графічною. Комп'ютер повинен запустити процеси, які забезпечують кодування текстової інформації, щоб вивести на екран те, що ми друкуємо на клавіатурі. Ми бачитимемо символи та літери, це зрозуміло. А що бачить машина? Вона сприймає абсолютно всю інформацію - і зараз йдеться не тільки про текст - як певну послідовність нулів і одиниць. Вони становлять основу так званого двійкового коду. Відповідно, процес, який перетворює надходить на пристрій інформацію на зрозумілу йому, має назву "двійкове кодування текстової інформації".

Короткий принцип дії двійкового коду

Чому найбільше поширення в електронних машинахотримало саме кодування інформації двійковим кодом? Текстовою основою, яка кодується за допомогою нулів та одиниць, може бути абсолютно будь-яка послідовність символів та знаків. Однак це не єдина перевага, яка має двійкове текстове кодування інформації. Справа в тому, що принцип, на якому влаштований такий спосіб кодування, дуже простий, але в той же час досить функціональний. Коли є електричний імпульс, його маркують (умовно, звісно) одиницею. Немає імпульсу – маркують банкрутом. Тобто текстове кодування базується на принципі побудови послідовності електричних імпульсів. Логічна послідовність, складена із символів двійкового коду, називається машинною мовою. У той же час кодування та обробка текстової інформації за допомогою двійкового коду дозволяють здійснювати операції за короткий проміжок часу.

Біти та байти

Цифра, яку сприймає машина, криє в собі деяку кількість інформації. Воно одно одному біту. Це стосується кожної одиниці та кожного нуля, які становлять ту чи іншу послідовність зашифрованої інформації.

Відповідно, кількість інформації у будь-якому випадку можна визначити, просто знаючи кількість символів у послідовності двійкового коду. Вони будуть чисельно рівними між собою. 2 цифри в коді несуть у собі інформацію обсягом 2 біти, 10 цифр - 10 біт тощо. Принцип визначення інформаційного обсягу, який у тому чи іншому фрагменті двійкового коду, досить простий, як бачите.

Кодування текстової інформації на комп'ютері

Ось зараз ви читаєте статтю, яка складається з послідовності, як ми вважаємо, букв алфавіту російської мови. А комп'ютер, як говорилося раніше, сприймає всю інформацію (і в даному випадку теж) як послідовність не літер, а нулів та одиниць, що позначають відсутність і наявність електричного імпульсу.

Справа в тому, що закодувати один символ, який ми бачимо на екрані, можна за допомогою умовної одиниці вимірювання, яка називається байтом. Як написано вище, двійковий код має так зване інформаційне навантаження. Нагадаємо, що чисельно вона дорівнює сумарній кількості нулів та одиниць у вибраному фрагменті коду. Так ось, 8 біт становлять 1 байт. Комбінації сигналів при цьому можуть бути різними, як це легко можна помітити, намалювавши на папері прямокутник, що складається з 8 осередків рівного розміру.

Виходить, що закодувати текстову інформацію можна за допомогою алфавіту, який має потужність 256 символів. У чому полягає суть? Сенс полягає в тому, що кожен символ матиме свій двійковий код. Комбінації, "прив'язувані" до певних символів, починаються від 00000000 і закінчуються 11111111. Якщо переходити від двійкової до десяткової системи числення, кодувати інформацію в такій системі можна від 0 до 255.

Не варто забувати про те, що зараз є різні таблиці, які використовують кодування букв російського алфавіту. Це, наприклад, ISO та КОІ-8, Mac та CP у двох варіаціях: 1251 і 866. Легко переконатися в тому, що текст, закодований в одній з таких таблиць, не відобразиться коректно у відмінному від даного кодування. Це відбувається через те, що в різних таблицяхдо того ж двійковому коду відповідають різні символи.

Спочатку це була проблема. Однак у програмах вже вбудовані спеціальні алгоритми, які конвертують текст, наводячи його до коректного вигляду. 1997 ознаменувався створенням кодування під назвою Unicode. У ній кожен символ має у своєму розпорядженні одразу 2 байти. Це дозволяє закодувати текст, який має набагато більше символів. 256 і 65536: є різниця?

Кодування графіки

Кодування текстової та графічної інформації має деякі схожі моменти. Як відомо, для виведення графічної інформації використовується периферійний пристрійкомп'ютера під назвою "монітор". Графіка зараз (мова йде зараз саме про комп'ютерної графіки) широко використовується в різних сферах. Благо, апаратні можливості персональних комп'ютерівдозволяють вирішувати складні графічні завдання.

Обробляти відеоінформацію стало можливим у Останніми роками. Але текст у своїй значно “легше” графіки, що, у принципі, зрозуміло. Через це кінцевий розмір файлів графіки потрібно збільшувати. Подолати подібні проблеми можна, знаючи суть, у якій надається графічна інформація.

Давайте спочатку розберемося, на які групи підрозділяється даний вид інформації. По-перше, це растрова. По-друге, векторний.

Растрові зображення досить схожі з картатим папером. Кожна клітка на такому папері зафарбовується тим чи іншим кольором. Такий принцип чимось нагадує мозаїку. Тобто виходить, що у растрової графіці зображення розбивається деякі елементарні частини. Їх називають пікселями. У перекладі російською мовою пікселі позначають “точки”. Логічно, що пікселі упорядковані щодо рядків. Графічна сітка складається саме з певної кількості пікселів. Її також називають растром. Зважаючи на ці два визначення, можна сказати, що растрове зображенняє не чим іншим, як набором пікселів, які відображаються на сітці прямокутного типу.

Розмір монітора та розмір пікселя впливають на якість зображення. Воно буде тим вище, чим більше растр у монітора. Розміри растру - це роздільна здатність екрана, про який напевно чув кожен користувач. Однією з найважливіших характеристик, які мають екрани комп'ютера, є роздільна здатність, а не лише роздільна здатність. Воно показує, скільки пікселів посідає ту чи іншу одиницю довжини. Зазвичай роздільна здатність монітора вимірюється в пікселях на дюйм. Чим більше пікселів припадатиме на одиницю довжини, тим вищою буде якість, оскільки “зернистість” при цьому знижується.

Обробка звукового потоку

Кодування текстової та звукової інформації, як та інші види кодування, має деякі особливості. Йдеться зараз про останній процес: кодування звукової інформації.

Подання звукового потоку (як і окремого звуку) може бути зроблено за допомогою двох способів.

Аналогова форма подання звукової інформації

При цьому величина може набувати дійсно величезної кількості різних значень. Причому ці значення не залишаються постійними: вони дуже швидко змінюються, і цей процес безперервний.

Дискретна форма подання звукової інформації

Якщо ж говорити про дискретний спосіб, то в цьому випадку величина може приймати лише обмежену кількість значень. При цьому зміна відбувається стрибкоподібно. Закодувати дискретно можна як звукову, а й графічну інформацію. Щодо аналогової форми, до речі.

Аналогова звукова інформація зберігається на вінілових платівкахнаприклад. А ось компакт-диск є дискретним способом подання інформації звукового характеру.

На самому початку ми говорили про те, що комп'ютер сприймає всю інформацію машинною мовою. Для цього інформація кодується у формі послідовності електричних імпульсів – нулів та одиниць. Кодування звукової інформації не є винятком цього правила. Щоб обробити на комп'ютері звук, його спочатку потрібно перетворити на ту саму послідовність. Тільки після цього над потоком чи одиничним звуком можуть здійснюватися операції.

Коли відбувається процес кодування, потік зазнає тимчасової дискретизації. Звукова хвиля безперервна, вона розвивається на малі ділянки часу. Значення амплітуди при цьому встановлюється кожного конкретного інтервалу окремо.

Висновок

Отже, що ми з'ясували під час цієї статті? По-перше, абсолютно вся інформація, яка виводиться на монітор комп'ютера, перш ніж там з'явитися, кодується. По-друге, це кодування полягає у перекладі інформації машинною мовою. По-третє, машинна мова є не що інше, як послідовність електричних імпульсів - нулів та одиниць. По-четверте, для кодування різних символівІснують окремі таблиці. І, по-п'яте, уявити графічну та звукову інформаціюможна в аналоговому та дискретному вигляді. Ось, мабуть, головні моменти, які ми розібрали. Однією з дисциплін, що вивчає цю областьє інформатика. Кодування текстової інформації та його основи пояснюються ще у школі, оскільки нічого складного у цьому немає.

Сучасний комп'ютер може обробляти цифрову, текстову, графічну, звукову та відео інформацію. Всі ці види інформації в комп'ютері представлені в двійковому коді, тобто використовується алфавіт потужністю два символи (0 та 1). Пов'язано це з тим, що зручно представляти інформацію у вигляді послідовності електричних імпульсів: відсутня імпульс (0), імпульс є (1). Таке кодування прийнято називати двійковим, а самі логічні послідовності нулів та одиниць – машинною мовою.

Кожна цифра двійкового машинного коду несе кількість інформації рівну одному біту.

Цей висновок можна зробити, розглядаючи цифри машинного алфавіту як рівноймовірні події. При записі двійкової цифри можна реалізувати вибір лише з двох можливих станів, отже, вона несе кількість інформації дорівнює 1 біт. Отже, дві цифри несуть інформацію 2 біти, чотири розряди - 4 біти і т. д. Щоб визначити кількість інформації в бітах, достатньо визначити кількість цифр у двійковому машинному коді.

Кодування текстової інформації

В даний час більша частина користувачів за допомогою комп'ютера обробляє текстову інформацію, яка складається з символів: букв, цифр, розділових знаків та ін.

З одного осередку інформаційної ємністю 1 біт можна закодувати лише 2 різних стану. Щоб кожен символ, який можна ввести з клавіатури в латинському регістрі, отримав свій унікальний двійковий код, потрібно 7 біт. З послідовності з 7 біт, відповідно до формулою Хартлі, може бути отримано N=2 7 =128 різних комбінацій з нулів і одиниць, тобто. двійкові коди. Поставивши у відповідність кожному символу його двійковий код, ми отримаємо кодувальну таблицю. Людина оперує символами, комп'ютер – їх двійковими кодами.

Для латинської розкладки клавіатури така таблиця кодування одна на весь світ, тому текст, набраний з використанням латинської розкладки, буде адекватно відображений на будь-якому комп'ютері. Ця таблиця називається ASCII (American Standard Code of Information Interchange) англійською вимовляється [е́ски], російською вимовляється [а́ски]. Нижче наводиться вся таблиця ASCII, коди якої вказані в десятковому вигляді. По ній можна визначити, що коли ви вводите з клавіатури, скажімо, символ “*”, комп'ютер його сприймає як код 42(10), своєю чергою 42(10)=101010(2) – і є двійковий код символу “* ”. Коди з 0 по 31 у цій таблиці не задіяні.

Таблиця символів ASCII

Для того щоб закодувати один символ використовують кількість інформації, що дорівнює 1 байту, тобто I = 1 байт = 8 біт. За допомогою формули, яка пов'язує між собою кількість можливих подій і кількість інформації I, можна обчислити скільки різних символів можна закодувати (вважаючи, що символи - це можливі події):

К = 2 I = 2 8 = 256,

тобто для подання текстової інформації можна використовувати алфавіт потужністю 256 символів.

Суть кодування полягає в тому, що кожному символу ставлять у відповідність двійковий код від 00000000 до 11111111 або відповідний десятковий код від 0 до 255.

Необхідно пам'ятати, що нині для кодування російських букв використовують п'ять різних кодових таблиць(КОІ - 8, СР1251, СР866, Мас, ISO), причому тексти, закодовані за допомогою однієї таблиці не будуть правильно відображатися в іншому кодуванні. Наочно це можна у вигляді фрагмента об'єднаної таблиці кодування символів.

Одному й тому двійковому коду ставиться у відповідність різні символи.

Двійковий код

Десятковий код

Втім, у більшості випадків про перекодування текстових документів піклується не користувач, а спеціальні програми- конвертори, які вбудовані у додатки.

Починаючи з 1997 р. останні версії Microsoft Officeпідтримують нове кодування. Вона називається Unicode (Юнікод). Unicode – це кодувальна таблиця, у якій кодування кожного символу використовується 2 байти, тобто. 16 біт. З такої таблиці може бути закодовано N=2 16 =65 536 символів.

Юнікод включає практично всі сучасні писемності, у тому числі: арабську, вірменську, бенгальську, бірманську, грецьку, грузинську, деванагарі, іврит, кирилицю, коптську, кхмерську, латинську, тамільську, хангиль, хань (Китай, Японія, Корея) ефіопську, японську (катакана, хірагана, кандзі) та інші.

З академічною метою додано багато історичних писемностей, у тому числі: давньогрецька, єгипетські ієрогліфи, клинопис, писемність майя, етруський алфавіт.

У Юнікоді представлений широкий набір математичних та музичних символів, а також піктограм.

Для символів кирилиці в Юнікоді виділено два діапазони кодів:

Cyrillic (#0400 - #04FF)

Cyrillic Supplement (#0500 - #052F).

Але використання таблиці Unicode у чистому вигляді стримується з тієї причини, що якщо код одного символу займатиме не один байт, а два байти, що для зберігання тексту знадобиться вдвічі більше дискового простору, а для його передачі каналами зв'язку – вдвічі більше часу.

Тому зараз на практиці найбільш поширене уявлення Юнікоду UTF-8 (Unicode Transformation Format). UTF-8 забезпечує найкращу сумісність із системами, що використовують 8-бітові символи. Текст, що складається лише із символів з номером менше 128, під час запису на UTF-8 перетворюється на звичайний текст ASCII. Інші символи Юнікоду зображуються послідовностями довжиною від 2 до 4 байтів. У цілому нині, оскільки найпоширеніші у світі символи – символи латинського алфавіту - в UTF-8 як і раніше займають 1 байт, таке кодування економічніше, ніж чистий Юнікод.

Щоб визначити числовий код символу, можна або скористатися кодовою таблицею. Для цього в меню потрібно вибрати пункт "Вставка" – "Символ", після чого на екрані з'являється діалогова панель Символ. У діалоговому вікні відображається таблиця символів для вибраного шрифту. Символи в цій таблиці розміщуються рядково, послідовно зліва направо, починаючи з символу Пробіл.



Завантаження...
Top