Компьютерт хэрэглэгдэх мэдээллийн кодчилолын төрлүүд. Компьютер дээрх мэдээллийг кодлох

Ижил мэдээллийг хэд хэдэн хэлбэрээр танилцуулж болно. Кодлох үндсэн аргууд нь орчин үеийн ертөнцөд үүнийг хийх боломжийг олгодог. Компьютерийн технологи бий болсны дараа хүн ажилладаг аливаа төрлийн мэдээллийг кодлох шаардлагатай болсон. Гэхдээ энэ төрлийн асуудлыг шийдэх нь компьютер гарч ирэхээс хамаагүй өмнө эхэлсэн.

Аргын хөтөч

1 арга зам. Хоёртын кодчилол.

Хоёртын кодчилол нь мэдээллийг танилцуулах хамгийн түгээмэл, өргөн тархсан аргуудын нэг юм. Тоон удирдлагатай компьютер, робот, машин хэрэгсэлтэй ажиллахдаа мэдээллийг ихэвчлэн хоёртын цагаан толгойн үсгийн хэлбэрээр кодчилдог.

Сонирхолтой: C дискээ цэвэрлэх 10 арга

2 арга зам. Богино хэллэг.

Энэ аргыг тусгай тэмдэгт ашиглан текстэн мэдээллийг кодлох арга гэж нэрлэдэг. Энэ арга нь аман яриаг бичихэд хамгийн хурдан юм. Стенографийн ур чадварыг зөвхөн тусгайлан бэлтгэгдсэн зарим хүмүүс эзэмшдэг бөгөөд тэднийг стенографич гэж нэрлэдэг. Ийм хүмүүс ярьж байгаа хүний ​​яриатай уялдуулан бичвэрээ бичих завтай байдаг.

3 арга зам. Синхрончлол.

Дижитал мэдээлэлтэй ажиллах явцад синхрончлол нь онцгой ач холбогдолтой юм. Мэдээллийг унших, бичих үед тэмдгийн өөрчлөлт бүрийн цагийг зөв тодорхойлох нь чухал юм. Хэрэв синхрончлол байхгүй бол тэмдгийн өөрчлөлтийн хугацааг зөв тодорхойлохгүй байж магадгүй юм. Үүний үр дүнд мэдээллийн алдагдал эсвэл эвдрэл гарах нь гарцаагүй.

4 зам. Run Length Limited - RLL.

Өнөөдрийг хүртэл хамгийн түгээмэл аргуудын нэг бол бичлэгийн талбарын уртыг хязгаарласан мэдээллийг кодлох явдал юм. Энэ аргын ачаар MFM аргыг ашиглан бичлэг хийх процессоос нэг хагас дахин их өгөгдлийг дискэн дээр байрлуулж болно. Энэ аргыг ашигласнаар нэг бит биш, харин бүхэл бүтэн бүлгийг кодлодог.

Сонирхолтой: Файлуудыг хулгайлахаас хамгаалах 10 арга

5 зам. хувиргах хүснэгтүүд.

Хайлтын хүснэгт нь тусгай аргаар эрэмблэгдсэн кодлогдсон тэмдэгтүүдийн жагсаалтыг агуулсан хүснэгт юм. Үүний дагуу тэмдэгтийг хоёртын код руу хөрвүүлдэг ба эсрэгээр.

6 зам. матрицын арга.

Матриц кодлох зарчим график зургуудЭнэ нь зургийг өгөгдсөн тооны багана, мөрөнд хуваасан явдал юм. Үүний дараа үүссэн сүлжээний элемент бүрийг сонгосон дүрмийн дагуу кодчилно.

Одоо сэтгэгдэл бичээрэй!

Мэдээлэл гардаг өөр төрлийн, Жишээлбэл:

Үнэр, амт, дуу чимээ;

Тэмдгүүд ба тэмдгүүд.

Шинжлэх ухаан, соёл, технологийн янз бүрийн салбарт мэдээллийг бүртгэх тусгай хэлбэрийг боловсруулсан.

Коднь мэдээллийг харуулахад ашиглаж болох тэмдэгтүүдийн бүлэг юм.

Мессежийг кодын дагуу тэмдэгтүүдийн хослол болгон хувиргах үйл явц гэж нэрлэдэг кодлох.

Байгаа гурван үндсэн кодлох аргамэдээлэл:

  • Тоон арга- тоо ашиглах.
  • Бэлгэдлийн арга - мэдээлэл нь гарч буй тексттэй ижил цагаан толгойн тэмдэгтүүдийг ашиглан кодчилдог.
  • График арга - мэдээллийг зураг эсвэл дүрс ашиглан кодчилдог.

Мэдээллийн кодчилолын жишээ:

Орос цагаан толгойн дууг харуулахын тулд ашиглана уу үсэг(АБВГДЭЭГ…ЭЮЯ);

Тоо харуулахын тулд ашиглана уу тоо (0123456789);

Дуу бичлэг хийж байна тэмдэглэлмөн бусад тэмдэг;

Хараагүй хэрэглээ Брайль, үсэг нь нүх ба булцуу гэсэн зургаан элементээс бүрддэг.

Брайл цагаан толгой

Мэдээллийг кодлох зарчмыг мэдэхгүй бол ижил кодыг янз бүрийн аргаар ойлгож болно, жишээлбэл, 300522005 дугаарыг тоо, утасны дугаар эсвэл хүн ам гэж тооцож болно гэдгийг санах нь зүйтэй.

Компьютер нь оруулсан мэдээллийг кодчилдог: текст, зураг, дуу чимээ. Кодлогдсон хэлбэрээр компьютер нь мэдээллийг боловсруулж, хадгалж, илгээдэг. Компьютерийн мэдээллийг хүн унших боломжтой хэлбэрээр харуулахын тулд энэ нь байх ёстой тайлах .

Шифрлэлтийн аргууд нь тусгай шинжлэх ухаанд оролцдог - криптограф .

Компьютерт аливаа мэдээллийг кодлохын тулд зөвхөн хоёр тэмдэгт ашигладаг. 0 Тэгээд 1 , учир нь компьютерийн технологихоёр төлөвийг хэрэгжүүлэхэд илүү хялбар байдаг:

0 - дохио байхгүй (хүчдэл байхгүй эсвэл гүйдэл байхгүй);

1 - дохио байна (хүчдэл эсвэл гүйдлийн урсгал байдаг).

Код үүсгэх.

Нэг бит нь хоёр төлөвийг кодлох боломжтой: 0 ба 1 (тийм ба үгүй, хар ба цагаан). Хэрэв та битийн тоог нэгээр нэмэгдүүлбэл хоёр дахин олон код авах болно.

Жишээ:

Хоёр бит нь 4 өөр код үүсгэдэг: 00, 01, 10, 11;

Гурван бит нь 000, 001, 010, 011, 100, 101, 110, 111 гэсэн 8 өөр код үүсгэдэг.

Төрөл бүрийн мэдээллийг кодлох

Текст кодчилол

Текстийг кодлохдоо тэмдэгт бүрт серийн дугаар гэх мэт утгыг оноодог.

Анхны алдартай компьютерийн текст кодчиллын стандарт гэж нэрлэдэг ASCII(Мэдээллийн солилцооны Америкийн стандарт код), тэмдэгт бүрийг кодлоход 7 бит ашигладаг.

128 тэмдэгтийг 7 битээр кодлох боломжтой: том, жижиг латин үсэг, тоо, цэг таслал, түүнчлэн тусгай тэмдэгтүүд, жишээлбэл, "§".

Стандартын өөр өөр хувилбаруудыг бүтээсэн бөгөөд кодыг 8 бит (256 тэмдэгт) болгон нэмсэн бөгөөд ингэснээр үндэсний тэмдэгтүүд, жишээлбэл, Латви үсгийг кодлох боломжтой байв.

Гэвч 256 тэмдэгт нь янз бүрийн цагаан толгойн бүх тэмдэгтүүдийг кодлоход хангалтгүй байсан тул шинэ стандартуудыг бий болгосон. Эдгээр өдрүүдэд хамгийн алдартай нь нэг юм ЮНИКОД. Тэмдэгт бүрийг 2 байтаар кодлосон тохиолдолд үр дүнд нь гарч ирнэ 62536 өөр код.

Зургийн өгөгдлийг кодлох

Компьютерт хадгалагдсан бараг бүх үүсгэсэн, боловсруулсан зургуудыг хоёр бүлэгт хувааж болно.

Растер график;

Вектор график.

Растер графикаар бүтээгдсэн аливаа дүрс нь өнгөт цэгүүдээс тогтдог. Эдгээр цэгүүдийг нэрлэдэг пиксел .

Кодлох зориулалттай өнгөт бус зургуудихэвчлэн ашигладаг 256 саарал өнгийн сүүдэрцагаанаас хар хүртэл. Бүх өнгийг кодлохын тулд, 8 бит(1 байт).

Кодлох зориулалттай өнгөт зургуудГурван өнгийг ихэвчлэн ашигладаг: улаан, ногоон, цэнхэр. Эдгээр гурван өнгийг холих замаар өнгөний аяыг олж авдаг.

Дууны кодчилол

Дуу чимээ гарч ирдэг эргэлзээагаар. Дуу нь хоёр хэмжигдэхүүнтэй:

- хэлбэлзлийн далайц, аль нь зааж байна эзлэхүүндуу чимээ;

- хэлбэлзлийн давтамж, аль нь зааж байна түлхүүрдуу чимээ.

Дууг цахилгаан дохио болгон хувиргаж болно, жишээлбэл, микрофон.

Аудио нь тодорхой хугацааны дараа дохионы хэмжээг хэмжиж, түүнд хоёртын утгыг оноож кодчилдог. Эдгээр хэмжилтийг илүү олон удаа хийх тусам илүү чанартайдуу чимээ.

Жишээ:

700 МБ багтаамжтай нэг CD нь 80 минутын CD чанартай дууг багтаах боломжтой.

Видео кодчилол

Кино нь маш хурдан өөрчлөгддөг кадруудаас бүрддэг. Кодлогдсон кино нь фрэймийн хэмжээ, ашигласан өнгө, секундэд фрэймийн тоо (ихэвчлэн 30), дуу бичлэг хийх аргын талаархи мэдээллийг агуулдаг - кадр бүрийг тусад нь эсвэл бүхэлд нь нэг дор.

Дэлхий дээр мэдээллийн урсгал байнга солилцож байдаг. Хүмүүс эх сурвалж байж болно техникийн төхөөрөмж, төрөл бүрийн зүйл, амьгүй, амьд байгалийн объект. Нэг буюу хэд хэдэн объект мэдээлэл хүлээн авах боломжтой.

Мэдээллийг илүү сайн солилцохын тулд мэдээллийг дамжуулагч тал дээр нэгэн зэрэг кодлож, боловсруулдаг (мэдээлэл бэлтгэж, цацах, боловсруулах, хадгалахад тохиромжтой хэлбэрт хөрвүүлдэг), дамжуулах, тайлах нь хүлээн авагч талд (кодлогдсон өгөгдлийг анхны хэлбэр рүү хөрвүүлэх) хийгддэг. хэлбэр). Эдгээр нь харилцан уялдаатай үүрэг даалгавар юм: эх сурвалж болон хүлээн авагч нь ижил төстэй мэдээлэл боловсруулах алгоритмтай байх ёстой, эс тэгвээс кодчилол тайлах үйл явц боломжгүй болно. График болон мультимедиа мэдээллийг кодлох, боловсруулах нь ихэвчлэн компьютерийн технологийн үндсэн дээр хэрэгждэг.

Компьютер дээрх мэдээллийг кодлох

Компьютерийн тусламжтайгаар өгөгдөл (текст, тоо, график, видео, дуу) боловсруулах олон арга байдаг. Компьютерийн боловсруулсан бүх мэдээллийг хоёртын кодоор илэрхийлдэг - бит гэж нэрлэгддэг 1 ба 0 тоог ашиглана. Техникийн хувьд энэ аргыг маш энгийнээр хэрэгжүүлдэг: 1 - цахилгаан дохио байгаа, 0 - байхгүй. Хүний үзэл бодлоос харахад ийм кодууд нь ойлголтод тохиромжгүй байдаг - кодлогдсон тэмдэгтүүд болох тэг ба нэгийн урт мөрүүдийг шууд тайлахад маш хэцүү байдаг. Гэхдээ ийм бичлэгийн формат нь мэдээллийн кодчилол гэж юу болохыг шууд харуулдаг. Жишээлбэл, хоёртын найман оронтой хэлбэрээр 8-ын тоо нь дараах битийн дараалал шиг харагдаж байна: 000001000. Гэхдээ хүнд хэцүү зүйл нь компьютерт энгийн байдаг. Электроникийн хувьд цөөн тооны нарийн төвөгтэй элементүүдээс олон энгийн элементүүдийг боловсруулах нь илүү хялбар байдаг.

Текст кодчилол

Бид гар дээрх товчлуурыг дарахад компьютер дарагдсан товчлуурын тусгай кодыг хүлээн авч, стандарт хүснэгтээс хайдаг. ASCII тэмдэгтүүд(Мэдээлэл солилцох Америкийн код) аль товчлуурыг дарж байгааг "ойлгодог" бөгөөд энэ кодыг цааш боловсруулахад (жишээлбэл, дэлгэц дээр тэмдэгт харуулах) дамжуулдаг. Тэмдэгтийн кодыг хоёртын хэлбэрээр хадгалахын тулд 8 бит ашигладаг тул хамгийн их хослолын тоо нь 256. Эхний 128 тэмдэгтийг хяналтын тэмдэгт, тоо, латин үсгүүдэд ашигладаг. Хоёр дахь хагас нь үндэсний тэмдэг, псевдографид зориулагдсан.

Текст кодчилол

Мэдээллийн кодчилол гэж юу болохыг жишээгээр ойлгоход хялбар байх болно. Англи хэлний "С" тэмдэгт ба Оросын "С" үсгийн кодуудыг авч үзье. Тэмдэгтүүд нь том үсгээр, код нь жижиг үсгээс ялгаатай гэдгийг анхаарна уу. Англи тэмдэгт нь 01000010, орос тэмдэгт нь 11010001 шиг харагдах болно. Мониторын дэлгэцэн дээр хүнд адилхан харагддаг зүйлийг компьютер огт өөрөөр хүлээн авдаг. Эхний 128 тэмдэгтийн кодууд өөрчлөгдөөгүй хэвээр байгаа бөгөөд 129 ба түүнээс хойш өөр өөр үсэг нь ашигласан кодын хүснэгтээс хамааран нэг хоёртын кодтой тохирч болохыг анхаарах хэрэгтэй. Жишээлбэл, аравтын бутархай код 194 нь KOI8 дахь "b" үсэг, CP1251 дэх "B", ISO дахь "T" үсэг, CP866 болон Mac кодчилолд энэ кодтой нэг ч тэмдэгт огт тохирохгүй байна. Тиймээс, текстийг нээхдээ орос үгсийн оронд абракадабра үсэг харвал энэ нь мэдээллийн ийм кодчилол нь бидэнд тохирохгүй бөгөөд бид өөр тэмдэгт хувиргагч сонгох хэрэгтэй гэсэн үг юм.

Тооны кодчилол

Хоёртын системд зөвхөн хоёр утгыг авдаг - 0 ба 1. Хоёртын тоотой бүх үндсэн үйлдлүүдийг шинжлэх ухаан ашигладаг. хоёртын арифметик. Эдгээр үйлдлүүд нь өөрийн гэсэн онцлог шинж чанартай байдаг. Жишээлбэл, гар дээр бичсэн 45 тоог ав. Цифр бүр ASCII кодын хүснэгтэд өөрийн гэсэн найман оронтой кодтой тул тоо нь хоёр байт (16 бит) эзэлдэг: 5 - 01010011, 4 - 01000011 . Энэ тоог тооцоололд ашиглахын тулд тусгай алгоритмаар хоёртын системд найман битийн хоёртын тоо хэлбэрээр хөрвүүлдэг: 45 - 00101101.

1950-иад онд шинжлэх ухаан, цэргийн зориулалтаар ихэвчлэн ашигладаг компьютерууд өгөгдлийг графикаар харуулахыг анх хэрэгжүүлсэн. Өнөөдөр компьютерээс хүлээн авсан мэдээллийг дүрслэн харуулах нь аливаа хүний ​​хувьд нийтлэг бөгөөд танил үзэгдэл бөгөөд тэр үед технологитой ажиллахад ер бусын хувьсгал хийсэн. Магадгүй хүний ​​​​сэтгэцийн нөлөөлөл нөлөөлсөн байх: нүдээр үзүүлсэн мэдээллийг илүү сайн шингээж, хүлээн авдаг. Өгөгдлийн дүрслэлийг хөгжүүлэх томоохон нээлт 80-аад онд график мэдээллийг кодлох, боловсруулах хүчирхэг хөгжилд хүрсэн үед гарсан.

Аналог болон дискрет график дүрслэл

Аудио кодчилол

Мультимедиа мэдээллийн кодчилол нь илүү тохиромжтой боловсруулалт хийхийн тулд дууны аналог шинж чанарыг дискрет болгон хувиргах явдал юм. ADC нь оролтын хэсэгт хүлээн авч, тодорхой хугацааны интервалаар далайцыг хэмжиж, гаралтын далайцын өөрчлөлтийн талаарх өгөгдөл бүхий тоон дарааллыг гаргадаг. Байхгүй физик өөрчлөлтүүдболохгүй байна.

Гаралтын дохио нь салангид байдаг тул далайцын хэмжилтийн давтамж (дээж) илүү олон давтамжтай байх тусам гаралтын дохио нь оролтын дохиотой илүү нарийвчлалтай тохирч байх тусам мультимедиа мэдээллийг кодлох, боловсруулах нь илүү сайн байдаг. Дээжийг мөн ADC-ээр дамжуулан хүлээн авсан тоон өгөгдлийн эрэмблэгдсэн дараалал гэж нэрлэдэг. Уг процессыг өөрөө дээж авах, оросоор дискретизаци гэж нэрлэдэг.


Урвуу хувиргалт нь DAC-ийн тусламжтайгаар хийгддэг: оролт руу орж буй тоон өгөгдөл дээр үндэслэн тодорхой цаг хугацааны туршид шаардлагатай далайцтай цахилгаан дохио үүсдэг.

Жишээ сонголтууд

Дээж авах гол параметрүүд нь зөвхөн хэмжилтийн давтамж төдийгүй битийн гүн - дээж бүрийн далайцын өөрчлөлтийг хэмжих нарийвчлал юм. Дижитал хэлбэрт шилжүүлэх явцад цаг хугацааны нэгж бүрийн дохионы далайцын утгыг илүү нарийвчлалтай дамжуулах тусам ADC-ийн дараах дохионы чанар өндөр байх тусам урвуу хувиргалт хийх үед долгионыг сэргээх найдвартай байдал өндөр болно.

Текстийн мэдээллийг компьютерт кодлох нь заримдаа төхөөрөмжийг зөв ажиллуулах эсвэл тодорхой фрагментийг харуулах зайлшгүй нөхцөл болдог. Текст, харааны мэдээлэл, дуу чимээ бүхий компьютерийг ажиллуулах явцад энэ үйл явц хэрхэн явагддаг вэ - бид энэ нийтлэлд энэ бүгдийг шинжлэх болно.

Оршил

Электрон компьютер (бидний өдөр тутмын амьдралд үүнийг компьютер гэж нэрлэдэг) текстийг маш тодорхой байдлаар хүлээн авдаг. Түүний хувьд текстийн фрагмент бүрийг бие биенээсээ тусгаарлагдсан тэмдэгтүүдийн бүлэг гэж ойлгодог тул текстийн мэдээллийг кодлох нь маш чухал юм.

Тэмдгүүд юу вэ?

Компьютерийн тэмдэгтийн үүрэг нь зөвхөн орос, англи болон бусад үсэг төдийгүй цэг таслал, бусад тэмдгүүд юм. Компьютер дээр бичиж байхдаа үгээ салгадаг орон зайг төхөөрөмж нь бэлгэдэл болгон хүлээн авдаг. Дээд математикийг санагдуулдаг зүйл, учир нь тэнд олон профессоруудын үзэж байгаагаар тэг нь давхар утгатай: энэ нь тоо бөгөөд тэр үед юу ч гэсэн үг биш юм. Философичдын хувьд ч гэсэн текст дэх орон зайн тухай асуулт гарч ирж болно сэдэвчилсэн асуудал. Мэдээжийн хэрэг хошигнол, гэхдээ тэдний хэлснээр хошигнол болгонд зарим нэг үнэн байдаг.

Ямар мэдээлэл байна вэ?

Тиймээс мэдээллийг хүлээн авахын тулд компьютер боловсруулах процессыг эхлүүлэх хэрэгтэй. Тэгээд ямар мэдээлэл байна вэ? Энэ нийтлэлийн сэдэв нь текстэн мэдээллийн кодчилол юм. Бид энэ ажилд онцгой анхаарал хандуулах болно, гэхдээ бид бусад бичил сэдвүүдийг ч бас авч үзэх болно.

Мэдээлэл нь текст, тоо, дуу, график байж болно. Жишээлбэл, компьютер бидний бичсэн зүйлийг гар дээр харуулахын тулд текстийн мэдээллийг кодлох процессыг эхлүүлэх ёстой. Бид тэмдэг, үсэг харах болно, энэ нь ойлгомжтой. Гэхдээ машин юу харж байна вэ? Энэ нь үнэхээр бүх мэдээллийг хүлээн авдаг - одоо бид зөвхөн текстийн тухай яриагүй - тэг ба нэгийн тодорхой дараалал гэж үздэг. Тэд хоёртын код гэж нэрлэгддэг үндэс суурийг бүрдүүлдэг. Үүний дагуу төхөөрөмжөөс хүлээн авсан мэдээллийг ойлгомжтой болгон хувиргах үйл явцыг "текст мэдээллийн хоёртын кодчилол" гэж нэрлэдэг.

Хоёртын кодын товч зарчим

Яагаад хамгийн түгээмэл байдаг электрон машинуудМэдээллийн кодчилолыг хоёртын кодоор яг хүлээн авсан уу? Тэг ба нэгийг ашиглан кодлогдсон текстийн суурь нь ямар ч тэмдэгт, тэмдэгтийн дараалал байж болно. Гэсэн хэдий ч, энэ нь мэдээллийн хоёртын текст кодчилолын цорын ганц давуу тал биш юм. Гол нь энэ кодчилолын аргыг зохион байгуулах зарчим нь маш энгийн, гэхдээ нэгэн зэрэг нэлээд ажиллагаатай байдаг. Цахилгаан импульс байгаа үед үүнийг нэгжээр (мэдээж болзолтойгоор) тэмдэглэнэ. Импульс байхгүй - тэгийг тэмдэглэнэ үү. Өөрөөр хэлбэл, мэдээллийн текст кодчилол нь цахилгаан импульсийн дарааллыг бий болгох зарчим дээр суурилдаг. Хоёртын тэмдэгтүүдээс бүрдэх логик дарааллыг машины хэл гэж нэрлэдэг. Үүний зэрэгцээ текстэн мэдээллийг хоёртын код ашиглан кодлох, боловсруулах нь үйл ажиллагааг нэлээд богино хугацаанд гүйцэтгэх боломжтой болгодог.

Бит ба байт

Машинд хүлээн зөвшөөрөгдсөн дүрс нь тодорхой хэмжээний мэдээллийг агуулдаг. Энэ нь нэг биттэй тэнцүү байна. Энэ нь шифрлэгдсэн мэдээллийн нэг буюу өөр дарааллыг бүрдүүлдэг тэг бүрт хамаарна.

Үүний дагуу ямар ч тохиолдолд мэдээллийн хэмжээг хоёртын кодын дарааллын тэмдэгтүүдийн тоог мэдэх замаар л тодорхойлж болно. Тэд бие биетэйгээ тоогоор тэнцүү байх болно. Кодын 2 цифр нь 2 бит, 10 цифр - 10 бит гэх мэт мэдээллийг агуулна. Хоёртын кодын тодорхой хэсэг дэх мэдээллийн хэмжээг тодорхойлох зарчим нь таны харж байгаагаар маш энгийн юм.

Текст мэдээллийг компьютерт кодлох

Яг одоо та бидний үзэж байгаагаар орос цагаан толгойн үсгүүдийн дарааллаас бүрдсэн нийтлэлийг уншиж байна. Өмнө дурьдсанчлан компьютер нь бүх мэдээллийг (энэ тохиолдолд ч гэсэн) үсэг биш, харин тэг ба нэгүүдийн дараалал гэж хүлээн зөвшөөрдөг бөгөөд энэ нь цахилгаан импульс байхгүй, оршихуйг илэрхийлдэг.

Гол нь бидний дэлгэцэн дээр харж буй нэг тэмдэгтийг байт гэж нэрлэгддэг ердийн хэмжүүрээр кодлох боломжтой юм. Дээр бичсэнчлэн хоёртын код нь мэдээллийн ачаалал гэж нэрлэгддэг. Тоон хувьд энэ нь сонгосон кодын фрагмент дэх тэг ба нэгүүдийн нийт тоотой тэнцүү гэдгийг санаарай. Тэгэхээр 8 бит нь 1 байт болгодог. Энэ тохиолдолд ижил хэмжээтэй 8 нүднээс бүрдэх тэгш өнцөгтийг цаасан дээр зурах замаар хялбархан харж болох тул дохионы хослолууд нь маш өөр байж болно.

256 тэмдэгтийн багтаамжтай цагаан толгойн үсгийг ашиглан текстэн мэдээллийг кодлох боломжтой болж байна. Ямар учиртай юм бэ? Үүний утга нь тэмдэгт бүр өөрийн гэсэн хоёртын кодтой байх явдал юм. Тодорхой тэмдэгтүүдэд хавсаргасан хослолууд нь 00000000-аас эхэлж 11111111-ээр төгсдөг. Хэрэв та хоёртын системээс аравтын тооллын системд шилжсэн бол ийм систем дэх мэдээллийг 0-ээс 255 хүртэл кодлох боломжтой.

Одоо орос цагаан толгойн үсгийн кодчилолыг ашигладаг янз бүрийн хүснэгтүүд байдаг гэдгийг бүү мартаарай. Эдгээр нь жишээлбэл, ISO ба KOI-8, Mac ба CP гэсэн хоёр хувилбартай: 1251 ба 866. Эдгээр хүснэгтүүдийн аль нэгэнд кодлогдсон текст өөр кодчилолд зөв харагдахгүй эсэхийг шалгахад хялбар байдаг. Энэ нь дотор байгаатай холбоотой юм өөр өөр хүснэгтүүдөөр өөр тэмдэгтүүд нь ижил хоёртын кодтой тохирч байна.

Энэ нь эхэндээ асуудал байсан. Гэсэн хэдий ч одоогийн байдлаар текстийг хөрвүүлдэг програмуудад тусгай алгоритмууд аль хэдийн баригдсан бөгөөд үүнийг зөв хэлбэрт оруулдаг. 1997 оныг Юникод хэмээх кодчилол бий болгосноор тэмдэглэсэн. Үүнд тэмдэгт бүр нэг дор 2 байт эзэмшдэг. Энэ нь илүү олон тооны тэмдэгттэй текстийг кодлох боломжийг танд олгоно. 256 ба 65536: ялгаа байна уу?

График кодчилол

Текст болон график мэдээллийг кодлох нь ижил төстэй талуудтай. Таны мэдэж байгаагаар график мэдээллийг харуулахад ашигладаг захын төхөөрөмжмонитор гэж нэрлэгддэг компьютер. Одоо график (бид одоо ярьж байна компьютер график) янз бүрийн салбарт өргөн хэрэглэгддэг. Сайн, техник хангамжийн чадвар хувийн компьютерууднэлээн төвөгтэй график асуудлыг шийдвэрлэх боломжийг танд олгоно.

Энэ нь видео мэдээллийг боловсруулах боломжтой болсон өнгөрсөн жил. Гэхдээ текст нь графикаас хамаагүй "хөнгөн" бөгөөд энэ нь зарчмын хувьд ойлгомжтой юм. Үүнээс болж график файлуудын эцсийн хэмжээг нэмэгдүүлэх шаардлагатай. График мэдээллийн мөн чанарыг мэдэж, ийм бэрхшээлийг даван туулах боломжтой.

Эхлээд энэ төрлийн мэдээлэл ямар бүлэгт хуваагддагийг ойлгоцгооё. Нэгдүгээрт, энэ нь растер юм. Хоёрдугаарт, вектор.

Растер зураг нь алаг цаастай нэлээд төстэй юм. Ийм цаасан дээрх нүд бүрийг нэг эсвэл өөр өнгөөр ​​буддаг. Энэ зарчим нь мозайкийг зарим талаар санагдуулдаг. Өөрөөр хэлбэл, растер графикт дүрс нь тусдаа үндсэн хэсгүүдэд хуваагддаг нь харагдаж байна. Тэдгээрийг пиксел гэж нэрлэдэг. Орос хэл рүү орчуулбал пиксел нь "цэг" гэсэн утгатай. Логикийн хувьд пикселүүд нь мөртэй харьцуулахад эрэмблэгдсэн байдаг. График сүлжээ нь зөвхөн тодорхой тооны пикселээс бүрдэнэ. Үүнийг бас растер гэж нэрлэдэг. Эдгээр хоёр тодорхойлолтыг харгалзан бид үүнийг хэлж чадна bitmapЭнэ нь тэгш өнцөгт сүлжээнд харагдах пикселийн багцаас өөр зүйл биш юм.

Мониторын растер болон пикселийн хэмжээ нь зургийн чанарт нөлөөлдөг. Энэ нь өндөр байх тусам мониторын растер том байх болно. Растер хэмжээ нь хэрэглэгч бүрийн сонссон дэлгэцийн нягтрал юм. Компьютерийн дэлгэцийн хамгийн чухал шинж чанаруудын нэг нь зөвхөн нягтрал биш, нягтрал юм. Энэ нь нэг буюу өөр уртын нэгжид хэдэн пиксел байгааг харуулдаг. Мониторын нягтралыг ихэвчлэн нэг инч тутамд пикселээр хэмждэг. Нэгж уртад илүү олон пиксел байх тусам чанар нь өндөр байх болно, учир нь "мөхлөг" багасдаг.

Аудио урсгал боловсруулах

Текст болон дууны мэдээллийг кодлох нь бусад төрлийн кодчилолын нэгэн адил зарим онцлог шинж чанартай байдаг. Бид одоо хамгийн сүүлийн процесст анхаарлаа хандуулах болно: аудио мэдээллийг кодлох.

Аудио урсгалын танилцуулгыг (мөн нэг дууг) хоёр аргаар хийж болно.

Дууны мэдээллийн танилцуулгын аналог хэлбэр

Энэ тохиолдолд үнэ цэнэ нь үнэхээр асар олон тооны өөр өөр утгыг авч болно. Түүнээс гадна эдгээр ижил утгууд нь тогтмол хэвээр байдаггүй: тэд маш хурдан өөрчлөгддөг бөгөөд энэ үйл явц тасралтгүй үргэлжилдэг.

Дууны мэдээллийн дүрслэлийн салангид хэлбэр

Хэрэв бид салангид аргын талаар ярих юм бол энэ тохиолдолд утга нь зөвхөн хязгаарлагдмал тооны утгыг авч болно. Энэ тохиолдолд өөрчлөлт нь үсрэлт, хязгаарт тохиолддог. Энэ нь зөвхөн дуу чимээг төдийгүй бас салангид кодлох боломжтой график мэдээлэл. Дашрамд хэлэхэд аналог хэлбэрийн хувьд.

Аналог аудио мэдээлэл дээр хадгалагдана винил бичлэгүүд, Жишээлбэл. Гэхдээ CD нь аль хэдийн сайн шинж чанартай мэдээллийг үзүүлэх салангид арга юм.

Хамгийн эхэнд бид компьютер бүх мэдээллийг машины хэлээр хүлээн авдаг тухай ярьсан. Үүнийг хийхийн тулд мэдээллийг цахилгаан импульсийн дараалал хэлбэрээр кодчилдог - тэг ба нэг. Аудио кодчилол нь энэ дүрэмд үл хамаарах зүйл биш юм. Компьютер дээр дууг боловсруулахын тулд эхлээд ижил дарааллаар эргүүлэх хэрэгтэй. Үүний дараа л урсгал эсвэл нэг дуунд үйлдлүүдийг хийж болно.

Кодчлох процесс явагдах үед урсгал нь түр зуурын түүвэрлэлтэнд ордог. Дууны долгион нь тасралтгүй, цаг хугацааны жижиг хэсгүүдэд үүсдэг. Энэ тохиолдолд далайцын утгыг тодорхой интервал бүрт тусад нь тогтооно.

Дүгнэлт

Тэгэхээр, энэ нийтлэлийн явцад бид юу олж мэдсэн бэ? Нэгдүгээрт, компьютерийн дэлгэц дээр гарч ирэхээс өмнө гарч буй бүх мэдээллийг кодчилдог. Хоёрдугаарт, энэ кодчилол нь мэдээллийг машины хэл рүү хөрвүүлэх явдал юм. Гуравдугаарт, машины хэл нь цахилгаан импульсийн дараалал - тэг ба нэгээс өөр зүйл биш юм. Дөрөвдүгээрт, кодлох зориулалттай янз бүрийн тэмдэгтусдаа ширээ байдаг. Тавдугаарт, график танилцуулах ба дуу чимээтэй мэдээлэланалог болон боломжтой салангид хэлбэр. Энд магадгүй бидний дүн шинжилгээ хийсэн гол зүйлүүд байна. Судалдаг салбаруудын нэг өгөгдсөн талбай, бол компьютерийн шинжлэх ухаан юм. Текстийн мэдээллийн кодчилол, түүний үндсийг сургуульд тайлбарладаг, учир нь үүнд төвөгтэй зүйл байхгүй.

Орчин үеийн компьютер нь тоон, текст, график, дуу, видео мэдээллийг боловсруулах боломжтой. Компьютер дээрх эдгээр бүх төрлийн мэдээллийг хоёртын кодоор илэрхийлдэг, өөрөөр хэлбэл хоёр тэмдэгтийн багтаамжтай цагаан толгойн үсгийг (0 ба 1) ашигладаг. Энэ нь мэдээллийг цахилгаан импульсийн дараалал хэлбэрээр илэрхийлэхэд тохиромжтой байдагтай холбоотой юм: импульс байхгүй (0), импульс (1) байна. Ийм кодчиллыг ихэвчлэн хоёртын систем гэж нэрлэдэг бөгөөд тэг ба нэгүүдийн логик дарааллыг машины хэл гэж нэрлэдэг.

Машины хоёртын кодын цифр бүр нь нэг биттэй тэнцэх хэмжээний мэдээллийн хэмжээг агуулна.

Машины цагаан толгойн тоог ижил магадлалтай үйл явдлууд гэж үзээд ийм дүгнэлт хийж болно. Хоёртын цифр бичихдээ боломжит хоёр төлөвөөс зөвхөн нэгийг нь сонгох боломжтой бөгөөд энэ нь 1 биттэй тэнцэх хэмжээний мэдээллийг агуулна гэсэн үг юм. Тиймээс хоёр оронтой тоо нь 2 бит, дөрвөн оронтой тоо - 4 бит гэх мэт мэдээллийг агуулна. Бит дэх мэдээллийн хэмжээг тодорхойлохын тулд хоёртын машины кодын цифрүүдийн тоог тодорхойлоход хангалттай.

Текст мэдээллийн кодчилол

Одоогийн байдлаар ихэнх хэрэглэгчид үсэг, тоо, цэг таслал гэх мэт тэмдэгтүүдээс бүрдсэн текст мэдээллийг боловсруулахдаа компьютер ашигладаг.

1 битийн мэдээллийн багтаамжтай нэг нүдэн дээр үндэслэн зөвхөн 2 өөр төлөвийг кодлох боломжтой. Латин үсгээр гарнаас оруулж болох тэмдэгт бүр өөрийн гэсэн хоёртын кодыг авахын тулд 7 бит шаардлагатай. Хартлийн томъёоны дагуу 7 битийн дараалалд үндэслэн N=2 7 =128 тэг ба нэгийн өөр өөр хослолыг олж авах боломжтой. хоёртын кодууд. Тэмдэгт бүрт хоёртын кодыг өгснөөр бид кодчиллын хүснэгтийг авдаг. Хүн тэмдэгтүүдтэй, компьютер нь хоёртын кодтой ажилладаг.

Латин гарны байршлын хувьд дэлхий даяар ийм кодчиллын хүснэгт байдаг тул латин хэлээр бичсэн текстийг ямар ч компьютер дээр хангалттай харуулах болно. Энэ хүснэгтийг ASCII (American Standard Code of Information Interchange) гэж нэрлэдэг бөгөөд англиар үүнийг [eski] гэж дууддаг, оросоор үүнийг [aski] гэж дууддаг. Доорх кодыг аравтын бутархай хэлбэрээр харуулсан ASCII хүснэгтийг бүхэлд нь харуулав. Үүнийг гараас "*" тэмдгийг оруулахад компьютер үүнийг 42(10) код, эргээд 42(10)=101010(2) гэж ойлгодог болохыг тодорхойлоход ашиглаж болно - энэ нь хоёртын систем юм. "*" тэмдгийн код. Энэ хүснэгтэд 0-ээс 31 хүртэлх кодыг ашиглаагүй.

ASCII тэмдэгтийн хүснэгт

Нэг тэмдэгтийг кодлохын тулд 1 байттай тэнцэх хэмжээний мэдээллийг ашигладаг, өөрөөр хэлбэл би \u003d 1 байт \u003d 8 бит. Боломжит үйл явдлын K тоо ба мэдээллийн I-ийн хэмжээг холбосон томьёог ашиглан та хэдэн өөр тэмдэгтийг кодлох боломжтойг тооцоолж болно (тэмдэгтүүдийг боломжит үйл явдал гэж үзвэл):

K \u003d 2 I \u003d 2 8 \u003d 256,

өөрөөр хэлбэл, 256 тэмдэгтийн багтаамжтай цагаан толгойг текстэн мэдээллийг илэрхийлэхэд ашиглаж болно.

Кодчлолын мөн чанар нь тэмдэгт бүрт 00000000-аас 11111111 хүртэлх хоёртын код эсвэл 0-ээс 255 хүртэлх аравтын бутархай кодыг өгдөг.

Одоогийн байдлаар үүнийг санаж байх ёстой Орос үсгийг кодлохдоо таван өөр кодын хүснэгтийг ашигладаг(KOI - 8, СР1251, СР866, Mac, ISO), үүнээс гадна нэг хүснэгтийг ашиглан кодлогдсон текстийг өөр кодчилолд зөв харуулахгүй. Харааны хувьд үүнийг хосолсон тэмдэгтийн кодчилолын хүснэгтийн хэсэг болгон илэрхийлж болно.

Ижил хоёртын кодонд өөр өөр тэмдэгтүүдийг оноодог.

хоёртын код

Аравтын код

Гэсэн хэдий ч ихэнх тохиолдолд текстийн баримт бичгийг хөрвүүлэхэд хэрэглэгч биш, харин тусгай хөтөлбөрүүд- програмуудад суулгасан хувиргагч.

1997 оноос хойш хамгийн сүүлийн үеийн хувилбарууд Microsoft Officeшинэ кодчилолыг дэмжих. Үүнийг Юникод гэдэг. Юникод бол тэмдэгт бүрийг кодлоход 2 байт ашигладаг кодчиллын хүснэгт юм. 16 бит Ийм хүснэгтэд үндэслэн N=2 16 =65,536 тэмдэгтийг кодлох боломжтой.

Юникод нь араб, армян, бенгал, бирм, грек, гүрж, деванагари, еврей, кирилл, копт, кхмер, латин, тамил, хангул, хань (Хятад, Япон, Солонгос), Чероки, этиоп хэл зэрэг орчин үеийн бараг бүх скриптийг агуулдаг. Япон (катакана, хирагана, ханз) болон бусад.

Эрдэм шинжилгээний зорилгоор эртний Грек, Египетийн иероглиф, дөрвөлжин үсэг, Майя үсэг, этруск цагаан толгой зэрэг олон түүхэн бичгүүдийг нэмсэн.

Юникод нь математикийн болон хөгжмийн тэмдэгтүүд, мөн пиктограммуудын өргөн хүрээг хамардаг.

Юникод кирилл үсгийн хоёр төрлийн код байдаг:

Кирилл (#0400 - #04FF)

Кириллийн нэмэлт (#0500 - #052F).

Гэхдээ юникод хүснэгтийг цэвэр хэлбэрээр нэвтрүүлэх нь хэрэв нэг тэмдэгтийн код нэг байт биш, харин хоёр байт авдаг бол текстийг хадгалахад дискний зай хоёр дахин их, хоёр дахин их цаг хугацаа шаардагддагтай холбоотой юм. холбооны сувгаар дамжуулах.

Тиймээс UTF-8 (Unicode Transformation Format) Юникод дүрслэл нь одоо практикт илүү түгээмэл болсон. UTF-8 нь 8 битийн тэмдэгт ашигладаг системтэй хамгийн сайн нийцтэй байдлыг хангадаг. Зөвхөн 128-аас бага тэмдэгтээс бүрдсэн текстийг UTF-8 дээр бичихдээ энгийн ASCII текст рүү хөрвүүлдэг. Үлдсэн Юникод тэмдэгтүүдийг 2-оос 4 байт урттай дарааллаар төлөөлдөг. Ерөнхийдөө дэлхийн хамгийн түгээмэл тэмдэгтүүд болох латин тэмдэгтүүд UTF-8-д 1 байт эзэлдэг тул энэхүү кодчилол нь цэвэр Юникодоос илүү хэмнэлттэй байдаг.

Тоон тэмдэгтийн кодыг тодорхойлохын тулд та кодын хүснэгтийг ашиглаж болно. Үүнийг хийхийн тулд цэснээс "Insert" - "Symbol" гэсэн зүйлийг сонгоод дараа нь Symbol харилцах цонх дэлгэц дээр гарч ирнэ. Сонгосон үсгийн тэмдэгтийн хүснэгт харилцах цонхонд гарч ирнэ. Энэ хүснэгтийн тэмдэгтүүдийг зай тэмдэгтээс эхлэн зүүнээс баруун тийш дараалан мөр мөрөөр нь байрлуулна.



Ачааж байна...
Топ