Témou je riešenie problémov s kódovaním zvukových informácií. Kódovanie informácií

Časové vzorkovanie zvuku.

Zvuk je zvuková vlna s plynule sa meniacou amplitúdou a frekvenciou. Čím väčšia je amplitúda signálu, tým je pre človeka hlasnejší, čím vyššia je frekvencia signálu, tým vyšší je tón. Na to, aby počítač spracoval zvuk, musí byť súvislý zvukový signál prevedený na sekvenciu elektrických impulzov (binárne jednotky a nuly).

Počas procesu kódovania kontinuálne zvukový signál vykonáva sa jeho časové vzorkovanie. Súvislá zvuková vlna je rozdelená na samostatné malé dočasné úseky a pre každý takýto úsek je nastavená určitá hodnota amplitúdy.
Diskretizácia je premena spojitých signálov na množinu diskrétnych hodnôt, z ktorých každá má priradený špecifický binárny kód.


Plynulá závislosť amplitúdy signálu od času A(t) je teda nahradená diskrétnou sekvenciou úrovní hlasitosti. Na grafe to vyzerá ako nahradenie hladkej krivky sekvenciou „krokov“.

Každému „kroku“ je priradená úroveň hlasitosti a jej kód (1, 2, 3 atď.). Úrovne hlasitosti zvuku možno považovať za súbor možných stavov, čím viac úrovní hlasitosti je priradených počas procesu kódovania, tým viac informácií bude mať každá úroveň a tým lepší bude zvuk. Moderné zvukové karty poskytujú 16-bitovú hĺbku kódovania zvuku. Počet rôznych úrovní signálu (stavov pre dané kódovanie) možno vypočítať pomocou vzorca:
N=2 16 =65356[hladiny zvuku],
kde I je hĺbka kódovania.

Moderné zvukové karty teda môžu poskytnúť kódovanie 65536 úrovní signálu. Každá hodnota amplitúdy zvukového signálu má priradený 16-bitový kód.

Pri binárnom kódovaní súvislého zvukového signálu je tento nahradený sekvenciou diskrétnych úrovní signálu. Kvalita kódovania závisí od počtu meraní úrovne signálu za jednotku času, teda od vzorkovacej frekvencie. Čím viac meraní sa vykoná za 1 sekundu (čím vyššia je vzorkovacia frekvencia), tým presnejší je postup binárneho kódovania.

Kvalita binárneho kódovania zvuku je určená hĺbkou kódovania a vzorkovacou frekvenciou.

Počet meraní za sekundu sa môže pohybovať od 8 000 do 96 000, to znamená, že vzorkovacia frekvencia analógového audio signálu môže nadobúdať hodnoty od 8 do 96 [kHz]. Pri frekvencii 8[kHz] zodpovedá kvalita vzorkovaného zvukového signálu kvalite rozhlasového vysielania a pri frekvencii 96[kHz] kvalite zvuku zvukového CD. Treba tiež vziať do úvahy, že sú možné mono aj stereo režimy.

Informačná hlasitosť zvukového súboru

Na určenie objemu zvukový súbor V zf je potrebné vynásobiť počet meraní K meas hĺbkou kódovania (počet bitov na úroveň) V 1meas:

V zf = K meas * V 1 meas

Kde počet meraní K meas závisí od:

Problém 1


Domáca úloha

1 Určite hlasitosť stereo audio súboru pri vzorkovacej frekvencii (dd) [kHz], čase zvuku (gg) [s] pre (mm)-bitové kódovanie.

2 Určite čas prehrávania v [s] mono zvukového súboru s hlasitosťou rovnajúcou sa (yy) [KB], s hĺbkou kódovania (mm) [BIT] a vzorkovacou frekvenciou (dd) [kHz].
Kde (dd) je váš dátum narodenia, (mm) je mesiac vášho narodenia, (yy) je rok vášho narodenia.

Ľudské ucho vníma zvuk s frekvenciou od 20 vibrácií za sekundu (slabý zvuk) do 20 000 vibrácií za sekundu (vysoký zvuk).

Človek môže vnímať zvuk v obrovskom rozsahu intenzít, v ktorých je maximálna intenzita 10 14 krát väčšia ako minimálna (stotisíc miliárd krát). Na meranie hlasitosti zvuku sa používa špeciálna jednotka "decibel"(dbl) (tabuľka 5.1). Zníženie alebo zvýšenie hlasitosti zvuku o 10 dbl zodpovedá zníženiu alebo zvýšeniu intenzity zvuku 10-násobne.

Časové vzorkovanie zvuku. Na to, aby počítač spracoval zvuk, musí byť spojitý zvukový signál prevedený do digitálnej diskrétnej formy pomocou časového vzorkovania. Súvislá zvuková vlna je rozdelená na samostatné malé dočasné úseky a pre každý takýto úsek je nastavená určitá hodnota intenzity zvuku.

Plynulá závislosť hlasitosti zvuku od času A(t) je teda nahradená diskrétnou sekvenciou úrovní hlasitosti. Na grafe to vyzerá ako nahradenie hladkej krivky sekvenciou „krokov“ (obr. 1.2).


Ryža. 1.2. Časové vzorkovanie zvuku

Vzorkovacia frekvencia. Mikrofón pripojený k zvukovej karte sa používa na nahrávanie analógového zvuku a jeho prevod do digitálnej podoby. Kvalita prijatého digitálny zvuk závisí od počtu meraní hladiny hlasitosti zvuku za jednotku času, t.j. vzorkovacie frekvencie. Čím viac meraní sa vykoná za sekundu (čím vyššia je vzorkovacia frekvencia), tým presnejšie „rebrík“ digitálneho audio signálu sleduje krivku dialógového signálu.

Vzorkovacia frekvencia zvuku je počet meraní hlasitosti zvuku za jednu sekundu.

Vzorkovacia frekvencia zvuku sa môže pohybovať od 8 000 do 48 000 meraní hlasitosti zvuku za sekundu.

Hĺbka kódovania zvuku. Každému „kroku“ je priradená špecifická úroveň hlasitosti. Úrovne hlasitosti zvuku možno považovať za súbor možných stavov N, ktorých kódovanie vyžaduje určité množstvo informácií I, ktoré sa nazývajú hĺbka kódovania zvuku.

Hĺbka kódovania zvuku je množstvo informácií potrebných na zakódovanie jednotlivých úrovní hlasitosti digitálneho zvuku.

Ak je známa hĺbka kódovania, počet úrovní hlasitosti digitálneho zvuku možno vypočítať pomocou vzorca N = 2 I. Nech je hĺbka kódovania zvuku 16 bitov, potom sa počet úrovní hlasitosti zvuku rovná:

N = 2 I = 216 = 65,536.

Počas procesu kódovania je každej úrovni hlasitosti priradený vlastný 16-bitový binárny kód, najnižšia úroveň zvuku bude zodpovedať kódu 000000000000000 a najvyššia - 1111111111111111.

Kvalita digitalizovaného zvuku.Čím vyššia je frekvencia a hĺbka vzorkovania zvuku, tým vyššia je kvalita digitalizovaného zvuku. Digitalizovaný zvuk najnižšej kvality zodpovedajúci kvalite telefonickú komunikáciu, získaná pri vzorkovacej frekvencii 8000-krát za sekundu, hĺbke vzorkovania 8 bitov a zázname jednej zvukovej stopy (mono režim). Najviac vysoká kvalita digitalizovaný zvuk zodpovedajúci kvalite audio CD sa dosahuje vzorkovacou frekvenciou 48 000-krát za sekundu, hĺbkou vzorkovania 16 bitov a záznamom dvoch zvukových stôp (režim stereo).

Je potrebné mať na pamäti, že čím vyššia je kvalita digitálneho zvuku, tým väčší je objem informácií zvukového súboru. Môžete odhadnúť objem informácií digitálneho stereo zvukového súboru s dĺžkou zvuku 1 sekundu s priemernou kvalitou zvuku (16 bitov, 24 000 meraní za sekundu). Aby ste to dosiahli, musíte hĺbku kódovania vynásobiť počtom meraní za 1 sekundu a vynásobiť 2 (stereo zvuk):

16 bitov × 24 000 × 2 = 768 000 bitov = 96 000 bajtov = 93,75 kB.

Zvukové editory. Zvukové editory umožňujú zvuk nielen nahrávať a prehrávať, ale aj upravovať. Digitalizovaný zvuk je prezentovaný v zvukové editory vo vizuálnej podobe, takže kopírovanie, presúvanie a mazanie častí zvukovej stopy je možné jednoducho vykonávať pomocou myši. Okrem toho môžete prekrývať zvukové stopy cez seba (mixovať zvuky) a aplikovať rôzne akustické efekty (echo, prehrávanie v opačnom smere atď.).

Zvukové editory vám umožňujú zmeniť kvalitu digitálneho zvuku a veľkosť zvukového súboru zmenou vzorkovacej frekvencie a hĺbky kódovania. Digitalizovaný zvuk je možné uložiť nekomprimovaný do zvukových súborov univerzálny formát WAV alebo v komprimovanom formáte MP3.

Pri ukladaní zvuku v komprimovaných formátoch sa zvukové frekvencie s nízkou intenzitou, ktoré sú pre ľudské vnímanie „nadmerné“ a časovo zhodujú s zvukových frekvencií s veľkou intenzitou. Použitie tohto formátu umožňuje komprimovať zvukové súbory niekoľko desiatokkrát, ale vedie k nenávratnej strate informácií (súbory nie je možné obnoviť do pôvodnej podoby).

Kontrolné otázky

1. Ako ovplyvňuje vzorkovacia frekvencia a hĺbka kódovania kvalitu digitálneho zvuku?

Úlohy na samostatné dokončenie

1.22. Úloha selektívnej odpovede. Zvuková karta vytvára binárne kódovanie analógového audio signálu. Koľko informácií je potrebných na zakódovanie každej zo 65 536 možných úrovní intenzity signálu?
1) 16 bitov; 2) 256 bitov; 3) 1 bit; 4) 8 bitov.

1.23. Úloha s podrobnou odpoveďou. Odhadnite objem informácií digitálnych zvukových súborov trvajúcich 10 sekúnd pri hĺbke kódovania a vzorkovacej frekvencii zvukového signálu, ktoré poskytujú minimálnu a maximálnu kvalitu zvuku:
a) mono, 8 bitov, 8000 meraní za sekundu;
b) stereo, 16 bitov, 48 000 meraní za sekundu.

1.24. Úloha s podrobnou odpoveďou. Určite trvanie zvukového súboru, ktorý sa zmestí na 3,5-palcovú disketu (všimnite si, že na ukladanie údajov na takúto disketu je vyčlenených 2847 sektorov po 512 bajtoch):
a) s nízkou kvalitou zvuku: mono, 8 bitov, 8000 meraní za sekundu;
b) s vysokou kvalitou zvuku: stereo, 16 bitov, 48 000 meraní za sekundu.

1. Všeobecné informácie

zložitosť: základné.

Približný čas riešenia (pre tých, ktorí budú robiť časť 2): 2 minúty

Predmet: Tvorba a spracovanie grafických a multimediálnych informácií

Podtéma: Digitálny záznam zvuku

Čo sa kontroluje: Schopnosť hodnotiť kvantitatívne charakteristiky proces nahrávania zvuku.

Stručné teoretické informácie: Pretože tento typúloha je nová v Jednotnej štátnej skúške KIM, zadáme ju (zatiaľ bez odôvodnenia, odôvodnenie nižšie) matematický model proces nahrávania:

N = k * F * L * T (1)

  • N– veľkosť súboru (v bitoch), ktorý obsahuje zvukový záznam;
  • k- počet nahrávacích kanálov (napríklad 1 – mono, 2 – stereo, 4 – quad atď.);
  • F– vzorkovacia frekvencia (v hertzoch), t.j. počet hodnôt amplitúdy zvuku zaznamenaných za jednu sekundu;
  • L– rozlíšenie, t.j. počet bitov použitých na uloženie každej nameranej hodnoty;
  • T– trvanie zvukového fragmentu (v sekundách).

Ako môže úloha vyzerať? Napríklad takto: Hodnoty všetkých požadovaných parametrov procesu nahrávania zvuku sú špecifikované, okrem jedného. Musíte odhadnúť hodnotu zostávajúceho parametra, napríklad veľkosť súboru alebo trvanie zvukového fragmentu.


Príklad podmienky:

Možné odpovede:

1) 0,2 MB

2. Príklad zadania

2.1. Úloha.

Problém 2012-A8-1.

Jednokanálový (mono) záznam zvuku sa vykonáva so vzorkovacou frekvenciou 16 kHz a 24-bitovým rozlíšením. Záznam trvá 1 minútu, jeho výsledky sa zapisujú do súboru, kompresia dát sa nevykonáva. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

1) 0,2 MB 2) 2 MB 3) 3 MB 4) 4 MB

2.2. Riešenie.

Zredukujeme počiatočné údaje na veľkosť bitov-sekúnd-hertzov a vykonáme výpočty pomocou vzorca (1):

Vzhľadom na to:

k= 1, pretože Jednokanálový (mono) zvukový záznam;

F= 16 kHz = 16 000 Hz;

T= 1 min = 60 s.

NájsťN

Dosaďte hodnotu známych parametrov do vzorca (1)

N=1*16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 * 5625 (bitov) =

= 2 12 *5625 bitov = (2 12 *5625)/2 3 bajtov = 2 9 *5625 bajtov =

= (2 9 *5625)/ 2 20 MB = 5625/2 11 MB = 5625/2048 MB.

číslo 5625/2048 je medzi číslami 2 a 3. Navyše je bližšie k 3 ako k 2, pretože 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

Správna odpoveď: Nie. 3 (3 MB)

Komentujte. Ďalšia myšlienka riešenia je uvedená v odseku 3.3

3. Tipy pre učiteľov a študentov

3.1 Aké vedomosti/schopnosti/zručnosti potrebuje študent na vyriešenie tohto problému?

1) Nemali by ste si „zapamätať“ vzorec (1). Študent, ktorý predstavuje podstatu procesu digitálneho nahrávania zvuku, ju musí vedieť samostatne formulovať.

2) Musíte vedieť zapísať hodnoty parametrov v požadovanom rozmere, ako aj základné aritmetické zručnosti, vrát. pracujúci s mocninou dvoch.

A. Silní študenti.

1. S najväčšou pravdepodobnosťou tento problém aj tak vyriešia.

2. Žiakom môžete dať za úlohu otestovať v praxi vzorec (1) nahrávaním zvuku z mikrofónu do súboru. Upozorňujeme, že to platí len vtedy, ak zaznamenané informácie nie sú komprimované (formát WAV (PCM) nekomprimovaný). Ak sa použijú komprimované zvukové formáty (WMA, MP3), potom bude veľkosť výsledného súboru z pochopiteľných dôvodov výrazne menšia ako vypočítaná. Na experimentovanie s digitálnym nahrávaním zvuku môžete použiť voľne dostupný zvukový editor Audacity (http://audacity.sourceforge.net/).

3. Je vhodné zdôrazniť pojmovú zhodu rastrovej reprezentácie zvuku a obrazu, ktoré sú varietami toho istého procesu približnej reprezentácie spojitého signálu - sekvencie krátkych diskrétnych signálov, t.j. digitalizácia založená na vzorkovaní. Kedy bitová mapa Vykonáva sa dvojrozmerné vzorkovanie jasu v priestore a v prípade zvuku jednorozmerné vzorkovanie v čase. V oboch prípadoch zvýšenie vzorkovacej frekvencie (počet pixelov alebo zvukových vzoriek) a/alebo zvýšenie počtu bitov reprezentujúcich jednu vzorku (farebná alebo zvuková bitová hĺbka) vedie k zvýšeniu kvality digitalizácie pri súčasnom zvýšení veľkosti. súboru s digitálnou reprezentáciou. Preto je potrebná kompresia údajov.

4. Je vhodné spomenúť alternatívne spôsoby digitalizácia zvuku – nahrávanie „častí“ nástrojov vo formáte MIDI. Tu je vhodné nakresliť analógiu s rastrovým a vektorovým znázornením obrázkov.

B. Nie tak silní študenti.

1. Je potrebné zabezpečiť asimiláciu vzťahu (1). Odporúča sa zadať úlohy typu „Ako sa zmení veľkosť súboru, ak sa čas nahrávania zvuku zvýši/skráti o p raz? ",

„Koľkokrát môžete predĺžiť/skrátiť trvanie nahrávania, ak maximálna veľkosť súbor zväčšiť/zmenšiť p raz? ", "Ako sa zmení veľkosť súboru, ak sa počet bitov na zaznamenanie jednej hodnoty zvýši/zníži o p raz?" atď.

2. Je potrebné dbať na to, aby žiaci plynule používali dimenzie, vedeli, že v MB je 23 bitov atď.

3. Je potrebné dbať na to, aby žiaci boli dostatočne matematicky gramotní a ovládali mentálne výpočty s mocninou dvojky (násobenie, delenie, delenie súčiniteľov reprezentujúcich 2n).

4. Vymyslite si vlastné prístupy a vyskúšajte ich.

3.3. Užitočný trik.

Pri takýchto problémoch často vznikajú mocniny dvoch. Násobenie a delenie mocnín je jednoduchšie ako ľubovoľné čísla: násobenie a delenie mocnín spočíva v sčítaní a odčítaní exponentov.

Všimnite si, že čísla 1000 a 1024 sa líšia o menej ako 3 %, čísla 60 a 64 o menej ako 7 %. Preto to môžete urobiť. Vykonajte výpočty tak, že 1000 nahradíte 1024 = 2 10 a 60 64 = 2 6, pričom využijete operácie s mocninami. Odpoveď najbližšie k výslednému číslu bude tá, ktorú hľadáte. Potom sa môžete ešte raz skontrolovať vykonaním presných výpočtov. Môžeme však vziať do úvahy, že celková chyba výpočtu v našej aproximácii nepresahuje 10%. Skutočne, 60*1000 = 60000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

Správny výsledok násobení podľa vzorca (1) je teda o niečo viac ako 90 % získaného približného výsledku. Ak zohľadnenie chyby nezmení výsledok, niet pochýb o odpovedi.

Príklad. (ege.yandex.ru, možnosť 1).

Dvojkanálový (stereo) záznam zvuku sa vykonáva so vzorkovacou frekvenciou 16 kHz a 32-bitovým rozlíšením. Záznam trvá 12 minút, jeho výsledky sa zapisujú do súboru a nevykonáva sa žiadna kompresia dát. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

1) 30 MB 2) 60 MB 3) 75 MB 4) 90 MB

Riešenie. Veľkosť záznamu v bitoch je

2*16*1000*32*12*60

Ak vezmeme do úvahy nahradenie 1000 číslom 1024=2 10 a 60 číslom 64=2 6 dostaneme:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

Ako viete, 1 MB = 2 20 bajtov = 2 23 bitov. Preto 3*2 28 bitov = 3*32 = 96 MB. Znížením tohto čísla o 10% dostaneme 86,4 MB. V oboch prípadoch je najbližšia hodnota 90 MB.

Správna odpoveď: 4

1. Prečítajte si vyhlásenie o probléme. Vyjadrite neznámy parameter z hľadiska známych. Osobitná pozornosť Venujte pozornosť rozmerom známych parametrov. Malo by to byť bity-sekundy-hertz (pripomeňme, že 1 Hz = s -1). Ak je to potrebné, znížte hodnoty parametrov na požadovaný rozmer, rovnako ako vo fyzikálnych problémoch.

2. Vykonajte výpočty a pokúste sa identifikovať mocniny dvoch.

3. Upozorňujeme, že podmienka vyžaduje, aby ste vybrali najvhodnejšiu odpoveď, preto nie je potrebná vysoká presnosť výpočtov na desatinné miesta. Hneď ako bude jasné, ktorá z možností odpovede je najbližšie k vypočítanej hodnote, výpočty by sa mali zastaviť. Ak je nezrovnalosť so všetkými možnosťami odpovedí veľmi veľká (niekoľkonásobne alebo rádovo), výpočty sa musia dvakrát skontrolovať.

4. Úlohy na samostatné riešenie

4.1. Problémové klony 2012-A8-1.

Nižšie sú uvedené štyri ďalšie možnosti pre úlohu 2012-A8-1.

A) Jednokanálové (mono) nahrávanie zvuku sa vykonáva so vzorkovacou frekvenciou 32 kHz a 24-bitovým rozlíšením. Záznam trvá 15 sekúnd, jeho výsledky sa zapisujú do súboru a nevykonáva sa žiadna kompresia dát. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

B) Dvojkanálový (stereo) záznam zvuku sa vykonáva so vzorkovacou frekvenciou 32 kHz a rozlíšením 24 bitov. Záznam trvá 30 sekúnd, jeho výsledky sa zapisujú do súboru a nevykonáva sa žiadna kompresia dát. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

1) 1,5 MB 2) 3 MB 3) 6 MB 4) 12 MB

C) Jednokanálový (mono) zvukový záznam sa vykonáva so vzorkovacou frekvenciou 16 kHz a rozlíšením 32 bitov. Záznam trvá 2 minúty, jeho výsledky sa zapisujú do súboru, kompresia dát sa nevykonáva. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

D) Jednokanálové (mono) nahrávanie zvuku sa vykonáva so vzorkovacou frekvenciou 16 kHz a 32-bitovým rozlíšením. Záznam trvá 4 minúty, jeho výsledky sa zapisujú do súboru, kompresia dát sa nevykonáva. Ktorá z nasledujúcich hodnôt je najbližšie k veľkosti výsledného súboru?

1) 2 MB 2) 4 MB 3) 8 MB 4) 16 MB

Správne odpovede:

A:1; B:3; AT 3; G 4.

4.2. Problém 2012-A8-2 (obrátený k predchádzajúcemu).

A) Jednokanálový (mono) zvukový záznam sa vykonáva so vzorkovacou frekvenciou 16 kHz a 24-bitovým rozlíšením. Výsledky sa zapíšu do súboru, ktorého veľkosť nemôže presiahnuť 8 MB, údaje nie sú komprimované. Ktorá z nasledujúcich hodnôt je najbližšie k maximálnemu možnému trvaniu zaznamenaného zvukového fragmentu?

B) Dvojkanálový (stereo) záznam zvuku sa vykonáva so vzorkovacou frekvenciou 16 kHz a rozlíšením 24 bitov. Výsledky sa zapíšu do súboru, ktorého veľkosť nemôže presiahnuť 8 MB, údaje nie sú komprimované. Ktorá z nasledujúcich hodnôt je najbližšie k maximálnemu možnému trvaniu zaznamenaného zvukového fragmentu?

1) 1 minúta 2) 30 sekúnd 3) 3 minúty 4) 90 sekúnd

C) Jednokanálový (mono) záznam zvuku sa vykonáva so vzorkovacou frekvenciou 48 kHz a 8-bitovým rozlíšením. Výsledky sa zapíšu do súboru, ktorého veľkosť nemôže presiahnuť 2,5 MB, údaje nie sú komprimované. Ktorá z nasledujúcich hodnôt je najbližšie k maximálnemu možnému trvaniu zaznamenaného zvukového fragmentu?

1) 1 minúta 2) 30 sekúnd 3) 3 minúty 4) 90 sekúnd

D) Jednokanálový (mono) zvukový záznam sa vykonáva so vzorkovacou frekvenciou 48 kHz a 16-bitovým rozlíšením. Výsledky sa zapíšu do súboru, ktorého veľkosť nemôže presiahnuť 5 MB, nevykonáva sa kompresia údajov. Ktorá z nasledujúcich hodnôt je najbližšie k maximálnemu možnému trvaniu zaznamenaného zvukového fragmentu?

1) 1 minúta 2) 30 sekúnd 3) 3 minúty 4) 90 sekúnd

Správne odpovede:

A:3; B: 4; IN 1; G:1.

5.Dodatok. Niektoré informácie o digitálnom nahrávaní zvuku.

Šírenie zvuku vo vzduchu možno považovať za šírenie kolísania tlaku. Mikrofón premieňa kolísanie tlaku na kolísanie elektrického prúdu. Toto je súvislý analógový signál. Zvuková karta poskytuje samplovanie vstupný signál z mikrofónu. To sa deje takto: nepretržitý signál je nahradený sekvenciou hodnôt meraných s určitou presnosťou.

Graf analógového signálu:

Diskrétna reprezentácia toho istého signálu (41 nameraných hodnôt):

Diskrétna reprezentácia rovnakého signálu (161 nameraných hodnôt, viac vysoká frekvencia vzorkovanie):

Je vidieť, že čím vyššia je vzorkovacia frekvencia, tým vyššia je kvalita približného (diskrétneho) signálu. Okrem vzorkovacej frekvencie je kvalita digitalizovaného signálu ovplyvnená počtom binárnych bitov pridelených na zaznamenanie každej hodnoty signálu. Čím viac bitov je pridelených každej hodnote, tým presnejšie môže byť signál digitalizovaný.

Príklad 2-bitovej reprezentácie toho istého signálu (iba 4 možné úrovne magnitúdy signálu možno očíslovať dvoma bitmi):

Teraz si môžete zapísať závislosť veľkosti súboru s digitalizovaným zvukom

file_size = (počet_zachytených_hodnôt_za_1_sekundu)*

*(počet_binárnych_bitov_pre_jednu_hodnotu_nahrávania)*

*(počet_sekúnd_záznamu).

Ak vezmeme do úvahy možnosť súčasného nahrávania zvuku z niekoľkých mikrofónov (stereo, quad nahrávanie atď.), ktoré sa robí na zvýšenie realizmu počas prehrávania, dostaneme vzorec (1).

Pri prehrávaní zvuku sa digitálne hodnoty konvertujú na analógové. Elektrické vibrácie prenášané do reproduktorov sa opäť premieňajú na kolísanie tlaku vzduchu.

S rôznou amplitúdou a frekvenciou. Čím vyššia je amplitúda signálu, tým hlasnejšie ho človek vníma. Čím vyššia je frekvencia signálu, tým vyšší je jeho tón.

Obrázok 1. Amplitúda vibrácií zvukových vĺn

Frekvencia zvukových vĺn určený počtom vibrácií za sekundu. Táto hodnota sa meria v hertzoch (Hz, Hz).

Ľudské ucho vníma zvuky v rozsahu od $20$ Hz do $20$ kHz, tento rozsah je tzv. zvuk. Nazýva sa počet bitov, ktoré sú pridelené jednému zvukovému signálu hĺbka kódovania zvuku. V modernom zvukové karty Poskytuje sa hĺbka kódovania zvuku v hodnote 16-$, 32-$ alebo 64-$. Počas procesu kódovania zvukové informácie trvalý signál je nahradený diskrétne, to znamená, že sa prevedie na sekvenciu elektrických impulzov pozostávajúcu z binárnych núl a jednotiek.

Vzorkovacia frekvencia zvuku

Jednou z dôležitých charakteristík procesu kódovania zvuku je vzorkovacia frekvencia, čo je počet meraní úrovne signálu za 1 $ za sekundu:

  • jedno meranie za sekundu zodpovedá frekvencii $1$ gigahertz (GHz);
  • Meranie 1 000 $ za sekundu zodpovedá frekvencii 1 $ kilohertz (kHz).

Definícia 2

Vzorkovacia frekvencia zvuku je počet meraní hlasitosti zvuku za jednu sekundu.

Počet meraní môže byť v rozsahu od $8$ kHz do $48$ kHz, pričom prvá hodnota zodpovedá frekvencii rozhlasového vysielania a druhá kvalita zvuku hudobných nosičov.

Poznámka 1

Čím vyššia je frekvencia a hĺbka vzorkovania zvuku, tým kvalitnejšie bude znieť digitalizovaný zvuk. Najnižšia kvalita digitalizovaného zvuku, ktorá zodpovedá kvalite telefonickej komunikácie, sa získa, keď je vzorkovacia frekvencia 8000-krát za sekundu, hĺbka vzorkovania je $8$ bitov, čo zodpovedá nahrávaniu jednej zvukovej stopy (mono režim). Najvyššiu kvalitu digitalizovaného zvuku, ktorá zodpovedá kvalite zvukového CD, dosiahnete pri vzorkovacej frekvencii 48 000 $ za sekundu, hĺbka vzorkovania $ 16 $ bitov, čo zodpovedá nahrávaniu dvoch zvukových stôp (režim stereo).

Informačná hlasitosť zvukového súboru

Treba poznamenať, že čím vyššia je kvalita digitálneho zvuku, tým väčší je informačný objem zvukového súboru.

Poďme odhadnúť objem informácií mono zvukového súboru ($ V$), to možno urobiť pomocou vzorca:

$V = N \cdot f \cdot k$,

kde $N$ je celkové trvanie zvuku vyjadrené v sekundách,

$f$ - vzorkovacia frekvencia (Hz),

$k$ - hĺbka kódovania (bity).

Príklad 1

Napríklad, ak je trvanie zvuku $1$ minúta a máme priemernú kvalitu zvuku, pri ktorej je vzorkovacia frekvencia $24$ kHz a hĺbka kódovania je $16$ bitov, potom:

$ V=60 \cdot 24000 \cdot 16 \bit=23040000 \bit=2880000 \bajt = 2812,5 \KB=2,75 \MB.$

Pri kódovaní stereo zvuku sa proces vzorkovania vykonáva oddelene a nezávisle pre ľavý a pravý kanál, čím sa zdvojnásobuje veľkosť zvukového súboru v porovnaní s mono zvukom.

Príklad 2

Napríklad odhadnime objem informácií digitálneho stereo zvukového súboru, ktorého trvanie zvuku sa rovná 1 $ sekundu s priemernou kvalitou zvuku (16 $ bitov, 24 000 $ merania za sekundu). Ak to chcete urobiť, vynásobte hĺbku kódovania počtom meraní za $ 1 $ sekundu a vynásobte $ 2 $ (stereo zvuk):

$ V=16 \bit \cdot 24000 \cdot 2 = 768000 \bit = 96000 \bajt = 93,75 \KB.$

Základné metódy kódovania zvukových informácií

Existovať rôzne metódy kódovanie zvukových informácií pomocou binárneho kódu, medzi ktorými sú dva hlavné smery: FM metóda A Metóda Wave-Table.

FM metóda (Frekvenčná modulácia) vychádza zo skutočnosti, že teoreticky každý zložitý zvuk možno rozložiť na sled jednoduchých harmonických signálov rôznych frekvencií, z ktorých každý bude predstavovať pravidelnú sínusoidu, čo znamená, že ho možno opísať kódom. Proces rozkladu zvukových signálov na harmonické série a ich reprezentácia vo forme diskrétnych digitálnych signálov sa vyskytuje v špeciálnych zariadeniach nazývaných „analógovo-digitálne prevodníky“ (ADC).

Obrázok 2. Konverzia zvukového signálu na diskrétny signál

Obrázok 2a zobrazuje audio signál na vstupe ADC a obrázok 2b zobrazuje už skonvertovaný diskrétny signál na výstupe ADC.

Pre inverzná konverzia Pri reprodukcii zvuku, ktorý je prezentovaný vo forme číselného kódu, sa používajú digitálno-analógové prevodníky (DAC). Proces konverzie zvuku je znázornený na obr. 3. Táto metóda kódovania neposkytuje dobrá kvalita zvuk, ale poskytuje kompaktný kód.

Obrázok 3. Konverzia diskrétneho signálu na zvukový signál

Obrázok 3a zobrazuje diskrétny signál, ktorý máme na vstupe DAC, a obrázok 3b zobrazuje audio signál na výstupe DAC.

Metóda stolovej vlny (Wave-Table) vychádza z toho, že vopred pripravené tabuľky ukladajú vzorky zvukov okolitého sveta, hudobných nástrojov a pod. Číselné kódy vyjadrujú výšku, trvanie a intenzitu zvuku a ďalšie parametre charakterizujúce vlastnosti zvuku. Keďže sa ako vzorky používajú „skutočné“ zvuky, kvalita zvuku získaná ako výsledok syntézy je veľmi vysoká a blíži sa kvalite zvuku skutočných hudobných nástrojov.

Príklady formátov zvukových súborov

Zvukové súbory prichádzajú v niekoľkých formátoch. Najpopulárnejšie z nich sú MIDI, WAV, MP3.

Formát MIDI(Musical Instrument Digital Interface) bol pôvodne určený na ovládanie hudobných nástrojov. V súčasnosti sa používa v oblasti elektronických hudobných nástrojov a počítačové moduly syntéza.

Formát zvukového súboru WAV(tvar vlny) predstavuje ľubovoľný zvuk ako digitálnu reprezentáciu pôvodnej zvukovej vibrácie alebo zvukovej vlny. Všetky štandardné Zvuky systému Windows majú príponu WAV.

formát MPZ(MPEG-1 Audio Layer 3) je jedným z digitálnych formátov na ukladanie zvukových informácií. Poskytuje vyššiu kvalitu kódovania.

Riešenie problémov s kódovaním zvukových informácií.

  1. Teoretická časť

Pri riešení problémov sa študenti spoliehajú na tieto koncepty:

Vzorkovanie času- proces, pri ktorom sa pri kódovaní súvislého zvukového signálu zvuková vlna rozdelí na samostatné malé časové úseky a pre každý takýto úsek sa nastaví určitá hodnota amplitúdy. Čím väčšia je amplitúda signálu, tým je zvuk hlasnejší.

Hĺbka zvuku (hĺbka kódovania) - počet bitov na kódovanie zvuku.

Počet rôznych úrovní objemu sa vypočíta podľa vzorca N=2 ja , kde I je hĺbka zvuku.

Vzorkovacia frekvencia– počet meraní úrovne vstupného signálu za jednotku času (za 1 sekundu). Čím vyššia je vzorkovacia frekvencia, tým presnejší je postup binárneho kódovania. Frekvencia sa meria v Hertzoch (Hz).

Kvalita binárneho kódovania je hodnota, ktorá je určená hĺbkou kódovania a vzorkovacou frekvenciou.

Šírka registra- počet bitov v registri audio adaptéra. Čím väčšia je kapacita číslic, tým menšia je chyba každého jednotlivého prevodu veľkosti elektrického prúdu na číslo a naopak. Ak je bitová hĺbka rovná I, potom pri meraní možno získať vstupný signál 2 ja =N rôznych hodnôt.

  1. Praktická časť. Analýza a riešenie problému.

Problém 1 . Odhadnúť objem informácií digitálneho stereo audio súboru trvajúceho 20 sekúnd s hĺbkou kódovania 16 bitov a vzorkovacou frekvenciou 10 000 Hz? Uveďte výsledok v KB, zaokrúhlený na najbližšiu stotinu.

Pri riešení takýchto problémov musíme pamätať na nasledujúce:

To mono - 1 kanál, stereo - 2 kanály

Problém 2 . Určte veľkosť (v bajtoch) digitálneho zvukového súboru, ktorého doba prehrávania je 10 sekúnd pri vzorkovacej frekvencii 22,05 kHz a rozlíšení 8 bitov.

Vzhľadom na to:

I = 8 bitov = 1 bajt

t = 10 sekúnd

η = 22,05 kHz = 22,05 * 1000 Hz = 22050 Hz

I - bitová hĺbka zvukovej karty,

t - čas prehrávania zvukového súboru,

η - vzorkovacia frekvencia

Riešenie:

V(Inform.) = I · η ·t

V(Inform.) = 22050 *10 *1 = 220500 bajtov

Odpoveď: V(Inform.) = 220500 bajtov

Nájsť: V (objem informácií)-?



Načítava...
Hore