Tema je rješavanje problema kodiranja zvučnih informacija. Kodiranje informacija

Vremensko uzorkovanje zvuka.

Zvuk je zvučni val sa stalno promjenjivom amplitudom i frekvencijom. Što je veća amplituda signala, glasniji je za osobu, što je veća frekvencija signala, to je viši ton. Da bi računar obrađivao zvuk, kontinuirani zvučni signal mora se pretvoriti u niz električnih impulsa (binarne 0 i 1).

U procesu kodiranja kontinuirano zvučni signal vrši se njegova vremenska diskretizacija. Neprekidni zvučni val je podijeljen u zasebne male vremenske dionice, a za svaki takav dio se postavlja određena vrijednost amplitude.
Diskretizacija je transformacija kontinuiranih signala u skup diskretnih vrijednosti, od kojih je svakoj dodijeljen određeni binarni kod.


Tako je kontinuirana zavisnost amplitude signala o vremenu A(t) zamijenjena diskretnim nizom nivoa glasnoće. Na grafikonu ovo izgleda kao zamjena glatke krive nizom "koraka".

Svakom "korak" je dodeljena vrednost nivoa jačine zvuka, njegov kod (1, 2, 3, itd.). Nivoi jačine zvuka mogu se smatrati skupom mogućih stanja, odnosno, što će više nivoa jačine zvuka biti dodijeljeno u procesu kodiranja, to će više informacija nositi vrijednost svakog nivoa i zvuk će biti bolji. Moderne zvučne kartice pružaju 16-bitnu dubinu audio kodiranja. Broj različitih nivoa signala (stanja za dato kodiranje) može se izračunati pomoću formule:
N=2 16 =65356[nivoi zvuka],
gdje je I dubina kodiranja.

Dakle, moderne zvučne kartice mogu kodirati 65536 nivoa signala. Svakoj vrijednosti amplitude audio signala dodijeljen je 16-bitni kod.

Sa binarnim kodiranjem kontinuiranog audio signala, on se zamjenjuje nizom diskretnih nivoa signala. Kvalitet kodiranja zavisi od broja merenja nivoa signala u jedinici vremena, odnosno od brzine uzorkovanja. Što se više mjerenja izvrši u 1 sekundi (što je veća brzina uzorkovanja), to je tačnija procedura binarnog kodiranja.

Kvalitet binarnog audio kodiranja je određen dubinom kodiranja i brzinom uzorkovanja.

Broj mjerenja u sekundi može se kretati od 8000 do 96000, odnosno brzina uzorkovanja analognog audio signala može imati vrijednosti od 8 do 96 [kHz]. Na frekvenciji od 8 [kHz], kvalitet uzorkovanog audio signala odgovara kvalitetu radio emisije, a na frekvenciji od 96 [kHz], odgovara kvalitetu zvuka audio CD-a. Također treba napomenuti da su mogući i mono i stereo načini rada.

Jačina informacija zvučnog fajla

Da biste odredili jačinu audio datoteke V sf, potrebno je pomnožiti broj mjerenja K meas sa dubinom kodiranja (broj bitova po nivou) V 1meas:

V zf \u003d K mjera * V 1 mjera

Gdje broj mjerenja K mjere ovisi o:

Zadatak 1


Zadaća

1 Odredite jačinu zvuka stereo zvučne datoteke, sa frekvencijom uzorkovanja (dd)[kHz], vremenom zvuka (dd)[s] za (mm)-bitno kodiranje.

2 Odredite vrijeme reprodukcije u [s] mono audio datoteke veličine jednake (yy) [KB] na dubini kodiranja (mm)[BIT] i frekvenciji uzorkovanja (dd)[kHz].
Gdje je (dd) vaš datum rođenja, (mm) je vaš mjesec rođenja, (yy) je vaša godina rođenja.

Ljudsko uho percipira zvuk na frekvencijama u rasponu od 20 vibracija u sekundi (nizak zvuk) do 20.000 vibracija u sekundi (visok zvuk).

Osoba može percipirati zvuk u ogromnom rasponu intenziteta, u kojem je maksimalni intenzitet 10 14 puta veći od minimalnog (sto hiljada milijardi puta). Za mjerenje glasnoće zvuka koristi se posebna jedinica. "decibel"(dbl) (Tabela 5.1). Smanjenje ili povećanje jačine zvuka za 10 dB odgovara smanjenju ili povećanju intenziteta zvuka za 10 puta.

Vremensko uzorkovanje zvuka. Da bi računar obradio zvuk, kontinuirani audio signal mora biti konvertovan u diskretni digitalni oblik korišćenjem vremenskog uzorkovanja. Neprekidni zvučni val podijeljen je u zasebne male vremenske dionice, za svaku takvu sekciju postavlja se određena vrijednost intenziteta zvuka.

Dakle, kontinuirana zavisnost jačine zvuka od vremena A(t) je zamenjena diskretnim nizom nivoa glasnoće. Na grafikonu ovo izgleda kao zamjena glatke krive nizom "koraka" (slika 1.2).


Rice. 1.2. Temporal Audio Sampling

Frekvencija uzorkovanja. Mikrofon spojen na zvučnu karticu koristi se za snimanje analognog zvuka i pretvaranje u digitalni oblik. Kvalitet primljenog digitalni zvuk zavisi od broja merenja nivoa jačine zvuka u jedinici vremena, tj. brzina uzorkovanja. Što se više mjerenja izvrši u I sekundi (što je veća frekvencija uzorkovanja), to preciznije "ljestve" digitalnog audio signala ponavljaju krivulju dijalog signala.

Stopa uzorkovanja zvuka je broj mjerenja jačine zvuka u jednoj sekundi.

Brzina uzorkovanja zvuka može se kretati od 8.000 do 48.000 mjerenja jačine zvuka u sekundi.

Dubina kodiranja zvuka. Svakom "korak" je dodeljena određena vrednost nivoa jačine zvuka. Nivoi glasnoće zvuka se mogu posmatrati kao skup mogućih stanja N, za čije kodiranje je potrebna određena količina informacija I, što se naziva dubina kodiranja zvuka.

Dubina kodiranja zvuka je količina informacija potrebna za kodiranje diskretnih nivoa glasnoće digitalnog zvuka.

Ako je dubina kodiranja poznata, tada se broj nivoa zvuka digitalnog zvuka može izračunati pomoću formule N = 2 I . Neka dubina audio kodiranja bude 16 bita, tada je broj nivoa glasnoće zvuka:

N = 2 I = 2 16 = 65536.

Tokom procesa kodiranja, svakom nivou jačine zvuka se dodeljuje sopstveni 16-bitni binarni kod, najniži nivo zvuka će odgovarati kodu 0000000000000000, a najviši - 11111111111111111.

Kvalitet digitalizovanog zvuka.Što je veća frekvencija i dubina uzorkovanja zvuka, to će biti bolji kvalitet digitaliziranog zvuka. Najniži kvalitet digitalizovanog zvuka koji odgovara kvalitetu telefonska veza, dobija se sa stopom uzorkovanja od 8000 puta u sekundi, dubinom uzorkovanja od 8 bita i snimanjem jednog audio zapisa (mono mod). Većina visoka kvaliteta digitalizovani zvuk koji odgovara kvalitetu audio CD-a postiže se brzinom uzorkovanja od 48.000 puta u sekundi, dubinom uzorkovanja od 16 bita i snimanjem dva audio zapisa (stereo mod).

Mora se imati na umu da što je kvalitetniji digitalni zvuk, to je veća količina informacija zvučne datoteke. Možete procijeniti jačinu informacija digitalne stereo zvučne datoteke sa trajanjem zvuka od 1 sekunde sa prosječnim kvalitetom zvuka (16 bita, 24.000 mjerenja u sekundi). Da biste to učinili, dubina kodiranja se mora pomnožiti s brojem mjerenja u 1 sekundi i pomnožiti sa 2 (stereo zvuk):

16 bita × 24.000 × 2 = 768.000 bita = 96.000 bajtova = 93,75 KB.

urednici zvuka. Uređivači zvuka vam omogućavaju ne samo snimanje i reprodukciju zvuka, već i njegovo uređivanje. Digitalizovani zvuk je predstavljen u urednici zvuka u vizuelnom obliku, tako da se operacije kopiranja, pomeranja i brisanja delova audio zapisa mogu lako izvesti pomoću miša. Osim toga, možete preklopiti audio zapise jednu na drugu (miksati zvukove) i primijeniti različite akustične efekte (eho, reverzna reprodukcija, itd.).

Uređivači zvuka vam omogućavaju da promijenite kvalitetu digitalnog zvuka i veličinu audio datoteke promjenom brzine uzorkovanja i dubine kodiranja. Digitalizovani zvuk se može sačuvati nekomprimovan u audio fajlovima univerzalni format WAV ili u komprimovanom formatu MP3.

Prilikom snimanja zvuka u komprimiranim formatima, "pretjerane" za ljudsku percepciju zvučne frekvencije niskog intenziteta se odbacuju, što se vremenski poklapa sa audio frekvencije sa velikim intenzitetom. Upotreba ovog formata omogućava komprimiranje audio datoteka na desetine puta, ali dovodi do nepovratnog gubitka informacija (datoteke se ne mogu vratiti u izvornom obliku).

Kontrolna pitanja

1. Kako brzina uzorkovanja i dubina kodiranja utiču na kvalitetu digitalnog zvuka?

Zadaci za samoispunjenje

1.22. Zadatak sa selektivnim odgovorom. Zvučna kartica proizvodi binarno kodiranje analognog audio signala. Koliko informacija je potrebno za kodiranje svakog od 65.536 mogućih nivoa intenziteta signala?
1) 16 bita; 2) 256 bita; 3) 1 bit; 4) 8 bita.

1.23. Pitanje sa detaljnim odgovorom. Procijenite količinu informacija digitalnih audio datoteka u trajanju od 10 sekundi na dubini kodiranja i stopi uzorkovanja audio signala, osiguravajući minimalnu i maksimalnu kvalitetu zvuka:
a) mono, 8 bita, 8000 mjerenja u sekundi;
b) stereo, 16 bita, 48.000 mjerenja u sekundi.

1.24. Pitanje sa detaljnim odgovorom. Odredite dužinu audio datoteke koja će stati na 3,5" disketu (imajte na umu da je 2847 sektora od 512 bajtova svaki dodijeljeno za pohranjivanje podataka na takvoj disketi):
a) sa niskim kvalitetom zvuka: mono, 8 bita, 8000 mjerenja u sekundi;
b) sa visokim kvalitetom zvuka: stereo, 16 bita, 48.000 mjerenja u sekundi.

1. Opće informacije

složenost: osnovni.

Približno vrijeme odluke (za one koji će raditi 2. dio): 2 minute

Predmet: Kreiranje i obrada grafičkih i multimedijalnih informacija

Podtema: Digitalni audio

Šta se provjerava: Sposobnost evaluacije kvantitativne karakteristike proces audio snimanja.

Kratke teorijske informacije: Zbog dati tip zadatak je nov u KIM USE, dat ćemo (do sada bez obrazloženja, obrazloženje ispod) matematički model proces snimanja:

N=k*F*L* T (1)

  • N– veličina datoteke (u bitovima) koja sadrži zvučni zapis;
  • k- broj kanala za snimanje (na primjer, 1 - mono, 2 - stereo, 4 - quad, itd.);
  • F– frekvencija uzorkovanja (u hercima), tj. broj vrijednosti amplitude zvuka snimljenih u jednoj sekundi;
  • L– dozvola, tj. broj bitova koji se koriste za pohranjivanje svake izmjerene vrijednosti;
  • T– trajanje zvučnog fragmenta (u sekundama).

Kako bi zadatak mogao izgledati? Na primjer, ovako: Postavljaju se vrijednosti svih potrebnih parametara procesa snimanja zvuka, osim jednog. Potrebno je procijeniti vrijednost preostalog parametra, na primjer, veličinu datoteke ili trajanje zvučnog fragmenta.


primjer stanja:

Opcije odgovora:

1) 0,2 MB

2. Primjer zadatka

2.1. Zadatak.

Zadatak 2012-A8-1.

Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 16 kHz i 24-bitnoj rezoluciji. Snimanje traje 1 minut, rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

1) 0,2 MB 2) 2 MB 3) 3 MB 4) 4 MB

2.2. Rješenje.

Početne podatke dovodimo u dimenziju bitova-sekundi-herca i vršimo proračune prema formuli (1):

Dato:

k= 1, jer jednokanalno (mono) snimanje zvuka;

F= 16 kHz = 16.000 Hz;

T= 1 min = 60 s.

NađiN

Zamijenite vrijednost poznatih parametara u formulu (1)

N=1*16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 *5625 (bit)=

= 2 12 *5625 bita = (2 12 *5625)/2 3 bajta = 2 9 *5625 bajtova =

= (2 9 *5625)/ 2 20 MB = 5625/2 11 MB = 5625/2048 MB.

Broj 5625/2048 je između brojeva 2 i 3. Štaviše, bliže je 3 nego 2, jer 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

Tačan odgovor: №3 (3 MB)

Komentar. Druga ideja rješenja data je u paragrafu 3.3

3. Savjeti za nastavnike i učenike

3.1 Koja znanja/vještine/vještine su potrebna studentu da bi riješio ovaj problem?

1) Formulu (1) ne treba „pamtiti“. Učenik koji predstavlja suštinu digitalnog audio procesa mora biti sposoban da ga samostalno formuliše.

2) Potrebno je znati zapisati vrijednosti parametara u traženoj dimenziji, kao i elementarne aritmetičke vještine, uklj. operišući sa stepenom dvojke.

A. Jaki studenti.

1. Najvjerovatnije će oni ipak riješiti ovaj problem.

2. Učenicima možete dati zadatak da u praksi provjere formulu (1), snimajući zvuk iz mikrofona u datoteku. Treba napomenuti da vrijedi samo ako snimljene informacije nisu komprimirane (WAV format (PCM) bez kompresije). Ako se koriste audio formati sa kompresijom (WMA, MP3), tada će volumen rezultirajuće datoteke, iz očiglednih razloga, biti znatno manji od izračunate. Za eksperimentiranje s digitalnim zvukom, možete koristiti besplatni Audacity audio editor (http://audacity.sourceforge.net/).

3. Preporučljivo je naglasiti konceptualnu zajedništvo rasterske reprezentacije zvuka i slike, koji su varijeteti istog procesa aproksimativne reprezentacije kontinuiranog signala - niza kratkih diskretnih signala, tj. digitalizacija zasnovana na uzorkovanju. Kada bitmap vrši se dvodimenzionalna diskretizacija svjetline u prostoru, u slučaju zvuka jednodimenzionalna diskretizacija u vremenu. U oba slučaja, povećanje brzine uzorkovanja (broj piksela ili audio uzoraka) i/ili povećanje broja bitova za predstavljanje jednog uzorka (boja ili dubina bita zvuka) dovodi do povećanja kvalitete digitalizacije, uz povećanje datoteke veličine sa digitalnim prikazom. Otuda potreba za kompresijom podataka.

4. Poželjno je napomenuti alternativnim načinima digitalizacija zvuka - snimanje "dijelova" instrumenata u MIDI formatu. Ovdje je prikladno povući analogiju sa rasterskim i vektorskim prikazom slika.

B. Ne tako jaki studenti.

1. Potrebno je osigurati asimilaciju relacije (1). Preporučljivo je dati zadatke poput „Kako će se promijeniti veličina datoteke ako se vrijeme snimanja zvuka poveća/smanji za str jednom? ",

„Koliko puta možete povećati/smanjiti trajanje snimanja, ako maksimalna veličina fajl uvećaj/smanji u str jednom? “, “Kako će se promijeniti veličina datoteke ako se poveća/smanji broj bitova za upisivanje jedne vrijednosti str jednom?" itd.

2. Potrebno je osigurati da učenici slobodno rade sa dimenzijama, znaju da u MB 2 ima 23 bita itd.

3. Potrebno je osigurati da su učenici dovoljno aritmetički pismeni, tečno u usmenom brojanju sa stepenom dvojke (množenje, dijeljenje, odabir faktora koji predstavljaju 2 n).

4. Osmislite vlastite pristupe i isprobajte ih.

3.3. Koristan trik.

U takvim problemima često se javljaju moći dvojke. Množenje i dijeljenje potencija je lakše od proizvoljnih brojeva: množenje i dijeljenje potencija se svodi na sabiranje i oduzimanje eksponenata.

Imajte na umu da se brojevi 1000 i 1024 razlikuju za manje od 3%, brojevi 60 i 64 razlikuju se za manje od 7%. Stoga, možete to učiniti. Izvršite proračune zamjenom 1000 sa 1024 = 2 10 i 60 sa 64 = 2 6 , koristeći prednosti operacija snage. Odgovor koji je najbliži dobijenom broju biće željeni. Zatim se možete još jednom provjeriti radeći točne proračune. Ali može se uzeti u obzir da ukupna greška proračuna u našoj aproksimaciji ne prelazi 10%. Zaista, 60*1000 = 60000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

Dakle, tačan rezultat množenja prema formuli (1) iznosi nešto više od 90% dobijenog približnog rezultata. Ako uzimanje u obzir greške ne promijeni rezultat, nema sumnje u odgovor.

Primjer. (ege.yandex.ru, opcija 1).

Dvokanalni (stereo) zvuk se snima na frekvenciji uzorkovanja od 16 kHz i 32-bitnoj rezoluciji. Snimanje traje 12 minuta, rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

1) 30 MB 2) 60 MB 3) 75 MB 4) 90 MB

Rješenje. Veličina zapisa u bitovima je

2*16*1000*32*12*60

Uzimajući u obzir zamjenu 1000 sa 1024=2 10 i 60 sa 64=2 6 dobijamo:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

Kao što znate, 1 MB = 2 20 bajtova = 2 23 bita. Dakle 3*2 28 bita = 3*32 = 96 MB. Smanjenjem ovog broja za 10%, dobijamo 86,4 MB. U oba slučaja, najbliža vrijednost je 90 MB.

Tačan odgovor: 4

1. Pročitajte stanje problema. Nepoznati parametar izraziti u terminima poznatih. Posebna pažnja obratiti pažnju na dimenziju poznatih parametara. Trebalo bi da bude - bit-sekundi-herc (podsjetimo da je 1 Hz = s -1). Ako je potrebno, dovedite vrijednosti parametara na željenu dimenziju, kao što se radi u problemima iz fizike.

2. Izvršite proračune, pokušavajući da izaberete stepene dvojke.

3. Imajte na umu da je u uslovu potrebno odabrati najprikladniji odgovor, stoga nije potrebna visoka tačnost izračunavanja na decimalna mjesta. Čim postane jasno koja je od opcija odgovora najbliža izračunatoj vrijednosti, treba prekinuti proračune. Ako je neslaganje sa svim opcijama odgovora vrlo veliko (za nekoliko puta ili za red veličine), tada se proračuni moraju ponovo provjeriti.

4. Zadaci za samostalno rješavanje

4.1. Klonovi zadatka 2012-A8-1.

Ispod su još četiri opcije za zadatak 2012-A8-1.

A) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 32 kHz i 24-bitnoj rezoluciji. Snimanje traje 15 sekundi, njegovi rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

B) Dvokanalni (stereo) zvuk se snima sa frekvencijom uzorkovanja od 32 kHz i 24-bitnom rezolucijom. Snimanje traje 30 sekundi, njegovi rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

1) 1,5 MB 2) 3 MB 3) 6 MB 4) 12 MB

C) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 16 kHz i 32-bitnoj rezoluciji. Snimanje traje 2 minute, njegovi rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

D) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 16 kHz i 32-bitnoj rezoluciji. Snimanje traje 4 minute, rezultati se upisuju u datoteku, kompresija podataka se ne vrši. Koja je od sljedećih vrijednosti najbliža veličini rezultirajuće datoteke?

1) 2 MB 2) 4 MB 3) 8 MB 4) 16 MB

Tačni odgovori:

A:1; B:3; AT 3; D:4.

4.2. Problem 2012-A8-2 (obrnuti prethodni).

A) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 16 kHz i 24-bitnoj rezoluciji. Rezultati se zapisuju u datoteku čija veličina ne može biti veća od 8 MB, kompresija podataka se ne vrši. Koja od sljedećih vrijednosti je najbliža maksimalnoj mogućoj dužini snimljenog audio klipa?

B) Dvokanalni (stereo) zvuk se snima sa frekvencijom uzorkovanja od 16 kHz i 24-bitnom rezolucijom. Rezultati se zapisuju u datoteku čija veličina ne može biti veća od 8 MB, kompresija podataka se ne vrši. Koja od sljedećih vrijednosti je najbliža maksimalnoj mogućoj dužini snimljenog audio klipa?

1) 1 minut 2) 30 sekundi 3) 3 minute 4) 90 sekundi

C) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 48 kHz i 8-bitnoj rezoluciji. Rezultati se zapisuju u datoteku čija veličina ne može biti veća od 2,5 MB, kompresija podataka se ne vrši. Koja od sljedećih vrijednosti je najbliža maksimalnoj mogućoj dužini snimljenog audio klipa?

1) 1 minut 2) 30 sekundi 3) 3 minute 4) 90 sekundi

D) Jednokanalni (mono) zvuk se snima na frekvenciji uzorkovanja od 48 kHz i 16-bitnoj rezoluciji. Rezultati se zapisuju u datoteku, čija veličina ne može biti veća od 5 MB, kompresija podataka se ne vrši. Koja od sljedećih vrijednosti je najbliža maksimalnoj mogućoj dužini snimljenog audio klipa?

1) 1 minut 2) 30 sekundi 3) 3 minute 4) 90 sekundi

Tačni odgovori:

A:3; B: 4; IN 1; G:1 .

5.Dodavanje. Neke informacije o digitalnom audio snimanju.

Širenje zvuka u vazduhu može se smatrati širenjem fluktuacija pritiska. Mikrofon pretvara fluktuacije pritiska u fluktuacije električne struje. Ovo je analogni kontinuirani signal. Zvučna kartica omogućava uzorkovanje ulazni signal sa mikrofona. To se radi na sljedeći način - kontinuirani signal zamjenjuje se nizom vrijednosti mjerenih s određenom točnošću.

Grafikon analognog signala:

Diskretna reprezentacija istog signala (41 izmjerena vrijednost):

Diskretna reprezentacija istog signala (161 izmjerena vrijednost, više visoka frekvencija diskretizacija):

Može se vidjeti da što je veća frekvencija uzorkovanja, to je veći kvalitet aproksimativnog (diskretnog) signala. Pored brzine uzorkovanja, na kvalitet digitalizovanog signala utiče i broj bitova dodeljenih za snimanje svake vrednosti signala. Što je više bitova dodijeljeno za svaku vrijednost, to se signal može preciznije digitalizirati.

Primjer 2-bitnog prikaza istog signala (dva bita mogu nabrojati samo 4 moguća nivoa signala):

Sada možete ispisati ovisnost o veličini datoteke s digitaliziranim zvukom

file_size = (broj_vrijednosti_uhvaćenih_po_1_sekundi)*

*(broj_binarnih_cifara_za_jedinstvenu_vrijednost_zapisa)*

*(broj_snimanja_sekundi).

Uzimajući u obzir mogućnost istovremenog snimanja zvuka sa više mikrofona (stereo, quad snimanje, itd.), što je učinjeno radi poboljšanja realizma tokom reprodukcije, dobijamo formulu (1).

Prilikom reprodukcije zvuka, digitalne vrijednosti se pretvaraju u analogne vrijednosti. Električne vibracije koje se prenose na zvučnike se ponovo pretvaraju u fluktuacije vazdušnog pritiska.

Sa različitom amplitudom i frekvencijom. Što je veća amplituda signala, to ga osoba percipira glasnije. Što je frekvencija signala veća, to je njegov ton viši.

Slika 1. Amplituda oscilovanja zvučnih talasa

Frekvencija zvučnog talasa određuje se brojem oscilacija u sekundi. Ova vrijednost se mjeri u hercima (Hz, Hz).

Ljudsko uho percipira zvukove u opsegu od $20$ Hz do $20$ kHz, ovaj opseg se naziva zvuk. Poziva se broj bitova koji je dodijeljen jednom zvučnom signalu dubina audio kodiranja. U modernom zvučne kartice 16-$, 32-$ ili 64-bitna dubina audio kodiranja je obezbeđena. U procesu kodiranja zvučne informacije kontinuirani signal se zamjenjuje diskretno, odnosno pretvara se u niz električnih impulsa koji se sastoji od binarnih nula i jedinica.

Stopa uzorkovanja zvuka

Jedna od važnih karakteristika procesa audio kodiranja je brzina uzorkovanja, koja predstavlja broj mjerenja nivoa signala po $1$ sekundi:

  • jedno mjerenje u sekundi odgovara frekvenciji od $1$ gigaherca (GHz);
  • $1000$ mjerenja u sekundi odgovara frekvenciji od $1$ kiloherca (kHz).

Definicija 2

Stopa uzorkovanja zvuka je broj mjerenja jačine zvuka u jednoj sekundi.

Broj mjerenja može biti u rasponu od $8$ kHz do $48$ kHz, pri čemu prva vrijednost odgovara frekvenciji radio emitovanja, a druga - kvalitetu zvuka muzičkog medija.

Napomena 1

Što je veća frekvencija i dubina uzorkovanja zvuka, to će bolje zvučati digitalizovani zvuk. Najniži kvalitet digitalizovanog zvuka, koji odgovara kvalitetu telefonske veze, dobija se kada je brzina uzorkovanja 8000 puta u sekundi, dubina uzorkovanja je 8$ bita, što odgovara snimanju jednog audio zapisa (“mono” način rada). Najveći kvalitet digitalizovanog zvuka, koji odgovara kvalitetu audio CD-a, postiže se kada je brzina uzorkovanja $48,000$ puta u sekundi, dubina uzorkovanja je $16$ bita, što odgovara snimanju dva audio zapisa (stereo mod).

Jačina informacija zvučnog fajla

Treba napomenuti da što je kvalitetniji digitalni zvuk, to je veći volumen informacija zvučnog fajla.

Hajde da procenimo obim informacija mono audio fajl ($V$), to se može uraditi pomoću formule:

$V = N \cdot f \cdot k$,

gdje je $N$ ukupno trajanje zvuka, izraženo u sekundama,

$f$ - frekvencija uzorkovanja (Hz),

$k$ - dubina kodiranja (bitovi).

Primjer 1

Na primjer, ako je trajanje zvuka $1$ minuta i imamo prosječan kvalitet zvuka, pri kojem je stopa uzorkovanja $24$ kHz, a dubina kodiranja $16$ bitova, tada:

$V=60 \cdot 24000 \cdot 16 \ bits=23040000 \ bits=2880000 \ bytes=2812,5 \ KB=2,75 \ MB.$

Prilikom kodiranja stereo zvuka, proces uzorkovanja se izvodi odvojeno i nezavisno za lijevi i desni kanal, što, shodno tome, udvostručuje jačinu zvučne datoteke u odnosu na mono zvuk.

Primjer 2

Na primjer, hajde da procijenimo količinu informacija digitalne stereo zvučne datoteke, čije trajanje zvuka iznosi $1$ sekunde sa prosječnim kvalitetom zvuka ($16$ bitova, $24000$ mjerenja u sekundi). Da biste to učinili, pomnožite dubinu kodiranja sa brojem mjerenja po $1$ sekundi i pomnožite sa $2$ (stereo zvuk):

$V=16 \ bitova \cdot 24000 \cdot 2 = 768000 \ bitova = 96000 \ bajtova = 93,75 \ kb.$

Osnovne metode za kodiranje audio informacija

Postoji razne metode kodiranje zvučnih informacija binarnim kodom, među kojima postoje dva glavna područja: FM metoda I metoda talasnog stola.

FM metoda (frekvencijska modulacija) se zasniva na činjenici da se teoretski svaki složeni zvuk može razložiti u niz jednostavnih harmonijskih signala različitih frekvencija, od kojih će svaki biti pravilna sinusoida, što znači da se može opisati kodom. Proces dekompozicije zvučnih signala u harmonijske serije i njihovo predstavljanje u obliku diskretnih digitalni signali javlja se u posebnim uređajima koji se nazivaju analogno-digitalni pretvarači (ADC).

Slika 2. Pretvaranje audio signala u diskretni signal

Slika 2a prikazuje audio signal na ulazu ADC-a, a slika 2b prikazuje već konvertovani diskretni signal na izlazu ADC-a.

Za inverzna transformacija pri reprodukciji zvuka, koji je predstavljen u obliku numeričkog koda, koriste se digitalno-analogni pretvarači (DAC). Proces konverzije zvuka prikazan je na sl. 3. Ova metoda kodiranja ne radi dobra kvaliteta zvuk, ali daje kompaktan kod.

Slika 3. Pretvaranje diskretnog signala u audio signal

Slika 3a prikazuje diskretni signal koji imamo na DAC ulazu, a slika 3b prikazuje audio signal na DAC izlazu.

Tabela-talasna metoda (Wave table) zasniva se na činjenici da se u unaprijed pripremljenim tabelama pohranjuju uzorci zvukova okolnog svijeta, muzičkih instrumenata i sl. Numerički kodovi izražavaju visinu, trajanje i intenzitet zvuka, te druge parametre koji karakterišu karakteristike zvuka. zvuk. Budući da se kao uzorci koriste “pravi” zvukovi, kvalitet zvuka dobijenog kao rezultat sinteze je vrlo visok i približava se kvalitetu zvuka pravih muzičkih instrumenata.

Primjeri formata zvučnih datoteka

Zvučni fajlovi dolaze u nekoliko formata. Najpopularniji od njih su MIDI, WAV, MP3.

MIDI format(Digitalni interfejs muzičkih instrumenata) je prvobitno dizajniran za kontrolu muzičkih instrumenata. Trenutno se koristi u oblasti elektronskih muzičkih instrumenata i računarski moduli sinteza.

WAV format audio datoteke(talasni oblik) predstavlja proizvoljan zvuk kao digitalni prikaz izvornog zvučnog talasa ili zvučnog talasa. Sve standardno zvuci prozora imaju ekstenziju .wav.

MP3 format(MPEG-1 Audio Layer 3) je jedan od digitalnih formata za pohranjivanje zvučnih informacija. Pruža kvalitetnije kodiranje.

Rješavanje problema za kodiranje audio informacija.

  1. Teorijski dio

Prilikom rješavanja zadataka učenici se oslanjaju na sljedeće koncepte:

Temporalna diskretizacija- proces u kojem se, tokom kodiranja kontinuiranog audio signala, zvučni val dijeli na zasebne male vremenske dionice, a za svaki takav dio se postavlja određena vrijednost amplitude. Što je veća amplituda signala, to je zvuk glasniji.

dubina zvuka (dubina kodiranja) - broj bitova po audio kodiranju.

Broj različitih nivoa zapremine izračunava se po formuli N= 2 I , gdje je I dubina zvuka.

Frekvencija uzorkovanja– broj mjerenja nivoa ulaznog signala po jedinici vremena (po 1 sekundi). Što je veća brzina uzorkovanja, to je preciznija procedura binarnog kodiranja. Frekvencija se mjeri u hercima (Hz).

Kvaliteta binarnog kodiranja je vrijednost koja je određena dubinom kodiranja i brzinom uzorkovanja.

Registrirajte bitnu dubinu- broj bitova u registru audio adaptera. Što je dubina bita veća, to je manja greška svake pojedinačne konverzije veličine električne struje u broj i obrnuto. Ako je širina bita I, tada prilikom mjerenja ulaznog signala, 2 I =N različitih vrijednosti.

  1. Praktični dio. Analiza i rješenje problema.

Zadatak 1 . Procijenite količinu informacija digitalne stereo zvučne datoteke u trajanju od 20 sekundi pri dubini kodiranja od 16 bita i brzini uzorkovanja od 10.000 Hz? Rezultat je prikazan u kbajtima, zaokruženo na stotinke.

Prilikom rješavanja ovakvih problema ne treba zaboraviti sljedeće:

Šta je mono - 1 kanal, stereo - 2 kanala

Zadatak 2 . Odredite veličinu (u bajtovima) digitalne audio datoteke čije je vrijeme reprodukcije 10 sekundi pri frekvenciji uzorkovanja od 22,05 kHz i rezoluciji od 8 bita.

Dato:

I = 8 bita = 1 bajt

t = 10 sek

η = 22,05 kHz = 22,05 * 1000 Hz = 22050 Hz

I - dubina bita zvučne kartice,

t - vrijeme reprodukcije audio datoteke,

η - brzina uzorkovanja

Rješenje:

V(Inform.) = I η t

V(Info) = 22050 *10 *1 = 220500 bajtova

Odgovor: V(Info) = 220500 bajtova

Nađi: V (volumen informacija) -?



Učitavanje...
Top