A téma a hangos információk kódolásával kapcsolatos problémák megoldása. Információk kódolása

Hang időmintavételezése.

A hang egy folyamatosan változó amplitúdójú és frekvenciájú hanghullám. Minél nagyobb a jel amplitúdója, annál hangosabb az ember számára, minél nagyobb a jel frekvenciája, annál magasabb a hangszín. Ahhoz, hogy a számítógép hangot dolgozhasson fel, a folyamatos hangjelet elektromos impulzusok sorozatává kell alakítani (bináris 0-k és 1-ek).

A kódolás folyamatában folyamatos hangjelzés idődiszkretizálása történik. A folyamatos hanghullám külön kis időszakaszokra van felosztva, és minden ilyen szakaszhoz be van állítva egy bizonyos amplitúdóérték.
A diszkretizálás a folytonos jelek átalakítása diszkrét értékek halmazává, amelyek mindegyikéhez egy meghatározott bináris kód van hozzárendelve.


Így a jel amplitúdójának az A(t) időtől való folyamatos függését a hangossági szintek diszkrét sorozata váltja fel. A grafikonon ez úgy néz ki, mintha egy sima görbét „lépések” sorozatára cserélnénk.

Minden „lépéshez” hozzá van rendelve a hangerőszint értéke, annak kódja (1, 2, 3 és így tovább). A hangerőszintek a lehetséges állapotok halmazának tekinthetők, illetve minél több hangerőszint kerül kiosztásra a kódolási folyamat során, annál több információt hordoz az egyes szintek értéke, és annál jobb lesz a hang. A modern hangkártyák 16 bites hangkódolási mélységet biztosítanak. A különböző jelszintek (egy adott kódolás állapota) száma a következő képlettel számítható ki:
N = 2 16 = 65356 [hangszintek],
ahol I a kódolási mélység.

Így a modern hangkártyák 65536 jelszintet képesek kódolni. Az audiojel amplitúdójának minden értékéhez 16 bites kód tartozik.

A folyamatos audiojel bináris kódolásával azt diszkrét jelszintek sorozata váltja fel. A kódolás minősége az időegységenkénti jelszint mérések számától, vagyis a mintavételezési gyakoriságtól függ. Minél több mérést végeznek 1 másodperc alatt (minél nagyobb a mintavételezési sebesség), annál pontosabb a bináris kódolási eljárás.

A bináris hangkódolás minőségét a kódolási mélység és a mintavételi gyakoriság határozza meg.

A másodpercenkénti mérések száma 8000-től 96000-ig terjedhet, azaz az analóg audiojel mintavételezési frekvenciája 8 és 96 [kHz] között lehet. 8[kHz]-es frekvencián a mintavételezett audiojel minősége a rádióadás minőségének, 96[kHz]-es frekvencián pedig egy audio-CD hangminőségének felel meg. Azt is meg kell jegyezni, hogy monó és sztereó mód is lehetséges.

Egy hangfájl információs hangereje

Egy hangfájl V sf hangerejének meghatározásához meg kell szorozni a mérések számát K meas a kódolási mélységgel (bitek száma szintenként) V 1meas:

V zf \u003d K mérték * V 1 mérték

Ahol a mérések száma K meas attól függ:

1. feladat


Házi feladat

1 Határozza meg a sztereó hangfájl hangerejét, mintavételi frekvenciával (dd)[kHz], hangidővel (dd)[s] (mm) bites kódoláshoz.

2 Határozza meg egy (yy) [KB] méretű monó audiofájl lejátszási idejét [s]-ben, kódolási mélységben (mm) [BIT] és mintavételezési frekvenciájában (dd) [kHz].
Ahol (dd) az Ön születési dátuma, (hh) a születési hónapja, (yy) a születési éve.

Az emberi fül 20 rezgés/másodperc (alacsony hang) és 20 000 rezgés/másodperc (magas hang) közötti frekvenciájú hangot érzékel.

Az ember hatalmas intenzitástartományban képes érzékelni a hangot, amelyben a maximális intenzitás 10 14-szer nagyobb, mint a minimum (százezer milliárdszor). Egy speciális egységet használnak a hangerősség mérésére. "decibel"(dbl) (5.1. táblázat). A hangerő 10 dB-lel történő csökkentése vagy növelése a hangintenzitás 10-szeres csökkenésének vagy növekedésének felel meg.

Hang időmintavételezése. Ahhoz, hogy a számítógép hangot feldolgozzon, a folyamatos hangjelet idő-mintavételezéssel diszkrét digitális formává kell alakítani. A folyamatos hanghullám külön kis időszakaszokra van felosztva, minden ilyen szakaszhoz beállítanak egy bizonyos hangintenzitásértéket.

Így a hangerősség A(t) időtől való folyamatos függőségét a hangerőszintek diszkrét sorozata váltja fel. A grafikonon ez úgy néz ki, mintha egy sima görbét "lépések" sorozatára cserélnénk (1.2. ábra).


Rizs. 1.2. Időbeli hangmintavétel

Mintavételi gyakoriság. A hangkártyához csatlakoztatott mikrofon az analóg hang rögzítésére és digitális formátumra való konvertálására szolgál. A kapott minőség digitális hang függ a hangerőszint időegységenkénti méréseinek számától, azaz. mintavételi ráta. Minél több mérést végeznek 1 másodperc alatt (minél magasabb a mintavételi frekvencia), annál pontosabban ismétli meg a digitális audiojel "létrája" a párbeszédjel görbéjét.

Hang mintavételi frekvencia a hangerő méréseinek száma egy másodperc alatt.

Az audio mintavételi frekvencia 8000 és 48000 hangerőmérés között lehet másodpercenként.

Hangkódolási mélység. Minden „lépéshez” hozzá van rendelve a hangerőszint egy bizonyos értéke. A hangerősségi szintek az N lehetséges állapotok halmazának tekinthetők, amelyek kódolásához bizonyos mennyiségű I információra van szükség, amit hangkódolási mélységnek nevezünk.

Hangkódolási mélység a diszkrét digitális hangerőszintek kódolásához szükséges információ mennyisége.

Ha ismert a kódolási mélység, akkor a digitális hangerőszintek száma kiszámítható az N = 2 I képlettel. Legyen a hangkódolási mélység 16 bit, akkor a hangerőszintek száma:

N = 2 I = 2 16 = 65536.

A kódolási folyamat során minden hangerőszinthez saját, 16 bites bináris kódot rendelnek, a legalacsonyabb hangszint a 0000000000000000 kódnak, a legmagasabb pedig a 11111111111111111 kódnak felel meg.

A digitalizált hang minősége. Minél nagyobb a hang frekvenciája és mintavételi mélysége, annál jobb lesz a digitalizált hang minősége. A minőségnek megfelelő legalacsonyabb minőségű digitalizált hang telefon kapcsolat, másodpercenként 8000-szeres mintavételezési sebességgel, 8 bites mintavételi mélységgel és egy hangsáv rögzítésével (monó mód) érhető el. A legtöbb jó minőség az audio CD minőségének megfelelő digitalizált hangot 48 000-szeres másodpercenkénti mintavételezési frekvenciával, 16 bites mintavételi mélységgel és két hangsáv rögzítésével (sztereó mód) érik el.

Emlékeztetni kell arra, hogy minél jobb a digitális hang minősége, annál nagyobb a hangfájl információmennyisége. Megbecsülheti egy 1 másodperces hangtartamú digitális sztereó hangfájl információs mennyiségét, átlagos hangminőséggel (16 bit, 24 000 mérés másodpercenként). Ehhez a kódolási mélységet meg kell szorozni az 1 másodpercenkénti mérések számával, és meg kell szorozni 2-vel (sztereó hang):

16 bit × 24 000 × 2 = 768 000 bit = 96 000 bájt = 93,75 KB.

hangszerkesztők. A hangszerkesztők segítségével nem csak hangot rögzíthet és lejátszhat, hanem szerkesztheti is. A digitalizált hang ben jelenik meg hangszerkesztők vizuális formában, így a hangsáv részeinek másolása, mozgatása és törlése egyszerűen elvégezhető az egér segítségével. Ezenkívül a hangsávokat egymásra helyezheti (hangok keverése), és különféle akusztikus effektusokat alkalmazhat (visszhang, visszajátszás stb.).

A hangszerkesztők lehetővé teszik a digitális hang minőségének és az audiofájl méretének megváltoztatását a mintavételi gyakoriság és a kódolási mélység változtatásával. A digitalizált hanganyag tömörítetlenül menthető hangfájlokba univerzális formátum wav vagy tömörített formátumban MP3.

Amikor a hangot tömörített formátumba menti, az emberi érzékelés szempontjából „túlzott” alacsony intenzitású hangfrekvenciákat eldobjuk, amelyek időben egybeesnek hangfrekvenciák nagy intenzitással. Ennek a formátumnak a használata lehetővé teszi az audiofájlok több tucatszori tömörítését, de visszafordíthatatlan információvesztéshez vezet (a fájlok nem állíthatók vissza eredeti formájukban).

Ellenőrző kérdések

1. Hogyan befolyásolja a mintavételezési sebesség és a kódolási mélység a digitális hangminőséget?

Önmegvalósítási feladatok

1.22. Szelektív válaszú feladat. A hangkártya az analóg audiojel bináris kódolását állítja elő. Mennyi információra van szükség a 65 536 lehetséges jelintenzitásszint mindegyikének kódolásához?
1) 16 bit; 2) 256 bit; 3) 1 bit; 4) 8 bites.

1.23. Kérdés részletes válasszal. Becsülje meg a 10 másodpercig tartó digitális audiofájlok információmennyiségét az audiojel kódolási mélységénél és mintavételezési gyakoriságánál, biztosítva a minimális és maximális hangminőséget:
a) monó, 8 bit, 8000 mérés másodpercenként;
b) sztereó, 16 bit, 48 000 mérés másodpercenként.

1.24. Kérdés részletes válasszal. Határozza meg egy hangfájl hosszát, amely elfér egy 3,5"-es hajlékonylemezen (vegye figyelembe, hogy 2847, egyenként 512 bájtos szektor van lefoglalva az adatok tárolására egy ilyen hajlékonylemezen):
a) alacsony hangminőséggel: monó, 8 bit, 8000 mérés másodpercenként;
b) kiváló hangminőséggel: sztereó, 16 bit, 48 000 mérés másodpercenként.

1. Általános információk

Bonyolultság: alapvető.

Hozzávetőleges döntési idő (azoknak, akik a 2. részt csinálják): 2 perc

Tantárgy: Grafikus és multimédiás információk létrehozása és feldolgozása

Altéma: Digitális hang

Amit ellenőriznek: Az értékelés képessége mennyiségi jellemzők hangfelvételi folyamat.

Rövid elméleti információk: Mert a adott típus a feladat új a KIM USE-ban, megadjuk (eddig indoklás nélkül, alább indoklás) matematikai modell rögzítési folyamat:

N=k*F*L* T (1)

  • N– a hangfelvételt tartalmazó fájl mérete (bitekben);
  • k- a felvételi csatornák száma (például 1 - monó, 2 - sztereó, 4 - quad stb.);
  • F– mintavételi frekvencia (hertzben), i.e. az egy másodperc alatt rögzített hangamplitúdó-értékek száma;
  • L– engedély, i.e. az egyes mért értékek tárolására használt bitek száma;
  • T– a hangrészlet időtartama (másodpercben).

Hogyan nézhet ki egy feladat? Például így: A hangrögzítési folyamat összes szükséges paraméterének értéke be van állítva, egy kivételével. Meg kell becsülni a fennmaradó paraméter értékét, például a fájl méretét vagy a hangrészlet időtartamát.


Példa az állapotra:

Válaszlehetőségek:

1) 0,2 MB

2. Feladat példa

2.1. A feladat.

Feladat 2012-A8-1.

Az egycsatornás (mono) hangfelvétel 16 kHz-es mintavételezési frekvenciával és 24 bites felbontással történik. A felvétel 1 percig tart, eredményét fájlba írják, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

1) 0,2 MB 2) 2 MB 3) 3 MB 4) 4 MB

2.2. Megoldás.

A kiindulási adatokat bit-másodperc-hertz dimenzióba visszük, és az (1) képlet szerint végezzük el a számításokat:

Adott:

k= 1, mert egycsatornás (mono) hangrögzítés;

F= 16 kHz = 16 000 Hz;

T= 1 perc = 60 s.

megtaláljaN

Helyettesítse az ismert paraméterek értékét az (1) képletben!

N=1*16000 *24*60 =(16 *1000) * (8*3) * (4*15)=

= 2 4 *(2 3 *125) *(2 3 *3)*) *(2 2 * 15) = 2 12 *5625 (bit)=

= 2 12 * 5625 bit = (2 12 * 5625) / 2 3 bájt = 2 9 * 5625 bájt =

= (2 9 * 5625)/ 2 20 MB = 5625/2 11 MB = 5625/2048 MB.

Szám 5625/2048 2 és 3 között van. Ráadásul közelebb van a 3-hoz, mint a 2-hez, mert 3 * 2048 – 5625 < 1000; 5625 - 2 * 2048 > 1000.

Helyes válasz: №3 (3 MB)

Megjegyzés. Egy másik megoldási ötlet a 3.3. bekezdésben található

3. Tippek tanároknak és diákoknak

3.1 Milyen tudásra/készségekre/készségekre van szüksége a tanulónak a probléma megoldásához?

1) Az (1) képletet nem szabad „memorizálni”. A digitális hangfolyamat lényegét képviselő hallgatónak tudnia kell azt önállóan megfogalmazni.

2) Le kell tudni írni a paraméterek értékeit a kívánt dimenzióban, valamint elemi számolási készségeket, pl. kettős hatványokkal működik.

A. Erős tanulók.

1. Valószínűleg úgyis megoldják ezt a problémát.

2. Feladatot adhat a tanulóknak, hogy a gyakorlatban ellenőrizzék az (1) képletet, a mikrofonból hangot rögzítve fájlba. Megjegyzendő, hogy csak akkor érvényes, ha a rögzített információ nincs tömörítve (WAV formátum (PCM) tömörítés nélkül). Ha tömörítésű hangformátumokat (WMA, MP3) használ, akkor az eredményül kapott fájl hangereje nyilvánvaló okokból lényegesen kisebb lesz, mint a számított. A digitális hanggal való kísérletezéshez használhatja az ingyenes Audacity hangszerkesztőt (http://audacity.sourceforge.net/).

3. Célszerű hangsúlyozni a hang és kép raszteres ábrázolásának fogalmi közösségét, amelyek a folytonos jel közelítő ábrázolásának ugyanazon folyamatának változatai - rövid diszkrét jelek sorozata, pl. mintavételen alapuló digitalizálás. Amikor bittérkép a fényesség térbeli kétdimenziós diszkretizálása, hang esetén egydimenziós időbeni diszkretizálás történik. Mindkét esetben a mintavételezési sebesség (a pixelek vagy hangminták számának) növelése és/vagy a bitek számának növelése egy minta megjelenítéséhez (szín vagy hang bitmélysége) a digitalizálás minőségének javulásához vezet, miközben növeli a fájlt. méret digitális ábrázolással. Ezért van szükség az adattömörítésre.

4. Kívánatos megemlíteni alternatív módokon hangdigitalizálás - hangszerek "alkatrészeinek" rögzítése MIDI formátumban. Itt célszerű analógiát vonni a képek raszteres és vektoros ábrázolásával.

B. Nem olyan erős tanulók.

1. Biztosítani kell az (1) reláció asszimilációját. Javasoljuk, hogy olyan feladatokat adjon, mint „Hogyan változik a fájl mérete, ha a hangfelvételi időt növeljük/csökkentjük p egyszer? ",

„Hányszor növelheti/csökkentheti a felvétel időtartamát, ha maximális méret fájl nagyítás/kicsinyítés p egyszer? ”, „Hogyan változik meg a fájl mérete, ha az egy érték írásához szükséges bitek számát növeljük/csökkentjük p egyszer?" stb.

2. Gondoskodni kell arról, hogy a tanulók szabadon operáljanak a méretekkel, tudják, hogy az MB 2-ben 23 bit van stb.

3. Gondoskodni kell arról, hogy a tanulók megfelelő számtani írástudással rendelkezzenek, folyékonyan beszéljenek kettős hatványokkal (szorzás, osztás, 2 n-t képviselő tényezők kiválasztása).

4. Találja ki saját megközelítéseit, és próbálja ki őket.

3.3. Hasznos trükk.

Az ilyen problémákban gyakran a kettő hatalma merül fel. A hatványok szorzása és osztása egyszerűbb, mint tetszőleges számok: a hatványok szorzása és osztása a kitevők összeadására és kivonására redukálódik.

Vegye figyelembe, hogy az 1000 és 1024 számok kevesebb, mint 3%-kal, a 60 és 64 számok kevesebb mint 7%-kal térnek el. Ezért megteheti. Hajtsa végre a számításokat úgy, hogy az 1000-et 1024 = 2 10-re, a 60-at pedig 64 = 2 6-ra cserélje, kihasználva a teljesítményműveletek előnyeit. A kapott számhoz legközelebb eső válasz lesz a kívánt. Ezután pontos számításokkal ellenőrizheti magát. De figyelembe lehet venni, hogy a teljes számítási hiba közelítésünkben nem haladja meg a 10%-ot. Valóban, 60*1000 = 60000; 64*1024=65536;

60000 > 0.9 * 65536 = 58982.4

Így az (1) képlet szerinti szorzás helyes eredménye valamivel több, mint a kapott közelítő eredmény 90%-a. Ha a hiba figyelembe vétele nem változtat az eredményen, a válaszhoz nem fér kétség.

Példa. (ege.yandex.ru, 1. lehetőség).

A kétcsatornás (sztereó) hangfelvétel 16 kHz-es mintavételezési frekvenciával és 32 bites felbontással történik. A felvétel 12 percig tart, eredményét fájlba írják, adattömörítést nem végeznek. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

1) 30 MB 2) 60 MB 3) 75 MB 4) 90 MB

Megoldás. A rekord mérete bitben a

2*16*1000*32*12*60

Ha figyelembe vesszük, hogy 1000 helyett 1024=2 10 és 60 helyett 64=2 6 a következőt kapjuk:

2 1 *2 4 *2 10 *2 5 *3*2 2 *2 6 =3*2 28

Mint tudják, 1 MB = 2 20 bájt = 2 23 bit. Tehát 3*2 28 bit = 3*32 = 96 MB. Ezt a számot 10%-kal csökkentve 86,4 MB-ot kapunk. Mindkét esetben a legközelebbi érték 90 MB.

Helyes válasz: 4

1. Olvassa el a probléma feltételét. Fejezd ki az ismeretlen paramétert az ismertekkel! Speciális figyelemügyeljen az ismert paraméterek méretére. Ez legyen - bit-másodperc-hertz (emlékezzünk arra, hogy 1 Hz = s -1). Ha szükséges, állítsa be a paraméterek értékeit a kívánt méretre, ugyanúgy, mint a fizikai feladatoknál.

2. Végezzen számításokat, próbálja kiválasztani a kettő hatványait.

3. Kérjük, vegye figyelembe, hogy ebben a feltételben a legmegfelelőbb választ kell választani, ezért nem szükséges a tizedesjegyig tartó nagy számítási pontosság. Amint kiderült, hogy melyik válaszlehetőség áll a legközelebb a számított értékhez, a számításokat le kell állítani. Ha az eltérés az összes válaszlehetőség között nagyon nagy (többször vagy nagyságrenddel), akkor a számításokat újra kell ellenőrizni.

4. Önálló megoldási feladatok

4.1. A 2012-A8-1 feladat klónjai.

Az alábbiakban további négy lehetőség található a 2012-A8-1 feladathoz.

A) Az egycsatornás (mono) hang rögzítése 32 kHz-es mintavételi frekvenciával és 24 bites felbontással történik. A rögzítés 15 másodpercig tart, eredményét fájlba írják, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

B) A kétcsatornás (sztereó) hangot 32 kHz-es mintavételezési frekvenciával és 24 bites felbontással rögzítik. A rögzítés 30 másodpercig tart, eredményeit fájlba írják, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

1) 1,5 MB 2) 3 MB 3) 6 MB 4) 12 MB

C) Az egycsatornás (mono) hangfelvétel 16 kHz-es mintavételi frekvenciával és 32 bites felbontással történik. A felvétel 2 percig tart, eredményét fájlba írják, adattömörítést nem végeznek. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

D) Az egycsatornás (mono) hang rögzítése 16 kHz-es mintavételi frekvenciával és 32 bites felbontással történik. A felvétel 4 percig tart, eredményét fájlba írják, adattömörítést nem végeznek. Az alábbi értékek közül melyik áll a legközelebb az eredményül kapott fájl méretéhez?

1) 2 MB 2) 4 MB 3) 8 MB 4) 16 MB

Helyes válaszok:

A:1; B:3; AT 3; D:4.

4.2. 2012-A8-2 probléma (fordítva az előzőhöz).

A) Az egycsatornás (mono) hangot 16 kHz-es mintavételi frekvenciával és 24 bites felbontással rögzítik. Az eredmények egy fájlba íródnak, amelynek mérete nem haladhatja meg a 8 MB-ot, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb a rögzített hangklip lehetséges maximális hosszához?

B) A kétcsatornás (sztereó) hangot 16 kHz-es mintavételezési frekvenciával és 24 bites felbontással rögzítik. Az eredmények egy fájlba íródnak, amelynek mérete nem haladhatja meg a 8 MB-ot, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb a rögzített hangklip lehetséges maximális hosszához?

1) 1 perc 2) 30 másodperc 3) 3 perc 4) 90 másodperc

C) Az egycsatornás (mono) hang rögzítése 48 kHz-es mintavételi frekvenciával és 8 bites felbontással történik. Az eredmények egy fájlba íródnak, amelynek mérete nem haladhatja meg a 2,5 MB-ot, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb a rögzített hangklip lehetséges maximális hosszához?

1) 1 perc 2) 30 másodperc 3) 3 perc 4) 90 másodperc

D) Az egycsatornás (mono) hang rögzítése 48 kHz-es mintavételi frekvenciával és 16 bites felbontással történik. Az eredmények egy fájlba íródnak, amelynek mérete nem haladhatja meg az 5 MB-ot, adattömörítés nem történik. Az alábbi értékek közül melyik áll a legközelebb a rögzített hangklip lehetséges maximális hosszához?

1) 1 perc 2) 30 másodperc 3) 3 perc 4) 90 másodperc

Helyes válaszok:

A:3; B: 4; IN 1; G:1.

5.Kiegészítés. Néhány információ a digitális hangrögzítésről.

A hang levegőben való terjedését a nyomásingadozások terjedésének tekinthetjük. A mikrofon a nyomásingadozásokat elektromos áram ingadozásává alakítja. Ez egy analóg folyamatos jel. A hangkártya mintavételezést biztosít bemeneti jel a mikrofonból. Ez a következőképpen történik - a folyamatos jelet egy bizonyos pontossággal mért értéksor váltja fel.

Analóg jel grafikon:

Ugyanazon jel diszkrét ábrázolása (41 mért érték):

Ugyanazon jel diszkrét ábrázolása (161 mért érték, több magas frekvencia diszkretizálás):

Látható, hogy minél nagyobb a mintavételezési frekvencia, annál jobb a közelítő (diszkrét) jel minősége. A digitalizált jel minőségét a mintavételezési sebességen kívül az egyes jelértékek rögzítéséhez allokált bitek száma is befolyásolja. Minél több bitet allokálunk az egyes értékekhez, annál pontosabban digitalizálható a jel.

Példa ugyanannak a jelnek a 2 bites ábrázolására (két bit csak 4 lehetséges jelszintet tud felsorolni):

Most már kiírhatja a fájlméret függőségét digitalizált hanggal

file_size = (rögzített_értékek_száma_1_másodpercenként)*

*(egyes_rögzítéshez_bináris_számjegyek_száma)*

*(rekord_másodpercek_száma).

Figyelembe véve a több mikrofonról történő egyidejű hangrögzítés lehetőségét (sztereó, quad felvétel stb.), ami a lejátszás során a valósághűség fokozása érdekében történik, az (1) képletet kapjuk.

Hang lejátszásakor a digitális értékek analóg értékekké alakulnak. A hangsugárzókra átvitt elektromos rezgéseket ismét légnyomás-ingadozásokká alakítják át.

Változó amplitúdóval és frekvenciával. Minél nagyobb a jel amplitúdója, annál hangosabban érzékeli az ember. Minél magasabb a jel frekvenciája, annál magasabb a hangja.

1. ábra Hanghullámok oszcillációs amplitúdója

Hanghullám frekvencia a másodpercenkénti oszcillációk száma határozza meg. Ezt az értéket hertzben (Hz, Hz) mérik.

Az emberi fül a 20 $ Hz és $ 20 $ kHz közötti tartományban érzékeli a hangokat, ezt a tartományt ún. hang. Az egy hangjelhez rendelt bitek számát hívják meg hangkódolási mélység. Modernben hangkártyák$16-$, $32-$ vagy $64-bites hangkódolási mélység biztosított. A kódolás folyamatában hangos információk a folyamatos jel kicserélődik diszkrét, azaz bináris nullákból és egyesekből álló elektromos impulzusok sorozatává alakul át.

Hang mintavételi frekvencia

A hangkódolási folyamat egyik fontos jellemzője a mintavételezési frekvencia, amely a jelszint mérések száma $1$ másodpercenként:

  • másodpercenként egy mérés 1$ gigahertz (GHz) frekvenciának felel meg;
  • A másodpercenkénti 1000 $ mérés megfelel $1 $ kilohertz (kHz) frekvenciának.

2. definíció

Hang mintavételi frekvencia a hangerő méréseinek száma egy másodperc alatt.

A mérések száma 8 $ kHz és 48 $ kHz között lehet, az első érték a rádióadás frekvenciájának, a második pedig a zenei média hangminőségének felel meg.

Megjegyzés 1

Minél magasabb a hang frekvenciája és mintavételi mélysége, annál jobban fog szólni a digitalizált hang. A legalacsonyabb minőségű digitalizált hang, amely megfelel a telefonkapcsolat minőségének, akkor érhető el, ha a mintavételi sebesség másodpercenként 8000, a mintavételi mélység $8$ bit, ami egy hangsáv rögzítésének felel meg ("mono"). mód). A digitalizált hang legmagasabb minősége, amely megfelel egy audio CD minőségének, akkor érhető el, ha a mintavételi sebesség 48 000 $ másodpercenként, a mintavételi mélység $ 16 $ bit, ami két hangsáv rögzítésének felel meg (sztereó mód).

Egy hangfájl információs hangereje

Meg kell jegyezni, hogy minél jobb a digitális hang minősége, annál nagyobb a hangfájl információmennyisége.

Becsüljünk információs kötet monó hangfájl ($V$), ezt a következő képlettel lehet megtenni:

$V = N \cdot f \cdot k$,

ahol $N$ a hang teljes időtartama másodpercben kifejezve,

$f$ - mintavételi frekvencia (Hz),

$k$ - kódolási mélység (bit).

1. példa

Például, ha a hang időtartama $1$ perc, és van egy átlagos hangminőségünk, amelynél a mintavételi frekvencia $24$ kHz, a kódolási mélység pedig $16$ bit, akkor:

$V=60 \cdot 24000 \cdot 16 \ bits=23040000 \ bits=2880000 \ bytes=2812.5 \ KB=2.75 \ MB.$

A sztereó hang kódolásakor a mintavételezési folyamat külön-külön és egymástól függetlenül történik a bal és jobb csatornákra, ami ennek megfelelően megduplázza a hangfájl hangerejét a mono hanghoz képest.

2. példa

Például becsüljük meg egy digitális sztereó hangfájl információs mennyiségét, amelynek a hang időtartama $1$ másodperc átlagos hangminőség mellett ($16$ bit, 24000$ mérés másodpercenként). Ehhez szorozza meg a kódolási mélységet az $1$ másodpercenkénti mérések számával, és szorozza meg $2$-al (sztereó hang):

$V=16 \ bit \cdot 24000 \cdot 2 = 768000 \ bit = 96000 \ bájt = 93,75 \ kb.$

Hanginformációk kódolásának alapvető módszerei

Létezik különféle módszerek hanginformáció kódolása bináris kóddal, amelyek között két fő terület van: FM módszerÉs hullámtábla módszer.

FM módszer (frekvencia moduláció) azon a tényen alapul, hogy elméletileg bármilyen összetett hang felbontható különböző frekvenciájú egyszerű harmonikus jelek sorozatára, amelyek mindegyike szabályos szinuszos lesz, ami azt jelenti, hogy kóddal leírható. A hangjelek harmonikus sorozatokra bontásának folyamata és diszkrét formában való megjelenítése digitális jelek speciális eszközökben, az úgynevezett analóg-digitális konverterekben (ADC) fordul elő.

2. ábra Audiojel átalakítása a diszkrét jel

A 2a ábra az ADC bemenetén lévő audiojelet, a 2b ábra pedig az ADC kimenetén lévő, már átalakított diszkrét jelet mutatja.

Mert inverz transzformáció a számkód formájában megjelenő hang lejátszásakor digitális-analóg konvertereket (DAC) használnak. A hangátalakítási folyamat az ábrán látható. 3. Ez a kódolási módszer nem jó minőségű hang, de kompakt kódot biztosít.

3. ábra: Diszkrét jel átalakítása audiojellé

A 3a ábra a DAC bemeneten lévő diszkrét jelet mutatja, a 3b ábra pedig a DAC kimenet audiojelét.

Táblázat-hullám módszer (Hullám asztal) azon alapul, hogy a környező világ hangjainak, hangszereknek stb. mintáit előre elkészített táblázatokban tárolják A numerikus kódok kifejezik a hang magasságát, időtartamát és intenzitását, valamint egyéb paramétereket, amelyek a hangszer jellemzőit jellemzik. a hang. Mivel mintaként „igazi” hangokat használnak, a szintézis eredményeként kapott hang minősége nagyon magas, és megközelíti a valódi hangszerek hangminőségét.

Példák hangfájl formátumokra

A hangfájlok többféle formátumban kaphatók. Közülük a legnépszerűbbek a MIDI, WAV, MP3.

MIDI formátum(Musical Instrument Digital Interface) eredetileg hangszerek vezérlésére készült. Jelenleg az elektronikus hangszerek területén használatos, ill számítógépes modulok szintézis.

WAV audio fájl formátum(hullámforma) egy tetszőleges hangot jelent az eredeti hanghullám vagy hanghullám digitális reprezentációjaként. Minden szabvány windows hangok rendelkezik a .wav kiterjesztéssel.

MP3 formátum(MPEG-1 Audio Layer 3) a hanginformációk tárolására szolgáló digitális formátumok egyike. Jobb minőségű kódolást biztosít.

Hanginformációk kódolásával kapcsolatos problémák megoldása.

  1. Elméleti rész

A feladatok megoldása során a tanulók a következő fogalmakra támaszkodnak:

Időbeli diszkretizálás- olyan folyamat, amelyben a folyamatos audiojel kódolása során a hanghullámot külön kis időszakaszokra osztják, és minden ilyen szakaszhoz egy bizonyos amplitúdóértéket állítanak be. Minél nagyobb a jel amplitúdója, annál hangosabb a hang.

hang mélysége (kódolási mélység) - az audio kódolásonkénti bitek száma.

A különböző hangerőszintek számát az N= 2 képlettel számítjuk kién , ahol I a hangmélység.

Mintavételi gyakoriság– a bemeneti jelszint méréseinek száma időegységenként (1 másodpercenként). Minél nagyobb a mintavételi sebesség, annál pontosabb a bináris kódolási eljárás. A frekvenciát hertzben (Hz) mérik.

A bináris kódolás minősége egy olyan érték, amelyet a kódolási mélység és a mintavételi sebesség határoz meg.

Regisztrálja a bitmélységet- a bitek száma az audio adapter regiszterében. Minél nagyobb a bitmélység, annál kisebb a hiba az elektromos áram nagyságának számmá történő minden egyes egyedi átalakításakor, és fordítva. Ha a bitszélesség I, akkor a bemeneti jel mérésekor 2én =N különböző érték.

  1. Gyakorlati rész. A probléma elemzése és megoldása.

1. feladat . Becsülje meg egy 20 másodperces, 16 bites kódolási mélységű és 10 000 Hz-es mintavételezési frekvenciájú digitális sztereó hangfájl információmennyiségét? Az eredmény Kbyte-ban jelenik meg, századokra kerekítve.

Az ilyen problémák megoldása során nem szabad megfeledkezni a következőkről:

Mi az a mono - 1 csatorna, sztereó - 2 csatorna

2. feladat . Határozza meg annak a digitális audiofájlnak a méretét (bájtban), amelynek lejátszási ideje 10 másodperc 22,05 kHz mintavételi frekvenciával és 8 bites felbontással.

Adott:

I = 8 bit = 1 bájt

t = 10 mp

η = 22,05 kHz = 22,05 * 1000 Hz = 22 050 Hz

I - a hangkártya bitmélysége,

t - audio fájl lejátszási ideje,

η - mintavételi sebesség

Megoldás:

V(Inform.) = I η t

V(Info) = 22050 *10 *1 = 220500 bájt

Válasz: V(Info) = 220500 bájt

Megtalálja: V (információs kötet) -?



Betöltés...
Top