Ako sa volá systém generovania hlasu? Online syntetizátory reči: najlepšie služby pre hlasový text

Program je určený na čítanie nahlas textové súbory. Na reprodukciu zvukov ľudského hlasu je možné použiť akékoľvek syntetizátory reči nainštalované v počítači. Hrať...

pred 3 mesiacmi Licencia: zadarmo Jazyk: ruština angličtina nemčina OS: XP/Vista/7/8/8.1/10 Veľkosť: 16,99 MB

Výkonný nástroj na čítanie textu z webovej stránky, listu, textového súboru, rôznych dokumentov alebo jeho konverziu na zvukové súbory MP3 alebo WMA. Program je integrovaný do takýchto...

pred 4 mesiacmi Licencia: Shareware Jazyk: Angličtina OS: XP/Vista/7/8/8.1/10 Veľkosť: 24,1 MB

zaujímavá aplikácia, ktorý je schopný konvertovať tlačený text na zvukovú reč. To je vhodné na vytváranie rôznych audio lekcií, prednášok alebo dokonca celých kníh, keď na cestách môžete jednoducho...

Pred 6 mesiacmi Licencia: zadarmo Jazyk: ruská angličtina OS: XP/Vista/7/8/8.1/10 Veľkosť: 3,72 MB

rozprávanie textový editor. Syntetizátor reči kompatibilný so SAPI4 a SAPI5. Program je určený na čítanie textových súborov nahlas pomocou balíkov rečových funkcií Microsoft Speech API 4/5 (SA...

Pred rokom Licencia: zadarmo Jazyk: ruský OS: XP/Vista/7/8/8.1/10 Veľkosť: 3,59 MB

S 2nd Speech Center môžete počúvať text namiesto čítania z obrazovky, čím si oddýchnete. Text sa vyslovuje zo schránky. Hovorený text je možné nahrávať do mp3/wav....

pred 2 rokmi Licencia: Shareware Jazyk: Angličtina OS: 2000/XP/2003/Vista/7/8/8.1/10 Veľkosť: 3,77 MB

pohodlné a rýchly program na vyjadrovanie textov, vytváranie zvukových kníh (vo formáte wav, mp3, amr, aac + zoznam skladieb), kladenie dôrazu na ruské texty alebo jednoducho pohodlné čítanie kníh z obrazovky. Chrome...

pred 4 rokmi Licencia: Shareware Jazyk: ruský OS: XP/Vista/7 Veľkosť: 2,59 MB

voľný program na prevod textu na reč. Pomôže vám prečítať akýkoľvek text nahlas, ako aj uložiť ho do súboru WAV alebo MP3. TTSReader má už asi 10 mužských a ženských hlasov. Atď...

pred 8 rokmi Licencia: zadarmo Jazyk: Angličtina OS: 2000/XP/Vista Veľkosť: 2,29 MB

Pomocou prevodníka textu na reč Pistonsoft môžete previesť text na reč alebo audioknihu vo formáte MP3 a WAV. Všetky jazyky nainštalované v systéme sú dostupné v programe na kopírovanie. Technológovia...

Syntéza ústnej reči je premena dovtedy neznámych textových informácií na reč. Hlasový výstup je implementácia rečového rozhrania na zjednodušenie používania systému. V skutočnosti je vďaka syntéze reči poskytnutý ďalší kanál na prenos údajov z počítača, mobilný telefón na osobu, podobne ako monitor. Samozrejme, nie je možné sprostredkovať kresbu hlasom, ale počúvajte email alebo denný rozvrh je v niektorých prípadoch celkom vhodný, najmä ak v tom čase vaše oči zamestnáva niečo iné. Napríklad, keď prídete ráno do práce, pripravujete sa na rokovania, môžete si v zrkadle upraviť kravatu alebo účes, zatiaľ čo počítač nahlas číta posledné správy, mail alebo pripomienky dôležitá informácia na rokovania.

Obrázok 2.2 - Spracovanie akustického signálu

Technológia syntézy reči našla široké uplatnenie u ľudí s problémami so zrakom. Pre všetkých ostatných vytvára nový rozmer jednoduchosti používania techniky a výrazne znižuje záťaž zraku a nervového systému a umožňuje využitie sluchovej pamäte.

Obrázok 2.3 - Syntéza reči

Akýkoľvek text pozostáva zo slov oddelených medzerami a interpunkčnými znamienkami. Výslovnosť slov závisí od ich umiestnenia vo vete a intonácia frázy závisí od interpunkčných znamienok. Napokon, výslovnosť závisí aj od významu slova! Preto, aby syntetizovaná reč znela prirodzene, je potrebné vyriešiť celý rad problémov súvisiacich so zabezpečením prirodzenosti hlasu na úrovni plynulosti zvuku a intonácie, ako aj so správnym umiestnením prízvukov, dešifrovaním skratiek. , čísla, skratky a špeciálne znaky, berúc do úvahy zvláštnosti ruského gramatického jazyka.

Existuje niekoľko prístupov k riešeniu problémov:

1) systémy alofónnej syntézy – poskytujú stabilný, ale nie dostatočne prirodzený, robotický zvuk;

2) systémy založené na prístupe Unit Selection – poskytujú oveľa prirodzenejší zvuk, ale môžu obsahovať fragmenty reči s ostrými poklesmi v kvalite až strate zrozumiteľnosti;

3) hybridná technológia založená na prístupe Unit Selection a doplnená o jednotky alofónnej syntézy.

Na základe tejto technológie bol vytvorený systém VitalVoice, ktorý poskytuje stabilný a prirodzený zvuk na akustickej úrovni.

Verbálna komunikácia je pre človeka prirodzená a pohodlná. Cieľom rozpoznávania reči je odstrániť sprostredkovateľa v komunikácii medzi osobou a počítačom. Ovládanie stroja hlasom v reálnom čase, ako aj zadávanie informácií ľudskou rečou výrazne zjednoduší život moderného človeka. Naučiť stroj rozumieť bez sprostredkovateľa jazyku, ktorým ľudia medzi sebou hovoria, je úlohou rozpoznávania reči.

Vedci a inžinieri už dlhé roky riešia problém verbálnej komunikácie medzi ľuďmi a strojmi. Prvé zariadenie na rozpoznávanie reči sa objavilo v roku 1952 a dokázalo rozpoznať čísla vyslovené osobou. Komerčné programy na rozpoznávanie reči sa objavili na začiatku deväťdesiatych rokov.

Všetky systémy rozpoznávania reči možno rozdeliť do dvoch tried:

1) Systémy závislé od hovoriaceho – sú naladené na reč hovoriaceho počas procesu učenia. Ak chcete pracovať s iným reproduktorom, takéto systémy vyžadujú úplnú rekonfiguráciu.

Obrázok 2.4 - Rozpoznávanie reči

2) Systémy nezávislé od reproduktorov – ktorých činnosť nezávisí od reproduktora. Takéto systémy nevyžadujú predbežné školenie a sú schopné rozpoznať reč akéhokoľvek rečníka.

Spočiatku sa na trhu objavil prvý typ systému. V nich bol zvukový obraz tímu uložený vo forme celistvého štandardu. Na porovnanie neznámej výpovede a príkazového štandardu boli použité metódy dynamické programovanie. Tieto systémy fungovali dobre pri rozpoznávaní malých sád 10-30 príkazov a rozumeli len jednému reproduktoru. Pre prácu s iným reproduktorom si tieto systémy vyžadovali kompletnú rekonfiguráciu.

Na pochopenie súvislej reči bolo potrebné prejsť k oveľa väčším slovníkom, od niekoľkých desiatok až po stovky tisíc slov. Metódy používané v systémoch prvého typu neboli vhodné na riešenie tohto problému, pretože je jednoducho nemožné vytvoriť štandardy pre taký počet slov.

Okrem toho tu bola túžba urobiť systém nezávislým od reproduktora. Je to veľmi náročná úloha, pretože každý má individuálny spôsob výslovnosti: rýchlosť reči, zafarbenie hlasu, výslovnosť. Takéto rozdiely sa nazývajú premenlivosť reči. Na jej zohľadnenie boli navrhnuté nové štatistické metódy založené najmä na matematickom aparáte skrytých Markovových modelov (HMM) alebo umelých Neurálne siete. Namiesto vytvárania noriem pre každé slovo sa vytvárajú normy pre jednotlivé zvuky, ktoré slová tvoria, takzvané akustické modely. Akustické modely sú tvorené štatistickým spracovaním rozsiahlych databáz reči obsahujúcich rečové nahrávky stoviek ľudí.

IN existujúce systémy rozpoznávanie reči používa dva zásadne odlišné prístupy:

Lexikálne rozpoznávanie

Všimnite si, že vytváranie systémov rozpoznávania reči je mimoriadne náročná úloha.

Dnes existuje technológia, ktorá dokáže previesť textové informácie do bežnej reči. S vývojom „inteligentných strojov“ sa táto technológia stáva čoraz aktuálnejšou a každý deň si vyžaduje viac a viac dokonalosti. Vlastne, na tento moment Bolo vyvinutých množstvo metód syntézy reči, o ktorých budeme hovoriť.

Syntetizátory reči sa dajú použiť v úplne odlišných oblastiach a používajú sa na riešenie mnohých problémov, od „čítania“ kníh, výroby „hovoriacich“ detských hračiek, ohlasovania zastávok vo verejnej doprave alebo v obslužných systémoch až po medicínu (tu sa oplatí spomienka na Stephena Hawkinga, používanie syntetizátora reči na komunikáciu so svetom).

Poďme sa teda bližšie pozrieť na technológiu a metódy syntézy reči. Ako už bolo spomenuté, existuje niekoľko metód syntézy reči. Možno teda rozlíšiť niekoľko hlavných prístupov:

parametrická syntéza;
zreťazená (kompilačná) syntéza;
syntéza podľa pravidiel (na základe tlačeného textu);

Parametrická syntéza umožňuje nahrávať reč pre ľubovoľný jazyk, ale nedá sa použiť pre texty, ktoré neboli vopred špecifikované. Parametrická syntéza reči sa používa, keď je množina správ obmedzená. Kvalita tejto metódy syntézy môže byť veľmi vysoká.

Parametrická syntéza reči je v podstate implementáciou princípu fungovania vokodéra. V prípade parametrickej syntézy zvukový signál reprezentovaný určitým počtom neustále sa meniacich parametrov. Tónový generátor sa používa na generovanie samohlások a generátor šumu sa používa na spoluhlásky. Ale táto metóda sa zvyčajne používa na nahrávanie hlasov v hudobných skladbách a častejšie ani nehovoríme o čistej hlasovej syntéze, ale skôr o modulácii.

Metóda syntézy kompilácie je založená na zostavovaní textov z vopred nahraného „slovníka“ prvkov. Veľkosť prvku systému musí byť aspoň slovo. Typicky je zásoba prvkov obmedzená na niekoľko stoviek slov a obsah syntetizovaných textov je obmedzený na objem slovníka. Táto metóda syntézy reči je široko používaná v každodennom živote - spravidla v rôznych pomocných službách a zariadeniach, ktoré si vyžadujú vybavenie systémami odozvy reči.

Úplná syntéza reči podľa pravidiel dokáže reprodukovať reč z predtým neznámeho textu. Táto metóda nevyužíva prvky ľudskej reči, ale je založená na naprogramovaných lingvistických a akustických algoritmoch.

Existuje tu aj rozdelenie - možno rozlíšiť dva prístupy k tejto metóde syntézy. Prvým je formantová syntéza reči podľa pravidiel a druhým artikulačná syntéza. Formantová syntéza je založená na formantoch – frekvenčných rezonanciách reči reproduktorový systém. Algoritmus syntézy formantov modeluje fungovanie ľudského vokálneho traktu, ktorý funguje ako súbor rezonátorov. Dnes je, žiaľ, väčšina syntetizátorov, ktoré pracujú výlučne na syntéze formantov, ťažko zrozumiteľná bez prípravy, ale nepochybne ide o univerzálnu a sľubnú technológiu. Artikulačná metóda sa snaží nedostatky formantovej metódy vylepšiť pridávaním fonetických znakov výslovnosti jednotlivých hlások do modelu.

Existuje aj technológia syntézy reči podľa pravidiel, ktorá využíva zaznamenané segmenty prirodzenej reči. Keďže metódy kompilácie sú stále najčastejšie používané, povedzme si o nich pár slov podrobnejšie.

V závislosti od toho, aké veľké sú „úryvky“ reči používané na syntézu, sa rozlišujú tieto typy syntézy:

mikrosegment (mikrovlnka);
alofonický;
difónny;
poloslabičný;
slabičný;
syntéza z jednotiek ľubovoľnej veľkosti.

Najčastejšie sa používajú alofonické a difónne metódy. Pre metódu difónnej syntézy reči základné prvky sú všetky druhy binomických kombinácií foném a pre alofón - kombinácie ľavého a pravého kontextu (alofón je variant fonémy, ktorý je určený jej špecifickým fonetickým prostredím). V čom Rôzne druhy kontexty sa kombinujú do tried podľa stupňa akustickej blízkosti.

Výhodou takýchto systémov je, že umožňujú syntetizovať text z textu, ktorý nie je vopred špecifikovaný, nevýhodou však je, že kvalita syntetizovanej reči nie je porovnateľná s kvalitou prirodzenej reči (na hraniciach môže dochádzať ku skresleniu). zošívacích prvkov). Je tiež veľmi ťažké kontrolovať intonačné charakteristiky reči, pretože vlastnosti jednotlivých slov sa môžu meniť v závislosti od kontextu alebo typu frázy.

Toto je však všetko v teórii. V praxi, v súčasnom štádiu vývoja, napriek aktívnemu pokroku v tejto oblasti, vývojári technológie syntézy reči stále majú určité ťažkosti spojené najmä s umelosťou syntetizovanej reči, nedostatkom emocionálneho zafarbenia v nej a nízkou odolnosťou voči hluku.

Faktom je, že každá syntetizovaná reč je pre človeka spravidla ťažko vnímateľná. Je to spôsobené tým, že medzery v syntetizovanom texte vypĺňa ľudský mozog, ktorý na to využíva ďalšie zdroje a človek dokáže bežne vnímať syntetizovanú reč len asi 20 minút.

Vnímanie reči ovplyvňuje aj jej emocionálne zafarbenie. V prípade syntetizovanej reči chýba. Hoci stojí za zmienku, že niektoré algoritmy stále umožňujú do určitej miery napodobňovať emocionálne zafarbenie reči zmenou trvania foném, prestávok a zafarbenia, ich práca je zatiaľ ďaleko od ideálu.

Čo sa týka tretieho menovaného problému – nízkej odolnosti voči šumu, experimenty ukazujú, že vnímanie syntetizovaného textu narúša akýkoľvek, aj ten najmenší, cudzí šum. Je to opäť spôsobené tým, že na spracovanie syntetizovanej reči ľudský mozog využíva dodatočné centrá, ktoré sa pri vnímaní prirodzenej reči nevyužívajú.

Na konci tohto článku by som rád uviedol niekoľko príkladov existujúcich syntetizátorov reči.

Každý pozná takzvané „čítačky“ - programy na pohodlnejšie čítanie textu z monitora. Mnohí z nás používajú programy na syntézu reči na hlasovanie textu, napríklad Balabolka a Govorilka.

Aby takéto programy mohli čítať texty, musíte si nainštalovať aj knižnicu SAPI (Speech API) a hlasové nástroje. Najbežnejšie sú dve verzie Speech API: SAPI4 a SAPI5 Obe knižnice môžu bežať na rovnakom počítači. IN operačné systémy Windows XP, Windows Vista a Windows 7 už majú nainštalované knižnice SAPI5.

Okrem elektronických čítačiek sú bežné programy pre prístup na obrazovku. Príklady takýchto programov sú:

PANNA 4. Program bol vytvorený pre pohodlnú prácu nevidiacich a slabozrakých používateľov s Windows. Umožňuje vám vybrať informácie, ktoré sa budú vyslovovať hlasom, a informácie, ktoré sa budú zobrazovať na Braillovom displeji. Pre zrakovo postihnutých používateľov je k dispozícii systém zväčšovania obrazovky Galileo.

Cobra 9.1 tiež uľahčuje prácu s Windows nevidiacim a slabozrakým používateľom. Tento program dokáže zobrazovať informácie z monitora počítača pomocou reči, Braillovho displeja a má funkciu zväčšenia obrazovky.

Dnes sa syntetizátory reči používajú v pevnej linke počítačové systémy alebo mobilné zariadenia sa už nezdajú nezvyčajné. Technológia prešla dlhú cestu a umožnila reprodukovať ľudský hlas. Ako to celé funguje, kde sa používa, aký je najlepší syntetizátor reči a s akými potenciálnymi problémami sa môže používateľ stretnúť, nájdete nižšie.

Čo sú to syntetizátory reči a kde sa používajú?

Syntetizátory reči sú špeciálne programy, pozostávajúci z niekoľkých modulov, ktoré umožňujú preložiť text napísaný na klávesnici do bežnej ľudskej reči vo forme zvuku.

Bolo by naivné veriť, že sprievodné knižnice obsahujú úplne každé slovo alebo možnú frázu nahranú v štúdiách skutočnými ľuďmi. Je to jednoducho fyzicky nemožné. Knižnice fráz by navyše boli také veľké, že by ich inštalácia ani na moderné veľké pevné disky, nehovoriac o mobilných zariadeniach, jednoducho nebola možná.

Na tento účel bola vyvinutá technológia s názvom Text-to-Speech (preklad textu na reč).

Syntetizátory reči sú najrozšírenejšie v niekoľkých oblastiach, medzi ktoré patrí samoštúdium cudzie jazyky (programy často podporujú 50 a viac jazykov), keď potrebujete počuť správnu výslovnosť slova, počúvanie textov kníh namiesto čítania, vytváranie rečových a vokálnych partov v hudbe, ich používanie osobami so zdravotným postihnutím, vydávanie vyhľadávacie dopyty vo forme vyslovených slov a fráz atď.

Typy programov

V závislosti od oblasti použitia možno všetky programy rozdeliť do dvoch hlavných typov: štandardné, ktoré priamo konvertujú text na reč, a rečové alebo vokálne moduly používané v hudobných aplikáciách.

Pre úplnejšie pochopenie obrazu zvážime obe triedy, ale väčší dôraz sa bude klásť na syntetizátory reči pre ich bezprostredný účel.

Výhody a nevýhody jednoduchých rečových aplikácií

Pokiaľ ide o výhody a nevýhody programov tohto typu, najprv zvážime nevýhody.

Najprv musíte jasne pochopiť, že počítač je počítač, ktorý v tomto štádiu vývin, ľudská reč dokáže syntetizovať veľmi približne. V najjednoduchších programoch sa často vyskytujú problémy s umiestnením akcentov v slovách, znížená kvalita zvuku av mobilných zariadeniach - zvýšená spotreba energie a niekedy neoprávnené načítanie rečových modulov.

Ale existuje aj veľa výhod, pretože veľmi veľa zvukové informácie sú vnímané oveľa lepšie ako vizuálne. Ľahkosť vnímania je zrejmá.

Ako používať syntetizátor reči?

Teraz pár slov o základných princípoch používania programov tohto typu. Bez problémov môžete nainštalovať akýkoľvek typ syntetizátora reči. IN stacionárne systémy používa sa štandardný inštalátor, kde hlavnou úlohou bude výber podporovaných jazykových modulov. Pre mobilné zariadenia Inštalačný súbor si môžete stiahnuť z oficiálneho obchodu alebo úložiska Google Play alebo AppStore, po ktorom sa aplikácia automaticky nainštaluje.

Spravidla pri prvom spustení nemusíte okrem nastavenia predvoleného jazyka vykonávať žiadne nastavenia. Je pravda, že niekedy program môže ponúknuť výber kvality zvuku (v štandardnej verzii, ktorá sa používa všade, vzorkovacia frekvencia je 4410 Hz, hĺbka je 16 bitov a bitová rýchlosť je 128 kbps). Na mobilných zariadeniach sú tieto čísla nižšie. Napriek tomu sa za základ berie určitý hlas. Použitím štandardnej výslovnostnej predlohy, použitím filtrov a ekvalizérov sa dosiahne zvuk práve takého zafarbenia.

Pri používaní si môžete vybrať niekoľko možností manuálneho prekladu, vyjadrenia existujúceho textu zo súboru, integrácie do iných aplikácií (napríklad webových prehliadačov) s aktiváciou výsledkov vyhľadávania alebo čítania textového obsahu na online stránkach. Stačí si vybrať správna možnosťčiny, jazyk a hlas, ktorým to všetko bude vyslovované. Mnoho programov má niekoľko typov hlasov: mužské aj ženské. Na aktiváciu procesu prehrávania sa zvyčajne používa tlačidlo štart.

Ak hovoríme o tom, ako deaktivovať syntetizátor reči, môže existovať niekoľko možností. V najjednoduchšom prípade použite tlačidlo zastavenia prehrávania v samotnom programe. V prípade integrácie do prehliadača sa deaktivácia vykoná v nastaveniach rozšírenia resp úplné odstránenie zapojiť. Ale s mobilné zariadenia, napriek okamžitému odstaveniu sa môžu vyskytnúť problémy, o ktorých sa bude diskutovať samostatne.

IN hudobné programy nastavenia a zadávanie textu je oveľa náročnejšie. Napríklad aplikácia FL Studio má vlastný rečový modul, v ktorom môžete mierne zmeniť nastavenia tónu, rýchlosti prehrávania atď. Na umiestnenie prízvuku pred slabiku sa používa symbol „_“. Ale takýto syntetizátor je vhodný len na vytváranie robotických hlasov.

Ale balík Vocaloid od Yamahy je program profesionálneho typu. Technológia Text-to-Speech je tu implementovaná v plnom rozsahu. V nastaveniach okrem štandardné parametre, môžete nastaviť artikuláciu, glissando, používať knižnice s vokálom profesionálnych interpretov, skladať slová a frázy, prispôsobovať ich notám a veľa ďalších vecí. Neprekvapí, že balík len s jedným vokálom zaberá v inštalačnej distribúcii približne 4 GB a viac a po rozbalení zaberie dva až trikrát viac.

Syntetizátory reči s ruskými hlasmi: stručný prehľad najpopulárnejších

Ale vráťme sa k tomu najviac jednoduché aplikácie a zvážte najobľúbenejšie z nich.

RHVoice - podľa väčšiny odborníkov je to najlepší syntetizátor reči, ktorý je ruským vývojom. V štandardnej verzii sú k dispozícii tri hlasy (Alexander, Irina, Elena). Nastavenia sú jednoduché. A samotná aplikácia môže byť použitá ako nezávislý program, kompatibilný so SAPI5, tak aj ako modul obrazovky.

Acapela je celkom zaujímavá aplikácia, Hlavná prednosťčo je takmer dokonalý voiceover textu vo viac ako 30 jazykoch. V bežnej verzii je však dostupný iba jeden hlas (Alena).

Vocalizer je výkonná aplikácia so ženským hlasom Milena. Veľmi často sa tento program používa v call centrách. Existuje veľa nastavení pre stres, hlasitosť, rýchlosť čítania a inštaláciu ďalších slovníkov. Hlavným rozdielom je, že rečový engine môže byť zabudovaný do programov ako Cool Reader, Moon+ Reader Pro alebo Full Preveriť volajúceho ID.

festival- najvýkonnejší nástroj syntéza a rozpoznávanie reči, určená pre Linuxové systémy a Mac OS X. Aplikácia sa dodáva s otvoreným zdrojový kód a okrem štandardu jazykové balíčky, dokonca podporuje fínčinu a hindčinu.

eSpeak je rečová aplikácia, ktorá podporuje viac ako 50 jazykov. Hlavnou nevýhodou je, že súbory so syntetizovanou rečou sa ukladajú výlučne vo formáte WAV, čo zaberá veľa miesta. Program je však multiplatformový a dá sa použiť aj na mobilných systémoch.

Problémy so syntetizátorom reči v systéme Google Android

Pri inštalácii „natívneho“ syntetizátora reči od spoločnosti Google sa používatelia neustále sťažujú, že spontánne začína načítavať ďalšie jazykové moduly, čo môže nielen trvať pomerne dlho, ale aj plytvať návštevnosťou.

V systémoch Android sa toho môžete zbaviť veľmi jednoducho. Ak to chcete urobiť, použite ponuku nastavení, potom prejdite do časti Jazyk a hlasový vstup a vyberte možnosť hlasové vyhľadávanie a pri možnosti offline rozpoznávania reči kliknite na krížik (zakázať). Okrem toho sa odporúča vymazať vyrovnávaciu pamäť aplikácie a reštartovať zariadenie. Niekedy možno budete musieť vypnúť upozornenia v samotnej aplikácii.

Aký je výsledok?

Ak to zhrnieme, môžeme povedať, že vo väčšine prípadov si bežní používatelia nájdu to najvhodnejšie jednoduché programy. RHVoice je lídrom vo všetkých hodnoteniach. Ale pre hudobníkov, ktorí chcú dosiahnuť prirodzene znejúci hlas, aby sluch nepocítil rozdiel medzi živým vokálom a počítačovou syntézou, je lepšie dať prednosť programom ako Vocaloid, najmä preto, že sa pre nich vyrába mnoho ďalších hlasových knižníc, a nastavenia maju tolko moznosti, ze primitivne aplikacie, ako sa hovori, ani zdaleka neboli.

Programy rečových syntetizátorov sa každým rokom stávajú čoraz viac súčasťou našich životov. Umožňujú nám dôkladnejšie sa učiť cudzie jazyky, prekladať texty do pohodlného zvukového formátu, používajú sa vo funkciách rôznych pomocných programov a oveľa viac. A keď niektorí z nás potrebujú reprodukovať akýkoľvek text online v audio formáte, mnohí z nás sa obrátia na rôzne služby a programy na syntézu reči, ktoré nám môžu pomôcť transformovať text, ktorý tam potrebujeme. V tomto článku budem hovoriť o sieťových verziách takýchto produktov, opíšem, čo je online syntetizátor reči, aké služby online syntézy reči existujú a ako ich používať.

Najlepšie online syntetizátory reči

Spočiatku boli syntetizátory reči vyvinuté pre ľudí so zrakovým postihnutím na reprodukciu textu pomocou počítačového hlasu. Postupne však ich výhody ocenilo masové publikum a teraz si takmer každý môže stiahnuť syntetizátor reči na PC alebo použiť alternatívy, ktoré sú prítomné v niektorých verziách operačných systémov.

Ktorý online syntetizátor reči si teda môžete vybrať? Nižšie uvediem množstvo služieb, ktoré vám umožňujú reprodukovať text na reč online.

Ivona je skvelý syntetizátor

Hlasové motory na to online službu veľmi odlišné vysoká kvalita, dobrý fonetický základ, znejú celkom prirodzene a „kovový“ počítačový hlas je tu cítiť oveľa menej často ako u konkurenčných služieb.

Služba Ivona má podporu pre mnoho jazykov v ruskej verzii je mužský hlas (Maxim) a ženský hlas (Tatyana).

Ak chcete použiť syntetizátor reči, prihláste sa do tohto zdroja vľavo sa zobrazí okno, do ktorého budete musieť vložiť text na čítanie.
Vložte text, kliknite na tlačidlo označujúce osobu, vyberte jazyk (ruština) a možnosť výslovnosti (žena alebo muž) a kliknite na tlačidlo „Prehrať“.

Žiaľ, bezplatná funkcionalita stránky je obmedzená na 250-znakovú vetu a je určená skôr na demonštráciu možností služby ako na serióznu prácu s textom. Väčšie príležitosti je možné získať len za poplatok.

https://youtu.be/TIbx4pxX6Gk

Acapela - služba rozpoznávania reči

Spoločnosť, ktorá predáva svoje hlasové motory pre rôzne technické riešenia, vás pozýva na používanie syntetizátora reči Acapela online. Prozódia tejto služby síce nie je na takej úrovni ako Ivona, no aj tu je kvalita výslovnosti veľmi dobrá. Zdroj Acapela podporuje asi 100 hlasov v 34 jazykoch.

Ak chcete použiť funkčnosť zdroja, otvorte zadanú službu, v ľavom okne vyberte ruský jazyk (Vyberte jazyk – ruština).
Vložte požadovaný text nižšie a kliknite na tlačidlo „Počúvať“.

Maximálna veľkosť textu na čítanie zvuku je 300 znakov.

Fromtexttospeech - online služba

Na online preklad textu do reči môžete použiť aj službu fromtexttospeech. Funguje na princípe prevodu textu do zvukového súboru mp3, ktorý si následne stiahnete do počítača. Služba podporuje textovú konverziu 50-tisíc znakov, čo je dosť významné množstvo.

Ak chcete pracovať so službou fromtexttospeech, prejdite na ňu, v možnosti „Vybrať jazyk“ vyberte možnosť „Ruština“ (tu je len jeden hlas - Valentina).
Vo veľkom okne zadajte (prilepte) text, ktorý potrebujete pre hlasový záznam, a potom kliknite na tlačidlo „Vytvoriť zvukový súbor“.
Text bude spracovaný, potom si môžete vypočuť výsledok a potom si ho stiahnuť do PC.
Ak to chcete urobiť, kliknite pravým tlačidlom myši na „Stiahnuť zvukový súbor“ a v zobrazenej ponuke vyberte možnosť „Uložiť cieľ ako“.

Dá sa použiť aj Google Translate

Známy online prekladač Google má zabudovanú funkciu prevodu textu na reč a množstvo prečítaného textu tu môže byť dosť objemné.

Ak chcete s ním pracovať, prihláste sa do tejto služby (tu).
V okne vľavo vyberte ruský jazyk a kliknite na tlačidlo „Počúvať“ s reproduktorom v spodnej časti.

Kvalita prehrávania je na celkom znesiteľnej úrovni, no nie viac.

Text-to-speech – online syntetizátor reči

Ďalší zdroj, ktorý poskytuje syntézu reči normálnej kvality. Bezplatná funkcia je obmedzená na písanie textu s dĺžkou do 1000 znakov.

Ak chcete pracovať so službou, prejdite na túto webovú stránku, v okne vpravo vedľa možnosti „Jazyk“ vyberte ruský jazyk.
V okne zadajte (alebo skopírujte z externého zdroja) požadovaný text a potom kliknite na tlačidlo „Povedz to“ vpravo.
Odkaz na výslovnosť zadaného textu môžete umiestniť aj do svojho e-mailu alebo webovej stránky kliknutím na tlačidlo „Áno“ nižšie.

Alternatívne PC programy na preklad textu do reči

Existujú aj programy na syntézu reči, ako TextSpeechPro AudioBookMaker, ESpeak, Voice Reader 15, VOICE a množstvo ďalších, ktoré dokážu previesť text na reč. Je potrebné ich stiahnuť a nainštalovať do počítača a funkčnosť a možnosti týchto produktov zvyčajne mierne prevyšujú možnosti uvažovaných online služieb. Ich podrobné charakteristiky si zaslúžia samostatný rozsiahly materiál.

Záver

Ktorý online syntetizátor reči by ste si teda mali vybrať? Vo väčšine z nich bezplatné funkcie sú výrazne obmedzené a z hľadiska kvality zvuku bude služba Ivona zaostávať za konkurenciou. Ak máte záujem o možnosť rýchly preklad z vášho textu do zvukového súboru, potom použite zdroj „fromtexttospeech“ - poskytne výsledok dobrá kvalita a v pomerne krátkom čase.