Як називається система генерації голосу. Синтезатори мови онлайн: найкращі сервіси для озвучування тексту

Програма призначена для читання вголос текстових файлів. Для відтворення звуків людського голосу можуть використовуватись будь-які мовні синтезатори, встановлені на комп'ютері. Відтворення...

3 місяці тому Ліцензія:Безкоштовна Мова:Російська/Англійська/Німецька ОС: XP/Vista/7/8/8.1/10 Розмір: 16.99 МБ

потужний інструмент для озвучування тексту з веб-сторінки, листа, текстового файлу, різних документів або конвертування його в аудіофайли формату MP3 або WMA. Програма інтегрується в такі програми.

4 місяці тому Ліцензія:Умовно-безкоштовна Мова:Англійська ОС: XP/Vista/7/8/8.1/10 Розмір: 24.1 МБ

цікава програма, яка здатна перетворити друкований текст на звукове мовлення. Це зручно для створення різних аудіо уроків, лекцій або навіть цілих книжок, коли, перебуваючи в дорозі, можна просто...

6 місяців тому Ліцензія:Безкоштовна Мова:Російський англійський ОС: XP/Vista/7/8/8.1/10 Розмір: 3.72 МБ

текстовий редактор. SAPI4 та SAPI5-сумісний синтезатор мови. Програма призначена для читання вголос текстових файлів з використанням пакетів функцій мовлення Microsoft Speech API 4/5 (SA...

Рік тому Ліцензія:Безкоштовна Мова:Українська ОС: XP/Vista/7/8/8.1/10 Розмір: 3.59 МБ

За допомогою 2nd Speech Center можна слухати текст, а не читати з екрана, таким чином дати відпочити очам. Текст вимовляється із буфера обміну. Є можливість записати текст у mp3/wav.

2 роки тому Ліцензія:Умовно-безкоштовна Мова:Англійська ОС: 2000/XP/2003/Vista/7/8/8.1/10 Розмір: 3.77 МБ

зручна та швидка програма для озвучування текстів, створення аудіокниг (у форматі wav, mp3, amr, aac + плейлист), розміщення наголосів у російських текстах або просто зручного читання книг з екрану. Крім...

4 роки тому Ліцензія:Умовно-безкоштовна Мова:Українська ОС: XP/Vista/7 Розмір: 2.59 МБ

безкоштовна програма для перетворення тексту на мову. Допоможе прочитати у слух будь-який текст, а також зберегти його у WAV або MP3 файл. У TTSReader вже є близько 10 чоловічих та жіночих голосів. Пр...

8 років назад Ліцензія:Безкоштовна Мова:Англійська ОС: 2000/XP/Vista Розмір: 2.29 МБ

Використовуючи Pistonsoft Text to Speech Converter, ви можете конвертувати текст у мову або аудіокнигу MP3 та WAV формату. У програмі доступні всі встановлені в системі мови. Технології...

Синтез мовлення - це перетворення заздалегідь не відомої текстової інформації на мову. Мовний висновок інформації - це реалізація мовного інтерфейсу, для спрощення використання системи. Фактично, завдяки синтезу промови надається ще один канал передачі даних від комп'ютера, мобільного телефону до людини, аналогічно монітору. Звичайно, передати малюнок голосом неможливо, але прослухати електронну пошту або розклад на день у ряді випадків досить зручно, особливо якщо в цей час погляд зайнятий чимось іншим. Наприклад, прийшовши вранці на роботу, готуючись до переговорів, Ви могли б поправляти у дзеркала краватку або зачіску, тоді як комп'ютер читає вголос останні новини, пошту або нагадує важливу інформацію для переговорів.

Рисунок 2.2 – Акустична обробка сигналу

Технологія синтезу мовлення знайшла широке застосування для людей, які мають проблеми із зором. Для інших вона створює новий вимір зручності користування технікою і значно знижує навантаження на зір, на нервову систему, дозволяє задіяти слухову пам'ять.


Малюнок 2.3 - Синтез мови

Будь-який текст складається зі слів, розділених пробілами та розділовими знаками. Вимова слів залежить від їх розташування в реченні, а інтонація фрази - від розділових знаків. Нарешті, вимовлення залежить від сенсу слова! Відповідно, для того щоб синтезована мова звучала натурально, необхідно вирішити цілий комплекс завдань, пов'язаних як із забезпеченням природності голосу на рівні плавності звучання та інтонації, так і з правильною розстановкою наголосів, розшифровкою скорочень, чисел, абревіатур та спеціальних знаків з урахуванням особливостей граматики російської мови.

Існує кілька підходів до вирішення поставлених завдань:

1) системи алофонного синтезу – забезпечують стабільне, але недостатньо природне, роботизоване звучання;

2) системи, засновані на підході Unit Selection - забезпечують набагато природніше звучання, проте можуть містити фрагменти мовлення з різкими провалами якості, аж до втрати розбірливості;

3) гібридна технологія, заснована на підході Unit Selection та доповнена одиницями алофонного синтезу.

На основі цієї технології була створена система VitalVoice, яка забезпечує стабільне та природне звучання на акустичному рівні.

Мовне спілкування є природним та зручним для людини. Завдання розпізнавання мови полягає в тому, щоб прибрати посередника у спілкуванні людини і комп'ютера. Управління машиною голосом у реальному часі, а також введення інформації у вигляді людської мови набагато спростить життя сучасної людини. Навчити машину розуміти без посередника ту мову, якою говорять між собою люди - завдання розпізнавання мови.

Вчені та інженери вже багато років вирішують проблему мовного спілкування людини та машини. Перший пристрій для розпізнавання мови з'явився в 1952 році, він міг розпізнавати промовлені людиною цифри. Комерційні програми з розпізнавання мови з'явилися на початку 90-х років.

Всі системи розпізнавання мови можна поділити на два класи:

1) Системи, залежні від диктора - налаштовуються на мовлення диктора у процесі навчання. Для роботи з іншим диктором такі системи потребують повного переналаштування.


Малюнок 2.4 - Розпізнавання мовлення

2) Системи, незалежні від диктора - робота яких залежить від диктора. Такі системи не вимагають попереднього навчання та здатні розпізнавати мову будь-якого диктора.

Спочатку ринку з'явилися системи першого виду. Вони звуковий образ команди зберігався як цілісного зразка. Для порівняння невідомого виголошення та зразка команди використовувалися методи динамічного програмування. Ці системи добре працювали при розпізнаванні невеликих наборів із 10-30 команд і розуміли лише одного диктора. Для роботи з іншим диктором ці системи вимагали повного переналаштування.

Щоб розуміти злиту мову, необхідно було перейти до словників набагато більших розмірів, від кількох десятків до сотень тисяч слів. Методи, що використовувалися в системах першого виду, не підходили для вирішення цього завдання, тому що просто неможливо створити зразки для такої кількості слів.

Крім цього, існувало бажання створити систему, яка не залежить від диктора. Це дуже складне завдання, оскільки в кожної людини індивідуальна манера вимови: темп мовлення, тембр голосу, особливості вимови. Такі відмінності називаються варіативністю мови. Щоб її врахувати, було запропоновано нові статистичні методи, що спираються в основному на математичні апарати Прихованих Марківських Моделей (СММ) або Штучних Нейронних мереж. Замість створення еталонів кожному за слова, створюються еталони окремих звуків, у тому числі складаються слова, звані акустичні моделі. Акустичні моделі формуються шляхом статистичної обробки великих мовних баз даних, що містять записи промови сотень людей.

У існуючих системах розпізнавання мови використовуються два принципово різні підходи:

Розпізнавання лексичних

Зазначимо, що створення систем розпізнавання мовлення є надзвичайно складним завданням.

На сьогоднішній день називається технологія, здатна перетворювати текстову інформацію на звичайне мовлення. З розвитком "розумних машин" ця технологія стає все більш актуальною, і з кожним днем ​​потребує все більшої досконалості. Власне, на даний момент розроблено цілу низку методів синтезу мови, про які ми й говоритимемо.

Синтезатори мови можуть застосовуватися в абсолютно різних сферах, і використовуються для вирішення безлічі завдань, починаючи від "начитування" книг, виробництва "розмовляючих" дитячих іграшок, оголошення зупинок у громадському транспорті або в системах сервісних служб, і закінчуючи медициною (тут варто згадати Стівена Хокінгу, що користується синтезатором мови для зв'язку зі світом).

Отже, розглянемо докладніше технологію та методи синтезу мови. Як згадувалося, існує кілька методів синтезу промови. Таким чином, можна виділити кілька основних підходів:

  • параметричний синтез;
  • конкатенативний (компіляційний) синтез;
  • синтез за правилами (за друкованим текстом);

Параметричний синтез дозволяє записувати мову для будь-якої мови, проте його не можна застосовувати для не заданих заздалегідь текстів. Параметрический синтез промови застосовують тоді, коли набір повідомлень обмежений. Якість такого методу синтезу може бути дуже високою.

Власне, параметричний синтез промови - це реалізація принципу роботи вокодера . У разі параметричного синтезу звуковий сигнал представлений певним числом параметрів, що безперервно змінюються. Для формування голосних звуків використовується генератор тонального сигналу, для приголосних - генератор шуму. Але такий метод зазвичай застосовують для запису голосу в музичних композиціях, і частіше йдеться навіть не про чистий синтез голосу, а швидше про модуляцію.

Метод компіляційного синтезу ґрунтується на складанні текстів із заздалегідь записаного "словника" елементів. Розмір елемента системи повинен бути не меншим за слово. Зазвичай запас елементів обмежується кількома сотнями слів, а зміст текстів, що синтезуються - обсягом словника. Цей метод синтезу мови широко використовується в повсякденному житті - як правило, у різних довідкових службах та техніці, що потребує оснащення системами мовної відповіді.

Повний синтез мови за правилами може відтворювати промову заздалегідь невідомим текстом. Цей метод не використовує елементів людської мови, а базується на запрограмованих лінгвістичних та акустичних алгоритмах.

Тут також існує свій поділ - можна назвати два підходи до цього способу синтезу. Перший – це формантний синтез мови за правилами, а другий – артикуляторний синтез. Формантний синтез базується на формантах – частотних резонансах мовної акустичної системи. Алгоритм формантного синтезу моделює роботу мовного тракту людини, що працює як набір резонаторів. Сьогодні, на жаль, більшість синтезаторів, що працюють виключно на формантному синтезі, зрозуміти без підготовки складно, але, безперечно, це універсальна та перспективна технологія. Артикуляторний метод намагається доопрацювати недоліки формантного шляхом додавання до моделі фонетичних особливостей вимовляння окремих звуків.

Також існує технологія синтезу промови за правилами, яка використовує записані відрізки природного мовлення. Оскільки все-таки найчастіше застосовуються компіляційні методи, скажемо про них кілька слів докладніше.

Залежно від того, наскільки великі "уривки" мови, що використовуються для синтезу, виділяють такі типи синтезу:

  • мікросегментний (мікрохвильовий);
  • алофонічний;
  • дифонний;
  • напівскладовий;
  • складовий;
  • синтез із одиниць довільного розміру.

Найчастіше використовуються алофонічний та дифонний методи. Для дифонного методу синтезу промови базовими елементами є всілякі двочленні комбінації фонем, а аллофонного - поєднання лівого і правого контексту (аллофон - варіант фонеми, який зумовлений її конкретним фонетичним оточенням). При цьому різні типи контекстів поєднуються в класи за ступенем акустичної близькості.

Перевага таких систем полягає в тому, що вони дають можливість синтезувати текст за не заданим заздалегідь текстом, а недолік - у тому, що якість синтезованої мови не можна порівняти з якістю мови природної (на межах зшивки елементів можуть виникати спотворення). Також дуже важко управляти інтонаційними характеристиками мови, оскільки характеристики окремих слів можуть змінюватися залежно від контексту чи типу фрази.

Втім, це все теоретично. На практиці, на сучасному етапі розвитку, незважаючи на активне просування в цій галузі, розробники технології синтезу промови все-таки відчувають деякі труднощі, в основному пов'язані зі штучністю мови, що синтезується, відсутністю в ній емоційного забарвлення і з низькою завадостійкістю.

Справа в тому, що будь-яка синтезована мова, як правило, сприймається людиною насилу. Це пов'язано з тим, що прогалини в синтезованому тексті заповнює людський мозок, який задіяє для цього додаткові ресурси, і людина може сприймати синтезовану мову лише близько 20 хвилин.

На сприйняття мови також впливає її емоційне забарвлення. У випадку із синтезованою мовою вона відсутня. Хоча варто відзначити, що деякі алгоритми все ж таки дозволяють деякою мірою імітувати емоційне забарвлення мови шляхом зміни тривалості фонем, пауз і модуляції тембру, але поки їхня робота далека від ідеалу.

Що стосується третьої названої проблеми - низької завадостійкості, то експерименти показують, що сприйняттю синтезованого тексту заважають будь-які, навіть найменші сторонні шуми. Це знов-таки пов'язано з тим, що для обробки синтезованої мови людський мозок задіяє додаткові центри, які не використовуються при сприйнятті природної мови.

Наприкінці цієї статті я хотів би навести деякі приклади існуючих синтезаторів мови.

Усім відомі звані " читалки " - програми для зручнішого читання тексту з монітора. Багато хто з нас використовують програми мовного синтезу для озвучування тексту, наприклад, Balabolka і Govorilka .

Щоб подібні програми озвучували тексти, необхідно також встановити бібліотеку SAPI (Speech API) і голосові движки. Найбільш поширені дві версії Speech API: SAPI4 і SAPI5. Обидві бібліотеки можуть працювати на одному комп'ютері. У операційних системах Windows XP, Windows Vista та Windows 7 вже встановлені бібліотеки SAPI5.

Крім читалок, поширені програми екранного доступу. Прикладами таких програм є:

VIRGO 4 . Програма була створена для комфортної роботи сліпих і слабозорих користувачів з Windows. Вона дозволяє вибрати ту інформацію, яка вимовлятиметься голосом і ту, яка відображатиметься на брайлівському дисплеї. Для людей з вадами зору передбачена системою збільшення екрану "Галілео".

Програма Кобра 9.1 також спрощує роботу з Windows для сліпих і слабозорих користувачів. Ця програма може виводити виводить інформацію з комп'ютерного монітора за допомогою промови, брайлівського дисплея та має функцію збільшення екрана.

Сьогодні синтезатори мови, які застосовуються в стаціонарних комп'ютерних системах або мобільних пристроях, чимось незвичайним не здаються. Технології зробили крок далеко вперед і дозволили відтворити людський голос. Як все це працює, де застосовується, який найкращий мовний синтезатор і з якими потенційними проблемами може зіткнутися користувач, дивіться нижче.

Що є мовними синтезаторами і де вони застосовуються?

Синтезатори мови є спеціальні програми, що складаються з декількох модулів, які дозволяють переводити набраний на клавіатурі текст у звичайну людську мову у вигляді звукового супроводу.

Було б наївно думати, що супутні бібліотеки містять абсолютно всі слова чи можливі фрази, записані у студіях реальними людьми. Це просто фізично неможливе. До того ж бібліотеки фраз мали б такий розмір, що встановити їх навіть на сучасні вінчестери великого обсягу, не говорячи вже про мобільні девайси, просто не було б можливим.

Для цього була розроблена технологія, що отримала назву Text-to-Speech (переклад тексту на мову).

Найбільш широке поширення синтезатори мови набули у кількох областях, до яких можна віднести самостійне вивчення іноземних мов (програми нерідко мають підтримку в 50 мов і більше), коду потрібно почути правильну вимову слова, прослуховування текстів книг замість читання, створення мовних та вокальних партій у музиці , використання їх людьми з обмеженими можливостями, видача пошукових запитів як озвучених слів і фраз тощо.

Різновиди програм

Залежно від області застосування, всі програми можна розділити на два основних типи: стандартні, що безпосередньо перетворюють текст на мову, і мовні або вокальні модулі, що застосовуються в музичних програмах.

Для більш повного розуміння картини розглянемо обидва класи, але більший акцент буде зроблено все-таки на синтезатори мови в їхньому безпосередньому призначенні.

Плюси та мінуси найпростіших мовних додатків

Що ж до переваг та недоліків програм такого типу, спочатку розглянемо все-таки недоліки.

Насамперед треба чітко розуміти, що комп'ютер - і є комп'ютер, який цьому етапі розвитку людську мову може синтезувати дуже приблизно. У найпростіших програмах найчастіше спостерігаються проблеми з постановкою наголосів, знижену якість звуку, а в мобільних пристроях - підвищене енергоспоживання, а іноді й несанкціоноване завантаження мовних модулів.

Але й переваг вистачає, адже багато звукову інформацію сприймають набагато краще, ніж візуальну. Зручність сприйняття очевидна.

Як користуватися синтезатором мови?

Тепер кілька слів про основні засади використання програм такого типу. Встановити синтезатор мови будь-якого типу можна без особливих проблем. У стаціонарних системах використовується стандартний інсталятор, де основним завданням стане вибір мовних модулів, що підтримуються. Для мобільних пристроїв інсталяційний файл можна завантажити з офіційного магазину або сховища на зразок Google Play або AppStore, після чого програма інсталюється в автоматичному режимі.

Як правило, при першому запуску жодних налаштувань, окрім встановлення мови за замовчуванням, виконувати не потрібно. Правда, іноді програма може запропонувати вибрати якість звучання (у стандартному варіанті, що застосовується повсюдно, частота дискретизації 4410 Гц, глибина 16 біт та бітрейт 128 кбіт/с). У мобільних пристроях ці показники нижчі. Проте за основу береться певний голос. З використанням стандартного шаблону вимови шляхом застосування фільтрів та еквалайзерів досягається звучання саме такого тембру.

У використанні можна вибрати кілька варіантів перекладу вручну, озвучення тексту з файлу, що вже має, інтеграція в інші програми (наприклад, веб-браузери) з активацією видачі пошукових результатів або прочитання текстового вмісту на сторінках онлайн. Досить вибрати потрібний варіант дій, мову та голос, яким усе це вимовлятиметься. Багато програм мають кілька різновидів голосів: як чоловічих, і жіночих. Для активації відтворення зазвичай використовується кнопка старту.

Якщо говорити про те, як відключити синтезатор мови, тут можливо кілька варіантів. У найпростішому випадку використовується кнопка зупинки відтворення у самій програмі. У разі інтеграції в браузер деактивація проводиться у налаштуваннях розширень або повним видаленням плагіна. А ось із мобільними пристроями, незважаючи на безпосереднє відключення, можуть бути проблеми, про які буде сказано окремо.

У музичних програмах налаштування та введення тексту набагато складніше. Наприклад, у програмі FL Studio є свій мовний модуль, в якому можна вибрати дещо змінити налаштування тональності, швидкості відтворення і т. д. Для встановлення наголосів перед складом використовується символ «_». Але такий синтезатор годиться тільки для створення роботизованих голосів.

Але пакет Vocaloid від Yamaha відноситься до програм професійного типу. Технологія Text-to-Speech тут реалізована у найбільш повному обсязі. У налаштуваннях, крім стандартних параметрів, можна виставити артикуляцію, глісандо, використовувати бібліотеки з вокалом професійних виконавців, складати слова та фрази, підганяючи їх під ноти, та ще купу всього. Не дивно, що пакет тільки з одним вокалом займає близько 4 Гб і більше в настановному дистрибутиві, а після розпакування - вдвічі-втричі більше.

Синтезатори мови з російськими голосами: короткий огляд найпопулярніших

Але повернемося до найпростіших програм і розглянемо найпопулярніші з них.

RHVoice - на думку більшості експертів, найкращий синтезатор мови, що є російською розробкою авторства. У стандартному варіанті доступно три голоси (Олександр, Ірина, Олена). Установки прості. А сама програма може використовуватися як самостійна програма, сумісна з SAPI5, і як екранний модуль.

Acapela - досить цікавий додаток, головною особливістю якого є майже ідеальне озвучення тексту більш ніж 30 мовами світу. У звичайній версії, щоправда, доступний лише один голос (Олена).

Vocalizer - потужна програма з жіночим голосом Milena. Дуже часто ця програма застосовується у call-центрах. Є безліч налаштувань постановки наголосу, гучності, швидкості читання та встановлення додаткових словників. Головна відмінність полягає в тому, що мовний двигун може вбудовуватися в програми Cool Reader, Moon + Reader Pro або Full Screen Caller ID.

Festival - найпотужніша утиліта синтезу та розпізнавання мови, створена для систем Linux та Mac OS X. Програма поставляється з відкритим вихідним кодом і, крім стандартних мовних пакетів, має підтримку навіть фінської мови та хінді.

eSpeak - мовленнєва програма, що підтримує більше 50 мов. Головним недоліком вважається збереження файлів із синтезованою мовою виключно у форматі WAV, який займає дуже багато місця. Зате програма є кросплатформною і може використовуватись навіть у мобільних системах.

Проблеми з синтезатором мови в Google Android

При установці «рідного» синтезатора мови від Google, користувачі постійно скаржаться на те, що він мимоволі включає завантаження додаткових мовних модулів, що може не тільки займати тривалий проміжок часу, але ще й витрачає трафік.

Позбутися цього в Android-системах можна дуже просто. Для цього використовуємо меню установок, далі переходимо в розділ мови та голосового введення, вибираємо голосовий пошук і на параметрі розпізнавання мовлення офлайн натискаємо на хрестик (вимкнення). Додатково рекомендується почистити кеш програм та перезавантажити пристрій. Іноді може знадобитися в самій програмі відключити показ повідомлень.

Що зрештою?

Поводячи певний результат, можна сказати, що здебільшого пересічним користувачам підійдуть найпростіші програми. В усіх рейтингах лідирує RHVoice. Але для музикантів, які хочуть досягти природного звучання голосу, щоб різниця між живим вокалом та комп'ютерним синтезом не відчувалася на слух, краще віддати перевагу програмам типу Vocaloid, тим більше що для них випускається безліч додаткових голосових бібліотек, а налаштування мають стільки можливостей, що примітивні програми, як кажуть, і поряд не стояли.

Програми-синтезатори мови з кожним роком дедалі більше входять до нашого життя. Вони дозволяють нам більш досконало вивчати іноземні мови, перекладають тексти у зручний аудіоформат, використовуються у функціоналі різноманітних службових програм та багато іншого. І коли у деяких з нас виникає потреба відтворити онлайн будь-який текст в аудіформаті, тоді багато хто з нас звертається до різних сервісів та програм із синтезу мови, здатних допомогти нам у трансформації потрібного там тексту. У цій статті я розповім про мережеві версії подібних продуктів, опишу, що таке синтезатор мови онлайн, які послуги синтезу мови online існують, і як їх використовувати.

Найкращі онлайн синтезатори мови

Спочатку синтезатори мови розроблялися для людей з дефектами зору для відтворення тексту за допомогою комп'ютерного голосу. Але поступово їх переваги оцінила масова аудиторія, і нині практично будь-який бажаючий може завантажити синтезатор мови на ПК, або скористатися альтернативами, які присутні в деяких версіях операційних систем.

То який синтезатор мови онлайн можна вибрати? Нижче я перелічу ряд сервісів, які дозволяють відтворити текст у промову онлайн.

Ivona - чудовий синтезатор

Голосові двигуни даного онлайн сервісу відрізняються дуже високою якістю, гарною фонетичною основою, звучать досить природно і «металевий» комп'ютерний голос тут відчувається набагато рідше, ніж у сервісів-конкурентів.

Сервіс Ivona має підтримку безлічі мов, у російському варіанті присутні чоловічий голос (Maxim) та жіноча (Tatyana).

  1. Щоб використати синтезатор мови, виконайте вхід на даний ресурс , зліва буде вікно, в яке необхідно буде вставити текст для прочитання.
  2. Вставте текст, клацніть на кнопочку з позначенням людини, виберіть мову (Russian) і варіант вимови (жіноча або чоловіча) і натисніть кнопку «Play».

На жаль, безкоштовний функціонал сайту обмежений пропозицією з 250 символами і призначений швидше для демонстрації можливостей сервісу, ніж для серйозної роботи з текстом. Великі можливості можна отримати лише платно.

https://youtu.be/TIbx4pxX6Gk

Acapela - сервіс розпізнавання мови

Компанія, що торгує своїми голосовими двигунами для різних технічних рішень, пропонує вам використовувати синтезатор мови Acapela в режимі онлайн. Хоча просод цього сервісу не на такій висоті, як у Ivona, проте, якість вимови тут теж дуже добротна. Ресурс Acapela підтримує близько 100 голосів 34 мовами.

  1. Щоб скористатися функціоналом ресурсу, відкрийте вказаний сервіс, ліворуч у вікні виберіть російську мову (Select a language – Russian).
  2. Вставте внизу текст і натисніть кнопку «Listen» (слухати).

Максимальний розмір тексту для аудіопрочитання – 300 символів.

Fromtexttospeech - онлайн сервіс

Щоб перевести текст у мову онлайн, можна також скористатися сервісом від текступошуку. Він працює за принципом конвертації тексту в аудіофайл формату mp3, який можна скачати собі на комп'ютер. Сервіс підтримує конвертацію тексту завбільшки 50 тис. символів, що досить значним обсягом.

  1. Для роботи з сервісом fromtexttospeech перейдіть на нього, в опції "Select Language" виберіть "Russian" (голос тут тільки один - Валентина).
  2. У великому вікні введіть (вставте) потрібний для озвучення текст, потім натисніть кнопку Create Audio File.
  3. Текст буде оброблений, потім ви зможете послухати отриманий результат, а потім завантажити його собі на ПК.
  4. Для цього натисніть правою клавішею миші на «Download audio file» і виберіть у меню «Зберегти об'єкт як».

Google Перекладач також можна використовувати

Всім нам відомий Google перекладач онлайн має вбудовану функцію відтворення тексту в мову, причому кількість прочитаного тексту тут може бути об'ємним.

  1. Для роботи з ним виконайте вхід на цей сервіс.
  2. Виберіть у вікні ліворуч російську мову та натисніть на кнопочку з динаміком знизу «Прослухати».

Якість відтворення на досить стерпному рівні, але не більше.

Text-to-speech - синтезатор мовлення онлайн

Ще один ресурс, який здійснює синтез мови нормальної якості. Безкоштовний функціонал обмежений набором тексту завдовжки 1000 символів.

  1. Для роботи з сервісом перейдіть на даний сайт, у вікні праворуч поруч із опцією «Language» (мова) виберіть Ukrainian.
  2. У вікні наберіть (або скопіюйте із зовнішнього джерела) потрібний текст, а потім натисніть кнопку праворуч «Say It».
  3. Лінк на вимову вказаного тексту можна також розмістити у вашому е-мейлі або веб-сторінці, натиснувши кнопку «Yes» трохи нижче.

Альтернативні програми для ПК для перекладу тексту в мову

Також існує програми для синтезу мовлення, такі як TextSpeechPro AudioBookMaker, ESpeak, Voice Reader 15, ГОЛОС та ряд інших, здатні конвертують текст у мову. Їх необхідно завантажити та встановити на свій комп'ютер, а функціонал та можливості даних продуктів зазвичай трохи перевищує можливості розглянутих онлайн-сервісів. Детальна ж їх характеристика заслуговує на окремий великий матеріал.

Висновок

То який синтезатор мови онлайн вибрати? У більшості з них безкоштовні можливості суттєво обмежені, а за якістю звучання сервіс Ivona залишить позаду своїх конкурентів. Якщо ж вас цікавить можливість швидкого переведення вашого тексту в аудіофайл, тоді скористайтесь ресурсом «fromtexttospeech» - він дає результат хорошої якості і за досить короткий час.



Завантаження...
Top