Українські TTS
Українськомовний TTS (також відомий як українськомовний текст-у-мовлення / українськомовний ТУМ, англ. Ukrainian text-to-speech / Ukrainian TTS) — text-to-speech система, що спроможна наживо виконувати конвертування україномовного друкованого тексту в україномовне аудіо.
До середини 2016 року, існувало 4 напівпрофесійні TTS системи з підтримкою української мови: 1) Розмовлялька (2 голоси: чоловічий Анатоль/Стьопа та жіночий Руся); 2) CyberMova/VymovaPlus/VymovaPro (4 голоси: жіночий Наталя та чоловічі Опанас, Дмитро, та Слава); 3) UkrVox (1 голос: чоловічий Ігор Мурашко); та 4) RHVoice (чоловічий Анатоль та жіночий Наталя: після 2021 року також чоловічий Володимир та жіножий Маріанна).
Українськомовні голоси TTS Анатоль (англ. Anatol) та Наталя (англ. Natalia) у системі TTS RHVoice російської програмістки Ольґи Яковлєвої з'явилися у лютому 2016 року завдяки зусиллю спеціалістів Соціально-реабілітаційного центру незрячих Харкова, які для створення чоловічого голосу Анатоль змогли залучити відомого радіоведучого, голоса харківського метро та диктора харківського суспільного радіо UA:Українське радіо Анатолія Подорожко.[1][2][3] Згодом у 2021 році для RHVoice створили ще два українські голоси: Володимир (англ. Volodymyr), озвучений радіоведучим Володимиром Бєгловим, та Маріанна (англ. Marianna), озвучений Маріанною Фірткою, радіоведучою «Львівська Хвиля».[4][5][6]
У 2016—2019 роках з'явилася перша професійна система української мови на базі Google WaveNet Text-to-Speech: спочатку у 2016 Google додала україномовний WaveNet жіночий голос лише до вебверсії Google Translate, 5 квітня 2017 Google також оновила свій офіційний застосунок Google Text-to-Speech для Android до версії 3.11.12, додавши підтримку україномовного WaveNet жіночого голосу,[7] а 21 лютого 2019 року Google також додала україномовний WaveNet жіночий голос до вебверсії Google Cloud Text-to-Speech.[8][9][10]
У вересні 2018 року, разом з оновленням для Nuance Vocalizer TTS для Android до версії 3.1.7, з'явилася друга професійна система української мови Text-to-Speech під назвою Lesya розроблена компанією Cerence/Nuance; цей український TTS голос Леся англ. Lesya) став доступний у таких продуктах як Nuance Vocalizer TTS (Windows/Android),[11] Nuance Mix,[12][13] Цей новий український голос Lesya також доступний у TTS продуктах незалежних перепостачальників, як от Code Factory,[14] NextUp,[15][16] KobaVision/KobaSpeech[17] тощо. Згодом саме рушій Cerence/Nuance з українськомовним голосом Lesya став доступний у iPhone телефонах Apple: спочатку у квітні 2022 року разом з оновленням iOS 16 українськомовний голос TTS Lesya став доступний у застосунках Voice Over та Live Text,[18][19][20][21] а пізніше у вересні 2023 року також і у застосунках Translate та Live Speech.[22]
Згодом у квітні 2021 році Microsoft придбав Nuance;[23] й одночасно з цим у березні 2021 року підтрику української мови додали до Нейронної TTS хмаринно-серверного сервісу Microsoft Azure (англ. Miscrosoft Azure Neural TTS) долучивши чоловічий голос Остап (англ. Ostap) та жіночий голос Поліна (англ. Polina).[24][25][26]
У жовтні 2021 року група українських розробників зі спільноти UA Speech Recognition and Synthesis під головуванням Юрія Паніва (псевдо robinhad) створили у GitHub репозиторій Ukrainian TTS використавши технологію ESPnet; cпочатку розробники додали лише один голос, однак згодом перелік розширили й станом на 2023 рік перелік доступних українськомовних голосів зріс до п'яти: чоловічі Mykyta, Dmytro та Олекса а також жіночі Lada та Tetyana.[27] Усі голоси можна використовувати безкоштовно на сайті розробників brehunets.com; окрім того напрацювання цього проєкту використано при створенні українськомовних голосів для Balacoon TTS та Neon AI / Coqui AI TTS.[28][29]
У серпні 2023 року сервіс fliki.ai додав підтримку української мови у своїх продуктах, й на додачу до TTS рушіїв від Microsoft та Google також створили 30 власних високоякісних ультра-реалістичних нейронних українськомовних жіночих та чоловічих голосів (всього 32 українськомовні TTS голоси).[30][31]
Далі наведено перелік та порівняння найпоширеніших україномовних синтезаторів мовлення (українські TTS / Ukrainian TTS).
Назва | Розробник(и) | Дата першого релізу | ОС | Остання стабільна версія | Ліцензія |
---|---|---|---|---|---|
№ 1 UkrVox Ігор Мурашко[32] | Ярослав Козак (Львів) | 1994 | MS DOS/MS Windows | 4.2 (січень 2011) | Безкоштовна |
№ 2 КіберМова Vymova Plus/Pro Panas,[33][34] Natalka[35] | КіберМова (Тетяна Людовик, Микола Сажок, Валентина Робейко; Київ) | 2003 | MS Windows | 1.0 (березень 2016) | Платна[36] |
№ 3 Розмовлялька[37][38] | Анатолій Чорний (Харків) | 2004 | MS Windows | 1.2 (липень 2007) | Безкоштовна |
№ 4 RHVoice Анатоль,[39] Наталя, [40][41][42] Володимир,[43], Маріанна[44] | Ольґа Яковлєва (Чебоксари, Росія) | 2016 | Linux/MS Windows/Google Android | 1.0 (лютий 2016) | Безкоштовна |
№ 5 Google WaveNet TTS Ukrainian | Google Inc. (Маунтін-В'ю, КА, США) | 2017 | Web/Google Android | 1.0 (квітень 2017)[45] | Платна |
№ 6 Cerence/Nuance TTS Ukrainian Lesya[46][47] | Cerence/Nuance (Берлінгтон, МА, США) | 2018 | MS Windows/Google Android | 1.0 (вересень 2018) | Платна |
№ 7 Microsoft Azure Neural TTS Ukrainian[48][49] | Microsoft (Сіетл, ВА, США) | 2021 | Web/MS Windows/Google Android/Apple MacOS/IOS | 1.0 (березень 2021) | Платна |
№ 8 Ukrainian TTS використавши ESPnet[50] | Юрій Панів (псевдо robinhad; Львів, Україна) | 2021 | Web/MS Windows/Google Android/Apple MacOS/IOS | 6.0 (грудень 2023) | Безкоштовна |
№ 9 fliki.ai TTS Ukrainian[51] | fliki.ai (Бенгалуру, Індія) | 2023 | Web/MS Windows/Google Android/Apple MacOS/IOS | 1.0 (серпень 2023) | Платна |
Приклади вимови різними українськими TTS уривку вірша Ліни Костенко Ще назва є, а річки вже немає:
Назва | Демо | Мови | Доступні голоси | ППІ розпізнавання мовлення | Підтримувані операційні системи | Символ наголосу |
---|---|---|---|---|---|---|
№ 1 UkrVox Ігор Мурашко | (Ігор Мурашко): | українська[52] | 1 (голос Ігоря Мурашко) | Microsoft Speech API 5 (SAPI 5) | Windows | ^ (перед наголошеною голосною)
|
№ 2 Кібермова Vymova Plus/Pro Panas/Natalka | (Опанас): (Наталка): |
українська[52] | 3 чоловічих (Опанас, Дмитро, Слава), 1 жіночий (Наталка) | Microsoft Speech API 5 (SAPI 5) | Windows | + (після наголошеної голосної)
|
№ 3 Розмовлялька Анатоль/Руся | (Анатоль): (Руся): |
українська | 2 (1 чоловічий: Анатоль/Стьопа[53], 1 жіночий: Руся) | власницький ППІ | Windows | ' (після наголошеної голосної)
|
№ 4 RHVoice Анатоль/Наталя | (Анатоль)[39]: (Наталя): |
українська | 2 (1 чоловічий: Анатоль[39], 1 жіночий: Наталя) | Microsoft Speech API 5 (SAPI 5) | Windows/Linux/Android | н/д |
№ 5 Google WaveNet TTS Ukrainian | (Google WaveNet TTS Ukrainian): | українська | 1 (1 жіночий: Google WaveNet TTS Ukrainian) | власницький ППІ (WaveNet) | Web, Android | н/д |
№ 6 Cerence/Nuance TTS Ukrainian Lesya | (Cerence/Nuance Lesya): | українська | 1 (1 жіночий: Cerence/Nuance TTS Ukrainian Voice Lesya) | Microsoft Speech API 5 (SAPI 5) | Windows/Android | н/д |
№ 7 Microsoft Azure Neural TTS Ukrainian | (Microsoft Azure Neural TTS Polina): TBA (Microsoft Azure Neural TTS Ostap): TBA |
українська | 1 (1 чоловічий: Остап, 1 жіночий: Поліна) | власницький ППІ (Azure Neural TTS) | Windows/Android/MacOS та iOS | н/д |
№ 8 Ukrainian TTS використавши ESPnet | (ukrainian-tts Oleksa): TBA (ukrainian-tts Tetyana): TBA |
українська | 5 (3 чоловічих: Oleksa, Mykyta, Dmytro; 2 жіночих: Lada, Tetyana) | відкритий ППІ (ESPnet2-TTS) | Windows/Android/MacOS та iOS | н/д |
№ 9 fliki.ai TTS Ukrainian | (fliki.ai-tts Pavlo): TBA (fliki.ai-tts Kateryna): TBA |
українська | 32 чоловічих та жіночих голосів (включає Google та Microsoft TTS голоси) | власницький ППІ (невідомо) | Windows/Android/MacOS та iOS | н/д |
Існує декілька програм-читачів екрана, що використовують Text-To-Speech (TTS) для читання тексту вголос у Windows та Android і які можна використовувати для читання тексту одним з наявних україномовних TTS. Зокрема такі програми як Voice,[54] Wordtalk,[55] Balabolka[56], Dspeech[57], Infovox4[58] тощо можна налаштувати аби вони читали текст українською з використанням вашого бажаного україномовного TTS двигуна.
- ↑ Звернення до українських IT-компаній і до міністерств інформаційної та соціальної політики — Zazid.net, 22 січня 2017
- ↑ natalia-ukr // RHVoice. — GitHub, 2016. — Переглянуто 8 листопада 2021. (англ.)
- ↑ anatol-ukr // RHVoice. — GitHub, 2016. — Переглянуто 8 листопада 2021. (англ.)
- ↑ RHVoice: Ukrainian voices // rhvoice.org. 2021. (англ.)
- ↑ marianna-ukr // RHVoice. — GitHub, 2021. — Переглянуто 8 листопада 2021. (англ.)
- ↑ volodymyr-ukr // RHVoice. — GitHub, 2021. — Переглянуто 8 листопада 2021. (англ.)
- ↑ Google Text-to-speech 3.11.12 improves voices and adds support for Ukrainian, Czech, Bangla, Khmer, more. androidpolice.com, 2017/04/11 (англ.)
- ↑ Google Cloud Text-to-Speech: Supported voices and languages. cloud.google.com, 2020 (англ.)
- ↑ Google Cloud Text-to-Speech adds 31 WaveNet voices, 7 languages and dialects. venturebeat.com, 2019/02/21 (англ.)
- ↑ Listing out voices. cran.r-project.org, 2020 (англ.)
- ↑ Cod Factory Vocalizer TTS Voice [Архівовано 18 вересня 2016 у Wayback Machine.]. play.google.com, 2018 (англ.)
- ↑ Nuance Mix: Languages and TTS Voices. docs.mix.nuance.com. 2021 (англ.)
- ↑ Cerence TTS Factsheet. cerence.com. 2021 (англ.)
- ↑ Code Factory: Speech synthesis [Архівовано 15 лютого 2020 у Wayback Machine.]. codefactoryglobal.com. 2018 (англ.)
- ↑ NextUp: Cerence TTS Voices. nextup.com. 2021 (англ.)
- ↑ Nuance TTS: Lesya (Ukrainian), sample. nextup.com. 2018 (англ.)
- ↑ KobaSpeech 4 With Vocalizer Lesya — Ukrainian. kobaspeech.com. 2018 (англ.)
- ↑ Функції Live Text та Voice Over від Apple підтримуватимуть українську мову // forbes.ua, 7 червня 2022
- ↑ Apple додав українську мову в Live Text та Voice Over // ms.detector.media, 8 червня 2022
- ↑ Apple додає новий-старий Український голос у войсовер! // Facebook сторінка "Навчально-інформаційний комп'ютерний центр УТОС", 7 червня 2022
- ↑ Відомості про оновлення iOS 16 // support.apple.com/uk-ua/, 2022
- ↑ Компанія Apple додала українську мову в застосунок для перекладів // ms.detector.media, 26 вересня 2023
- ↑ Microsoft купив компанію з розпізнавання мовлення майже за $20 млрд // lb.ua, 13 квітня 2021
- ↑ Language and voice support for the Speech service // Azure AI Services, 2023 (англ.)
- ↑ What's new in Azure AI Speech?, March 2021 release // Azure AI Services, 15 веересня 2023 (англ.)
- ↑ Eleven more languages are generally available for Azure Neural Text-to-Speech // AI - Azure AI services Blog, techcommunity.microsoft.com, 31 березня 2021 (англ.)
- ↑ https://github.com/robinhad/ukrainian-tts/releases
- ↑ Neon AI Support for the Ukrainian Language // neon.ai, 2023 (англ.)
- ↑ Українська мова в Balacoon // balacoon.com, 8 липня 2023
- ↑ fliki.ai: What's New? // fliki.ai, 2023 (англ.)
- ↑ fliki.ai: Best Ukrainian AI Voices. Generate high quality text-to-speech using natural Ukrainian AI voices // fliki.ai, 2023 (англ.)
- ↑ [1]
- ↑ [2]
- ↑ [3]
- ↑ [4]
- ↑ VymovaPlus ($29,95)
VymovaPro ($37,45)
Natalka Стандартна ($14.95)
Natalka Сімейна ($29.95)
Natalka Для класу ($99.95)
Natalka Для сайту ($199.95) - ↑ [5]
- ↑ [6]
- ↑ а б в Оригінальний голос: Анатолій Подорожко — диктор харківського суспільного радіо UA:Українське радіо та «голос харківського метро»
- ↑ [7]
- ↑ [8]
- ↑ [9]
- ↑ Оригінальний голос: Володимир Бєглов
- ↑ Оригінальний голос: Маріанна Фіртка
- ↑ доступна у додатку Google TTS починаючи з версії 3.11.12
- ↑ [10]
- ↑ https://www.nuance.com/omni-channel-customer-engagement/voice-and-ivr/text-to-speech.html
- ↑ [11]
- ↑ https://speech.microsoft.com/portal/voicegallery
- ↑ [12]
- ↑ [13]
- ↑ а б Також може читати текст англійською мовою, але з українським акцентом
- ↑ Анатоль та Стьопа мають однакові голоси
- ↑ Архівована копія. Архів оригіналу за 16 лютого 2020. Процитовано 16 лютого 2020.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) - ↑ Архівована копія. Архів оригіналу за 8 лютого 2020. Процитовано 15 лютого 2020.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) [Архівовано 2020-02-08 у Wayback Machine.] - ↑ Архівована копія. Архів оригіналу за 5 вересня 2017. Процитовано 4 вересня 2017.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) - ↑ Архівована копія. Архів оригіналу за 31 липня 2015. Процитовано 26 липня 2015.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) - ↑ Архівована копія. Архів оригіналу за 10 серпня 2015. Процитовано 26 липня 2015.
{{cite web}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання)
- Голос Natalka (на основі КіберМова Vymova Plus/Pro Natalka TTS, kibermova.com) (англ.)
- Голоси Ostap, Polina та uk-UA-Wavenet-A/uk-UA-Standard-A (на основі Microsoft Azure Neural Ukrainian TTS та Google WaveNet Ukrainian TTS, ttsconverter.io) (англ.)
- Голоси Ostap та Polina (на основі Microsoft Azure Neural Ukrainian TTS, speech.microsoft.com) (англ.)
- Голос uk-UA-Wavenet-A/uk-UA-Standard-A (на основі Google WaveNet Ukrainian TTS, cloud.google.com) (англ.)
- Голоси Mykyta, Dmytro, Oleksa, Lada, Tetyana (на основі Ukrainian TTS using ESPnet, brehunets.com) ; Голоси Mykyta, Lada, Tetyana також доступні у Balacoon TTS (англ.)
- Голос Vits-жіночий (на основі Neon AI / Coqui AI Ukrainian Vits TTS, neon.ai) (англ.) ; Голос Vits-жіночий також доступний у CoquiTTS (англ.)