VitalVoice

Синтез русской речи

 

Назначение и области применения:

VitalVoice реализует основное требование пользователей к системам синтеза речи: она позволяет озвучить любые, пусть даже очень нестандартные тексты (SMS, электронные письма, Интернет-форумы и т.п.) таким образом, что у слушателя складывается ощущение, что он слышит естественный человеческий голос.

Текст может быть прочтен различными голосами синтеза. Каждый голос основан на использовании речевой базы диктора объемом около 10 часов речи, размеченной на 9 уровнях, включающих текстовую расшифровку, разметку на слова, слоги, аллофоны, паузы, маркеры словных и фразовых ударений, типы интонации, неречевые явления и другие фонетические явления.

Для правильного интонирования и определения места ударения в словах разработан мощный модуль автоматической обработки русского текста, использующий морфологический, синтаксический и семантический виды анализа. Использование данного модуля, также как и столь объемные и тщательно размеченные голосовые базы, делают «VitalVoice» уникальной технологией синтеза русской речи.

Достоинства:

  • Высокая качество и естественность звучания на произвольном тексте
  • Учет фонетических, морфологических и грамматических особенностей русского языка
  • Технология клонирования естественной интонации
  • Правильная расстановка ударений
  • Правильная расшифровка сокращений, чисел, аббревиатур и специальных знаков
  • Простота использования и внедрения
  • Поддержка стандартных протоколов обмена данными и языков разметки (MRCP, SAPI, SSML)
  • Наличие пользовательского словаря
  • Возможность изменения высоты голоса и темпа речи в широком диапазоне

Функциональные возможности:

  • Расшифровка стандартных сокращений с использованием семантического анализа ( г. Минск, г. Брест, г. Витебск, 2010 г., 145 г.)
  • Правильное прочтение аббревиатур (ГАИ, БГУ)
  • Расшифровка дат, времени, правильное прочтение телефонных номеров (26.02.2010, 10:40)
  • Расшифровка специальных знаков (20$, дом № 7)
  • Правильная расшифровка формул (2*3=6)
  • Снятие омографии. (корректное произнесение различных по значению слов, имеющих одинаковое написание: бе-лок, бе-лок, за-мок, за-мок)
  • 8 различных голосов синтезатора речи.
  • Возможность изменения высоты голоса и темпа речи в широком диапазоне
  • Скорость формирования звукового файла в 10-12 раз превышает реальное время

Технические характеристики:

  • Формат входных данных: txt, doc, rtf
  • Формат выходных данных: wav, mp3
  • Формат wav-файла: частота дискретизации 22050 Гц, разрядность 16, PCM, моно

Rating All.BY Каталог Бизнес Сайтов на BEL.BIZ