Международная конференция «Математические и информационные технологии, MIT-2011»
(IX конференция «Вычислительные и информационные технологии в науке,
технике и образовании») № гос. регистрации 0321102644, ISBN 978-5-905569-02-9

Врнячка Баня, Сербия, 27–31 августа 2011 г.

Будва, Черногория, 31 августа – 5 сентября 2011 г.

Мусабаев Р.Р.   Калимолдаев М.Н.   Амиргалиев Е.Н.  

Синтез интонационной составляющей речевого сигнала с применением сплайновой интерполяции

Докладчик: Мусабаев Р.Р.

В данной статье дается описание метода синтеза интонационной составляющей речевого сигнала на основе сплайнов – математически рассчитанных кривых, плавно соединяющих отдельные опорные точки интонационного контура. Данный метод был использован при реализации системы компилятивного синтеза речевого сигнала разрабатываемой в ИПИУ МОН РК. В статье описывается специализированный язык, с помощью которого производиться предварительное описание фонетических и интонационных свойств синтезируемого речевого сигнала. Также приводится описание алгоритмов используемых в процессе расчета гладких параметрических кривых задающих динамику изменения регулируемых параметров. Произведено сравнение предложенного в данной работе метода с методом линейной интерполяции, который используется в большинстве существующих систем синтеза речи. Оценка производилась по критерию минимума суммы квадратов невязок между расчетными значениями по двум методам и натуральным эталонным контуром. В результате для метода линейной интерполяции критерий в среднем равен 0.25, в то время как для предложенного метода значение критерия составляет в среднем 0.07.

Файл тезисов: Калимолдаев_Аннотация.doc
Файл с полным текстом: Калимолдаев_Статья.pdf


К списку докладов

© 1996-2019, Институт вычислительных технологий СО РАН, Новосибирск