-
Ключові слова:
звуковідтворення, звуковоспроизведение ; мовні сигнали, речевые сигналы ; мовна інформація, речевая информация ; сегментація мови, сегментация речи ; шумові сигнали, шумовые сигналы
-
Анотація:
У роботі запропоновано метод адаптивного визначення пауз і голосової активності у мовному голосовому сигналі з адаптивним порогом шуму, який дозволяє з високою надійністю визначати паузи у голосових сигналах з високим рівнем стороннього шуму і нестаціонарним шумом. Впроваджено метод визначення позиції зміни диктора у мовному голосовому сигналі на основі байєсівського інформаційного критерію порівняння моделей диктора в околі паузи у голосовому сигналі, і запропоновано методи сегментації сигналу за ознакою зміни диктора. Покращено методи фільтрації мовного сигналу від сторонніх шумів та методи зміни швидкості відтворення голосового сигналу з використанням інформації, отриманої про шум з ділянок без голосової активності, визначених за допомогою адаптивного методу визначення пауз. Покращено методи зміни швидкості відтворення голосового сигналу з використанням методики PSOLA без змін до акустичних характеристик сигналу. Створено інформаційну систему для автоматизованого розподіленого комп'ютерного документування мовних голосових фонограм, яка показала високу ефективність у підвищенні продуктивності роботи груп операторів-стенографістів.
-
Теми документа
-
УДК // Оброблення і перетворення образів
|