Please use this identifier to cite or link to this item: http://essuir.sumdu.edu.ua/handle/123456789/66439
Or use following links to share this resource in social networks: Recommend this item
Title Детектування мовної активності в автоматизованій системі розпізнавання мовця критичного застосування
Other Titles Speech activity detection for the automated speaker recognition system of critical use
Детектирование речевой активности в автоматизированной системе распознавания диктора критического применения
Authors Биков, М.М.
Ковтун, В.В.
Максимов, О.О.
ORCID
Keywords автоматизована система розпізнавання мовців критичного застосування
автоматизированная система распознавания дикторов критического применения
automated speaker recognition system of critical use
детектування мовної активності
детектирования речевой активности
speech activity detection
вейвлет-перетворення
вейвлет-преобразования
wavelet transformation
згортальна нейромережа
сверточная нейросеть
neural network
Type Article
Date of Issue 2017
URI http://essuir.sumdu.edu.ua/handle/123456789/66439
Publisher Сумський державний університет
License
Citation Биков, М.М. Детектування мовної активності в автоматизованій системі розпізнавання мовця критичного застосування [Текст] / М.М. Биков, В.В. Ковтун, О.О. Максимов // Журнал інженерних наук. – 2017. – Т. 4, № 1. – С. H14-H20.
Abstract У статті автори розробили метод детектування мовної активності для автоматизованої системи розпізнавання мовців критичного застосування із вейвлет-параметризацією мовного сигналу та класифікацією на інтервали «мова»/«пауза» з використанням згортальної нейромережі. Запропонований авторами метод вейвлет-параметризації дозволяє обрати оптимальні параметри вейвлет- перетворення відповідно до заданої користувачем похибки подання мовного сигналу. Також метод до- зволяє здійснювати оцінювання втрат інформації залежно від вибраних параметрів неперервного вейвлет-перетворення (НВП), що дозволило зменшити кількість обчислюваних коефіцієнтів НВП мовного сигналу на порядок із допустимим ступенем спотворення локального спектра НВП. Також запропоновано алгоритм детектування мовної активності із згортальним нейромережевим класифікатором, який показує високу якість сегментації мовних сигналів на інтервали «мова»/«пауза» та є стійким до присутності у мовному сигналі вузькосмугового шуму і техногенних шумів за рахунок властивостей згортальної нейромережі.
В статье авторы разработали метод выявления речевой деятельности для автоматизированной системы распознавания критического использования языков с вейвлет-параметризацией речевого сигнала и классификации с интервалами «языка»/«паузы» с помощью криволинейной нейронной сети. Предложенный авторами метод вейвлет-параметризации позволяет выбирать оптимальные параметры вейвлет-преобразования в соответствии с заданной пользователю ошибки представления речевого сигнала. Также метод позволяет оценить потерю информации в зависимости от выбранных параметров непрерывного преобразования вейвлета (АЭС), что позволило уменьшить количество масштабируемых коэффициентов ЛВП речевого сигнала в порядке величины с допустимой степенью искажения локальный спектр LVP. Также предложен алгоритм обнаружения речевой активности с классифицируемой криволинейной нейронной сетью, показывает высокое качество сегментации речевых сигналов с интервалами «язык»/«пауза» и устойчива к присутствиям в речевом сигнале узкополосных шумов и техногенных шумов, за счет свойств, обладаемых криволинейной нейронной сетью.
In the article, the authors developed a method for detecting speech activity for an automated system for recognizing critical use of speeches with wavelet parameterization of speech signal and classification at intervals of “language”/“pause” using a curvilinear neural network. The method of wavelet-parametrization proposed by the authors allows choosing the optimal parameters of wavelet transformation in accordance with the user-specified error of presentation of speech signal. Also, the method allows estimating the loss of information depending on the selected parameters of continuous wavelet transformation (NPP), which allowed to reduce the number of scalable coefficients of the LVP of the speech signal in order of magnitude with the allowable degree of distortion of the local spectrum of the LVP. An algorithm for detecting speech activity with a curvilinear neural network classifier is also proposed, which shows the high quality of segmentation of speech signals at intervals "language" / "pause" and is resistant to the presence in the speech signal of narrowband noise and technogenic noise due to the inherent properties of the curvilinear neural network.
Appears in Collections: Journal of Engineering Sciences / Журнал інженерних наук

Views

Germany Germany
31
Iraq Iraq
1
Ireland Ireland
3874
Japan Japan
28274
Lithuania Lithuania
1
Mongolia Mongolia
1
Serbia Serbia
1
Singapore Singapore
1
Sweden Sweden
1
Ukraine Ukraine
14386
United Kingdom United Kingdom
7748
United States United States
110878
Unknown Country Unknown Country
11

Downloads

China China
1
Germany Germany
1
India India
1
Lithuania Lithuania
1
Netherlands Netherlands
2217
Poland Poland
1
Singapore Singapore
1
Ukraine Ukraine
14387
United Kingdom United Kingdom
1
United States United States
28273
Unknown Country Unknown Country
6

Files

File Size Format Downloads
Bykov_Kovtun_Maksymov_JES_2017_1_4_H14-H20.pdf 614.03 kB Adobe PDF 44890

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.