Please use this identifier to cite or link to this item:
http://essuir.sumdu.edu.ua/handle/123456789/66439
Or use following links to share this resource in social networks:
Tweet
Recommend this item
Title | Детектування мовної активності в автоматизованій системі розпізнавання мовця критичного застосування |
Other Titles |
Speech activity detection for the automated speaker recognition system of critical use Детектирование речевой активности в автоматизированной системе распознавания диктора критического применения |
Authors |
Биков, М.М.
Ковтун, В.В. Максимов, О.О. |
ORCID | |
Keywords |
автоматизована система розпізнавання мовців критичного застосування автоматизированная система распознавания дикторов критического применения automated speaker recognition system of critical use детектування мовної активності детектирования речевой активности speech activity detection вейвлет-перетворення вейвлет-преобразования wavelet transformation згортальна нейромережа сверточная нейросеть neural network |
Type | Article |
Date of Issue | 2017 |
URI | http://essuir.sumdu.edu.ua/handle/123456789/66439 |
Publisher | Сумський державний університет |
License | |
Citation | Биков, М.М. Детектування мовної активності в автоматизованій системі розпізнавання мовця критичного застосування [Текст] / М.М. Биков, В.В. Ковтун, О.О. Максимов // Журнал інженерних наук. – 2017. – Т. 4, № 1. – С. H14-H20. |
Abstract |
У статті автори розробили метод детектування мовної активності для автоматизованої системи
розпізнавання мовців критичного застосування із вейвлет-параметризацією мовного сигналу та класифікацією на інтервали «мова»/«пауза» з використанням згортальної нейромережі. Запропонований
авторами метод вейвлет-параметризації дозволяє обрати оптимальні параметри вейвлет-
перетворення відповідно до заданої користувачем похибки подання мовного сигналу. Також метод до-
зволяє здійснювати оцінювання втрат інформації залежно від вибраних параметрів неперервного
вейвлет-перетворення (НВП), що дозволило зменшити кількість обчислюваних коефіцієнтів НВП мовного сигналу на порядок із допустимим ступенем спотворення локального спектра НВП. Також запропоновано алгоритм детектування мовної активності із згортальним нейромережевим класифікатором, який показує високу якість сегментації мовних сигналів на інтервали «мова»/«пауза» та є стійким до присутності у мовному сигналі вузькосмугового шуму і техногенних шумів за рахунок властивостей згортальної нейромережі. В статье авторы разработали метод выявления речевой деятельности для автоматизированной системы распознавания критического использования языков с вейвлет-параметризацией речевого сигнала и классификации с интервалами «языка»/«паузы» с помощью криволинейной нейронной сети. Предложенный авторами метод вейвлет-параметризации позволяет выбирать оптимальные параметры вейвлет-преобразования в соответствии с заданной пользователю ошибки представления речевого сигнала. Также метод позволяет оценить потерю информации в зависимости от выбранных параметров непрерывного преобразования вейвлета (АЭС), что позволило уменьшить количество масштабируемых коэффициентов ЛВП речевого сигнала в порядке величины с допустимой степенью искажения локальный спектр LVP. Также предложен алгоритм обнаружения речевой активности с классифицируемой криволинейной нейронной сетью, показывает высокое качество сегментации речевых сигналов с интервалами «язык»/«пауза» и устойчива к присутствиям в речевом сигнале узкополосных шумов и техногенных шумов, за счет свойств, обладаемых криволинейной нейронной сетью. In the article, the authors developed a method for detecting speech activity for an automated system for recognizing critical use of speeches with wavelet parameterization of speech signal and classification at intervals of “language”/“pause” using a curvilinear neural network. The method of wavelet-parametrization proposed by the authors allows choosing the optimal parameters of wavelet transformation in accordance with the user-specified error of presentation of speech signal. Also, the method allows estimating the loss of information depending on the selected parameters of continuous wavelet transformation (NPP), which allowed to reduce the number of scalable coefficients of the LVP of the speech signal in order of magnitude with the allowable degree of distortion of the local spectrum of the LVP. An algorithm for detecting speech activity with a curvilinear neural network classifier is also proposed, which shows the high quality of segmentation of speech signals at intervals "language" / "pause" and is resistant to the presence in the speech signal of narrowband noise and technogenic noise due to the inherent properties of the curvilinear neural network. |
Appears in Collections: |
Journal of Engineering Sciences / Журнал інженерних наук |
Views
Germany
31
Iraq
1
Ireland
3874
Japan
28274
Lithuania
1
Mongolia
1
Serbia
1
Singapore
1
Sweden
1
Ukraine
14386
United Kingdom
7748
United States
110878
Unknown Country
11
Downloads
China
1
Germany
1
India
1
Lithuania
1
Netherlands
2217
Poland
1
Singapore
1
Ukraine
14387
United Kingdom
1
United States
28273
Unknown Country
6
Files
File | Size | Format | Downloads |
---|---|---|---|
Bykov_Kovtun_Maksymov_JES_2017_1_4_H14-H20.pdf | 614.03 kB | Adobe PDF | 44890 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.