Please use this identifier to cite or link to this item:
https://essuir.sumdu.edu.ua/handle/123456789/98458
Or use following links to share this resource in social networks:
Tweet
Recommend this item
Title | Модель і метод навчання класифікатора контекстів спостереження на зображеннях відеоінспекції стічних труб |
Other Titles |
Model and method of training the classifier of observation context on video inspection images of sewer pipes |
Authors |
Moskalenko, Viacheslav Vasylovych
![]() Zaretskyi, Mykola Oleksandrovych ![]() Kovalskyi, Yaroslav Yuriiovych ![]() Martynenko, Serhii Serhiiovych ![]() |
ORCID |
http://orcid.org/0000-0001-6275-9803 http://orcid.org/0000-0001-9117-5604 http://orcid.org/0000-0002-5345-5186 http://orcid.org/0000-0003-0735-9246 |
Keywords |
інспекція стічних труб sewer pipe inspection згорткові нейронні мережі convolutional neural networks сіамські мережі siamese networks інформаційноекстремальне навчання information and extreme training класифікація classification |
Type | Article |
Date of Issue | 2020 |
URI | https://essuir.sumdu.edu.ua/handle/123456789/98458 |
Publisher | Національний аерокосмічний університет ім. М.Є. Жуковського "Харківський авіаційний інститут" |
License | Creative Commons Attribution 4.0 International License |
Citation | Москаленко В. В., Зарецький М. О., Ковальський Я. Ю., Мартиненко С. С. Модель і метод навчання класифікатора контекстів спостереження на зображеннях відеоінспекції стічних труб // Радіоелектронні і комп’ютерні системи. 2020. № 3(95). С. 59-66. DOI: 10.32620/reks.2020.3.06. |
Abstract |
Відеоінспекція часто використовується для діагностики дефектів стічних труб. Для коректного
кодування знайдених дефектів згідно існуючих стандартів необхідно враховувати багато контекстної
інформації щодо орієнтації та розташування камери в трубі. Запропоновано модель класифікації
контекстів спостереження на кадрах відеоінспекції стічних труб та п’ятиетапний метод машинного
навчання. Основна ідея запропонованого підходу полягає у поєднанні методів глибокого машинного
навчання з принципами максимізації інформації та кодування самокоректуючими кодами Хеммінга.
Запропонована модель складається з глибокої згорткової нейронної мережі із сигмоїдним та
округлючим вихідними шарами та інформаційно-екстремальних вирішувальних правил. Перші етапи
методу полягають в аугментації даних та навчанні екстрактора ознак в складі сіамської моделі з
softmax триплетною функцією втрат. Наступні етапи пов’язані з обчислення двійкового коду для
кожного класу розпізнавання, що використовується як мітка під час навчання з бінарною кросентропійною функцією втрат з метою підвищення компактності розподілу спостережень кожного
класу в двійковому просторі Хемінга. На останньому етапі методу навчання передбачається для
кожного класу здійснювати оптимізацію параметрів радіально-базисних вирішувальних правил в
просторі Хеммінга на основі інформаційного критерію. Інформаційний критерій, виражений як
логарифмічна функція точністних характеристик вирішувальних правил, забезпечує максимальну
узагальнюючу здатність та достовірність моделі за найскладніших у статистичному розумінні умов.
Перевірка ефективності даного підходу здійснювалась на даних, наданих компаніями Ace Pipe Cleaning
(Канзас Сіті, США) та MPWiK (Вроцлав, Польша) шляхом порівняння результатів навчання за
запропонованою та традиційною моделями та схемами навчання. Отримана модель класифікатора
кадрів зображення забезпечує прийнятну для практичного використання точність класифікації на
тестовій вибірці, що становить 96,8 % і перевищує результат традиційної схеми навчання з softmaх
вихідним шаром на 6,8 %. Video inspection is often used to diagnose sewer pipe defects. To correctly encode founded defects according to existing standards, it is necessary to consider a lot of contextual information about the orientation and location of the camera from sewer pipe video inspection. A model for the classification of context on frames during observations in the video inspection of sewer pipes and a five-stage method of machine learning is proposed. The main idea of the proposed approach is to combine the methods of deep machine learning with the principles of information maximization and coding with self-correcting Hamming codes. The proposed model consists of a deep convolutional neural network with a sigmoid layer followed by the rounding output layer and information-extreme decision rules. The first stages of the method are data augmentation and training of the feature extractor in the Siamese model with softmax triplet loss function. The next steps involve calculating a binary code for each class of recognition that is used as a label in learning with a binary cross-entropy loss function to increase the compactness of the distribution of each class's observations in the Hamming binary space. At the last stage of the training method, it is supposed to optimize the parameters of radial-basis decision rules in the Hamming space for each class according to the existing information-extreme criterion. The information criterion, expressed as a logarithmic function of the accuracy characteristics of the decision rules, provides the maximum generalization and reliability of the model under the most difficult conditions in the statistical sense. The effectiveness of this approach was tested on data provided by Ace Pipe Cleaning (Kansas City, USA) and MPWiK (Wroclaw, Poland) by comparing learning results according to the proposed and traditional models and training schemes. The obtained model of the image frame classifier provides acceptable for practical use classification accuracy on the test sample, which is 96.8 % and exceeds the result of the traditional scheme of training with the softmax output layer by 6.8 %. |
Appears in Collections: |
Наукові видання (ЕлІТ) |
Views
Downloads
Files
File | Size | Format | Downloads |
---|---|---|---|
Moskalenko_siamese_networks.pdf | 833.71 kB | Adobe PDF | 0 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.