Please use this identifier to cite or link to this item:
https://essuir.sumdu.edu.ua/handle/123456789/98457
Or use following links to share this resource in social networks:
Tweet
Recommend this item
Title | Багатошарова модель та метод навчання для детектування шкідливого трафіку на основі ансамблю дерев рішень |
Other Titles |
Multi-layer model and training method for malware traffic deetection based on decision tree ensemble |
Authors |
Moskalenko, Viacheslav Vasylovych
![]() Zaretskyi, Mykola Oleksandrovych ![]() Moskalenko, Alona Serhiivna ![]() Kudriavtsev, Anton Mykhailovych ![]() Semashko, Viktor Anatoliiovych ![]() |
ORCID |
http://orcid.org/0000-0001-6275-9803 http://orcid.org/0000-0001-9117-5604 http://orcid.org/0000-0003-3443-3990 http://orcid.org/0000-0003-0967-0185 http://orcid.org/0000-0002-9765-876X |
Keywords |
система детектування загроз intrusion detection system згорткова розріджено кодуюча модель convolutional sparse coding model зростаючий нейронний газ growing sparse coding neural gas ансамбль дерев рішень decision tree ensemble регресійний випадковий ліс regression random forest інформаційний критерій information criterion дистиляція знань knowledge distillation інформаційно-екстремальна машинне навчання information-extreme machine learning |
Type | Article |
Date of Issue | 2020 |
URI | https://essuir.sumdu.edu.ua/handle/123456789/98457 |
Publisher | Національний аерокосмічний університет ім. М.Є. Жуковського "Харківський авіаційний інститут" |
License | Creative Commons Attribution 4.0 International License |
Citation | Москаленко В. В., Зарецький М. О., Москаленко А. С., Кудрявцев А. М., Семашко В. А. Багатошарова модель та метод навчання для детектування шкідливого трафіку на основі ансамблю дерев рішень // Радіоелектронні і комп’ютерні системи. 2020. № 2(94). С. 92-101. DOI: 10.32620/reks.2020.2.08. |
Abstract |
Запропоновано модель і метод навчання багатошарового екстрактора ознак та вирішувальних правил
для детектора шкідливого трафіку. Модель екстрактора ознак основана на згортковій розріджено
кодуючій мережі, розріджений кодер якої апроксимується моделлю регресійного випадкового лісу згідно принципів дистиляції знань. При цьому розроблено алгоритм зростаючого розріджено кодуючого
нейронного газу для навчання екстрактора ознак без вчителя з автоматичним визначення необхідної
кількості ознак на кожному шарі. На етапі навчання екстрактора ознак для реалізації розрідженого
кодування використано жадібний L0-регуляризований метод ортогонального узгодженого переслідування (Orthogonal Matching Pursuit), а під час дистиляції знань додатково використовувався L1-
регуляризований метод найменших кутів (Least angle regression algorithm). Завдяки ефекту редукції
причини отримані ознаки є некорельованими, а сформований ознаковий опис є стійким до завад та
змагальних (Adveserial) атак. Запропонований екстрактор ознак навчається без вчителя для розділення пояснюючих факторів і дозволяє з максимальною ефективністю використати нерозмічені навчальні
дані, обсяг яких, як правило, досить великий. Як модель вирішувальних правил запропоновано використовувати двійковий кодер спостережень на основі ансамблю дерев рішень та інформаційноекстремальні роздільні замкнені гіперповерхні (контейнери) класів, що відновлюються в радіальному базисі двійкового простору Хеммінга. Додавання кодуючих дерев відбувається за принципом бустінгу, а радіус контейнерів класів оптимізується шляхом прямого перебору. Інформаційно-екстремальний класифікатор характеризується низькою обчислювальною складністю та високою узагальнюючою здатністю для малих наборів розмічених навчальних даних. Результати верифікації навченої моделі на відкритих тестових наборах даних CTU підтверджують придатність запропонованих алгоритмів для практичного застосування, оскільки точність розпізнавання шкідливого трафіку становить 96,1 %. The model and training method of multilayer feature extractor and decision rules for a malware traffic detector is proposed. The feature extractor model is based on a convolutional sparse coding network whose sparse encoder is approximated by a regression random forest model according to the principles of knowledge distillation. In this case, an algorithm of growing sparse coding neural gas has been developed for unsupervised training the features extractor with automatic determination of the required number of features on each layer. As for feature extractor, at the training phase to implement of sparse coding the greedy L1-regularized method of Orthogonal Matching Pursuit was used, and at the knowledge distillation phase, the L1-regularized method at the least angles (Least regression algorithm) was additionally used. Due to the explaining-away effect, the extracted features are uncorrelated and robust to noise and adversarial attacks. The proposed feature extractor is unsupervised trained to separate the explanatory fac- Інтелектуальні системи керування та діагностування 101 tors and allows to use the unlabeled training data, which are usually quite large, with the maximum efficiency. As a model of the decision rules proposed to use the binary encoder of input observations based on an ensemble of decision trees and information-extreme closed hyper-surfaces (containers) for class separation, that are recovery in radial-basis of Hemming' binary space. The addition of coding trees is based on the boosting principle, and the radius of class containers is optimized by direct search. The information-extreme classifier is characterized by low computational complexity and high generalization capacity for small sets of labeled training data. The verification results of the trained model on open CTU test data sets confirm the suitability of the proposed algorithms for practical application since the accuracy of malware traffic detection is 96.1 %. |
Appears in Collections: |
Наукові видання (ЕлІТ) |
Views

3
Downloads
Files
File | Size | Format | Downloads |
---|---|---|---|
Moskalenko_information_criterion.pdf | 959.17 kB | Adobe PDF | 0 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.