Please use this identifier to cite or link to this item: https://essuir.sumdu.edu.ua/handle/123456789/93457
Or use following links to share this resource in social networks: Recommend this item
Title Data Mining технологія для оцінювання рівня цифрового розвитку країн: сплайн багатовимірної адаптивної регресії
Authors Koibichuk, Vitaliia Vasylivna  
Bozhenko, Viktoriia Volodymyrivna  
Boiko, Anton Oleksandrovych  
ORCID http://orcid.org/0000-0002-3540-7922
http://orcid.org/0000-0002-9435-0065
http://orcid.org/0000-0002-1784-9364
Keywords економічний розвиток
economic development
рівень цифрового розвитку
digital development level
національний індекс кібербезпеки
national cyber security index
інтелектуальний аналіз даних
data mining
сплайн багатовимірної адаптивної регресії
multivariate adaptive regression spline
Type authors certificate
Date of Issue 2023
URI https://essuir.sumdu.edu.ua/handle/123456789/93457
Publisher УКРНОІВІ
License Copyright not evaluated
Citation Свідоцтво про реєстрацію авторського права на твір № 118811 Україна. Науковий твір "Data Mining технологія для оцінювання рівня цифрового розвитку країн: сплайн багатовимірної адаптивної регресії" / В. В Койбічук, В. В. Боженко, А. О. Бойко. Заявл. 08.05.2023; опубл. 31.07.2023, Бюл. № 76.
Abstract Епоха 4.0 кидає виклики всім країнам. З метою комплексного та всебічного оцінювання певної сфери необхідним є застосування потужних аналітичних методів. А сфера цифрового розвитку, якість організації кібербезпеки особливо вимагає застосування потужного програмно-аналітичного забезпечення для виявлення потенційних кіберзагроз, їх упередження, та підтримки сталого розвитку кожної країни. Також характерністю епохи діджиталізації є використання методів машинного навчання, інтелекутального аналізу даних, нейронних технологій для проведення грунтовної аналітики. Дослідження стосується побудові оптимального багатовимірного адаптивниго регресійного сплайну, що описує залежність рівня цифрового розвитку країн від національного індексу кібербезпеки та легкості ведення бізнесу та грунтується на прогнозних методах інтелектуального аналізу даних. Об’єктами дослідження є 103 країни, статистичні дані досліджуваних показників цих країн використані за 2021 рік відповідно до звітів Академії електронного урядування (e-Governance Academy) та групи Світового банку Doing Business. Дослідження виконано в чотири етапи. На 1-му етапі було проведено бібліометричний аналіз з використанням програмного забезпечення Vosviewer для опису математичного апарату, що потрібен при використанні MARS-моделей, та аналітичної платформи Scivall для виявлення тенденцій щодо безпеки кіберпростору. На другому етапі – формування вхідної вибірки даних (показники цифрового розвитку країни, національний індекс кібербезпеки та легкість ведення бізнесу) та обгрунтування її статистичної значущості за допомогою інструментів дескриптивної статистики в програмному пакеті Statgraphics. На третьому етапі було розробленно лінійну множинну регресійну модель, що характеризує ступінь впливу індексу національної кібербезпеки та легкості ведення бізнесу на рівень цифрового розвитку. Обидві незалежні змінні здійснюють позитивний прямопропорційний вплив на зміну залежного індикатора, при цьому вплив показника «легкість ведення бізнесу» в чотири рази перевищує вплив національного індексу кібербезпеки, що логічно інтерпретується масовістю використання цифрових технологій у всіх сферах бізнесу та цифровій економіці, є фактором-стимулятором economic development. Відсутність мультиколінеарності у предикторних змінних доведено за допомогою VIF-тесту, а статистична значущість моделі – за допомогою тестоу Ст’юдента, коефіцієнту детермінації, стандартної помилки оцінки, середньої абсолютної помилки, критерієм Фішера та ANOVA. На четвертому етапі для більш точного оцінювання впливу національного індексу кібербезпеки та легкості ведення бізнесу на рівень цифрового розвитку було розроблено сплайн багатовимірної адаптивної регресії, що використовує три базових функції. Розроблення MARS-моделі здійснено з використанням програмного забезпечення Salford Predictive Modeler. Якість моделі обгрунтувана з використанням узагальненого критерію перехресної перевірки. Отримані результати дозволили комплексно визначити вплив націального індексу кібербезпеки та легкості ведення бізнесу на рівень цифрового розвитку досліджуваної країни та можуть бути використані аналітичними відділами соціально-економічних об’єктів (банків, фінасових установ), органами національної кіберполіції, національним координаційним центрам кібербезпеки для економічного розвитку та сталого зростання.
Powerful analytical methods to comprehensively assess a particular area are required in the era of 4.0. The article deals with an optimal multivariate adaptive regression spline that describes the dependence of the countries’ digital development on the national cyber security index and accessible business. It is based on predictive methods of intelligent data analysis. The objects of the study are 103 countries. The statistical data of the investigated indicators of these countries were used for 2021 according to the reports of the e-Governance Academy and the World Bank Doing Business Group. The originality of the research lies in the multivariate adaptive regression spline of countries' digital development level developed by the authors. The research is implemented within the scope of execution of four stages. During the first stage, a bibliometric analysis was carried out using Vosviewer software to describe the mathematical tool in MARS and display the features of this technology and its areas of application, in particular, forecasting, optimization of the development of secondary models and features of technologies during its construction, such as artificial intelligence, data mining, neural network. Also, in the first stage, the Scival analytical platform was used to identify cybersecurity trends. The input sample of data (indicators of the country's digital development, the national cyber security index, and the ease of doing business) was formed in the second stage. Using descriptive statistics tools in the Statgraphics software package, its statistical significance was justified. A multiple regression model was developed to compare the results of the classical regression model and the results obtained by the MARS model, characterizing the influence of the national cyber security index and ease of doing business on digital development. Its development was implemented in the third stage. Both independent variables positively and directly affect the dependent indicator. At the same time, the influence of the "ease of doing business" index is four times greater than the national cyber security index, caused by the mass use of digital technologies in all business areas and the digital economy, and that is a stimulating factor of economic development. The absence of multicollinearity in the predictor variables was proven using the variance inflation factor test, and the statistical significance of the model – using the Student's test, coefficient of determination, standard error of estimate, mean absolute error, Fisher's test, and ANOVA. In the fourth stage, a multivariate adaptive regression spline using three basis functions was developed to assess more accurately the impact of the national cyber security index and ease of doing business on digital development. The MARS model was developed using the Salford Predictive Modeler software. The quality of the model is based on the Generalized Cross Validation criterion. The obtained results made it possible to comprehensively determine the influence of the cyber security national index and ease of doing business on the country’s digital development under study and can be used by analytical departments of socio-economic objects (banks, financial institutions), national cyber police bodies, national cyber security coordination centers for economic development and sustainable growth.
Appears in Collections: Наукові видання (ННІ БіЕМ)

Views

Belgium Belgium
397
China China
1
Ireland Ireland
9
Japan Japan
1
Singapore Singapore
1
Ukraine Ukraine
97
United States United States
398
Unknown Country Unknown Country
906

Downloads

Indonesia Indonesia
1
Ukraine Ukraine
98
United States United States
285
Unknown Country Unknown Country
1

Files

File Size Format Downloads
Koibichuk_data_mining.pdf 3 MB Adobe PDF 385

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.