Please use this identifier to cite or link to this item:
https://essuir.sumdu.edu.ua/handle/123456789/86244
Or use following links to share this resource in social networks:
Tweet
Recommend this item
Title | Оцінка ймовірності виникнення шахрайства в процесі кредитування клієнтів банку |
Other Titles |
Assessment of the probability of fraud in the process of lending to the bank's customers |
Authors |
Yarovenko, Hanna Mykolaivna
Радько, В.В. |
ORCID |
http://orcid.org/0000-0002-8760-6835 |
Keywords |
кредитні шахрайства ймовірність Python логістична регресія дерево рішень нейронна мережа credit fraud probability logistic regression decision tree neural network |
Type | Article |
Date of Issue | 2021 |
URI | https://essuir.sumdu.edu.ua/handle/123456789/86244 |
Publisher | Сумський державний університет |
License | In Copyright |
Citation | Яровенко, Г. М., Радько, В. В. Оцінка ймовірності виникнення шахрайства в процесі кредитування клієнтів банку // Вісник Сумського державного університету. Серія Економіка. 2021. № 3. С. 151−161. DOI: 10.21272/1817-9215.2021.3-17 |
Abstract |
Статтю присвячено актуальній темі оцінці ймовірності виникнення кредитних шахрайств у банках.
Дана проблематика пов’язана із зростанням рівня діджиталізації економічних процесів та переведенням
платіжних операцій у цифровий простір. Її вирішення здійснюється у восьми наукових напрямках, що
підтверджено шляхом побудови та аналізу карти наукометричної бібліографії досліджень, присвячених
проблемі шахрайств щодо кредитування клієнтів банків. В статті було виділено кластери наукових праць,
що стосуються: процесів захисту онлайн-транзакцій; машинного, ансамблевого та інкрементного
навчання для вирішення проблем кредитних шахрайств; ймовірнісних підходів; процесів виявлення аномалій
у операціях, пов’язаних із відмиванням незаконних коштів у банках; процесу знаходження шахрайств у
фінансовій сфері; оцінки ризиків; Data Mining. Для проведення дослідження оцінки ймовірності виникнення
кредитних шахрайств у банках використано статистичні дані, які складаються з 122 змінних та 307511
записів щодо клієнтів банку. Побудова концептуальної моделі дозволила окреслити етапи здійснення
моделювання, яке проводилося за допомогою сучасної мови програмування Python. Дані було очищено від
пропущеної інформації та перевірено на відповідність нормального закону розподілу. В результаті
отриманого набору даних було побудовано три моделі - логістична регресія, дерево рішень та нейронна
мережа. Виявилося, що частка правильних прогнозів у тренувальній вибірці для логістичної регресії склала
93,09%, для дерева рішень та нейронної мережі – 100,00%, а у тестовій вибірці, відповідно, – 93,60%,
99,15%, 86,67%. Це свідчить про адекватність даних обох вибірок та високу точність прогнозування.
Побудовані моделі було також перевірено на точність та якість. В результаті виявилося, що всі моделі є
досить точними та якісними, але дерево рішення є найбільш точною, якісною та адекватною моделлю.
Побудовані моделі є універсальними інструментами для виявлення шахрайських операцій, але вони
потребують постійного моніторингу та оновлення інформації у зв’язку із появою нових ознак злочинної дії
в процесі кредитування клієнтів. The article is devoted to the current topic of assessing the likelihood of credit fraud in banks. This issue is related to the growth of economic processes digitalization and the transfer of payment transactions to the digital space. Its solution is carried out in eight scientific areas, confirmed by the construction and analysis of a map of scientometric bibliography of research on the problem of fraud in lending to bank customers. The article highlights clusters of scientific papers related to processes of protection of online transactions, machine, ensemble and incremental training to solve the problems of credit fraud, probabilistic approaches, techniques of detecting anomalies in operations related to money laundering in banks, the process of finding fraud in the financial sector, risk assessments, Data Mining. The data set from 122 variables and 307,511 records of the bank's customers were used to conduct a study to assess the likelihood of credit fraud in banks. The construction of the conceptual model made it possible to outline the stages of modelling, which was carried out using the modern Python programming language. The data was cleared of missing information and checked for compliance with the normal distribution law. As a result of the obtained data set, three models were built - logistic regression, decision tree and neural network. It turned out that the share of correct predictions in the training sample for logistic regression was 93.09%, for the decision tree and neural network - 100.00%, and in the test sample, respectively - 93.60%, 99.15%, 86, 67%. It indicates the adequacy of the data of both pieces and the high accuracy of forecasting. The constructed models were also tested for accuracy and quality. As a result, it turned out that all models are pretty accurate and high quality, but the decision tree is the most accurate, high quality and adequate model. Built-in models are universal tools for detecting fraudulent transactions, but they require constant monitoring and updating of information in connection with the emergence of new signs of criminal activity in the process of lending to customers. |
Appears in Collections: |
Вісник Сумського державного університету. Економіка (2009-2024) |
Views
Australia
1
Belgium
1
Brazil
1
China
7614371
Czechia
40318206
France
1
Germany
236542418
Greece
2786
Ireland
59525
Italy
1
Japan
1
Lithuania
1
New Zealand
1
Norway
1
Serbia
1
Singapore
1701376192
Spain
178566
Sweden
1
Ukraine
1886352812
United Arab Emirates
10551
United Kingdom
7614370
United States
-517635637
Unknown Country
40318209
Downloads
Belgium
1
China
7614372
Czechia
40318207
Denmark
1
Finland
1
France
1
Germany
1
Indonesia
1
Italy
1
Lithuania
1
Singapore
1
Spain
1
Turkey
1
Ukraine
138430315
United Arab Emirates
1
United Kingdom
1
United States
-892214915
Files
File | Size | Format | Downloads |
---|---|---|---|
Yarovenko_credit_fraud.pdf | 774.02 kB | Adobe PDF | -705852008 |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.