ІНТЕЛЕКТУАЛЬНИЙ АНАЛІЗ ДАНИХ
DATA MINING
Сторінки: 65-75. Номер: №3, 2020 (285)
Автори:
В. І. Томенко
Черкаський інститут пожежної безпеки імені Героїв Чорнобиля Національного університету цивільного захисту України
Н. В. Сачанюк-Кавецька
Вінницький національний технічний університет
О. О. Дмитрієнко
Полтавський національний педагогічний університет імені В.Г. Короленка
V Tomenko
Cherkasy Institute of Fire Safety named after the Heroes of Chernobyl of the National University of Civil Defense of Ukraine
N. Sachaniuk-Kavets’ka
Vinnytsia National Technical University
O. Dmytriienko
Poltava V.G. Korolenko National Pedagogical University
DOI: https://www.doi.org/10.31891/2307-5732-2020-285-3-11
Рецензія/Peer review : 23.04.2020 р.
Надрукована/Printed : 04.06.2020 р.
Анотація мовою оригіналу
Інтелектуальний аналіз даних, в інформатиці – процес виявлення цікавих та корисних закономірностей та взаємозв’язків у великих обсягах даних. Поле поєднує інструменти статистики та штучного інтелекту (такі як нейронні мережі та машинне навчання) та управління базами даних для аналізу великих цифрових колекцій, відомих як набори даних. Видобуток даних широко використовується у бізнесі (страхування, банківська справа, роздрібна торгівля), наукових дослідженнях (астрономія, медицина) та державній безпеці (виявлення злочинців та терористів). Поширення численних великих, а іноді і пов’язаних між собою державних та приватних баз даних призвело до постанов, що гарантують точність та захист окремих записів від несанкціонованого перегляду та підробки. Більшість типів аналізу даних спрямовані на встановлення загальних знань про групу, а не на знання про конкретних осіб – супермаркет менше турбується продажем ще однієї речі одній людині, ніж продажем багатьох предметів багатьом людям, хоча аналіз шаблонів також може бути використаний для того, щоб розпізнати аномальну поведінку особистості, таку як шахрайство чи інша злочинна діяльність. Одним із підходів до підвищення надійності є спочатку групування осіб, які мають подібні схеми закупівель, оскільки групові моделі менш чутливі до незначних аномалій. Наприклад, група “частих ділових мандрівників”, швидше за все, матиме шаблон, який включає безпрецедентні покупки в різних місцях, але учасники цієї групи можуть бути позначені для інших транзакцій, таких як покупки в каталозі, які не відповідають профілю цієї групи
Ключові слова: комп’ютерні програми, аналіз баз даних, інтелектуальний аналіз, електротехніка, математична модель, аналіз даних, контроль доступу.
Розширена анотація англійською мовою
As computer storage increased during the 1980s, many companies began to store more transaction data. The resulting collection of records, often referred to as data warehouses, was too large to be analyzed using traditional statistical approaches. Several computer science conferences and seminars have been held to consider how the latest advances in artificial intelligence (such as the discovery of expert systems, genetic algorithms, machine learning, and neural networks) can be adapted to discover knowledge (the best term in the computer science community). When studying consumer buying behavior, a typical pattern usually becomes apparent; purchases made outside of this pattern may be marked for further investigation or for denial of the transaction. However, the wide variety of normal behaviors makes this a difficult task; no difference between normal and fraudulent behavior works for everyone or constantly.
Data mining, in computer science – the process of identifying interesting and useful patterns and relationships in large amounts of data. The field combines statistics and artificial intelligence tools (such as neural networks and machine learning) and database management to analyze large digital collections known as datasets. Data mining is widely used in business (insurance, banking, retail), research (astronomy, medicine) and national security (detection of criminals and terrorists). The proliferation of numerous large and sometimes interconnected public and private databases has resulted in regulations guaranteeing the accuracy and protection of individual records from unauthorized inspection and forgery. Most types of data analysis focus on establishing general group knowledge rather than specific knowledge – a supermarket is less concerned with selling another item to one person than selling many items to many people, although pattern analysis can also be used to identify abnormalities. personal behavior, such as fraud or other criminal activity. One approach to improving reliability is to first group individuals who have similar procurement schemes, as group models are less sensitive to minor anomalies. For example, the “frequent business travelers” group is likely to have a template that includes unprecedented purchases in different locations, but members of this group may be marked for other transactions, such as catalog purchases that do not match the group’s profile.
Keywords: computer programs, database analysis, intelligent analysis, electrical engineering, mathematical model, data analysis, access control.
Referencse
- Berry, J. and Linoff, G. (1997), Data mining techniques-for marketing, sales and customer support, Williams Publishing House, New York: Wiley, USA.
- Berry, J.A.M. and Linoff, G. (2000), Mastering data mining -the art and science of customer relationship management, Williams Publishing House, New York: Wiley, USA.
- Chatfield, C. (1997), Royal statistical society news, Williams Publishing House, New York: Wiley, USA.
- Friedman, J. (1998), Data mining and statistics-what’s the connection, 29th Symposium on the interface, Williams Publishing House, Cape Town, South Africa.
- Hand, D. (1998), Data mining-statistics and more, Williams Publishing House, New York: Wiley, USA.
- Hand, D. (1999), Data mining-new challenges for statisticians, Williams Publishing House, New York: Wiley, USA.
- Hand, D.J. (1999), Statistics and Data mining-intersecting disciplines, SIGKDD Explorations, New York: Wiley, USA.
- Hastie, T. Tibshirani, R. and Friedman, J. (2001), Elements of statistical learning-data mining inference and prediction, Williams Publishing House, New York: Wiley, USA.
- Kuonen, D. (2004), Data mining and Statistics: What is the connection, The Data Administrative Newsletter, Wiley, USA.