Надіслати статтю
вул. Інститутська 11, м. Хмельницький, 29016

ЗАСТОСУВАННЯ КЛАСТЕРИЗАЦІЇ НА ОСНОВІ САМООРГАНІЗАЦІЙНИХ КАРТ КОХОНЕНА ДЛЯ РОЗПОДІЛУ КОРИСТУВАЧІВ НА ГРУПИ

APPLICATION OF CLUSTERIZATION ON THE BASIS OF KOHANEN’S SELF-ORGANIZING MAPS FOR DISTRIBUTION OF USERS TO GROUPS

Сторінки 100-105. Номер №1, 2020 (261)

Автори:
СИНЬКО А. І.,
ПЕЛЕЩИШИН А. М.
Національний університет “Львівська політехніка”
SYNKO A.,
PELESHCHYSHYN A.
Lviv Polytechnic National University

DOI: https://www.doi.org/10.31891/2307-5740-2020-278-1-19
Надійшла / Paper received: 12.01.2020
Надрукована / Paper Printed: 10.03.2020

Анотація мовою оригіналу.

В роботі наведено результати дослідження, отриманих завдяки застосуванню одного з провідних засобів аналізу даних – кластеризації. Для кластеризації даних були застосовані штучні нейронні мережі – мережа Кохонена. Для проведення дослідження обрано форум, що містить спільноти, на приладі однієї з яких зібрані особисті дані користувачів, впорядковані за групами, відповідно за їх перебуванням на форумі, та побудована карта Кохонена для кращого представлення, розуміння та сприйняття даних. На основі отриманих даних дослідження була проведена оптимізація результатів та прогнозування. Також представлені переваги та недоліки при застосуванні даного підходу.

Розширена анотація англійською мовою.

Today the World Wide Web contains many information, data which helps to solve various issues. However, we have a problem with how this information is reliable. Therefore, the main aim of this work is the analysis of users who have published materials in virtual communities. One of the leading methods of analysis data is clustering. Cluster analysis is useful when you need to classify a large amount of information. For the clustering was selected CyberForum which have communities. Data are from the community that contains 80 users. Users divided into three groups, which are different from each other by time of stay in the forum (junior group – users who have been using the online service for less than a year; middle group – users who have been using the online service from one to five years; senior group – users who have been using the online service from five years and more). Clustering feature of a user are the number of posts he has written, experience in the field and reviews from others users. So, we have three groups of users with three characteristics for clustering. For solving the task, we chose Kohonen neural network (KNN). This method has its own advantages and disadvantages which I provided. The Python language selected for software implementation. Thousand iterative trainings selected for clustering. Because we have a lot of data for analysis, they have been taken out in a separate file. The results of study is designed map. So, we can do the next conclusions. Firstly, every user can be useful, no matter their age, job post, experience and time spent in forum or community. Secondly, for better selecting data about users’ developers of software (for forums) need to encourage people, which registered on site enter more information about yourself. Thirdly, developers need to create more user selection functions (filters) for search materials.

Ключові слова: аналіз користувачів, кластеризація, кластерний аналіз, навчання без супервізора, мережа Кохонена, форум, спільнота, мережа Інтернет.

References.

1. Everitt B., Landau S., Leese M., Stahl D. Cluster Analysis. Wiley, 2010. 346 p.
2. Cherezov D. S. Obzor osnovnyh metodov klassifikacii i klasterizacii dannyh / D. S. Cherezov, N. A.Tyukachev // Vestnik VGU, seriya: sistemnyj analiz i informacionnye tehnologii. – 2009. – № 2. – S. 25–29.
3. Tkachenko R. O. Neiromerezhevi zasoby shtuchnoho intelektu : navchalnyi posibnyk / Tkachenko R. O., Tkachenko P. R., Izonin I. V. – Lviv : Vydavnytstvo Lvivskoi politekhniky, 2017. – 204 s.
4. Tehnologii analiza dannyh: Data Mining, Visual Mining, Text Mining, OLAP. / [Barsegyan.A. A., Kupriyanov M. S., Stepanenko V. V., Holod I. I.]. – 2-e izd. – SPb : BHV-Peterburg, 2007. – 384 s.
5. Wang J. H., Rau J. D., and Liu W. J. Two-stage clustering via neural networks. IEEE Transactions on Neural Networks, 2003, Vol. 14, pp. 606–615.
6. Golovko V.A. Nejronnye seti: obuchenie, organizaciya i primenenie. Kn. 4 : ucheb. posobie dlya vuzov / obsh. red. A.I. Galushkina. – Moskva : IPRZhR, 2001. – 256 s. – (Nejrokompyutery i ih primenenie).
7. Braian Solis. Rol suchasnykh sotsialnykh merezh v sotsiumi ta politychnykh tekhnolohiiakh / Braian Solis – Moskva : Dyrekt- Medya, 2012.
8. Paklin N.B. Biznes-analitika: ot dannyh k znaniyam : ucheb. posobie / Paklin N.B., Oreshkov V.I. – 2-e izd., pererab. i dop. – SPb : Piter, 2013. – 704 s.
9. Debok G. Analiz finansovyh dannyh s pomoshyu samoorganizuyushihsya kart / G. Debok, T. Kohonen ; per. s angl. – M. : Alpina, 2001. – 317 s.
10. Kohonen T. Samoorganizuyushiesya karty / T. Kohonen ; per. s angl. V. Ageev ; pod red. Yu. Tyumenceva. – M. : Binom, 2008. – 656 s.

Post Author: npetliaks

Translate