ЗАСТОСУВАННЯ МОДЕЛЕЙ МАШИННОГО НАВЧАННЯ ДЛЯ ПРОГНОЗУВАННЯ ЦІН НА РИНКУ НЕРУХОМОСТІ
APPLICATION OF MACHINE LEARNING MODELS FOR PREDICTING PRICES ON THE REAL ESTATE MARKET
Сторінки: 265-273. Номер: №5, 2022 (313)
DOI: https://www.doi.org/10.31891/2307-5732-2022-313-5-265-273
Автори:
ПАШКЕВИЧ Олег
ЗВО Університет Короля Данила
https://orcid.org/0000-0001-7254-3512
e-mail: oleh.pashkevych@ukd.edu.ua
ВАЩИЩАК Сергій
ЗВО Університет Короля Данила
https://orcid.org/0000-0002-1753-1540
e-mail: serhii.vaschyshak@ukd.edu.ua
БОЙЧУК Андрій
ЗВО Університет Короля Данила
https://orcid.org/0000-0003-3357-8274
e-mail: andrii.m.boichuk@ukd.edu.ua
СТИСЛО Тарас
ЗВО Університет Короля Данила
https://orcid.org/0000-0002-2377-7985
e-mail:taras.styslo@ukd.edu.ua
Демчина Микола
ЗВО Університет Короля Данила
e-mail:mykola.demchyna@ukd.edu.ua
PASHKEVYCH Oleh, VAHSCHYSHCHAK Serhii,
BOICHUK Adrii, STYSLO Taras, DEMCHYNA Mykola
HEI King Danylo University
Анотація мовою оригіналу
В роботі наведено результати використання машинного навчання для прогнозування змін цін на ринку нерухомості. Проаналізовано економічні моделі та чинники, що впливають на формування ціни. Ці дані використано як основу для побудови моделі машинного навчання. Особлива увага зосереджена на виборі базових даних для побудови такої моделі. Проаналізовано різні типи регресійних моделей, які можуть бути реалізовані у відповідних програмних середовищах. В кінцевому результаті створена статистична модель для прогнозування ціни на житло за допомогою лінійної регресії. Вона використана для визначення тенденцій змін цін на ринку нерухомості в середньостроковому і довгостроковому періодах. Детально розглянуто всі бібліотеки які використовуються в розробці статистичної моделі, проаналізовано їх переваги та недоліки. Розглянуто та реалізовано наступні кроки створення моделі:імпорт бібліотек та модулів, розроблено зчитування даних з датасету, аналіз даних, очистка та середня статистична оцінка. Як результат, лінійну регресію використано для аналізу масиву даних, отриманих з відкритого ресурсу – сайту продажу та оренди нерухомості Zillow. Об’єкти нерухомості. Описані на цьому ресурсі, стосуються міста Сіетл. Використано кластеризацію за основними параметрами об’єктів нерухомості, зокрема площею, розміщенням, віком. Щоб оцінити співвідношення різноманітних характеристик об’єкта нерухомості проведено 3D-моделювання з використанням конструктора Axes3D. На основі аналізу виконана візуалізація даних з використанням різних бібліотек. Аналізовані дані відображено на карті за допомогою Folium. Реалізовано кластеризацію даних та тестування на реальних даних, що показало доволі непогані результати прогнозу ціни. Отриманий результат моделювання перевірено на реальних об’єктах нерухомості та встановлено, що точність роботи такої моделі становить 76%. Такий високий результат вказує на правильність її побудови та раціональність використання програмних рішень для її втілення. Вона в майбутньому може бути використана для аналізу подібних масивів даних в цій галузі.
Ключові слова: машинне навчання, регресійні моделі, ціна нерухомості, економічні моделі, кластеризація даних
Розширена анотація англійською мовою
The work shows the results of using machine learning to forecast price changes in the real estate market. Economic models and factors affecting price formation are analyzed. This data was used as a basis for building a machine learning model. Special attention is focused on the selection of basic data for building such a model. Various types of regression models, which can be implemented in appropriate software environments, have been analyzed. As a result, a statistical model was created for predicting housing prices using linear regression. It is used to determine trends in price changes on the real estate market in the medium and long term. All libraries used in the development of statistical models are examined in detail, their advantages and disadvantages are analyzed. The following steps of model creation were considered and implemented: import of libraries and modules, developed data reading from the dataset, data analysis, cleaning and average statistical evaluation. As a result, linear regression was used to analyze an array of data obtained from an open resource – the real estate sales and rental site Zillow. The real estate objects described on this resource relate to the city of Seattle. Clustering was used according to the main parameters of real estate objects, in particular, area, location, age. In order to evaluate the ratio of various characteristics of the real estate object, 3D modeling was carried out using the Axes3D designer. Based on the analysis, data visualization was performed using various libraries. The analyzed data is displayed on a map using Folium. Data clustering and testing on real data were implemented, which showed quite good price forecast results. The obtained modeling result was checked on real estate objects and it was established that the accuracy of the model is 76%. Such a high result indicates the correctness of its construction and the rationality of using software solutions for its implementation. In the future, it can be used to analyze similar data sets in this field.
Keywords: machine learning, regression models, real estate price, economic models, data clustering.
Література
1. Прогнозування цін на нерухомість в умовах фінансово-економічної кризи. Сейл Прайс Компані. [Електронний ресурс] : [веб-сайт]. – Режим доступу : http://www.saleprice.com.ua/ua/publications/real_estate_price_forecasting.html (дата звернення: 03.10.2022р.).
2. Мірошниченко І.В., Крашеніннікова О.В. Прогнозування ціни на нерухомість з використанням алгоритмів машинного навчання. Ефективна економіка. 2022. № 1. – URL: http://www.economy.nayka.com.ua/?op=1&z=9890 (дата звернення: 05.11.2022). DOI: 10.32702/2307-2105-2022.1.81
3. Григорків В. С., Ярошенко О. І., Філіпчук Н. В. Нейронні мережі та їх використання для прогнозування тенденцій ринку нерухомості. / В. С. Григорків, О. І. Ярошенко, Н. В. Філіпчук // Науковий вісник НЛТУ України. – 2012. Вип. 22.5. – С. 324-330.
4. Шаповалова В.О. Прогнозування цін на нерухомість з урахуванням тенденцій ділових циклів / В.О. Шаповалова // Економiка та держава, 2015. – № 9/2015. – С. 37–41.
5. Калиніченко Ю.В., Добровольська В.В., Абрамчк А.Р. Моделювання тенденцій ринку нерухомості. / Ю.В. Калиніченко, В.В. Добровольська, А.Р. Абрамчк // Економічний аналіз: зб. наук. праць Тернопільського національного економічного університету, 2016. Том 23. № 1. – С. 28-36.
6. Хлевна Ю.Л., Бура Ю.С. Інформаційне забезпечення прогнозування цін на нерухомість методами машинного навчання. / Ю.Л. Хлевна, Ю.С. Бура // Sciences of Europe, 2021. – № 71. – Р. 54-62.
7. Элбон К. Машинное обучение с использованием Python. Сборник рецептов. / К. Элбон. – Петербург: СПб. БХВ, 2019. – 890 с.
8. Лінійна регресія [Електронний ресурс]. – Режим доступу: https://uk wikipedia.org/ – Назва з екрану. Sandro Skansi, Introduction to Deep Lerning. – Springer. – 2018.
References
1. Prohnozuvannia tsin na nerukhomist v umovakh finansovo-ekonomichnoi kryzy. Seil Prais Kompani. [Elektronnyi resurs] : [veb-sait]. – Rezhym dostupu : http://www.saleprice.com.ua/ua/publications/real_estate_price_forecasting.html (data zvernennia: 03.10.2022r.).
2. Miroshnychenko I.V., Krasheninnikova O.V. Prohnozuvannia tsiny na nerukhomist z vykorystanniam alhorytmiv mashynnoho navchannia. Efektyvna ekonomika. 2022. № 1. – URL: http://www.economy.nayka.com.ua/?op=1&z=9890 (data zvernennia: 05.11.2022). DOI: 10.32702/2307-2105-2022.1.81.
3. Hryhorkiv V. S., Yaroshenko O. I., Filipchuk N. V. Neironni merezhi ta yikh vykorystannia dlia prohnozuvannia tendentsii rynku nerukhomosti. / V. S. Hryhorkiv, O. I. Yaroshenko, N. V. Filipchuk // Naukovyi visnyk NLTU Ukrainy. – 2012. Vyp. 22.5. – S. 324-330.
4. Shapovalova V.O. Prohnozuvannia tsin na nerukhomist z urakhuvanniam tendentsii dilovykh tsykliv / V.O. Shapovalova // Ekonomika ta derzhava, 2015. – № 9/2015. – S. 37–41.
5. Kalynichenko Yu.V., Dobrovolska V.V., Abramchk A.R. Modeliuvannia tendentsii rynku nerukhomosti. / Yu.V. Kalynichenko, V.V. Dobrovolska, A.R. Abramchk // Ekonomichnyi analiz: zb. nauk. prats Ternopilskoho natsionalnoho ekonomichnoho universytetu, 2016. Tom 23. № 1. – S. 28-36.
6. Khlevna Yu.L., Bura Yu.S. Informatsiine zabezpechennia prohnozuvannia tsin na nerukhomist metodamy mashynnoho navchannia. / Yu.L. Khlevna, Yu.S. Bura // Sciences of Europe, 2021. – № 71. – R. 54-62.
7. Еlbon K. Mashynnoe obuchenye s yspolzovanyem Python. Sbornyk retseptov. / K. Эlbon. – Peterburh: SPb. BKhV, 2019. – 890 s.
8. Liniina rehresiia [Elektronnyi resurs]. – Rezhym dostupu: https://uk wikipedia.org/ – Nazva z ekranu. Sandro Skansi, Introduction to Deep Lerning. – Springer. – 2018.