МЕТОДИ ВІДНОВЛЕННЯ ВІДСУТНІХ ДАНИХ У ІНТЕРФЕЙСІ ВЕЛИКИХ ДАНИХ

  • М. П. КОМАР
Ключові слова: великі дані, аналіз даних, обробка даних, відсутні дані, відновлення даних, функціональні залежності, правила асоціації, кластерний аналіз, машинне навчання, нейронна мережа.

Анотація

У статті досліджено відомі методи та запропоновано новий метод відновлення відсутніх даних.
Найбільшою проблемою відомих методів відновлення відсутніх даних є лише обробка структурованих даних, тоді,
коли напівструктуровані та неструктуровані дані домінують у реальних прикладних задачах сучасного світу. Крім того, дуже
важливо аналізувати приховані залежності в наборі даних, а також враховувати характер набору даних та передбачати
відсутність даних для кожного джерела даних окремо. Тому, перспективним є використання парадигми великих даних для
попередньої обробки та обробки інформації з різних джерел, що складається з безперервних числових даних та
категоріальних даних. Тим не менше, природа відсутніх даних у різних джерелах даних теж різна. Отже, основною ідеєю є
аналіз даних з різних джерел на основі специфіки та природи цих джерел. Ідея запропонованого методу обчислення
відсутніх даних полягає в обробці структурованих та напівструктурованих даних на основі ієрархії об’єктів, а також набору
функціональних залежностей та розробки правил асоціації. Це питання дуже важливе для інтерфейсів великих даних,
оскільки більша частина інформації доступна в напівструктурованому вигляді. Запропонований метод створює додаткові
значення даних за допомогою доменних та функціональних залежностей на основі декількох методів обчислення та додає ці
значення до наявних навчальних даних.

Опубліковано
2021-02-04
Розділ
ІНФОКОМУНІКАЦІЙНІ ТЕХНОЛОГІЇ, АВТОМАТИЗАЦІЯ ТА ОБЧИСЛЮВАЛЬНА ТЕХНІКА