Надіслати статтю
вул. Інститутська 11, м. Хмельницький, 29016

МЕТОД КОНСТРУЮВАННЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ  ЗГІДНО АНАЛІЗУ ПОМИЛОК SQL-ЗАПИТІВ

A METHOD OF SOFTWARE DESIGN ACCORDING TO THE ANALYSIS OF SQL QUERY ERRORS

Сторінки: 302-307. Номер: №3, 2023 (321) 
Автори:
ПРАВОРСЬКА Н.І.
Хмельницький національний університет
ORCID ID: 0000-0001-6001-3311
e-mail: margana2000007@gmail.com
ЯШИНА О.М.
Хмельницький національний університет
ORCID: 0000-0001-7816-1662
e-mail: ipzhnu@gmail.com
НЕТРЕБА І.В.
Хмельницький національний університет
ORCID: 0009-0009-1366-2429
e-mail: crfichyga@gmail.com
ДОМІНА А.Р.
Хмельницький національний університет
ORCID: 0009-0002-2170-5299
e-mail: anastasiya.domina.2015@gmail.com
КИРИЧЕНКО О.М.
ORCID: 0009-0006-4149-212X
PRAVORSKA NATALYA , YASHYNA OKSANA , NETREBA IHOR , DOMINA ANASTASIYA, KYRYCHENKO OLEXANDER
Khmelnytskyi National University, Ukraine
DOI: https://www.doi.org/10.31891/2307-5732-2023-321-3-302-307

Анотація мовою оригіналу

У статті наведено результати дослідження аналізу методів виявлення семантичних помилок для декларативної мови програмування – результатів аналізу Брасса і Голдберга, які здійснили аналіз виявивши, що бувають не тільки синтаксичні, але й семантичні помилки, які впливають на роботу програми. Подано список семантичних помилок, які часто зустрічаються під час створення запитів, для аналізу семантичних помилок використовувався набір з 191 834 із зібраних запитів більше ніж 36 000 містили помилку. Для кожної помилки здійснено опис проблеми, наведено приклад типічної помилки, та шляхи її вирішення, можливий варіант реалізації інструменту для їх виявлення для подальшого застосування. Аналізуючи поширеність семантичних помилок у SQL-запитах, виявилось, що найбільше поширеними помилками є відсутність предикатів сполуки, за якими слідують постійні помилки вихідного стовпця, та непотрібні аргументи лічильника. Також було виявлено, що спільна поява семантичних проблем у SQL-запитах для всього набору даних досить низька, що вказує на те, що запити рідко містять більше однієї семантичної помилки. Найбільша схожість між двома проблемами становить 20% для непотрібного аргументу підрахунку та непотрібного угруповання по атрибуту. Також було виявлено, що більш складні запити з точки зору кількості використовуваних сполук, предикатів та функцій, як правило, страждають від більшої кількості семантичних помилок, цікаве відкриття, яке може бути використане в майбутньому як метрика для раннього прогнозування того, чи буде запит може містити семантичні помилки або ні. На сьогоднішній день в Інтернеті багато ресурсів, які містять багато запитів з проблемами такого типу. Тому розробники які ознайомляться з даним дослідженням та з описаними вище проблемами, оцінять проблему та будуть виділяти більше часу для виявлення цих проблем, щоб усунути їх відразу після їх виявлення, а не в процесі роботи програми.
Ключові слова: помилки, SQL, семантичні помилки, декларативна мова програмування, аналіз, метод, програмне забезпечення, конструювання програмного забезпечення, програмування Інтернет, веб-технології.

 Розширена анотація англійською  мовою

The article presents the results of the analysis of methods for detecting semantic errors for a declarative programming language – the results of the analysis by Brass and Goldberg, who performed the analysis and discovered that there are not only syntactic, but also semantic errors that affect the operation of the program. A list of frequently encountered semantic errors during query generation is provided, a set of 191,834 of the collected queries was used to analyze semantic errors, more than 36,000 contained an error. For each error, a description of the problem is made, an example of a typical error is given, and ways to solve it, a possible option for implementing a tool for their detection for further use. Analyzing the prevalence of semantic errors in SQL queries, the most common errors were found to be missing join predicates, followed by persistent source column errors, and unnecessary counter arguments. It was also found that the co-occurrence of semantic problems in SQL queries for the entire data set is quite low, indicating that queries rarely contain more than one semantic error. The highest similarity between the two problems is 20% for an unnecessary count argument and an unnecessary grouping by attribute. It was also found that more complex queries in terms of the number of compounds, predicates and functions used tended to suffer from more semantic errors, an interesting finding that could be used in the future as a metric to early predict whether a query might contain semantic errors or not. Today, there are many resources on the Internet that contain many queries with problems of this type. Therefore, developers who read this study and the problems described above will appreciate the problem and will allocate more time to identify these problems in order to eliminate them immediately after they are discovered, and not during the operation of the program.
Keywords: errors, SQL, semantic errors, declarative programming language, analysis, method, software, software design, Internet programming, web technologies.

Post Author: Горященко Сергій

Translate