РОЗРОБКА МОДУЛЬНОГО КОНВЕЄРА УНІФІКАЦІЇ ДАНИХ ДЛЯ АНАЛІТИКИ ЕКОЛОГІЧНИХ ЗАГРОЗ У РЕАЛЬНОМУ ЧАСІ
DOI:
https://doi.org/10.35546/kntu2078-4481.2025.3.2.26Ключові слова:
програмна система, аналітика в реальному часі, уніфікація даних, H3, DuckDB, матеріалізовані подання, моніторинг довкілляАнотація
У статті представлено результати дослідження та розробки модульної програмної системи для аналітики екологічних ризиків у реальному часі, що ґрунтується на концепції уніфікованого приймання подій та застосуванні шестикутної просторової агрегації H3. Актуальність роботи зумовлена високим рівнем гетерогенності первинних джерел даних, серед яких: відкриті аналітичні звіти (OSINT), супутникові детекції пожеж (FRP), вимірювання потужності дози іонізуючого випромінювання та метеорологічні поля. Зазначені джерела оперують різними часовими шкалами, одиницями вимірювання та схемами подання даних. Це призводить до виникнення труднощів у процесі їх інтеграції, зокрема, до зміщення часових міток, невідповідності одиниць, конфліктів структур та дублювання подій, що ускладнює оперативне отримання узгоджених результатів і уповільнює оновлення інформаційних шарів. Метою дослідження визначено побудову компактного та відтворюваного програмного конвеєра для обробки даних, здатного перетворювати змішані потоки подій у добові агреговані шари ризику та попиту із затримкою на рівні секунд. Запропонована архітектура включає три основні компоненти. Першим є інтерфейс плагінів-адаптерів джерел (PSAI), що забезпечує відображення кожного джерела у стандартизовану таблицю подій; адаптери відповідають лише за специфічний розбір вхідних даних, тоді як подальша логіка уніфікації є спільною. Другим компонентом виступає модуль детермінованої уніфікації подій (DEH), який переводить усі часові позначки у формат UTC, нормалізує одиниці вимірювання, верифікує координати та гарантує ідемпотентні вставки, що дозволяє безпечно здійснювати повторні прогони та коректно враховувати запізнілі дані. Третій компонент – запитний шар, орієнтований на застосування просторово-часової агрегації за принципом H3-first: точки FRP агрегуються у 15-хвилинні інтервали на рівні H3 r10 із використанням оператора MAX(FRP) для уникнення накладань, після чого добові зведення на рівні H3 r7 інтегрують дані FRP з подіями OSINT, сигналами радіаційного моніторингу та метеопоказниками, зокрема, проксі-індикатором напрямку та швидкості вітру, для формування комплексного індексу ризику. Реалізація системи здійснена у середовищі DuckDB без залучення окремих серверів чи мережевих сервісів, що спрощує інфраструктуру та знижує вартість експлуатації. Використаний підхід забезпечує явність та тестованість інтеграційних контрактів: інтерфейс PSAI фіксує правила приймання даних, модуль DEH – стандартизацію часу та одиниць вимірювання, ієрархія H3 – просторову узгодженість, а DuckDB – можливість матеріалізації результатів засобами стандартного SQL. Проведені експерименти підтвердили високу ефективність запропонованого рішення: оновлення даних виконуються за долі секунди навіть на потужності обладнання рівня ноутбука; дублювання супутникових FRP-детекцій скорочується приблизно на 99 %; добові експорти зведень мають обсяг менше одного мегабайта, що істотно спрощує їх передачу та зберігання. Таким чином, розроблена система поєднує гнучкість модульної архітектури, відтворюваність інтеграційних процедур та ефективність обчислювальної моделі, що створює підґрунтя для практичного використання у сфері моніторингу довкілля, підтримки рішень з управління ризиками та розвитку сервісів екологічної аналітики.
Посилання
Raasveldt M., Mühleisen H. (2019). DuckDB: an in-process analytical database. Proceedings of the 2019 ACM SIGMOD International Conference on Management of Data (Demo). URL: https://duckdb.org (access date: 03.09.2025).
Uber Engineering. (2018). H3: Uber’s Hexagonal Hierarchical Spatial Index. URL: https://www.uber.com/blog/h3/ (access date: 03.09.2025).
NASA LANCE. (2023). Fire Information for Resource Management System (FIRMS). URL: https://firms.modaps.eosdis.nasa.gov (access date: 03.09.2025).
Schroeder W., Oliva P., Giglio L., Csiszar I. (2014). The VIIRS 375 m active fire detection data suite. Remote Sensing of Environment, vol. 143, pp. 85–96. https://doi.org/10.1016/j.rse.2013.12.008 (access date: 03.09.2025).
European Commission. EURDEP – European Radiological Data Exchange Platform. URL: https://rem.jrc.ec.europa.eu (access date: 05.09.2025).
SaveEcoBot. Radiation map & data access. URL: https://www.saveecobot.com/en (access date: 03.09.2025).
OpenWeather. OpenWeatherMap API. URL: https://openweathermap.org/api (access date: 03.09.2025).
Boeing G. (2017). OSMnx: New methods for acquiring, constructing, analyzing, and visualizing complex street networks. Computers, Environment and Urban Systems, vol. 65, pp. 126–139. https://doi.org/10.1016/j.compenvurbsys.2017.05.004 (access date: 03.09.2025).
Valhalla. Open Source Routing Engine. URL: https://github.com/valhalla/valhalla / (access date: 05.09.2025).
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License.






