СТАТИСТИЧНИЙ АНАЛІЗ ДАНИХ ПРО ВИКОРИСТАННЯ ОБЧИСЛЮВАЛЬНИХ РЕСУРСІВ КОМП’ЮТЕРІВ ЗАКЛАДУ ВИЩОЇ ОСВІТИ ЗАСОБАМИ PYTHON

Автор(и)

DOI:

https://doi.org/10.35546/kntu2078-4481.2023.1.20

Ключові слова:

статистичний аналіз, Python, Pandas, Matplotlib, Seaborn

Анотація

В статті представлено дослідження інструментарію для реалізації первинного статистичного аналізу даних про використання обчислювальних ресурсів мережі закладу вищої освіти (ЗВО). Досліджено сучасні роботи, присвячені аналізу даних про використання обчислювальних ресурсів, та шляхи впровадження результатів цих досліджень. Окрім того, описано специфіку моніторингу використання обчислювальних ресурсів ЗВО. Наведено опис особливостей споживання обчислювальних ресурсів мережі шкідливим ПЗ. Досліджено можливості застосування інструментарію мови Python для аналізу апаратно-технічного стану мережі ЗВО та споживання обчислювальних ресурсів. Запропоновано архітектуру бази даних (БД) для зберігання отриманих в результаті моніторингу даних про використання обчислювальних ресурсів і наведено опис полів, де міститиметься основна інформація: використання центрального та графічного процесорів, завантаженість оперативної пам’яті, заповнення накопичувача даних. Більш того, проаналізовано можливості бібліотеки Pandas в контексті первинного статистичного аналізу даних про використання обчислювальних ресурсів. Таким чином, було визначено особливості структури для зберігання даних DataFrame. Описано методи завантаження даних з БД до структури DataFrame. Розглянуто засоби динамічного відображення даних з допомогою Jupyter Notebook. Представлено метод реалізації первинного статистичного аналізу, а саме розрахунку: мінімального, максимального, середнього значень, квартилів, моди і медіани. Наведено опис використання бібліотек Matplotlib та Seaborn для візуалізації отриманих результатів. Розглянуто можливість використання гістограм для порівняння результатів моніторингу за кілька різних днів. Розглянуто можливість побудови діаграми розсіювання на основі отриманих даних про використання обчислювальних ресурсів. Виділено основні переваги застосування розробленого ПЗ: можливість визначення взаємозв’язків показників, діагностування наявності шкідливого ПЗ та прогнозування необхідних обчислювальних ресурсів для коректної роботи мережі ЗВО. Визначено подальші шляхи розвитку запропонованого ПЗ статистичного аналізу даних про використання обчислювальних ресурсів комп’ютерів ЗВО.

Посилання

Leonardi L., Bello L. Lo, Agliano S. Priority-based bandwidth management in virtualized software-defined networks. Electronics. Vol. 9, Issue 6. P. 1-6.

Somani G., Chaudhary S. Application Performance Isolation in Virtualization. 2009 IEEE International Conference on Cloud Computing(2009). DOI:10.1109/CLOUD.2009.78. P. 41–48.

Кандиба І. О., Горбань Г. В., Фісун М. Т., Ткаченко М. П. Дослідження апаратно-технічного стану локальної мережі закладу вищої освіти засобами мови Python. Вчені записки Таврійського національного університету імені В. І. Вернадського, 2022. № 3 т.33 С. 44 -49.

Чупілко Т., Чупілко О., Мормуль М. Проектування і програмна реалізація автоматизованої системи відвідуваності та аналізу даних в закладах освіти. Інформаційні технології та комп’ютерна інженерія. Випуск. 56, Том 1. 2023. С. 35–43.

Aidan J. S., Verma H. K., Awasthi L. K. Comprehensive survey on petya ransomware attack. 2017 International Conference on Next Generation Computing and Information Systems (ICNGCIS)(2017). P. 122–125.

Bantilan N. Pandera: Statistical data validation of pandas dataframes. Proceedings of the Python in Science Conference (SciPy)(2020). P. 116–124.

Teoh T. T., Rong Z. Python for Data Analysis. Artificial Intelligence with Python. Springer, 2022. P. 107–122.

Bisong E., Matplotlib and seaborn. Building Machine Learning and Deep Learning Models on Google Cloud Platform: A Comprehensive Guide for Beginners. 2019. P. 151–165.

Горбань Г. В., Кандиба І. О., Антіпова К. О., Кірей К. О. Первинний та візуальний аналіз даних спортивних результатів з академічного веслування засобами мови python з використанням бібліотек PANDAS, MATPLOTLIB ТА SEABORN. Таврійський науковий вісник. Серія: Технічні науки. Том 3. С. 27–37.

Несвіт М. І., Несвіт К. В. Розв’язання математичних задач сучасними мовами програмування та технологіями. Модернізація вищої освіти в україні та проблеми управління якістю підготовки фахівців у технічному університеті : зб. матеріалів університетської. наук.-метод. конф. ХНУБА. Харків. C. 120–123.

##submission.downloads##

Опубліковано

2023-06-28