STATISTICAL DATA ANALYSIS ON THE COMPUTING RESOURCES USE OF UNIVERSITY COMPUTERS BY MEANS OF PYTHON

Authors

DOI:

https://doi.org/10.35546/kntu2078-4481.2023.1.20

Keywords:

statistical analysis, Python, Pandas, Matplotlib, Seaborn

Abstract

The article presents a study of tools for implementing primary statistical data analysis on the use of university network computing resources. Modern researches on the data analysis on the computing resources use and ways to implement results of them are studied in it. Moreover, peculiarities of monitoring the use of higher education institutions computing resources are described. Also, features of malware consumption of computing resources are described in this research. The article discusses a possibility of using Python tools for analysing the hardware and technical state of a university network and the computing resources consumption. Thus, it proposes an architecture of a database for storing the obtained data on the use of computing resources. In addition, a description of fields that store the main data is given: the use of the central and graphics processors, the load of RAM, and the data storage device filling. The authors analysis possibilities of the Pandas library in a context of primary statistical data analysis on the use of computing resources. Moreover, features of the DataFrame data storage structure are investigated in this research. Therefore, article describes methods of loading data from the database into the DataFrame structure and means of dynamic data display with Jupyter Notebook. Also, the authors consider a method of implementing primary statistical analysis, namely the calculation of: minimum, maximum, average, quartiles, mode, median. In addition, a description of the use of the Matplotlib and Seaborn libraries for visualizing the results is given. The publication considers possibility of using histograms to compare monitoring results for several different days and building a scatter plot based on the obtained data on the use of computing resources. The main advantages of using the developed software are highlighted: the ability to determine the interrelationships of indicators, diagnose the presence of malware and predict the necessary computing resources for the correct operation of the university network. Further ways of development of the proposed software for statistical data analysis on the use of computing resources of higher education institutions` computers are determined.

References

Leonardi L., Bello L. Lo, Agliano S. Priority-based bandwidth management in virtualized software-defined networks. Electronics. Vol. 9, Issue 6. P. 1-6.

Somani G., Chaudhary S. Application Performance Isolation in Virtualization. 2009 IEEE International Conference on Cloud Computing(2009). DOI:10.1109/CLOUD.2009.78. P. 41–48.

Кандиба І. О., Горбань Г. В., Фісун М. Т., Ткаченко М. П. Дослідження апаратно-технічного стану локальної мережі закладу вищої освіти засобами мови Python. Вчені записки Таврійського національного університету імені В. І. Вернадського, 2022. № 3 т.33 С. 44 -49.

Чупілко Т., Чупілко О., Мормуль М. Проектування і програмна реалізація автоматизованої системи відвідуваності та аналізу даних в закладах освіти. Інформаційні технології та комп’ютерна інженерія. Випуск. 56, Том 1. 2023. С. 35–43.

Aidan J. S., Verma H. K., Awasthi L. K. Comprehensive survey on petya ransomware attack. 2017 International Conference on Next Generation Computing and Information Systems (ICNGCIS)(2017). P. 122–125.

Bantilan N. Pandera: Statistical data validation of pandas dataframes. Proceedings of the Python in Science Conference (SciPy)(2020). P. 116–124.

Teoh T. T., Rong Z. Python for Data Analysis. Artificial Intelligence with Python. Springer, 2022. P. 107–122.

Bisong E., Matplotlib and seaborn. Building Machine Learning and Deep Learning Models on Google Cloud Platform: A Comprehensive Guide for Beginners. 2019. P. 151–165.

Горбань Г. В., Кандиба І. О., Антіпова К. О., Кірей К. О. Первинний та візуальний аналіз даних спортивних результатів з академічного веслування засобами мови python з використанням бібліотек PANDAS, MATPLOTLIB ТА SEABORN. Таврійський науковий вісник. Серія: Технічні науки. Том 3. С. 27–37.

Несвіт М. І., Несвіт К. В. Розв’язання математичних задач сучасними мовами програмування та технологіями. Модернізація вищої освіти в україні та проблеми управління якістю підготовки фахівців у технічному університеті : зб. матеріалів університетської. наук.-метод. конф. ХНУБА. Харків. C. 120–123.

Published

2023-06-28