Современные приложения ориентированы на облачные сервисы для достижения лучшей производительности, географической репликации и снижения стоимости владения. Следуя существующим концепциям облачных сервисов, данное исследование использует богатые телеметрические данные и отображает рабочую нагрузку, выполняемую с использованием базы данных SQLкомпании Azure. Основной целью данного исследования является потенциальное улучшение как сервиса, так и обслуживания клиентов с помощью контролируемой платформы. Автоматическая система поиска неисправностей в базе данных предназначена для обнаружения проблем в реляционной облачной базе данных и обеспечения соответствующего анализа причин возникновения неполадок с целью сокращения времени и затрат на ручной поиск и решение данных проблем. Эта система была внедрена поверх платформы Microsoft Azure. Она основана на научных моделях общих и категориальных статистических данных, которые были разработаны и построены после тщательного анализа собранных телеметрических данных. Окончательная первопричина каждого текущего вопроса в сервисе Azure собирается после анализа результатов моделей с помощью экспертной системы. Результаты оценки показывают, что постоянное совершенствование инфраструктуры сократило время обработки примерно в 2 раза, в то время как количество интервалов увеличилось в два раза, что можно считать общим улучшением примерно в 4 раза.
Modern applications are focused on cloud services to achieve better performance, geographic replication and lower cost of ownership. Following the modern concepts of cloud services, this study draws on rich telemetry data and displays the workload performed using the Azure SQL database. The main purpose of this research is the potential improvement both of service and customer assistance employing a controlled platform. The automatic database troubleshooting system is designed to detect problems in a relational cloud database and analyze appropriately the sources of problems in order to reduce the time and cost of manual search and solution of these problems. This system was implemented on top of the Microsoft Azure platform. It is based on scientific models of general and categorical statistical data, which were developed and constructed after a thorough examination of the collected telemetry data. The final root cause of each current issue in the Azure service is gathered after analyzing the results of the models by means of an expert system. The evaluation results show that the continuous enhancement of the infrastructure has reduced the processing time, approximately, by 2 times while the number of intervals has doubled, which can be considered an overall improvement of 4 times, approximately.