В статье предложен метод оптимизации обработки большого объема данных, предназначенный для диагностирования состояния оборудования сложных технических систем. Такое диагностирование позволяет повысить эффективность анализа неисправностей в технических системах с целью их скорейшего устранения. Это достигается за счет прогнозирования отказа критически уязвимых систем, способных вывести из эксплуатации транспортное средство, либо привести к последствиям, угрожающим жизни людей. Метод реализован в информационной системе, основанной на наборе алгоритмических согласованностей, направленных на идентификацию информации в высоконагруженных сетях и ее обработку в моменты передачи от сложных технических систем к центральному хранилищу данных. Функционирование информационной системы основывается на применении гибридных алгоритмов поиска и сортировки данных, концепции Data Mining, а также алгоритмов для работы с большими объемами данных. Методы отбора и распределения данных выполняются на уровне контроля показаний датчиков технической системы и распределяются до момента записи в хранилище данных. Это позволяет идентифицировать информацию, необходимую для построения прогноза отказа критически уязвимых технических систем. С целью увеличения скорости обработки данных, применяется язык разработки С/С++, который позволяет взаимодействовать информационной системе с датчиками контроля показаниями. В качестве хранилища данных используются реляционная и нереляционная базы данных, позволяющие сохранять большие массивы информации и обеспечивать постоянных доступ к данным. Разработанная информационная система может быть использована в транспортных средствах с используемой системой контроля показаний в реальном времени.Ключевые слова: анализ данных, большие данные, компьютерные системы, базы данных, модульное программное обеспечение, Big Data, Data Mining, коллекции данных, гибридные хранилища данных
ВведениеНадежное функционирование современных, например, судовых сложных технических систем (СТС) [1-4] часто основывается на использовании удаленных программных решений по прогнозированию их работоспособности [5,6].Для решения подобных задач используются клиент-серверные архитектуры, на основе сервера баз данных (БД), применяемых для хранения полученных данных, а также серверные анализаторы данных. Использование такой архитектуры позволяет выявлять неисправности в работе технической системы на ранних этапах ее выхода из строя, а также уменьшить вероятность отказа технической системы при несвоевременном ее обслуживании. Работоспособность клиент-серверного хранилища данных зависит от модели и структуры хранения данных. Использование реляционной модели относится к классической нотации для разработки клиент-серверных