Развитие эффективных методов компьютерного зрения постоянно находится в центре исследований многих учёных, так как они дают возможность повысить скорость и эффективность решения задач в различных отраслях промышленности: картография, робототехника, системы виртуальной и дополненной реальности, системы автоматизированного проектирования. Значительную перспективу имеют современные исследования, методы и алгоритмы решения задач стереозрения, распознавания образов, в том числе те, которые работают в режиме реального времени. Одной из важных задач стереозрения является задача сопоставления карт глубины для получения трёхмерной модели сцены, но есть некоторые нерешенные вопросы процесса сопоставления карт глубин для крупномасштабных сцен окружающей среды, полученных беспилотными летательными аппаратами, а именно: низкое разрешение по глубине из-за большого расстоянию сцены от камеры, и проблема наличия шума вследствие дефектов камеры. Указанные проблемы затрудняют обнаружение ключевых точек на изображениях для их дальнейшего сопоставления. В представленной работе предлагается подход к определению ключевых точек на смежных картах глубин на основе поиска ключевых точек, находящихся в близких областях пространства параметров. Подход базируется на поиске множества ключевых точек в двух последовательных видеокадрах и нахождении среди них пар точек таких, что каждая точка пары соответствует одной и той же точке сцены на входном изображении. Соответствующие пары ключевых точек, которые локализованы детектором признаков, могут быть ложно-положительными. Предложенный алгоритм может устранить такие пары точек путём определения преобладающего направления движения ключевых точек в локальных участках изображения, а также алгоритм даёт возможность определения центра смещение точки обзора камеры, чем обеспечивает лучшую оценку положения съёмочного оборудования. Результаты работы реализованы в виде программного приложения и протестированы на видеоматериалах, полученных беспилотным летательным средством Ключевые слова: компьютерное зрение; стререозрение; распознавание образов; карта глубины; трёхмерная модель сцены; сопоставление ключевых точек; детектор признаков; беспилотный летательный аппарат
На данный момент существует большое количество задач по автоматизированной обработке многомерных данных, например, классификация, кластеризация, прогнозирование, задачи управления сложными объектами. Соответственно, возникает необходимость в развитии математического и алгоритмического обеспечения для решения возникающих задач. Целью исследования является развитие алгоритмов классификации точечных множеств на основе их пространственного распределения. В работе предлагается рассматривать данные как точки в многомерном метрическом пространстве. В работе рассмотрены подходы к описанию характеристик точечных множеств в пространствах высокой размерности и предлагается подход к описанию точечного множества на основе сигнатур, которые представляют собой характеристику заполненности точечного множества на основе расширения понятия пространственного хеширования. Обобщенный подход к вычислению сигнатур точечных множеств заключается в разбиении пространства, занимаемого множеством на регулярную сетку с помощью метода пространственного хеширования, вычисления геометрических характеристик множества в полученных ячейках и определения наиболее заполненных ячеек по каждому из пространственных измерений. Предлагается новый подход к классификации на основе сигнатур множества, который заключается в нахождении сигнатур для точек с известным значением принадлежности к некоторым классам, а для новых точек вычисляется расстояние от хеша точки до сигнатуры каждого из известных множеств, на основе чего определяется наиболее вероятный класс точки. В качестве используемых метрик предлагаются Евклидово расстояние и метрика городских кварталов. В работе проведён сравнительный анализ используемых метрик с точки зрения точности классификации. Преимуществами предложенного подхода являются простота вычислений и высокая степень точности классификации для равномерно распределенных точек. Представленный алгоритм реализован в виде программного приложения на языке Python с использованием библиотеки NumPy. Также рассмотрены варианты использования предложенного подхода для задач с нечисловыми данными, такими как строковые и булевы значения. Для таких данных предложено использовать метрику Хэмминга, проведённые эксперименты показали работоспособность алгоритма для таких типов данных Ключевые слова: пространственное хеширование; классификация; точечное множество; метрическое пространство; сигнатура точечного множества; Евклидово расстояние; расстояние городских кварталов; метрика Хэмминга
УДК 004.92 Д.В. ВОРОНЦОВА, А.О. ДАШКЕВИЧ, Т.В. ГРИЩЕНКО Національний технічний університет «Харківський політехнічний інститут» ПІДХІД ДО ВІЗУАЛІЗАЦІЇ ВПРАВ ДЛЯ М'ЯЗІВ ОБЛИЧЧЯ Сьогодні IT технології не тільки надають змогу збирати, опрацьовувати, зберігати інформацію, але і демонструвати її в інтересах користувачів. Одним із способів презентації інформації є комп'ютерна графіка. За допомогою комп'ютерної графіки з'явилась можливість унаочнити те, що неможливо побачити у реальному житті: зазирнути, роздивитись, навіть торкнутись речей, які раніше були представлені тільки на ілюстраціях. На сьогодні існує велика кількість програм, додатків, Інтернет ресурсів, цифрових атласів, відео, що презентують пристрої складних механізмів, явища природи, анатомію людини, виконання фізичних вправ і т.п. Не дуже розвиненою сферою, з точки зору цифрового унаочнення, виявилась сфера фейсбілдінгу. Вправи гімнастики обличчя, презентовані на малюнках, або представлені на реальних відео які не демонструють м'язи, що навантажені. Необхідно відмітити: розуміння внутрішнього розподілу зусиль на відповідні м'язи при виконанні вправ призводить до кращого результату та допомагає уникнути помилок. В роботі наведено загальну схему 3D моделювання, текстурування, рігу, анімації та візуалізації для створення базової моделі інструктора фейсбілдінгу із застосуванням таких програмних пакетів, як Autodesk Maya, Zbrush, Adobe Photoshop. Розроблено спосіб 3D унаочнення на анатомічному рівні певних груп м'язів обличчя та шийного відділу. За базові приймались вправи спортивно-оздоровчого комплексу для обличчя, розроблених лікарем-косметологом центру лазерних технологій. На основі розробленої моделі, за запропонованим підходом унаочнення, з урахуванням рекомендацій лікаря-косметолога створені демонстраційні відео виконання фізичних вправ фейсбилдінгу засобами Sony Vegas Pro з аудіо супроводженням. Початкові кадри демонструють виконання вправ моделі з реалістичною текстурою. Наступні кадри показують обліт камери й зміну матеріалу моделі, а саме модель інструктора приймає білий матовий колір, а м'язи, що навантажені, підсвічуються червоним кольором. Така зміна матеріалів надає змогу більш інформативно представити виконання вправ. Отримані відеоролики можуть використовуватись у медичній практиці та косметології для демонстрації вправ м'язів шийного відділу та обличчя. Ключові слова: 3D модель, фейсбілдінг, унаочнення роботи м'язів, анімація, демонстраційне відео, візуалізація, м'язи шийного відділу та обличчя.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.