Resum en El uso de los sistemas de captura de imágenes para las computadoras es cada vez más común. Por otro lado, el procesamiento y análisis de video digital puede tener aplicaciones interesantes en el área de la comunicación hombre-máquina. Pensando en este desarrollo científico-tecnológico, este trabajo aborda el problema de la comunicación "amigable" entre la computadora y algunos seres humanos minusválidos que requieren de facilidades, por lo que se desarrolló un lenguaje gestual con el que la persona puede indicar a la máquina algunas acciones simples a seguir por medio de sus manos. Se definió un alfabeto muy limitado de gestos que la máquina puede interpretar y se pensó también en no utilizar guantes instrumentados, ya que son costosos y estorbosos. Por lo tanto, el número de gestos tiene que ser reducido y deben mostrarse relativamente burdos; dada la falta de precisión que se tendrá durante su captura con una cámara digital común y corriente. Una vez realizados y capturados los gestos, se procede a su segmentación con el propósito de aislarlos del resto de la escena captada por la cámara y poder efectuar su interpretación de una manera más sencilla. Los gestos están provistos de movimiento, de tal modo que para aislarlos se puede explotar esta información recurriendo a un algoritmo de segmentación basada en el movimiento. Logrando el aislamiento se lleva a cabo su interpretación de una manera más sencilla y rápida al obtener una máscara binaria del gesto, la cual se proyecta enseguida en dos ejes ortogonales x y y. Los perfiles del gesto obtenidos por la proyección enxyy, se utilizan como una especie de apuntadores; de esta manera se puede buscar en una base de datos previamente estructurada y guardada en memoria. Los resultados obtenidos hasta ahora son satisfactorios, aunque el número de gestos definidos es muy reducido y bastante distintos unos de otros, lo que facilita su interpretación. Por lo anterior este trabajo consiste en ampliar el tam año del alfabeto y aumentar la complejidad de los gestos para tener una aplicación más realista. Descriptores: interfaz gestual, interacción hombre-máquina, interpretación automática de gestos, segmentación de objetos no rígidos, análisis de movimiento de objetos no rígidos, segmentación de objetos en movimiento.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.