2019
DOI: 10.1007/978-3-030-26061-3_20
|View full text |Cite
|
Sign up to set email alerts
|

Method for Multimodal Recognition of One-Handed Sign Language Gestures Through 3D Convolution and LSTM Neural Networks

Help me understand this report

Search citation statements

Order By: Relevance

Paper Sections

Select...
1
1
1
1

Citation Types

0
1
0
3

Year Published

2021
2021
2024
2024

Publication Types

Select...
5
3
1

Relationship

2
7

Authors

Journals

citations
Cited by 9 publications
(6 citation statements)
references
References 30 publications
0
1
0
3
Order By: Relevance
“…However, it is worth noting that there is a problem with each signer showing gestures at different speeds. That is why almost all modern gesture recognition methods are reduced to processing a video sequence that provides information about the movements of any part of the human body, for example, a hand or both hands in time and space [ 129 , 130 , 131 , 132 , 133 , 134 ]. Additionally, the presence of complex background situations on video frames that dynamically change leads to rather serious recognition problems due to insufficient use of the spatial features: hand gestures are relatively small in size compared to the entire background environment.…”
Section: Methodsmentioning
confidence: 99%
“…However, it is worth noting that there is a problem with each signer showing gestures at different speeds. That is why almost all modern gesture recognition methods are reduced to processing a video sequence that provides information about the movements of any part of the human body, for example, a hand or both hands in time and space [ 129 , 130 , 131 , 132 , 133 , 134 ]. Additionally, the presence of complex background situations on video frames that dynamically change leads to rather serious recognition problems due to insufficient use of the spatial features: hand gestures are relatively small in size compared to the entire background environment.…”
Section: Methodsmentioning
confidence: 99%
“…Разработаны и исследованы интегральные кодер-декодер модели для распознавания слитной русской речи с использованием коннекционной временной классификации с применением различным типов нейронные сетей, таких как Highway, ResNet, DenseNet, DiracNet, Transformer, обученные с использованием методов аугментации обучающих речевых данных, показавшие большую скорость распознавания по сравнению со стандартной системой распознавания речи [65,66]. Разработан метод многомодального (цветной видеопоток и карта глубины) распознавания статических и динамических одноручных жестов русского жестового языка с помощью трехмерной сверточной глубокой нейронной сети с долгой кратковременной памятью (LSTM), которая позволяет извлекать как кратковременные, так и долгосрочные пространственно-временные характеристики жестов [67,68]. Разработан метод распознавания эмоций в диалоговой речи на основе иерархичной модели рекуррентной нейронной сети с длинной кратковременной памятью (RNN-LSTM), а также метод адаптации данных, позволяющий эффективно использовать кросскорпусную экспериментальную установку, что дает возможность увеличить количество обучающих данных и сделать модель более универсальной [69 -72].…”
Section: рм юсупов дв бакурадзе санкт-петербургский институт информат...unclassified
“…Результаты современных исследований дают основания считать, что методы машинного обучения, основанные на глубоких нейронных сетях, по сравнению с традиционными классическими подходами [46], которые базируются на линейных классификаторах (например, метод опорных векторов) имеют определенную специфику. Они показывают хорошие результаты в решении задач сегментации, классификации, а также распознавании как статических, так и динамических жестов.…”
Section: заключениеunclassified