Abstract. In the paper, the basic idea of Bottle Neck Feature(BNF) and the process how to extract BNF are presented. In this study, we apply BNF for Vietnamese speech recognition with five layers MLP network of different sizes for the first hidden layer. Input features to extract BNF feature are Perceptual Linear Prediction(PLP) and Mel Frequency Cepstral Coeffcient(MFCC). The experiments are carried out on a data set of VOV(Voice of Vietnam).The results show that using BNF for Vietnamese speech recognition, a WER(Word Error Rate)is improved up to 6-7% comparing to the baseline system, and MFCC feature gives a better result than PLP feature.Key words. BNF, Bottle Neck Feature, Vietnamese speech recognition, HMM-GMM.
GIỚI THIỆUPhương pháp trích chọn các đặc trưng của tiếng nói sử dụng mạng neural đang trở thành một phần quan trọng trong hệ thống nhận dạng tiếng nói [1], phương pháp này nhằm tận dụng ưu điểm phân lớp của mạng neural đồng thời khắc phục một trong các nhược điểm của mô hình Markov ẩn (HMM-Hidden Markov Model), mô hình HMM không mô hình hóa được các đặc tính phụ thuộc thời gian của tín hiệu tiếng nói do HMM giả thiết rằng mỗi trạng thái hiện tại chỉ phụ thuộc vào trạng thái ngay trước nó [2,3]. Đã có nhiều phương pháp được đưa ra nhằm khắc phục nhược điểm trên của HMM, một phương pháp được sử dụng phổ biến là bổ sung thêm các vector đặc trưng lân cận với vector đặc trưng đang xét tại thời điểm t, tức là tổ hợp nhiều hơn một khung dữ liệu (frame) để đưa vào huấn luyện HMM tại
The ability to infer undefined information/knowledge by similar inference is one of the natural abilities of human. The paper aims to study, simulate the above ability. The IRS model searches for undefined information/knowledge from an unfamiliar domain using similarities from familiar domains, through query. Because the semantic relations or similarities are not explicitly stated in the query, the IRS model is called an implicit semantic entity search model. The paper presents extracting, clustering, ranking techniques and a model of implicit relational search on Vietnamese language domain.
Since the 1980s, the concept lattice was studied and applied to the problems of text mining, frequent itemset, classification, etc. The formal concept analysis - FCA is one of the main techniques applied in the concept lattice. FCA is a mathematical theory which is applied to the data mining by setting a table with rows describing objects and columns describing attributes, with relationships between them, and then sets up the concept lattice structure. In the area of information retrieval, FCA considers the correlation of objects-attributes the same as those of documents-terms. In the process of setting up the lattice, FCA defines each node in the lattice as a concept. The algorithm for the construction of concept lattice will install a couple on each node, including a set of documents with common terms, and a set of terms which co-occurs in documents. In a larger scale, each concept in the lattice could be recognized as a couple of questions - answers. In the lattice, the action of browsing up or down of nodes will allow approaching more general concepts or more detail concepts, respectively.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.