Loanwords, such as Anglicisms, are a challenge in German speech recognition. Due to their irregular pronunciation compared to native German words, automatically generated pronunciation dictionaries often include faulty phoneme sequences for Anglicisms. In this work, we propose a multitask sequenceto-sequence approach for grapheme-to-phoneme conversion to improve the phonetization of Anglicisms. We extended a grapheme-to-phoneme model with a classifier to distinguish Anglicisms from native German words. With this approach, the model learns to generate pronunciations differently depending on the classification result. We used our model to create supplementary Anglicism pronunciation dictionaries that are added to an existing German speech recognition model. Tested on a dedicated Anglicism evaluation set, we improved the recognition of Anglicisms compared to a baseline model, reducing the word error rate by 1 % and the Anglicism error rate by 3 %. We show that multitask learning can help solving the challenge of loanwords in German speech recognition.
Zusammenfassung
Die Diagnostik sowie die Therapie der h?ufigsten Krebsneuerkrankung unserer Zeit, des Prostatakarzinoms (PCa), sind auch heutzutage unzureichend. Die Diagnostik mittels eines bekannt unspezifischen Markers und ohne vororientierte Biopsie liefert derzeit nur vage Anhaltspunkte f?r die Situation des Patienten. Bekannte schonende, minimalinvasive Verfahren f?r die Therapie werden nur bei einfachen PCa-Formen angewendet, da die Orientierung in der endoskopischen Situation nur mit viel Erfahrung sicher gewehrleistet werden kann. Die konventionelle, radikaler agierende Operationsmethode pr?pariert einen Sicherheitssaum, der Kontinenz und Potenz zerst?ren kann.
Ziel des MobiGuide-Projektes ist die Entwicklung eines integralen Arbeitsablaufs, der eine OP maximaler Radikalit?t bei minimaler L?sion erm?glicht. Daf?r wird eine prostataspezifische MRT-Diagnostik durchgef?hrt, die mittels MR-gest?tzter, navigierter Biopsie verifiziert wird. Anhand dieser im Raum orientierten Diagnose wird die Radikalit?t der OP festgelegt. W?hrend der minimalinvasiven OP k?nnen Gewebeproben orientiert, endoskopisch entnommen werden. Durch eine markerbasierte Erkennung in der Mikrofluidik werden sie realzeitnah charakterisiert. Um Relevanz f?r das Gesundheitswesen zu gewinnen, m?ssen die daf?r notwendigen heterogenen Probleml?sungsmodule unterschiedlicher Disziplinen in einem Medizinprodukt perfekt zusammenspielen.
Daf?r sind eine Validierung und ein qualit?tsgesicherter Entwicklungsprozess in allen Modulen notwendig. Zwischen Partnern zur Verf?gung gestellte Module m?ssen valide sein, da sich Kompetenzen auf einzelne Gruppen beschr?nken und Ergebnisse nicht gruppen?bergreifend gepr?ft werden k?nnen. Dar?ber hinaus muss der rationale Entwicklungsprozess f?r Zulassungen und Zertifizierungen dokumentiert werden.
Die am angestrebten Arbeitsablauf orientierte Ausgestaltung der notwendigen Informationstechnik erfolgt unter zwei Perspektiven. In der Entwicklungsphase steht die flexible Anpassbarkeit im Vordergrund. Neue Experimente sind schnell integrierbar und eine Qualit?tssicherung wird auf jeder der aufeinander aufbauenden Entwicklungsebenen unterst?tzt. In dem operationsunterst?tzenden System steht die kognitive Ergonomie f?r den Arzt im Vordergrund. Es leistet die Dokumentation und ?bermittlung nur wirklich neuer Informationen.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.