Detection of occupations in texts is relevant for a range of important application scenarios, like competitive intelligence, sociodemographic analysis, legal NLP or health-related occupational data mining. Despite the importance and heterogeneous data types that mention occupations, text mining efforts to recognize them have been limited. This is due to the lack of clear annotation guidelines and highquality Gold Standard corpora. Social media data can be regarded as a relevant source of information for real-time monitoring of atrisk occupational groups in the context of pandemics like the COVID-19 one, facilitating intervention strategies for occupations in direct contact with infectious agents or affected by mental health issues. To evaluate current NLP methods and to generate resources, we have organized the ProfNER track at SMM4H 2021, providing ProfNER participants with a Gold Standard corpus of manually annotated tweets (human IAA of 0.919) following annotation guidelines available in Spanish and English, an occupation gazetteer, a machinetranslated version of tweets, and FastText embeddings. Out of 35 registered teams, 11 submitted a total of 27 runs. Best-performing participants built systems based on recent NLP technologies (e.g. transformers) and achieved 0.93 F-score in Text Classification and 0.839 in Named Entity Recognition.
El presente artículo analiza el papel de las traductoras en una industria que evoluciona rápidamente por la digitalización y la automatización, y sugiere las habilidades y competencias que estas deberán adoptar para tener éxito en un futuro (no muy lejano). Esta investigación se basa en una revisión exhaustiva de las oportunidades laborales del mercado laboral actual con técnicas de minado de datos con Python, así como en encuestas recientes que pretenden comprender qué funciones están desempeñando las traductoras en la actualidad. En el mundo globalizado actual, los servicios lingüísticos son mucho más que solo traducir. Proponemos diferentes áreas de especialización que ofrecerán oportunidades laborales de éxito y sostenibles en la era de la automatización al seguir y aplicar las tendencias de la industria de los servicios lingüísticos. Asimismo, analizamos las tendencias del sector y las habilidades y competencias que serán clave en el (no tan lejano) mercado laboral, y proponemos un nuevo perfil profesional, muy técnico y simbiótico con la tecnología: el de ingeniera lingüística. Las ingenieras lingüísticas son personas con los perfiles necesarios para triunfar en la era de la automatización, y serán capaces de ocupar las múltiples posiciones laborales, nuevas y transversales, que aparecerán como resultado de los recientes avances tecnológicos. Numerosos estudios se han centrado en los "beneficios" de la tecnología en términos de aumento de la productividad. Las tendencias actuales del mercado también han dado lugar a estudios que cuestionan la sostenibilidad de la profesión de las traductoras. Sin duda, la tecnología cambia nuestras vidas, pero depende de nosotras que lo haga para bien o para mal. En nuestra relación con la tecnología, podemos resistir, cooperar o reinventarnos. Consideramos que defender una posición ludita solo traerá consecuencias negativas para la profesión y, por ello, proponemos el papel de las ingenieras lingüísticas, que no solo cooperarán con la tecnología y se beneficiarán de ella, sino que verán aumentadas sus habilidades y competencias para satisfacer las exigencias del sector al estar al día de los avances tecnológicos.
Recent major changes and technological advances have consolidated machine translation (MT) as a key player to be considered in the language services world. In numerous instances, it is even an essential player due to budget and time constraints. Much attention has been paid to MT research recently, and MT use by professional or amateur users has increased. Yet, research has focused mainly on language combinations with huge amounts of online available corpora (e.g. English-Spanish). The situation for minoritized or stateless languages like Catalan is different. This study analyses Softcatalà’s new open-source, neural machine translation engine and compares it with Google Translate and Apertium in the English-Catalan language pair. Although MT engine developers use automatic metrics for MT engine evaluation, human evaluation remains the gold standard, despite its cost. Using TAUS DQF tools, translation quality (in terms of relative ranking, adequacy and fluency) and productivity (comparing editing times and distances) have been evaluated with the participation of 11 evaluators. Results show that Softcatalà's Translator offers higher quality and productivity than the other engines analysed.
En el contexto actual de avances tecnológicos y desarrollo de la inteligencia artificial, la digitalización de las sociedades y las mejoras tecnológicas transforman nuestras vidas en todos los ámbitos. La traducción no es una excepción. Con la aparición de la traducción automática neuronal —un nuevo paradigma de traducción automática—, la calidad que ofrece dicho sistema ha mejorado sustancialmente, incluso llegando a afirmarse que iguala o supera la calidad de la traducción humana en determinados ámbitos como las noticias. No obstante, los lenguajes de especialidad entrañan complejidades intrínsecas. En traducción jurídica, el anisomorfismo del lenguaje jurídico puede ser una brecha muy difícil de salvar para las máquinas: términos dispares para un mismo concepto en sistemas jurídicos diferentes, equivalencia cero o parcial, etc. Así, el objetivo del presente trabajo es estudiar la utilidad de la traducción automática como recurso formativo en el aula de traducción jurídica, teniendo en cuenta las características y tendencias del sector de la traducción profesional. Para ello, en este estudio se hace una evaluación humana de tres traducciones humanas de contratos societarios inglés-español y de una traducción generada por un motor de traducción automática neuronal. Los resultados apuntan a 1) que la traducción automática podría constituir una herramienta didáctica muy útil en la clase de traducción jurídica; 2) que la identificación de las competencias podría potenciarse con un enfoque de esta naturaleza; 3) la forma de incorporación de la traducción automática a la formación en Traducción Jurídica, y 4) las ventajas que tendría aquella sobre métodos de enseñanza-aprendizaje tradicionales.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.