Currently, Linked Open Data (LOD) have enabled integrated data sharing across disciplines over the Web. However, for LOD users, in areas such as biodiversity (which massively use the Web to disseminate data), the task of transforming data file contents in CSV (Comma Separated Value) to RDF (Resource Description Framework) is not trivial. We have developed a new approach to map data files in CSV to RDF format based on a domain-specific language (DSL) called BioDSL. Using it, biodiversity data users can write compact programs to map their data to RDF and link them to the LOD. Biodiversity vocabularies and ontologies, such as Darwin Core and OntoBio, can be used with BioDSL to enrich user data. Existing tools are exclusively focused on mapping (CSV to RDF), offering little or no support for linking data to the LOD (interconnecting user entities to LOD entities). They also are more complex to use than BioDSL.
Este trabalho faz parte de um projeto maior, o Annotation and Image Markup Project, que tem o objetivo de criar uma base de conhecimento médico sobre imagens radiológicas para identificação, acompanhamento e reasoning acerca de lesões tumorais em pesquisas sobre câncer e consultórios médicos. Esse projeto está sendo desenvolvido em conjunto com o Radiological Sciences Laboratory da Stanford University. O problema específico, que será abordado nesse trabalho, é que a maior parte das informações semânticas sobre imagens radiológicas não são capturados e relacionados às mesmas usando termos de ontologias biomédicas e padrões, como o RadLex e DICOM, o que impossibilita a sua avaliação automática por computadores, busca em arquivos médicos em hospitais, etc. Para tratar isso, os radiologistas precisam de uma solução computacional fácil, intuitiva e acessível para adicionar essas informações. Nesse trabalho foi desenvolvida uma solução Web para inclusão dessas anotações, o sistema ePAD. O aplicativo permite a recuperação de imagens médicas, como as imagens disponíveis em sistemas de informação hospitalares (PACS), o delineamento dos contornos de lesões tumorais, a associação de termos ontológicos a esses contornos e o armazenamento desses termos em uma base de conhecimento. Os principais desafios desse trabalho envolveram a aplicação de interfaces intuitivas baseadas em Rich Internet Applications e sua operação a partir de um navegador Web padrão. O primeiro protótipo funcional do ePAD atingiu seus objetivos ao demonstrar sua viabilidade técnica, sendo capaz de executar o mesmo trabalho básico de anotação de aplicações Desktop, como o OsiriX-iPad, sem o mesmo overhead. Também mostrou a sua utilidade a comunidade médica o que gerou o interesse de usuários potenciais.
Dedico esse trabalho a minha família, a minha noiva Yasmin aos meus amigos, ao meu orientador, Dilvan, aos mestres que me ajudaram a concluir este trabalho, Laurindo e Andrea, e aos amigos, Cíntia e Lucas. AGRADECIMENTOS Os agradecimentos principais são direcionados a todos mestres que me conduziram a produzir e crescer na vida acadêmica, em especial Dilvan, meu orientador, Laurindo e Andrea, meus parceiros de pesquisas, aos colegas do grupo de pesquisa Silvio, Flor, João Paulo e Guilherme. Agradecimentos especiais são direcionados aos meus pais, Dirce e Carlos, minha irmã, Karla, minha noiva, Yasmin, e a todos meus familiares que me deram apoio e compreenderam minhas ausências. RESUMO ABREVIAÇÃO. Uma infraestrutura semântica para integração de dados científicos sobre biodiversidade. 2018. 158 p. Tese (Doutorado em Ciências-Ciências de Computação e
Currently, Linked Open Data (LOD) have enabled integrated data sharing across disciplines over the Web. However, for LOD users, in areas such as biodiversity (which massively use the Web to disseminate data), the task of transforming data file contents in CSV (Comma Separated Value) to RDF (Resource Description Framework) is not trivial. We have developed a new approach to map data files in CSV to RDF format based on a domain-specific language (DSL) called BioDSL. Using it, biodiversity data users can write compact programs to map their data to RDF and link them to the LOD. Biodiversity vocabularies and ontologies, such as Darwin Core and OntoBio, can be used with BioDSL to enrich user data. Existing tools are exclusively focused on mapping (CSV to RDF), offering little or no support for linking data to the LOD (interconnecting user entities to LOD entities). They also are more complex to use than BioDSL.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.