Desde o seu nascimento, a Ciência da Informação vem estudando métodos para o tratamento automático da informação. Esta pesquisa centrou-se na Recuperação de Informação, área que envolve a aplicação de métodos computacionais no tratamento e recuperação da informação, para avaliar em que medida a Ciência da Computação contribui para o avanço da Ciência da Informação. Inicialmente a Recuperação de Informação é contextualizada no corpo interdisciplinar da Ciência da Informação e são apresentados os elementos básicos do processo de recuperação de informação. Os modelos computacionais de recuperação de informação são analisados a partir da categorização em "quantitativos" e "dinâmicos". Algumas técnicas de processamento da linguagem natural utilizadas na recuperação de informação são igualmente discutidas. No contexto atual da Web são apresentadas as técnicas de representação e recuperação da informação desde os mecanismos de busca até a Web Semântica. Conclui-se que, apesar da inquestionável importância dos métodos e técnicas computacionais no tratamento da informação, estas se configuram apenas como ferramentas auxiliares, pois utilizam uma conceituação de "informação" extremamente restrita em relação àquela utilizada pela Ciência da Informação.
La recuperación de información designa la operación mediante la cual se seleccionan los documentos de una colección en función de una demanda determinada de información. Se recupera un documento si su representación coincide total o parcialmente con la representación de la necesidad del usuario. La correcta interpretación de tales representaciones es fundamental para la eficiencia de un sistema de información, que involucra procesos cuya formalización y automatización solo son posibles por medio de simplificaciones de conceptos típicamente subjetivos. Estas simplificaciones afectan directamente en la eficiencia de los sistemas de información. Este trabajo presenta y evalúa las formas de representación computacional de los conceptos y operaciones que hacen parte del proceso de recuperación de información. La automatización del proceso de recuperación de información viabiliza la operación de grandes cantidades de datos de forma rápida y ágil, pero no necesariamente proporciona resultados consistentes o satisfactorios. El juicio de relevancia de la información implica procedimientos basados en las capacidades y habilidades humanas de abstracción, aprehensión y representación de su significación.
ResumoA Ciência da Informação tem por objeto o estudo das propriedades gerais da informação e a análise de seus processos de construção, comunicação e uso. Dentre os tipos informacionais encontra-se a informação orgânica, que é registrada em documentos de arquivo. Os usuários dessa informação podem ser divididos em dois grupos distintos pelo uso na fase corrente, por administradores, e na fase de guarda permanente, por historiadores e cidadãos. Uma vez definido o comportamento informacional de cada um dos grupos, a discussão é direcionada para a mediação da informação nos arquivos permanentes; em que é apresentada a interação de usuários e profissionais da informação, por meio do serviço de referência, visando à satisfação de necessidades informacionais. Nesse contexto são apresentados os padrões arquivísticos de descrição com os instrumentos de pesquisa enquanto ferramentas do serviço de referência nos arquivos permanentes. O presente texto versa, ainda, acerca das tecnologias da informação e das novas possibilidades de promoção da informação orgânica registrada em arquivos permanentes no ambiente digital, mediante contribuições oriundas da arquitetura da informação de web sites e da conversão dos padrões arquivísticos de descrição. Palavras-chaveArquivos permanentes. Serviço de referência. Mediação da informação. Comportamento informacional. Descrição arquivística. Linguagens de marcação. Arquitetura da Informação.
A Ciência da Informação é um campo que ainda denota traços atinentes à sua estruturação e solidificação, por isso, ainda sofre influências externas devido ao respectivo fraco grau de autonomia. A sua gênese é atribuída à explosão informacional que caracterizou o período pós - segunda Guerra Mundial e às conferências subsequentes que visavam analisar a implementação de máquinas na transferência da informação. Parte do seu contributo social é centrada na recuperação da informação mediada pela tecnologia que garante a despersonalização do conhecimento para indivíduos, grupos e sociedade, através da informação como conhecimento em ação. A área desenvolveu-se sobre um enfoque tecnológico de caráter interdisciplinar que atualmente cria as suas limitações. A informação registrada que constitui o seu objeto pela possibilidade de manipulação, também se torna uma limitação, daí a necessidade de adoção da técnica de mineração de dados para a descoberta do conhecimento em grandes volumes de dados e ampliação do universo da recuperação da informação.
ResumoO presente trabalho tem como objetivo identificar, na fase de recuperação, atributos disponíveis nos momentos em que se realiza pesquisas por conjuntos de dados em repositórios governamentais, a partir do modelo de Ciclo de Vida de Dados para a Ciência da Informação (CVD-CI) proposto por Sant'Ana (2013). A pesquisa fora delimitada a realização de buscas por conjuntos de dados através do mecanismo oferecido pelo sítio Portal Brasileiro de Dados Abertos, utilizando os termos 'Educação' e 'Saúde'. O uso do termo 'Saúde' resultou na recuperação de 14 conjunto de dados e o termo 'Educação' recuperou 23, totalizando 37 conjuntos de dados. A análise destes conjuntos de dados dividiu-se em duas etapas: na primeira foram identificados quais atributos estavam disponíveis na página contendo o resultado das buscas a partir termos utilizados. A segunda etapa consistiu em identificar os atributos disponíveis nas páginas referentes a cada um dos conjuntos de dados recuperados na busca. Como resultado, fora construído dois quadros: o primeiro identifica os atributos que estão disponíveis nas páginas com resultados da pesquisa pelo mecanismo de busca do site; o segundo, identifica os atributos disponíveis em cada conjunto de dados recuperado pela pesquisa. Os resultados demonstraram que na primeira etapa, não há diferença nos atributos disponíveis nos resultados de busca por ambos os termos. Entretanto, na segunda etapa houve discrepâncias nos atributos identificados em cada conjunto de dados. Palavras AbstractThe present study aims to identify, in the recovery stage, attributes available in moments when a user conducts datasets researches in government repositories, based on the Life Cycle Data Model for Information Science (CVD-CI) proposed by Sant'Ana (2013). The research was bounded out conducting searches for data sets offered through the search engine available on the site Brazilian Open Data Portal, using the terms 'education' and 'Health'. The use of the term 'health' resulted in the recovery of 14 datasets and the term 'education' recovered 23, totaling 37 datasets. Analysis of these datasets was divided into two stages: the first were identified which attributes were available on page containing the results of searches from terms used. The second step was to identify the attributes available on the pages for each datasets retrieved in the search. As a result, it was built two tables: the first identifies the attributes that are available on search results pages that were generated by site search engine. The second identifies the attributes available in each dataset retrieved by the search. The results showed that in the first stage, there is no difference in the attributes available in the search results by both terms. However, in the second stage there were discrepancies in the attributes identified in each dataset.Keywords: Data Life Cycle. Data Gathering. Open Government Data. Governmental Repository. 39Fernando de Assis Rodrigues, Ricardo César Gonçalves Sant'Ana e Edberto Ferneda InCID: R. Ci. Inf. e Doc., ...
As ontologias estão sendo utilizadas para a implementação de novos recursos e melhorias em sistemas de busca e recuperação de informações, principalmente no contexto da Web. O presente artigo tem como objetivo apresentar um panorama sobre a utilização de ontologias em sistemas de recuperação de informação, discutindo tipos adotados, áreas de aplicação, principais abordagens, propostas de melhorias, estudos validados por usuários e lacunas de pesquisa ainda existentes. A metodologia adotada para este fim contou com pesquisa bibliográfica, de caráter exploratório, baseada nas áreas de Ciência da Informação e Ciência da Computação, realizada por meio de publicações presentes na ACM Digital Library e Google Scholar. Entre os principais resultados, percebemos que as ontologias têm sido amplamente discutidas na literatura e utilizadas em diversas propostas e experimentos, proporcionando melhorias significativas no processo de recuperação de informação. Tal recurso possibilita o desenvolvimento de funcionalidades e recursos interativos, busca semântica, expansão e refinamento de consultas, além de contribuir para projetos de acesso à Web Semântica, visualização de informações, recuperação multimídia, dispositivos móveis e desenvolvimento de interfaces e sistemas. No entanto, apesar das inúmeras contribuições, sugerimos que as ontologias sejam utilizadas para potencializar a busca, através da exploração do significado existente entre os conceitos relacionados.
Introdução: Compreender a produtividade científica dos Programas de Pós-Graduação no país pode favorecer o conhecimento sobre as diferentes áreas do saber. No caso das áreas de informação no Brasil, tal panorama pode apoiar estratégias, processos de tomada de decisão, além de evidenciar atividades de pesquisa, de modo a subsidiar políticas de fomento à pesquisa científica. Entretanto, ainda há espaços para estudos sobre como se comportam, ou quais são as características da produção científica dessas áreas em diferentes constructos, como nos programas de pós-graduação das respectivas áreas do conhecimento, por exemplo. Conhecer os fatores que induzem a produtividade nos programas de pós-graduação por meio de seus membros (pesquisadores e estudantes) pode apoiar estratégias e políticas de fomento e manutenção das atividades de pesquisa. Objetivo: O objetivo deste estudo é, portanto, descrever a produtividade científica dos programas brasileiros de pós-graduação nas áreas de informação (Arquivologia, Biblioteconomia, Ciência da Informação, Documentação e Museologia), representada por seus membros (pesquisadores e estudantes). Metodologia: Como estratégia metodológica, este estudo tem abordagem quantitativa, com uso da bibliometria como técnica quantitativa e estatística de medição dos índices de produção e disseminação do conhecimento científico. Resultados: Dos 20 Programas de Pós-Graduação estudados, 5 reúnem mais da metade do total de produção científica da área. A produção científica é divulgada, preferencialmente, em canais de comunicação de trabalhos completos em anais de congresso. Conclusão: Ainda no mesmo contexto, não há uma relação específica entre volume de pesquisadores e estudantes dos programas de pós-graduação e o volume da produção científica.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.