Para medir a atividade científica, tem-se utilizado os indicadores bibliográficos que se baseiam em análise estatística de dados quantitativos encontrados na produção técnica e científica. O objetivo deste estudo foi delinear um panorama da produção científica da temática Tecnologias de Informação e Comunicação em bibliotecas, de modo a identificar: os autores mais produtivos (Lei de Lotka); a evolução histórica do número de publicações e os periódicos que mais publicaram sobre a temática (Lei de Bradford); e as principais abordagens que cobrem o tema (Lei de Zipf). A metodologia seguiu quatro etapas: escolha da Web of Science como base de dados de consulta; configuração dos parâmetros das estratégias de busca e do período de cobertura; depuração dos resultados; e tratamento dos dados de pesquisa. Os resultados mostraram que os primeiros trabalhos indexados na Web of Science datam de 1988 e que, até 2014, foram produzidos 458 artigos. A produção científica se mostrou estável nos últimos anos. Os autores mais produtivos foram Gomez, Fourie e Aharony. Não se observou uma alta concentração em um grupo específico, mas sim uma ampla difusão de autores. Identificou-se que são cinco os periódicos com maior produtividade, responsáveis por um terço do total da produção científica: Electronic Library, Program Electronic Library and Information Systems, Library Hi Tech, Library Trends e Libri. As principais palavras-chave indexadas pela Web of Science foram: Academic Library, Internet, Digital Library, Information Retrieval, Librarians e Mobile Services. São abordagens muito presentes no desenvolvimento de produtos, serviços, softwares e aplicativos na sociedade atual.
Machine Learning Techniques Used for Text Mining Angel Freddy Godoy VieraThe machine learning techniques are still extensively used for text mining. In this paper, there was a literature review of scientific journals published in the years 2010 and 2011, with the aim of identifying the main machine learning techniques utilized for text mining. It was possible to use descriptive and statistical techniques to organize, summarize and analyze the found data, and also, there is a shortened description of the main techniques found. Thirteen learning techniques applied to text mining appeared in the articles analyzed and 83% of the papers mentioned from 1 to 3 machine learning techniques. The main techniques used by the authors in the papers studied were support vector machine (svm), k-means (k-m), k-nearest neighbors (k-nn), naive bayes (nb), self-organizing maps (som). Pairs of techniques that appear most frequently are svm/nb, svm/k-nn, svm/Decision Tree and nb/k-nn.
Resumo O artigo apresenta aspectos da diversidade terminológica relacionada à Inteligência de Negócios e Inteligência Competitiva na produção científica da área da Ciência da Informação brasileira, caracterizando ocorrências de polissemia e sinonímia, e, buscando contribuir para redução da ambiguidade do campo conceitual da área. Foram analisados 29 artigos de 101 encontrados na base BRAPCI. Desses artigos foram extraídos 40 conceitos, os quais foram submetidos à análise, conforme: a) os termos e conceitos de referência, b) as categorias Processo, Função, Produto ou Tecnologia e, c) associação de autores por conceito de referência. Os resultados mostram que: a) se confirma a existência dos fenômenos de polissemia e sinonímia, b) embora o termo Inteligência Competitiva tenha sido predominantemente adotado pelos autores, ele se apresenta com uma ampla variedade de conceitos, c) predominância da categoria processo, d) dispersão de sentidos na análise cronológica, não sobressaindo predominância de um ou outro conceito referencial e, e) categoria tecnologia apresenta-se concentrada nas publicações entre 1999 e 2001. Conclui que, tendo em vista a fragilidade terminológica constatada por esta pesquisa, deve-se aprofundar a análise desses termos e conceitos verificando o seu comportamento em áreas afins a aqui estudada, o que certamente mostraria outros aspectos da diversidade terminológica.
Purpose
This paper aims to propose criteria and indicators for the adoption of e-books in libraries in the context of the cloud computing paradigm.
Design/methodology/approach
This paper carried out bibliographical and documentary research and the application of a questionnaire. Sampling focused on five library managers and five e-book vendor managers.
Findings
A proposal is presented containing a set of three criteria and their respective indicators. The technology platform criterion consists of seven indicators: patron data privacy, patron data security, availability of services, accessibility of information in e-books, interoperability of the technology platform, digital preservation and portability of e-books. The criterion for the acquisition of e-books involves three indicators: forms of commercialization, acquisition models and selection of e-book titles. The criterion for the circulation of e-books is divided into two indicators: unlimited and limited use. In the unlimited use mode, there are no limits on the use of e-books. In limited use, there are 11 levels of permissions: available copies, number of loans under each license, duration of the license, interlibrary loan, reading only in digital format, reading online via streaming only, download on the patron’s device, content printing, loan according to the patron’s identity, reservation services and renewal services.
Practical implications
This paper provides a set of criteria and indicators that can aid in the construction of policies and the development of collections, programs and projects directed toward the use of e-books in libraries.
Originality/value
This paper contributes socially by presenting a proposal that can support policies of evaluation and development of collections, projects, programs and actions around the adoption of e-books in different types of libraries.
For years now, players known as data brokers have operated on an unregulated market, by building businesses from the aggregation and processing of data, away from public scrutiny. Due to the genesis of laws that ended up exposing their model, along with debates on data privacy, a new generation of data protection acts, much stricter, are being enacted worldwide. The shift away from the data commoditization paradigm might, at first, indicate the extinction of such businesses. In this paper, we present related concepts and a brief history that led to that current scenario, along with some collaborativeoriented proposals for the adequacy of the data brokerage industry to a transparent perspective.
databases, and in the elaboration of queries and the comprehension of the users' needs. We also identified different semantic search engines, usually aimed at specific purposes, rather than generic searches. It was thus verified that SW technologies are used for researchers oriented towards specific contexts, and that researchers with a general purpose use semantic approaches, but not based in the Semantic Web.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.