A proximidade entre os conceitos de informação e conhecimento provoca desordem conceitual em estudos na ciência da informação. Em contrapartida, o estabelecimento científico de uma disciplina depende de clareza conceitual acerca de seu objeto de estudo. Em vista disso, a hipótese proposta demonstra a necessidade de se mapearem as relações conceituais existentes entre informação (objeto de estudo da área) e conhecimento, objetivando evidenciar a distinção destes, para que possam ser usados com menos ambiguidade pelos pesquisadores da área. Para tanto, discutem-se, primeiramente, os conceitos de ciência da informação e de seu objeto de estudo, sob três paradigmas propostos por Capurro: fisicista, cognoscente e social; em seguida, algumas relações conceituais entre informação e conhecimento e suas consequências - existem relações de semelhança entre ambos, mas isso não faz com que se tornem idênticos. Definições anteriores sobre tais termos podem já ter constatado essas relações, contudo raramente esse assunto foi tratado de maneira pontual e com atenção, na falsa justificativa de que é um debate puramente teórico e que não levaria a resultado útil algum.
The expansion of recommender systems to the commercial and industrial level has allowed a rapid evolution of techniques, methods and algorithms. Initially, research focused on improving the quality of predictions, however, there are significant challenges such as generating models able to work with large volumes of information. Data sparsity on datasets is a challenge for recommender systems. Clustering and explanation of recommendations are growing research fields in the recommender systems area. Model-based recommender systems provide more accurate predictions and recommendations, more scalable results and they better address the problem of sparsity. The most adopted model by the modern recommender systems is the Matrix Factorization and their derived techniques.This thesis exposes a comprehensive study of the state-of-the-art research works and it proposes a Bayesian non-negative matrix factorization method to improve the current clustering results in the collaborative filtering area. We also provide an innovative pre-clustering algorithm adapted to the proposed probabilistic method. Results obtained using several open datasets show: 1) A conclusive clustering quality improvement when BNMF is used, compared to the classical Matrix Factorization or to the improved k-means results, 2) A higher predictions accuracy using Matrix Factorization based methods than using improved KMeans, and 3) Better BNMF execution times compared to those of the classic matrix factorization, and an additional improvement when using the proposed pre-clustering algorithm.
Resumo Versa sobre o controle do conhecimento científico pelas editoras e\ou provedores comerciais. Analisa-se as relações econômicas entre a produção, distribuição e uso da informação na cadeia produtiva do conhecimento, para compreender a lógica que sustenta essa indústria. Discute-se a revisão pelos pares e o círculo vicioso, envolvendo uma explicita apropriação privada dos recursos públicos destinados à pesquisa, na qual o Estado "paga, no mínimo, três vezes" para subsidiar o seu progresso científico e tecnológico, custeando não só a produção científica como também o seu posterior acesso e recuperação online, e por último sua posse em formato impresso, por meio de caríssimas assinaturas. Por último, apresenta-se uma contribuição empírica sobre a área brasileira de Física, sugerindo que seus principais periódicos são comerciais; as citações da produção brasileira refletem o mesmo comportamento de citação das bases de dados do Institute for Scientific Information, com todos os seus vieses.Palavras-chave indústria da informação; editoras científicas comerciais; bases de dados; produção científica; periódicos científicos. The knowledge production chain: economic, sociological and technical implicationsAbstract It is about the control of knowledge by publishing and/or commercial providers. It examines the relationship between economic production, distribution and use of information in the knowledge production chain, to understand the logic that supports this industry. It discusses the peer-review and the vicious circle, involving an explicit private appropriation of public resources for research, in which the State "pays at least three times" to support its scientific and technological progress, not only funding the scientific production but also its subsequent recovery and online access, and finally, its possession in print, through very expensive subscriptions. Finally, it is an empirical contribution regarding the area of Physics in Brazil, suggesting that its main journals are commercial, the Brazilian production of citations that reflect the behavior of the data-bases citation of Institute for Scientific Information, with all its biases.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
hi@scite.ai
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.