Streszczenie: Uniwersalna klasyfikacja dziesiętna (UKD) jest powszechnie wykorzystywanym systemem klasyfikacji obszarów badawczych. Swoim zasięgiem obejmuje wszystkie obszary wiedzy. UKD jest wykorzystywana głównie do opisu zawartości publikacji naukowych w systemach katalogujących dorobek badawczy. Głównym celem niniejszej pracy jest opracowanie metody wyznaczania podobieństwa opisów zawartości publikacji naukowych, zdefiniowanych za pomocą wyrażeń UKD. Prezentację proponowanej metody poprzedza przedstawienie krótkiej charakterystyki uniwersalnej klasyfikacji dziesiętnej oraz zasad obowiązujących przy tworzeniu wyrażeń złożonych wykorzystujących UKD.Słowa kluczowe: uniwersalna klasyfikacja dziesiętna, podobieństwo publikacji naukowych, podobieństwo semantyczne.Summary: Universal Decimal Classification (UDC) is a highly flexible classification system for all kinds of information in any medium. Because of its logical hierarchical arrangement and analytical-synthetic nature, it is suitable for a physical organization of collections as well as document browsing and searching. The main purpose of this paper is to present the algorithm for similarity calculation among UDC expressions. The method proposed here can be used for the automatic evaluation of similarity among scientific publications.
Ontology-based approach in exploratory analysis of textual data can significantly improve the qualityof the obtained results. On the other hand, the use of domain knowledge defined in the form ofontologies increases the time needed to prepare a model and makes required calculations morecomplex. The publication will discuss selected aspects of cluster analysis performed on documentsautomatically annotated using ontologies. It seems that methodological aspects of cluster analysisprocess, especially the way in which distances are determined, should depend on the structure of agiven ontology. Three cases involving the use of ontologies with linear, hierarchical and networkstructures will be discussed. The methodological aspects of ontology-based cluster analysis of textdocuments was used for analysis of projects’ descriptions related to the area of economics andregistered in the period 2019-2021. Only Horizon and Framework Program projects were included.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.