Представлен метод, реализующий алгоритм слияния семантических графов на основе эквивалентности их топологий. Результатом применения метода является семантическая сеть, сформированная из двух разнородных источников и имеющая высокую связность.Ключевые слова: семантические сети, графы, тезаурусы, топология семантических сетей, Wiktionary, RuThes Введение. Семантическая сеть -информационная модель предметной области, имеющая вид ориентированного графа, вершины которого соответствуют объектам предметной области, а ребра задают отношения между ними [1, 2]. В настоящее время семантические сети широко используются при решении множества различных задач, в частности при построении баз знаний, в задачах машинного перевода и обработки текста на естественном языке. Вследствие широкого спектра использования подобных графов возникает необходимость в их доработке -увеличении числа узлов и повышении связности между ними.При традиционном способе построения семантической сети ее формирование осуществляется вручную, что требует значительных трудозатрат. Такие сети содержат небольшое количество узлов, тем не менее они обладают важным преимуществом -их узлы и связи проверены вручную и являются корректными. Альтернативный подход -автоматическое построение семантической сети на базе внешнего источника, формируемого пользователями сети Интернет [3]. Ярким примером такого источника является словарь Wiktionary [4].Однако автоматическое формирование семантической сети на основе Wiktionary имеет существенный недостаток: этот источник сам по себе не является семантической сетью, т.е. при работе с ним семантические отношения между узлами приходится восстанавливать по ряду косвенных признаков. Это приводит к тому, что восстанавливаются далеко не все семантические отношения. Особенно критичной низкая связность является для семантического ядра сети. Описанная ситуация наглядно демонстрирует необходимость в слиянии нескольких семантических сетей для получения более качественного артефакта.В настоящей статье рассматриваются два разнородных источника словарных данных -Jackalope и RuThes [5]. Первый из них -это тезаурус, построенный автоматически из данных, содержащихся в словаре Wiktionary [6]. Его особенности -наличие большого числа смысловых значений и множество небольших компонентов связности на периферии семантического графа. RuThes -это экспертный тезаурус, содержащий достаточно связное семантическое ядро. Именно на примере этих двух словарных источников предлагается метод слияния семантических сетей с использованием особенностей топологии объединяемых графов.Алгоритм слияния графов. Различные семантические сети могут иметь специфичные особенности структуры, тем не менее в целом они представлены множеством узлов и ребер между ними, где каждый узел содержит смысловое значение, а ребра обозначают семантические отношения между понятиями. Подобное структурное сходство позволяет проанализиро-A method realizing of semantic graphs merging algorithm based on features of their topologies is presented. The method application results in creation of a ...
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.