Некоторые работы Intelligent Systems Research Group

Некоторые работы Intelligent Systems Research Group (с участием Н. Кеберле)

Проблемы/решения для интеллектуального поиска в Semantic Web с помощью онтологий:

Ermolayev, V.A., Keberle, N.G., Plaksin, S.L., Vladimirov, V.N. (2003)

Capturing Semantics from Search Phrases: Incremental User Personification and Ontology-Based Query Transformation / Извлечение семантики из поисковых фраз: инкрементальная персонификация пользователя и преобразование поисковой фразы с помощью онтологий

Персонификация пользователей на Веб-порталах с помощью профилей – широко известная технология. Как можно построить профиль? Например, «подсматривая через плечо» — т.е. наблюдая за ссылками, которые пользователь открывает. Другой способ – дать возможность пользователю выбрать интересующие его категории из классификатора.

Оба способа не учитывают семантической составляющей в поисковых фразах, которые составляет пользователь. Действительно, одному и тому же ключеслову (роскошный перевод впервые от urbansheep, потом у vvlad) в фразе обычно соответствуют разные контексты, в зависимости от того, какому сообществу принадлежит пользователь, написавший такое ключеслово в поисковой фразе.

В статье предлагается способ инкрементального уточнения профиля пользователя, на основании выставления оценки каждому использованному ключеслову в отношении к некоторой (-ым) онтологиям, доступным на Веб-портале.

Ключеслово/ключефраза получает оценку таким образом:

лючеслово, <семантическое отношение>, концепт онтологии, степень похожести),

где <семантическое отношение> — одно из таких: «подкласс-суперкласс», «часть-целое», «синоним», «экземпляр».

Таким образом можно попросить пользователя оценить вводимые им слова по степени похожести на один или несколько концептов онтологии. Делать это можно вручную (если точных соответствий в онтологии(-ях) нет), полуавтоматически (лексический разбор ключеслова и поиск лексически близких синонимов и экземпляров в онтологии), автоматически (если пользователь уже оценил похожесть ключеслов).

Для поиска даже в случае отсутствия точных соответствий в профиле предложены несколько правил преобразования и агрегирования, основанных на анализе семантических отношений.

Опубликовано в : M.D. Godlevsky, S.W. Liddle, H.C. Mayr (Eds.):Proceedings of the 2nd International Conference on Information Systems Technologies and its Applications, GI-LNI P-30, pp.9-20 (ISTA’2003), June 19-21, Kharkiv, Ukraine, 2003.


Проблемы/решения для создания семантически интероперабельных информационных систем:

Ermolayev. V., Keberle, N., Shapar, V., Vladimirov, V. (2004)

Ontology-Driven Sub-Query Extraction for Distributed Autonomous Information Resources in UnIT-Net IEDI./ Выявление подзапросов к распределенным автономным информационным ресурсам в инфраструктуре электронного документооборота UnITNet.

Проект UnITNet применяет архитектуру mediatorwrapper «от начала до конца» для конкретной задачи – организации специфического электронного документооборота между распределенными разнородными автономными провайдерами информационных ресурсов. В основе такой архитектуры лежит использование онтологий: каждый ресурс снабжается онтологией ресурса, а целостное видение предметной области организуется в онтологию медиатора. Отображения «онтология медиатора – онтологии ресурсов» также организованы в виде онтологий маппингов.

При реализации медиаторной архитектуры в распределенной среде для wrappers было решено использовать Web сервисы. Внутренний язык представления онтологий – OWL DL, внутренний язык запросов к онтологиям – RDQL.

Несоответствие терминологии, которую используют для описания своих ресурсов независимые провайдеры, и терминологии, которая понятна пользователю системы, требует решений по разделению и преобразованию исходного запроса пользователя на подзапросы к отдельным ресурсам.

В статье предложен общий алгоритм извлечения подзапросов из исходного запроса пользователя. Пользователь формирует запрос, просматривая и выбирая концепты онтологии медиатора (в которой есть соответствия абсолютно всем концептам онтологий ресурса). Медиатор преобразовывает запрос так, чтобы передать на wrappers ресурсов подзапросы в терминологии этих ресурсов, и затем собирает результаты для показа пользователю.

Опубликовано в: A. Doroshenko, T. Halpin, S. W. Liddle, H. C. Mayr (eds.) Information Systems Technology and its Applications. Proc. 3-d Int. Conf ISTA’2004, July 15-17, 2004, Salt Lake City, Utah, USA, pp. 137-150, GI LNI Vol P-48


Еще одна статья по теме:

Keberle, N., Ermolayev, V., Vladimirov, V., Dzhurinsky, E. (2005)

Visual Semantic Query Formulation and Execution in UnIT-NET IEDI / Визуальное построение семантических запросов и их выполнение в UnIT-NET IEDI.

Требовать от обычного пользователя свободного знания структуры онтологии и языка запросов RDQL неправильно. Удобный визуальный интерфейс, история запросов, сохранение ответов – такие пожелания были взяты за основу при разработке QFI – Query Formulation Interface – Java приложения на стороне клиента системы UnIT-Net.

В статье представлены принципы создания такого интерфейса и его верификация.

Опубликовано в: «Mathematical Modeling, IT, Automated Control Systems» series of the Herald of Kharkiv National University, No 703, ISSN 0453-8048, p. 95-108

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


Ответить с помощью ВКонтакте: