Архив июля, 2009

Читатели спрашивают… (часть 1)

На shcherbak.net  добавлена новая рубрика "Читатели спрашивают..." В рамках этой рубрики читатели shcherbak.net могут  задавать вопросы по тематике Semantic Web, а мы и вы, читатели -специалисты в Semantic Web, надеюсь сможем на эти вопросы ответить. ))

В качестве первой записи этой рубрики решил взять вопросы читателя Dio.

Отвечаем вместе! Присоединяйтесь к обсуждению.

Из комментария читателя dio в FAQ SHCHERBAK.NET:

Я недавно начал знакомиться с инструментарием Semantic Web и пытаюсь выяснить, насколько он применим в моей ситуации. Хотел бы прояснить накопившиеся вопросы, да и вообще уточнить, в ту ли сторону я копаю. Надеюсь, в этом разделе сайта мои вопросы будут более-менее уместны. Должен сказать, что ко всему хорошему вдобавок, мое понимание БД чисто теоретическое, никаких сведений о прикладных аспектах работы с ними я не имею, т.к. моя область — алгоритмы Text Mining. Из-за этого затруднительно бывает понять, какие в точности задачи решает тот или иной инструмент. Одним словом, “сами мы нездешние, люди добрые, допоможите хто сколько сможет”(С) и т.д.

Вопросы:
1) Предположим, объект класса A определен как нечто, имеющее необходимую связь b c объектом класса С (экзистенциальная связь с кардинальностью min 1). Индивидуал I помещен в класс A явно. В Protégé 3 при этом на закладке Frames появляется табличка для ввода значений соответствующего свойства. Табличка подкрашивается красным, пока свойство не введено. В Protégé 4 не происходит вообще ничего.
Вопрос: можно ли заставить Protégé сообщать о таких ситуациях, как о явных ошибках и выдавать их списком.
2) Как выразить на OWL отношение следования вида A b C d V => A e V. Здесь (A, B) – классы, (b, d) – свойства классов, V – класс или тип данных, e – свойство класса или свойство данных.
Например:
Индивидуалы: Событие:Рождение, Персона:Человек, Дата:Год
(Рождение -> Год, Рождение -> Человек) => Человек (родился) Год
3) Контора имеет несколько традиционных баз данных, каждая из которых представляет какой-то аспект «предметной области». Реальна ли такая интеграция этих баз при помощи надстроечной онтологии, описывающей «предметную область» полностью, чтобы никаких фактических изменений в уже работающей части системы делать не пришлось? Годятся ли для этого такие средства, как D2RQ или Virtuoso? Какое средство предпочтительней?
4) Как решаются проблемы с масштабируемостью отдельной онтологии. Видно, что Protégé целиком прогружает онтологии в память и при размере онтологий порядка нескольких сот тысяч элементов начинает работать уже с некоторым скрипом. Если онтология генерируется по содержимому большой БД «традиционного типа», как это оговорено в п.3, размеры явно будут гораздо большими и критерия для деления результирующей онтологии на фрагменты не видно.
5) Предположим, что часть синсетов WordNet конвертируется в иерархию классов OWL, т.е., отношение isKindOf заменяется OWL isSubclassOf. При этом синсеты WordNet имеют еще десяток связей других типов, каждая из которых имеет определенные свойства (по наличию обратных, транзитивности, запрету на образование циклов и т.п.). Надо полагать, что в нотации OWL это должно быть выражено в виде требования, чтобы экземпляры, выведенные от синсета такого-то, имели связи со всеми экземплярами, выведенными от синсета сякого-то + описание дополнительных свойств. Есть ли практическая возможность поддерживать такого рода онтологию на OWL, или она будет слишком громоздкой?
6) Насколько эффективна будет процедура вывода в онтологии, состоящей из нескольких десятков тысяч классов и нескольких миллионов индивидуалов. Можно ли рассчитывать на то, что при автоматическом пополнении онтологии с таким характерным размером процедура классификации сможет отрабатывать если и не после каждой вставки, то хотя бы раз в час. Ожидающийся темп пополнения – десятки/сотни вставок в час.

Первые ответы на эти вопросы здесь!

RDFa под угрозой?

RDFa — одна из самых перспективных технологий Semantic Web.

Во-первых, RDFa позволяет использовать семантику не только специалистам Semantic Web, но и обычным авторам web-страниц, не владеющим технологией RDF. Благодаря этому, Semantic Web сможет, наконец, получить широкое распространение.

Во-вторых, RDFa — единственный способ записи семантических данных, индексируемый пауком Google.

Однако, в связи с последними событиями с прекращением работы над xHTML 2, мне кажется, что голактеко RDFa оказался в опасности. См. «An Unofficial Q&A about the Discontinuation of the XHTML2 WG» (есть русский перевод на Хабре).

  1. Разработкой RDFa занималась группа xHTML 2. После упразднения группы, неясно будет ли кто-нибудь заниматься развитием RDFa.

  2. Однако, есть еще более серьезная причина для опасений.

    RDFa работает в XML-документах с поддержкой пространств имен.

    В настоящий момент, RDFa можно использовать в xHTML 1 и xHTML 2 документах.

    Однако, ситуация изменится: xHTML 1 — станет устаревшим, xHTML 2 — будет упразднен, и единственным актуальным стандартом станет HTML5.

    HTML 5 существует в двух синтаксисах: HTML — собственно HTML 5 и XML — xHTML 5.

    Собственно HTML 5 не является XML-документом, не поддерживает пространства имен, и соответственно, не подходит для использования RDFa.

    xHTML 5 является XML-документом, и поддерживает RDFa.

    Казалось бы, xHTML 5 и станет основой для использования RDFa вместо устаревшего xHTML 1 и отмененного xHTML 2.

    Однако, xHTML 5 документ (в отличие от xHTML 1) обязан передаваться не с понятным всем браузерам MIME-типом «text/html», а с правильным «application/xhtml+xml». У нормальных браузеров это не вызывает никаких проблем. Но, Internet Exlorer вместо отображения документа покажет его дерево элементов.

    Таким образом, получается, что ни в одном из HTML 5-синтаксисов RDFa полноценно использовать не удастся: собственно HTML 5 — из-за того, что он не XML, а xHTML 5 — из-за несовместимости с Internet Explorer.

Такая вот грустная картина получается. Буду очень рад ошибиться, а также благодарен участникам shcherbak.net, указавшим — где именно.

Алик Кириллович,
http://www.alik.su
alik@alik.su
http://feeds.feedburner.com/alik-kirillovich

WebConf09: Помните как это было? (Фотогалерея)

Фотогалерея конференции Webconf09!

Вспомним как это было. Публикую первую часть фотографий.

WebConf09: Материалы конференции!

Труды конференции  WebConf09   представлены в виде сборника в двух частях.

Напомню, на этой конференции в рамках секции "Web -технологии" нам весьма успешно удалось обговорить практические аспекты внедрения технологий  Semantic Web.

В материалах конференции можно найти неопубликованные на shcherbak.net тезисы докладов по Semantic Web и смежным темам!

Хорошего чтения ))

Скачать  Материалы конференции WebConf09 (Часть 1).

Скачать Материалы конференции WebConf09 (Часть 2).

Семантизация 2: Yandex на пути в Semantic Web!

"API Поиска по блогам" Яндекса поддерживает семантическую разметку FOAF (Friend of a Friend)!

"API Поиска по блогам" - это инструмент, позволяющий использовать Поиск Яндекса по блогахна любом сайте, будь-то личный блог, форум или что-нибудь подобное. С помощью "API Поиска по блогам" можно проиндексировать личный блог или все блоги на какой-либо платформе и осуществлять детальный поиск с учетом семантической разметки.

Поддерживаемые Yandex'ом теги FOAF описаны здесь.

На расширение FOAF от Yandex можно посмотреть здесь! Обратите внимание расширение написано на  OWL!

Почему   "Семантизация 2"?  Потому что совсем недавно  Google объявил о поддержке семантических разметок (RDFa). Прочитать заметку об этом можно здесь! В тоже время, решение от Yandex, мы уже сейчас можем использовать для решения задачи поиска на наших сайтах.

PS. Спасибо Алику Кирилловичу за информацию.

Новая версия JADE 3.7 и WADE 2.5

2 июля 2009 года Telecom Italia Lab выпустили новый релиз JADE.

Новая версия получила названия 'OSGAgents', благодаря интеграции с OSGi - спецификацией динамической модульной шины для создания Java-приложений, разрабатываемой консорциумом OSGi Alliance. Данная интеграция позволяет запускать агентов в OSGi среде, дает им доступ к основным возможностям OSGi(регистрация и использования OSGi-сервисов и др.). На сайте можно также скачать JADE-OSGi Guide.

Еще одним достоинством новой версии является поддержка WSDC (Web Service Dynamic Client). Это расширение позволяет вызывать веб-службы на лету, минуя генерацию классов-заглушек.

Более подробную информацию можно получить на официальном сайте JADE и WADE