SHCHERBAK.NET и Semantic Web: конец или начало?

Что говорить, но SHCHERBAK.NET честно отработал почти два года на благо  русскоязычного сообщества Semantic Web.

В рамках него было собрано много материалов по различным аспектам  Semantic Web, много людей получило базовые познания о SW и связанным  технологиям,

мне кажется ресурс был полезен.

Общем, я принял решение о закрытии этого сайта, как хранилища  информации по SW.

Так как вокруг SHCHERBAK.NET сформировалось устойчивое сообщество  активистов, я решил передать им материалы сайта. Результатом этой передачи будет создание нового сайта с новым именем, методикой ведения
и развития, и есстественно новыми и переработанными материалами...

План закрытия следующий - в ближайшие две-три недели большую часть материалов  shcherbak.net просмотрят и перенесут на новый сайт. Результатом переноса будет удаление материалов из shcherbak.net.

Кроме того, когда начнется перенос открытый доступ к сайту закончится. Потом до открытия нового сайта доступ возобновится.

Буду ли  я еще онлайн публиковаться?  Скорее всего блоггерская деятельность для меня закончилась.

Те авторские публикации, которые мне были переданы, но не были опубликованы на shcherbak.net,   что будет с ними? С ними конечно же познакомят читателей, но уже на новом ресурсе.


Читатели спрашивают… (часть 1)

На shcherbak.net  добавлена новая рубрика "Читатели спрашивают..." В рамках этой рубрики читатели shcherbak.net могут  задавать вопросы по тематике Semantic Web, а мы и вы, читатели -специалисты в Semantic Web, надеюсь сможем на эти вопросы ответить. ))

В качестве первой записи этой рубрики решил взять вопросы читателя Dio.

Отвечаем вместе! Присоединяйтесь к обсуждению.

Из комментария читателя dio в FAQ SHCHERBAK.NET:

Я недавно начал знакомиться с инструментарием Semantic Web и пытаюсь выяснить, насколько он применим в моей ситуации. Хотел бы прояснить накопившиеся вопросы, да и вообще уточнить, в ту ли сторону я копаю. Надеюсь, в этом разделе сайта мои вопросы будут более-менее уместны. Должен сказать, что ко всему хорошему вдобавок, мое понимание БД чисто теоретическое, никаких сведений о прикладных аспектах работы с ними я не имею, т.к. моя область — алгоритмы Text Mining. Из-за этого затруднительно бывает понять, какие в точности задачи решает тот или иной инструмент. Одним словом, “сами мы нездешние, люди добрые, допоможите хто сколько сможет”(С) и т.д.

Вопросы:
1) Предположим, объект класса A определен как нечто, имеющее необходимую связь b c объектом класса С (экзистенциальная связь с кардинальностью min 1). Индивидуал I помещен в класс A явно. В Protégé 3 при этом на закладке Frames появляется табличка для ввода значений соответствующего свойства. Табличка подкрашивается красным, пока свойство не введено. В Protégé 4 не происходит вообще ничего.
Вопрос: можно ли заставить Protégé сообщать о таких ситуациях, как о явных ошибках и выдавать их списком.
2) Как выразить на OWL отношение следования вида A b C d V => A e V. Здесь (A, B) – классы, (b, d) – свойства классов, V – класс или тип данных, e – свойство класса или свойство данных.
Например:
Индивидуалы: Событие:Рождение, Персона:Человек, Дата:Год
(Рождение -> Год, Рождение -> Человек) => Человек (родился) Год
3) Контора имеет несколько традиционных баз данных, каждая из которых представляет какой-то аспект «предметной области». Реальна ли такая интеграция этих баз при помощи надстроечной онтологии, описывающей «предметную область» полностью, чтобы никаких фактических изменений в уже работающей части системы делать не пришлось? Годятся ли для этого такие средства, как D2RQ или Virtuoso? Какое средство предпочтительней?
4) Как решаются проблемы с масштабируемостью отдельной онтологии. Видно, что Protégé целиком прогружает онтологии в память и при размере онтологий порядка нескольких сот тысяч элементов начинает работать уже с некоторым скрипом. Если онтология генерируется по содержимому большой БД «традиционного типа», как это оговорено в п.3, размеры явно будут гораздо большими и критерия для деления результирующей онтологии на фрагменты не видно.
5) Предположим, что часть синсетов WordNet конвертируется в иерархию классов OWL, т.е., отношение isKindOf заменяется OWL isSubclassOf. При этом синсеты WordNet имеют еще десяток связей других типов, каждая из которых имеет определенные свойства (по наличию обратных, транзитивности, запрету на образование циклов и т.п.). Надо полагать, что в нотации OWL это должно быть выражено в виде требования, чтобы экземпляры, выведенные от синсета такого-то, имели связи со всеми экземплярами, выведенными от синсета сякого-то + описание дополнительных свойств. Есть ли практическая возможность поддерживать такого рода онтологию на OWL, или она будет слишком громоздкой?
6) Насколько эффективна будет процедура вывода в онтологии, состоящей из нескольких десятков тысяч классов и нескольких миллионов индивидуалов. Можно ли рассчитывать на то, что при автоматическом пополнении онтологии с таким характерным размером процедура классификации сможет отрабатывать если и не после каждой вставки, то хотя бы раз в час. Ожидающийся темп пополнения – десятки/сотни вставок в час.

Первые ответы на эти вопросы здесь!

WebConf09: Материалы конференции!

Труды конференции  WebConf09   представлены в виде сборника в двух частях.

Напомню, на этой конференции в рамках секции "Web -технологии" нам весьма успешно удалось обговорить практические аспекты внедрения технологий  Semantic Web.

В материалах конференции можно найти неопубликованные на shcherbak.net тезисы докладов по Semantic Web и смежным темам!

Хорошего чтения ))

Скачать  Материалы конференции WebConf09 (Часть 1).

Скачать Материалы конференции WebConf09 (Часть 2).

Семантизация 2: Yandex на пути в Semantic Web!

"API Поиска по блогам" Яндекса поддерживает семантическую разметку FOAF (Friend of a Friend)!

"API Поиска по блогам" - это инструмент, позволяющий использовать Поиск Яндекса по блогахна любом сайте, будь-то личный блог, форум или что-нибудь подобное. С помощью "API Поиска по блогам" можно проиндексировать личный блог или все блоги на какой-либо платформе и осуществлять детальный поиск с учетом семантической разметки.

Поддерживаемые Yandex'ом теги FOAF описаны здесь.

На расширение FOAF от Yandex можно посмотреть здесь! Обратите внимание расширение написано на  OWL!

Почему   "Семантизация 2"?  Потому что совсем недавно  Google объявил о поддержке семантических разметок (RDFa). Прочитать заметку об этом можно здесь! В тоже время, решение от Yandex, мы уже сейчас можем использовать для решения задачи поиска на наших сайтах.

PS. Спасибо Алику Кирилловичу за информацию.

Семантические плагины к Firefox: Часть 3.

Для пользователей браузера Firefox вышел интересный плагин, который позволяет совместить результаты поиска Google с результатами поиска Wolfram Alpha. Набираем в Google запрос и, кроме ответа Google, получаем массу полезной информации об понятиях - элементах поискового запроса. Не знаю, как обычным пользователям, но исследователям Semantic Web, плагин будет полезен однозначно.

Скачать и почитать отзывы о плагине можно здесь: Wolfram Alpha Google :: Add-ons for Firefox

Прим. Wolfram Alpha - это семантическая машина поиска, которая пытается логически вывести ответ на запрос пользователя. Особенность вывода результатов поиска Wolfram Alpha в том, что списка страниц, соответствующих запросу пользователя, как таковых нет. Мы получаем ответ в виде обработанных данных, которые по сути и представляют ответ на наш вопрос.

Wolfram Alpha понимает только английский язык.


Google Semantics - плагин для Firefox, позволяюший добавлять в результаты поиска Google список синонимов, соответствующих по мнению гугла вашему запросу. Плагин позиционируется, как очень полезное дополнение для SEO.

Скриншот с результами работы вышеперечисленных плагинов:

ishot-5

WebConf09: начало публикации материалов (тезисы)

Сегодня Вам, уважаемые читатели SHCHERBAK.NET, представляется возможность ознакомиться с тезисами докладов секции "Web-технологии".Это первая часть тезисов, которую я успел подготовить к публикации на сайте. Остальные тезисы и материалы будут опубликованы несколько позже. Следите за новостями.

Кстати говоря, насчет фото и видео - уже технически для публикации все готово, в ближайшее время опубликую.

приношу свои извинения за задержку публикации, но материалов действительно получилось много (более 300 фотографий и более часа видео) .

По мере обработки материалов буду их публиковать...