Archive for the ‘ RDF ’ Category

RDFa под угрозой?

RDFa — одна из самых перспективных технологий Semantic Web.

Во-первых, RDFa позволяет использовать семантику не только специалистам Semantic Web, но и обычным авторам web-страниц, не владеющим технологией RDF. Благодаря этому, Semantic Web сможет, наконец, получить широкое распространение.

Во-вторых, RDFa — единственный способ записи семантических данных, индексируемый пауком Google.

Однако, в связи с последними событиями с прекращением работы над xHTML 2, мне кажется, что голактеко RDFa оказался в опасности. См. «An Unofficial Q&A about the Discontinuation of the XHTML2 WG» (есть русский перевод на Хабре).

  1. Разработкой RDFa занималась группа xHTML 2. После упразднения группы, неясно будет ли кто-нибудь заниматься развитием RDFa.

  2. Однако, есть еще более серьезная причина для опасений.

    RDFa работает в XML-документах с поддержкой пространств имен.

    В настоящий момент, RDFa можно использовать в xHTML 1 и xHTML 2 документах.

    Однако, ситуация изменится: xHTML 1 — станет устаревшим, xHTML 2 — будет упразднен, и единственным актуальным стандартом станет HTML5.

    HTML 5 существует в двух синтаксисах: HTML — собственно HTML 5 и XML — xHTML 5.

    Собственно HTML 5 не является XML-документом, не поддерживает пространства имен, и соответственно, не подходит для использования RDFa.

    xHTML 5 является XML-документом, и поддерживает RDFa.

    Казалось бы, xHTML 5 и станет основой для использования RDFa вместо устаревшего xHTML 1 и отмененного xHTML 2.

    Однако, xHTML 5 документ (в отличие от xHTML 1) обязан передаваться не с понятным всем браузерам MIME-типом «text/html», а с правильным «application/xhtml+xml». У нормальных браузеров это не вызывает никаких проблем. Но, Internet Exlorer вместо отображения документа покажет его дерево элементов.

    Таким образом, получается, что ни в одном из HTML 5-синтаксисов RDFa полноценно использовать не удастся: собственно HTML 5 — из-за того, что он не XML, а xHTML 5 — из-за несовместимости с Internet Explorer.

Такая вот грустная картина получается. Буду очень рад ошибиться, а также благодарен участникам shcherbak.net, указавшим — где именно.

Алик Кириллович,
http://www.alik.su
alik@alik.su
http://feeds.feedburner.com/alik-kirillovich

Сегодня читателям SHCHERBAK.NET представляется возможность посмотреть какие языки описания графов (RDF-based) можно применять при разработке прикладного программного обеспечения. А главное, в очерке вы найдете описания фреймворков для работы с графовыми разметками.

Читать


Александру Качуру, студенту кафедры Информационных управляющих систем, хочу выразить благодарность за предоставленные материалы.

Развитие семантического веба выводит на первый план задачи, о которых многие специалисты по искусственному интеллекту, включая, собственно, и меня,  стали забывать. А это задачи, связанные с анализом ествественно-языковых текстов, при чем анализ зачастую проводится на основе онтологий или для построения онтологий. В этом плане мне показались интересными статьи Евгения Рабчевского по автоматическому формированию онтологий:

Автоматическое построение онтологий

Проектирование экспертных систем технической поддержки на основе онтологий

Автоматическое построение онтологий для тематических поисковых систем


Хочу выразить благодарность Евгению Рабчевскому от себя и читателей сайта SHCHERBAK.NET за интересные материалы! :grin: Кроме того,  я надеюсь, что идеи, выраженные в статьях, получат дальнейшее развитие…

Перевод cтандарта W3C «Протокол SPARQL для RDF»

Итак,  рекомендация W3C SPARQL Protocol for RDF переведена на русский язык.

С чем и поздравляю всех читателей сайта SHCHERBAK.NET.

Перевод доступен, как и несколько других, на странице переводов!

Подготовка к публикации этого перевода заняла много больше времени, чем я предполагал.

Перевод SPARQL  готов, но его публикация немного задерживается…

P.S. Ув. читатели SHCHERBAK.NET, которые мне обещали замечания к переводам, очень жду.

Семантические плагины Firefox (часть 2)

В продолжение заметки о семантических плагинах FireFox

Итак, чем радует нас Mozilla Foundation в семантической сфере:

FOAFox 0.2.1 – плагин для обнаружения профилей FOAF на веб-страницах. Напомню, FOAF – акроним понятия Friend-of-a-Friend – RDF/XML формат для описания людей и их взаимоотношений в Semantic Web.

Внедренный в веб-страницу профиль FOAF можно с помощью этого плагина просмотреть через HTML-интерфейс.

Semantic Turkey 0.6.5 – семантический «закладочник»(Semantic Bookmarking tool) и средство разработки онтологий. С одной стороны, это исследовательский проект  ART Research Group, позволяющий создавать онтологии на языках RDF/RDFS и OWL. С другой стороны, с помощью этого плагина можно сформировать онтологию на основе информации о посещенных веб-страницах. Кроме того, есть средства для экспорта полученных онтологий. Среди недостатков, отмечу следующее – несмотря на то, что плагин, ориентирован на использование в  Firefox, домашняя страница этого плагина в  FF нормально не отображается – пришлось заходить на сайт через Safari. Далее, плагин очень интересный, но текущая функциональность скромна ( даже до возможностей редактора онтологий Protege бежать еще и бежать)  и чувство недоделанности проекта не покидало меня на протяжении всего знакомства с плагином. Обратить внимание на этот плагин стоит обязательно, но мой вывод – надо подождать релиза! А так, конечно, must have!

Headr surf tool 0.0.1.21 – инструмент для семантического серфинга – дополнительная панель инструментов для Firefox (сходу минус проекту – ну нельзя иметь в одном маленьком файрфоксе десяток панелей инструментов). Тем более задача плагина анализировать просматриваемые веб-страницы с целью рекомендации для прочтения связанных по смыслу веб-страниц и сайтов.  Я считал и считаю, что такие инструменты должны вызываться по нажатию кнопки на стандартной панели инструментов( или в статус баре), как, например, Zotero – почему-то о потенциальных пользователях разрабытываемых средств никто не хочет думать – а ведь для них все делается! Как результат – эта панель инструментов надоела мне через пять минут и была отключена. Но в идее этот семантический проект интересен.

Google Semantics 2.2.  – легкий способ получить синоним для ключевых слов через Google – этот плагин позиционируется как средство для поисковой оптимизации – общем для улучшения SEO необходим.

The Data Browser Extension 0.8.7 -  средство для табличного отображения RDF-данных (визуализация RDF в виде таблиц). Одно из лучших средств для представления «машино-понимаемых» форматов в человеко-читаемом виде.

Ontos Semantic Web Navigation Plug-in 1.0 – плагин,  делающий FireFox совместимым с Семантическим вебом. Как бы странно, это не звучало, смысл в этих словах есть – семантическая аннотация ресурсов на серверах проекта Ontos позволяет находить новую информацию об просматриваемых страницах, есть фукнция автоматической генерации семантических отчетов о ресурсах. Интересный плагин, но из серии надоедающих, при обращении к любом сайту идет запрос на сервера Ontos, что есть не очень хорошо (тотальный контроль об ваших перемещениях по Веб – оно вам нужно?). Я не хочу сказать, что проект плох. Я хочу сказать, что Семантический Веб не предназначен для увеличения контроля за его пользователями, уровень этого контроля как  раз должен уменьшиться. Я конечно, понимаю, что   тотальная слежка за пользователями есть и никуда не девается – ведь надо же адаптировать (улучшить) результаты поиска под наши потребности? – конечно надо. Кроме того, мы же повышаем уровень своей социальности. Правда этот уровень «держит за руку» мир программ, который о нас иногда знает больше чем собственно мы сами. Вот это проблема, при чем проблема, о которой буквально через 3-4 года будут все говорить, говорить, а может будут еще и кричать, только сделать уже ничего нельзя будет. Правда и сейчас нельзя ничего сделать, так как Семантический Веб стал инструментом для заработка денег, очень больших денег…

Fuzzbot 0.8.3  – еще один из плагинов для идентификации внедренной семантической информации в веб-страницы. Fuzzbot использует парсер ibrdfa для извлечения триплетов  RDF из веб-страниц. Этот плагин можно рассматривать как альтернативу SemanticRadar. Мое мнение – SemanticRadar более зрелый плагин, пока он лучший.

MozCC 2.4.3 – средство для просмотра метаданных о веб-страницах, включая информацию о лицензии Creative Commons. Метаданные, должны быть представлены на языке RDFa. Все стандартно, кроме информации о лицензии. Плюс плагина в том, что если информация о лицензии  на странице есть, то об этом отдельно будет пользователю сообщено!

И, напоследок, скажу – Файрфокс, как был самым семантическим браузером, так и остался!

Новый год – новый перевод стандарта W3C (RDFa)

Читателям сайта SHCHERBAK.NET доступен новый перевод стандарта W3С!

Начальное руководство по RDFaСвязь человеческого восприятия ресурса с машинным представлением. Заметка рабочей группы W3C от 14 октября 2008.

Перевод доступен здесь!

Семантическая Паутина. Часть 2

== Семантическая Паутина. Часть 2 ==

Жишкевич Николай

Я продолжаю рассказ о Семантической Паутине и технологиях, которые, возможно, никогда не изменят будущего, если вы не окажите им немного помощи. Вкратце: основная идея семантической паутины – добавить к существующим веб-страницам немного информации ориентированной на машинную обработку, добавить сведения о самой информации и о том в каких отношениях она находится с другими страницами сети. Когда это случится, то по Сети будут путешествовать автономные Семантические Агенты, похожие на ИскИны, (Искусственные Интеллекты из популярных научно-фантастических рассказов). Они будут помогать искать информацию, планировать рабочий день, брать на себя все больше и больше рутинной работы.

Почему я сказал “возможно, никогда не изменят будущего”? Read the rest of this entry »

Семантическая Паутина. Часть 1

== Семантическая Паутина. Часть 1 ==

Жишкевич Николай

Прогресс в IT похож на морские приливы: сначала волна энтузиазма штурмует берег обыденности и коммерческой целесообразности. Затем, будучи не в силах удержаться, волна отходит назад, с тем, чтобы набраться сил и спустя некоторое время попробовать еще раз захватить плацдарм. Сегодня я хочу поговорить о Семантической Паутине и микроформатах.

В начале 2000-ых годов я впервые услышал о идее которую пропагандировал Тим Бернерс-Ли. Это была идея Семантической Паутины (Semantic Web) и о том как она изменит привычный нам internet. Не секрет, что с самых первых дней развития internet предпринимались попытки создать такой способ представления информации в ней, чтобы указывать на ее логическое значение. Указать, что же хранится в том или ином абзаце или таблице. Придумали теги, такие как STRONG, EM – они должны были играть роль указателей на то, что какие-то части веб-страницы имеют более важное значение, дать акцент на них. Или, например, тег CITE, который должен был служить для хранения цитат или сносок на другую информацию. Тег ACRONYM мог бы указать на … акронимы. Или тег ADDRESS, который должен был бы хранить информацию об авторе документа. Все эти теги не только имели особые шрифты или отступы, но, прежде всего, должны были дать больше “информации об информации” поисковым машинам и браузерам. А теперь, положа руку на сердце, признайтесь, кто из вас слышал и тем более использовал эти возможности? Во всевозможных книжках про веб-программирование и верстку говорят, прежде всего, о том, как создать какой-то красивый эффект, о том, как сделать, чтобы что-то мигало, вертелось и двигалось. Все теги, о которых я упомянул выше (EM, CITE, ACRONYM), пали жертвой ряда обстоятельств: отшумевшая война браузеров, слабые визуальные возможности html заставляли использовать эти теги, прежде всего, для визуального оформления, не обращая внимания на их логический смысл. Эти теги были первой робкой попыткой сделать internet более целостным, что же … покойтесь с миром. Первоначальный этап, когда при разработке сайтов говорили только о его визуальном наполнении, картинках, flash-роликах прошел. Конечно, и сейчас визуальное оформление является важнейшим фактором, но по мере увеличения количества людей постоянно пользующихся internet-ом, ростом широкополосных сетей, бумом социальных сетей, с тем как internet становится все более близким для “домохозяек” и появлением новых моделей коммерции в internet, произошел возврат к старым идеям и попытка их реализовать на новой технологической базе.

Read the rest of this entry »