Информация о себе и своей организации... Как это представить на веб-странице в понятном для поисковиков виде?

Один из способов - это добавление информации с помощью микроформата hCard, как это описано здесь!

Более развитой альтернативой hCard является RDFa, о котором расскажу сегодня.

RDFa - семантическая разметка, которая позволяет описывать информацию веб-страницы в терминах сущностей и их свойств.

RDFa встраивается в (x)HTML, подобно микроформатам (hCard,  hProduct).

Зачем это нужно?

Читать продолжение »

Обзор недельных событий (3)

Эта неделя  характеризовалась повышением внимания к микроформатам.

А ведь микроформаты как оказалось очень полезны.

Несмотря на то, что внимание к этой теме у меня на блоге было не большим, интересные материалы по теме есть.

Читайте на Щербак.NET:
Читать продолжение »

Микроформаты, что же это и зачем?

Микроформаты - это один из видов семантической разметки, который используется для описания данных (знаний) на веб-страницах.

С одной стороны, семантические разметки, такие как RDF и OWL существуют достаточно давно и имеют широкие возможности для описания знаний, но сложность разметок и необходимость обладания специализированными знаниями для их использования привели к тому, что пользователи не пользуются ими. Такая не популярность не позволяет применить методы искусственного интеллекта для организации   эффективного поиска (на основе логического вывода). В тоже время, в издательствах уже давно используют технологии микроформатов, подобных vCard, которые облегчают работу с материалом, который публикуется. Основой этих технологий есть использование меток и их групп, для определения общепринятого представления типовой информации, например, об авторах, книгах, организациях и т.п. За каждой меткой закрепляется некоторое общепринятое значение, которое может быть использовано при машинной обработке.

На сегодня разработано достаточно много различных микроформатов, которые могут использоваться при разработке веб страниц, и обработку которых уже поддерживают поисковые машины, такие как Яндекс и Гугл.
Читать продолжение »

RDFa под угрозой?

RDFa — одна из самых перспективных технологий Semantic Web.

Во-первых, RDFa позволяет использовать семантику не только специалистам Semantic Web, но и обычным авторам web-страниц, не владеющим технологией RDF. Благодаря этому, Semantic Web сможет, наконец, получить широкое распространение.

Во-вторых, RDFa — единственный способ записи семантических данных, индексируемый пауком Google.

Однако, в связи с последними событиями с прекращением работы над xHTML 2, мне кажется, что голактеко RDFa оказался в опасности. См. «An Unofficial Q&A about the Discontinuation of the XHTML2 WG» (есть русский перевод на Хабре).

  1. Разработкой RDFa занималась группа xHTML 2. После упразднения группы, неясно будет ли кто-нибудь заниматься развитием RDFa.

  2. Однако, есть еще более серьезная причина для опасений.

    RDFa работает в XML-документах с поддержкой пространств имен.

    В настоящий момент, RDFa можно использовать в xHTML 1 и xHTML 2 документах.

    Однако, ситуация изменится: xHTML 1 — станет устаревшим, xHTML 2 — будет упразднен, и единственным актуальным стандартом станет HTML5.

    HTML 5 существует в двух синтаксисах: HTML — собственно HTML 5 и XML — xHTML 5.

    Собственно HTML 5 не является XML-документом, не поддерживает пространства имен, и соответственно, не подходит для использования RDFa.

    xHTML 5 является XML-документом, и поддерживает RDFa.

    Казалось бы, xHTML 5 и станет основой для использования RDFa вместо устаревшего xHTML 1 и отмененного xHTML 2.

    Однако, xHTML 5 документ (в отличие от xHTML 1) обязан передаваться не с понятным всем браузерам MIME-типом «text/html», а с правильным «application/xhtml+xml». У нормальных браузеров это не вызывает никаких проблем. Но, Internet Exlorer вместо отображения документа покажет его дерево элементов.

    Таким образом, получается, что ни в одном из HTML 5-синтаксисов RDFa полноценно использовать не удастся: собственно HTML 5 — из-за того, что он не XML, а xHTML 5 — из-за несовместимости с Internet Explorer.

Такая вот грустная картина получается. Буду очень рад ошибиться, а также благодарен участникам shcherbak.net, указавшим — где именно.

Алик Кириллович,
http://www.alik.su
alik@alik.su
http://feeds.feedburner.com/alik-kirillovich

Семантизация 2: Yandex на пути в Semantic Web!

"API Поиска по блогам" Яндекса поддерживает семантическую разметку FOAF (Friend of a Friend)!

"API Поиска по блогам" - это инструмент, позволяющий использовать Поиск Яндекса по блогахна любом сайте, будь-то личный блог, форум или что-нибудь подобное. С помощью "API Поиска по блогам" можно проиндексировать личный блог или все блоги на какой-либо платформе и осуществлять детальный поиск с учетом семантической разметки.

Поддерживаемые Yandex'ом теги FOAF описаны здесь.

На расширение FOAF от Yandex можно посмотреть здесь! Обратите внимание расширение написано на  OWL!

Почему   "Семантизация 2"?  Потому что совсем недавно  Google объявил о поддержке семантических разметок (RDFa). Прочитать заметку об этом можно здесь! В тоже время, решение от Yandex, мы уже сейчас можем использовать для решения задачи поиска на наших сайтах.

PS. Спасибо Алику Кирилловичу за информацию.

Google поддерживает семантическую разметку (RDFa)!!!

Семантика наступает на WEB...  RDFa самый простой способ внедрить семантику в веб-страницы.

Перевод стандарта RDFa можно почитать здесь.

Google станет первой машиной поиска, которая начнет учитывать семантику веб-страниц.

С этим шагом, даже те, кто относился снисходительно к технологиям Semantic Web, пересмотрят свое отношение. А те кто не захотят, потеряют прибыли. Кстати говоря, несмотря на критические замечания менеджмента Google в сторону Semantic Web, поддержка семантических технологий  у  Google появилась первой.

Думаю это может говорить о положительных тенденциях... ))

Подборка ссылок по теме от Новитского Александра:

http://googleblog.blogspot.com/2009/05/more-search-options-and-other-updates.html

http://www.jenitennison.com/blog/node/104
http://www.google.com/support/webmasters/bin/answer.py?hl=en&answer=146898
http://dltj.org/article/google-rdfa/


Как я написал в одном комментарии:

ДА СОДРОГНУТЬСЯ ВСЕ SEOШНИКИ!
Как только семантическая разметка начнет влиять на выдачу результатов google. Все продвигаемые сайты станут семантически размечены. Скорее всего "черной" семантикой, но ...прийдет "злобный" Pellet, мы к нему напишем правила фильтрации, и сделаем логический вывод и все станет "белым и пушистым"
А если это будет так, то Яндекс без поддержки семантических технологий будет выглядеть бледно. А жаль, кто-кто, а они могли бы внедрить поддержку этого формата уже давно.