Рубрикатор сайта:


Визуализация RDF с помощью CSS.

XML 11.05.2008

Возможно ли это?

Такой вопрос я получил вот здесь!

Итак, и … Анализ интернет-источников показал, что проблема есть, а решения как такового нет!

Первая проблема с которой я столкнулся при использовании с это то, что не позволяет создать селекторы для тегов, в имени которых используется префикс пространства имен, т.е. для конструкции <ns:author> нельзя создать -селектор с именем “ns:author”. Создать конечно можно, но работать в web-браузерах такая конструкция не будет.

Конечно, можно применить -селектор “*” для однотипного форматирования всех возможных элементов . Но это не решение…

Читать полностью »

Понравилась статья, подписаться на новости можно здесь!

Популярность: 38%

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

Google Pagerank SHCHERBAK.NET “немного” увеличился…

Shcherbak, UANET, Общее 01.05.2008

Сегодня утром Toolbar “сообщил” мне приятную новость -

сайта .NET стал равен 5.

{RDF+XSLT} - cтатья с самым высоким (4).

На online сервисах по определению проверить информацию о повышении мне не удалось… но плагин Firefox SeoQuake подтверждает информацию - у .net действительно стал равным пяти :grin:

В связи с этим, я хочу поблагодарить читателей за проявляемый интерес к сайту .NET.

Только благодаря вашему вниманию к .NET у меня поддерживается желание развивать этот ресурс по технологиям :)

Понравилась статья, подписаться на новости можно здесь!

Популярность: 67%

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

ReDeFer или как просто получить RDF!

Semantic Web, XML 29.04.2008

(Resource Description Framework) - это основа документооборота .

ReDeFer - это один из множества проектов по созданию средств преобразования документов различных форматов в .

Наиболее полезными, на мой взгляд, средствами ReDeFer являются:

XSD2OWL - средство преобразования схем в . Причем преобразование в осуществляется из .
Читать полностью »

Понравилась статья, подписаться на новости можно здесь!

Популярность: 54%

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

Что нужно помнить об XML!

Shcherbak, XML 08.04.2008

Подготовлено по материалам семинара по

Читать здесь :)

Понравилась статья, подписаться на новости можно здесь!

Популярность: 60%

1 Star2 Stars3 Stars4 Stars5 Stars (2 votes, average: 2.5 out of 5)
Loading ... Loading ...

{XML++}

Общее 08.04.2008

Итак,

(eXtensible Markup Language) – это расширяемый язык разметки.

– это инструмент для структурирования информации

– это инфраструктура для создания Web-базированных информационных систем, т.е. набор программных компонент для создания, обработки структурированных документов и их передачи, посредством, например, протокола HTTP.

– это основа для построения современных веб-сервисов.

Основные потребители

1. SOA (service-oriented architecture)
2.

SOA использует для стандартизации структуры передаваемой информации между сервисами.

использует как средство интеграции онтологий и т.п. в существующую инфраструктуру Web.

Развитием управляет консорциум WWW (W3C).

Например, список компьютеров в можно представить так:

<productList>
<computer model="S3331" price="5000">
<hdd capacity="400">Hitachi</hdd>
<processor>P4</processor>
<motherboard> 865GPE </motherboard>
</computer>
<computer model="S3234" price="4000">
<hdd capacity="120">WD</hdd>
<processor>P4</processor>
<motherboard> 865GPE </motherboard>
</computer>
</productList>

Данные в размещаются внутри тегов. Пара “открывающий - закрывающий тег” соответствует элементу данных.

Элементом называется часть документа , разграниченная открывающим тегом, таким как <my_element>, и закрывающим тегом, таким как </my_element>.

Документ состоит из одного элемента верхнего уровня, называемым корневым элементом и наборов, вложенных в него, элементов и символьных данных.

Символьные данные - это текст внутри элемента.

Атрибутом является свойство элемента, которое предоставляет дополнительную информацию об элементе или о моделируемой сущности элемента.

Имена конструкций (атрибутов, элементов и т.п), применяемые для описания сущностей предметной области должны иметь уникальные имена. В случае если имена должны быть уникальными не только внутри документа , но и вне его, необходимо использовать пространства имен .

Пространства имен – символьная строка, обозначаемая некоторый объект реального мира через URI.

URI (Uniform Resource Identifier) – унифицированный идентификатор ресурса.

В вместо URI в основном используется URL (Uniform Resource Locator).

URL - унифицированный локатор ресурсов, позволяющий
Например, пространство имен http://ontolib.com/ с префиксом ns, позволяет создать элемент <ns:computer> __</ns:computer>, который будет использоваться для описания сущности «Компьютер», причем структура моделируем сущности уникальна внутри схемы , принятой в ontolib.com.

Применение пространств имен позволяет различать элементы имеющие одинаковые имена.

Так через используемые пространства имен можно отличить элемент <ns:computer> с http://ontolib.com и <ns:computer> из http://.net.

Для повышения читабельности -данных (и не только для этого!!!) необходимо структурировать информацию по определенным критериям.
Например, можно использовать способы структурирования информации, принятые в ER-моделировании или ООП.

Например, для структурирования можно использовать простое правило -

элементы соответствуют сущностям предметной области, а атрибуты соответствуют характеристикам этих сущностей.

Для организации связи «быть частью» между сущностями можно использовать вложение элементов . Так, если Вы хотите показать, что некоторый элемент является частью другого элемента, то описываете его внутри этого элемента. Например, если Вы хотите показать, что сущность автомобиль состоит из различных компонентов, например, двигателя, колес и т.д., тогда в это можно выразить так:

<car namе="VM"><engine>V6</engine></car>

Но это не единственный вид связи, который может моделироваться в .

поддерживает все возможные виды связей, которые могут моделироваться такими языками, как UML, языками ER-моделирования и т.п.

Но для моделирования таких связей, вероятнее всего, вам придется использовать такие технологии как XLink или XPointer.

Кроме того, при создании документов необходимо не забывать простые правила формирования -документов, а именно,

1. - регистрозависим, т.е.в тегах учитывается регистр символов.
2. Элементы должны быть правильно вложены друг в друга.
3. В должен быть один корневой элемент.
4. Значения атрибутов всегда должны быть заключены в кавычки.

В могут использоваться как одинарные кавычки, так и двойные. Одинарные кавычки в основном применяются в случаях, когда значения атрибута уже содержит двойные кавычки.

Для обработки конструкций применяются синтаксические анализаторы.

Например, msxml от Microsoft.

Что нужно помнить при работе с ?

1. В сохраняются пробелы (в отличие от HTML), т.е. если в текстовые описания добавлять лишние пробелы, то они синтаксическим анализатором не удаляются.
2. В символы перевода строки CR/LF преобразуются в LF.

Для описания данных в используется или схема .

(Document Type Definition) задает правила формирования теговой разметки.

Например, для описания компьютеров можно определить следующее :

<!ELEMENT productList (product)+ >
<!ELEMENT computer (hdd, processor, morherboard) >
<!ELEMENT hdd (#PCDATA) >
<!ELEMENT processor (#PCDATA) >
<!ELEMENT motherboard (#PCDATA) >

Использование знака «+» возле элемента накладывает на элемент ограничение - этот элемент как минимум раз должен быть определен. Могут также применяться, такие знаки, как «*» и «?». Знак «*» означает, что возможно 0, 1 или более элементов, а «?» означает, что элемент необязателен. Отсутствие знаков возле элементов означает обязательность их определения (т.е. элемент обязательно должен быть).

Атрибуты элементов определяются с помощью конструкции <!ATTLIST>.

<!ATTLIST имя_элемента имя_атрибута тип_атрибута значение_по_умолчанию >

В все типы атрибутов основаны на строковом типе данных.

Наиболее распространенные типы атрибута:

CDATA – символьные данные;
ID - уникальный идентификатор;
(value1|value2|) – перечисление возможных значений атрибутов, т.е. возможным значением атрибута будет одно из перечисляемых.

Например, можно определить атрибут model так:

<!ATTLIST computer model CDATA>

к можно подключить так:

<!DOCTYPE productList SYSTEM “products.”>

или можно определить конструкции внутри документа, например, так

<!DOCTYPE productList
[
<!ELEMENT productList (product)+ >
<!ELEMENT computer (hdd, processor, morherboard) >
<!ELEMENT hdd (#PCDATA) >
<!ELEMENT processor (#PCDATA) >
<!ELEMENT motherboard (#PCDATA) >
]>

Недостатки :

1. Отсутствие типизации узлов.
2. Отсутствие поддержки пространств имён.

Вместо можно использовать Schema.

Schema поддерживает различные типы данных.

Подключить XMLSchema к документу можно так:

<ProductList xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:noNamespaceSchemaLocation="products.">

</ProductList>

Для визуализации содержимого файла с помощью можно использовать каскадную таблицу стилей . Подключить ее можно следующим образом:

<?-stylesheet type="text/" href="sheet." ?>

Для визуализации содержимого файла с помощью можно использовать . Подключить его можно следующим образом:

<?-stylesheet type="text/" href="sheet." ?>

Для обработки -конструкций применяются такие технологии как DOM, SAX, .

Некоторые определения:

-документ, имеющий правильный синтаксис, называется правильно сформированным -документом.

-документ, проверенный и соответствующий ( SCHEMA) называется допустимым («валидным») -документом.

Более подробно об можно почитать здесь Школы XML

Понравилась статья, подписаться на новости можно здесь!

Популярность: 30%

1 Star2 Stars3 Stars4 Stars5 Stars (3 votes, average: 5 out of 5)
Loading ... Loading ...

Вопросы? {FAQ}

Общее 03.02.2008

Здесь вы можете задавать мне вопросы.

Я по мере возможности буду на них отвечать ))

На наиболее интересные вопросы буду отвечать в виде заметок на сайте ))

Вопрос 1:

Где взять онтологии для использования в своих проектах?

Ответ:

Вы можете использовать открытую онтологию OpenCyc (весьма легко интегрируется с ).

Кроме того, доступны для скачивания онтологии на DBpedia и .stanford.edu.


Вопрос 2:

каким образом можно использовать настраиваемый интерфейс для графовой модели памяти? т.е. как бы подменить используемую в фреймовую модель на графовую.
где можно об этом почитать?

Ответ:

Подменять не нужно, просто надо выбрать какую использовать версию редактора - -Frames или -.

Графовый (-) описан здесь

-Frames описан здесь. Этот использует протокол Open Knowledge Base Connectivity. что это почитать можно на ontolib.com в глоссарии и ссылки получить можно там же.


Вопрос 3:

В каких больших коммерческих проектах технологии SW применены? Хотелось бы увидеть архитектуру этих приложений и по-возможности экономический эффект от применения по сравнению скажем с WEB 2.0.

Ответ:

Один из наиболее интересных коммерческих проектов это проект DBin.

Проект весьма неоднозначный, с одной стороны в нем есть черты store, с другой - социальной сети. О нем немного можно почитать здесь.

В качестве основы для приложения Dbin используется среда и новая парадигма Communities.

Анализом экономического эффекта от внедрения SW я не занимался, но при прочих равных разработку программного обеспечения в парадигме выполнить проще, а значит и дешевле. А возможности при этом будут выше. Как минимум синтаксическая и семантическая интероперабельность приложения SW будет гораздо выше, чем у любого другого приложения, построенного на классических технологиях.

К слову, интероперабельность - это способность к взаимодействию!

Вопрос 4:

Что полезного дает использование для описания структуры сайта и для “сайтоделания” вообще?
Разве недостаточно “голого” ? Насколько существенно использование в проекте именно -графов?

Ответ:

- это средство , которое сделает когда-то возможной автоматическую обработку информации агентами!

- это семантическая разметка данных. Анализ такой разметки позволяет агенту делать логический вывод.

ориентировался на отделение структуры данных от их визуального представления, а позволил внести в структуру данных понятие семантики. Т.е. позволил данные на веб-страницах представлять в виде наборов связанных отношениями объектов.

Анализ отношений между объектами и есть основа логического вывода.

В своих проектах более целесообразно использовать (как более развитую альтернатива ).

Если Вы все-таки останавливаете свой выбор на , то более эффективным будет использование в синтаксисе n3.

в / синтаксисе весьма “тяжёлое” решение.

Конкретно, на сайте ontolib.com были доступны два вида информации, первый - html, второй - со схемой данных rdfs. Внешняя программа анализируя содержимое сайта могла выделить ссылку на +RDFS, а уже по ним эта программа должна (в идеале) осуществлять более точный и “осмысленный” анализ содержимого сайта.


Вопрос 5:

Где можно скачать руководство пользователя для Protégé? русскоязычный вариант предпочтительнее, но и на английском дока не помешала бы…

Ответ:

Руководства пользователя, программиста и другая документация по на английском здесь.

Переводы руководств (и многое другое) можно скачать здесь!


Вопрос 6:

Можно ли визуализировать с помощью ?

Ответ:

Нет, но можно с помощью .

В комментариях можно обсудить вопросы и ответы!


Задать вопрос:

  1. Captcha
  2. (обязательно)
  3. (валидный e-mail)
 

cforms contact form by delicious:days

Понравилась статья, подписаться на новости можно здесь!

Популярность: 38%

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...