Рубрикатор сайта:


Несколько полезных плагинов для редактора онтологий Protégé

ORA-SPATIAL, Protege, Онтологии 28.01.2008

Функциональность редактора онтологий (см. заметку) может быть расширена путем добавления плагинов.

Плагины к можно разрабатывать самому, а можно воспользоваться одним из представленных ниже:

TGVizTab – плагин Protege, который позволяет визуализировать содержимое онтологии с помощью java библитеки TouchGraph. TGViz выводит графическое представление объектов, экземпляров и связей между объектами с возможностью контроля глубины вывода.

Вид онтологии в , визуализированной с помощью TGViz:


Вид онтологии в редакторе Protege

Рекомендую для пользования!

Читать полностью »

Понравилась статья, подписаться на новости можно здесь!

Популярность: 51%

1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 4 out of 5)
Loading ... Loading ...

Developing of high-perfomance technologies for creating and supporting web ontologies

ORA-SPATIAL, Онтологии 25.01.2008

The article describes the method of storage large and stable ontologies with using systems of management of spatial data.

Читать

Понравилась статья, подписаться на новости можно здесь!

Популярность: 26%

1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
Loading ... Loading ...

{ORA+SPATIAL}

ORA-SPATIAL, Shcherbak 25.01.2008

Developing Of High-Performance Technologies For Creating And Supporting Web Ontologies

Valentin Filatov, Sergey , Antonina Khairova

Abstract – The subject of the article is examination of storing large and stable ontologies in the spatial database, and also development of information storage and retrieval system of construction and supporting ontologies.

The article describes the method of storage large and stable ontologies with using systems of management of spatial data.

Keywords –, (Recourse Description Framework), RDFS ( Schema), ( Web Language), Oracle Database 10g,

I. Introduction

Due to the widening of Internet the work of searching systems has become harder, to provide sufficient coverage they had to index and process bigger volume of information. But the main difficulty was not even the increasing number of indexed web-sites, but providing users’ queries with relevant answers, i.e. giving them links to the resources they needed.

Present-day reality in individual areas of scientific exploration dictates the necessity of applying methods on knowledge engineering for solving wide class of practical goals. As an example there may be used the initiative of , the main aim of which is to give to large massive sod data, printed in the Internet, more sensible, to raise accommodation of working with the information.

One of the main achievements of project became the developing of standard description language – ( Web Language). Thanks to this many knowledge engineers, programmers and experts got the possibility of using common rules of conception, storage and processing.

There are different meanings of word . In this article is the specification of some data domain, it’s conceptual description as formalize conception, which includes vocabulary of terms of data domain and logical expressions describing intercommunications of these concepts. Thus, of some data domain represents concepts thesaurus of this domain, providing the possibility of interpretation data domain terms via interpretation paradigmatic relations like “the whole and the parts”, “class - subclass” and some kinds of associative relations.

Together with the interests to the the instrumentals for working with them were created, specially aligned for wide common use of in the issues of intellectual searching, classification, and exposure of data non-coordination, modeling of behavior intellectual agents and processing of data. However, even presence of good instrumental environment doesn’t decline problems of designing and constructing. And the problem of knowledge extraction automation just like the whole the problem of extraction still doesn’t have an effective solution nowadays. Already developed ontologies and the experience of using them for solving different problems are becoming become more valuable.

The process of creating modern intellectual information systems often requires integration of knowledge from different sources, and as consequence effective solving of problems of knowledge replication. The problem of automation of choosing process still doesn’t have a satisfactory solution. That’s why studies on the developing such an approach for providing and replication of knowledge, which on one hand could allow to consider the specificity of data domain the most sufficiently and on the other hand to provide and use knowledge in some uniform kind are very important to present day.

II. Urgency and goal of work

models for the time of researching in this area have undergone considerable development. In the present time there are a lot of instruments for creating and supporting ontologies, which besides common functions of editing and oversight perform support of documentation , import, export of ontologies in different formats, support of graphic editing, management of libraries etc.

These tools of constructing have several drawbacks. Most of the tools store their ontologies in text files, which limits size of , the have low productivity, have superfluity of functions, that makes user’s work more difficult. The additional development of algorithms for comfort of working with stored metadata is needed.

Basing on the features of analysis of existing tools drawbacks, we can say that subject of the article is examination of storing large and stable ontologies in the spatial database, and also development of information storage and retrieval system of construction and supporting ontologies.

The article describes the method of storage large and stable ontologies with using systems of management of spatial data. During the realization f this module the following features of ontologies were taken into account: in ontologies knowledge is formalized as a description of data domain by means of class hierarchy; a separate set of features and objects is given for each class, features in ontologies have definitional domain – class, for which this feature is set, and also value area.

Depending on the value area the features are divided into two types: T-features (values of this data type or set of fated values) and o-features ( values of which are objects of fated class).

We can say, that the hierarchy structure on ontologies is projected on spatial structure of database. It is necessary to note that ontologies can be very big, in some cases besides complicate hierarchy with amount of classes and features there can be stored millions and millions of objects. In addition to this situation, when in one database great number of ontologies are stored, the speed of queries execution to database becomes lower. As the considered database is one of the parts of complicate project, in which access to database is performed very often, so that in general the speed of work execution depends on the speed of queries execution to database simpliciter.

Methods of application should allow putting information about data domain like ontologies in the spatial database, and also allow high speed of query execution. There should be methods for processing ontologies, classes, objects and features of objects, and also administration of database session in it.

As a result, it is necessary to draw attention, that the suggested methods of storage and support of ontologies in the spatial database and methods of their management are universal, which allows wide using of the results of this work in research and applied work.

III. Semantic data description

Onlogies have been developed and used for solving different problems, including combined usage by people and program agents, possibility of accumulation and second knowledge use in data domain, creating models and programs, operating with ontologies, and not neatly specified structures of data, analysis of knowledge in the data domain.

For more intellectual generalization of sections of the information it is necessary for web-portals to define the , which should describe the terminology used in contents of a web-portal, and the axioms setting rules of use of these terms in a context of other terms. Set of and axioms is the model of the data description.

The base building block of data model is the statement representing a three: a resource, the called property and its value. In terminology (Resource Description Framework) these three parts of the statement accordingly refer to: the subject, a predicate and object [5].

Everything that is described by means is called a resource. It can be ordinary Web-page or its any part, for example, separate element HTML or , being a part of the described document. Also a resource can be the whole collection of pages, for example, separately taken Web-site. And, at last, something, not being accessible through the Internet can be resource, for instance, any subject from the world of things. In a word, everything that can attribute some URI (the universal identifier) or URI with addition of an internal name of object (a name of an anchor in HTML) can become a resource and be described by means of .

It is necessary to understand a certain aspect, the characteristic, attribute or the attitude used for the description of a resource as property. Each property has the specific sense, admissible values, type of resources to which it can be applied, and also attitudes with other properties.

According to the specification, value of property can have one of two types. The first is the resource set by some URI. The second type – a literal – is some text value of the characteristic. However, the literal can express value of any primitive type of the data which are present in . It’s test also can comprise a certain marking, for example, , but distinctive feature of such marking is that it is not processed by the -processor and is perceived as a usual line [6].

Real value cannot be estimated, while it is used for the internal purposes of a separately taken application. There will be the use of introduction, when it becomes means of interprograms interaction, data exchange when machines receive ability to combine the information received from various sources, thereby, receive any new information. The more applications on the Internet can work with data, the higher their value will be.

The description of technologies for development and support of ontologies.

The status of recommendation W3C and the presence of ready interoperability program decisions make technologies more attractive, than other technological decisions of knowledge engineering [7]. The key moment of the given approach is that besides the resources in our database metadata for the description of objects of storehouse and management by them, metadata, described by means of RDFS (Resource Description Framework Schema) language (fig. 1) are stored.



Model of storage of metadata

Fig.1 – Model of storage of metadata

The given approach is based on - data manager technologies Oracle Database 10g, including additional opportunities on processing spatial data for support of spatial services, different kinds of the GIS – applications intended for processing or granting of the information about the location of objects and other information systems.

Database Oracle 10g includes /RDFS languages support, enabling developers of applications to use advantages of a platform of a semantic data structure. Applied developers can supplement value to data and metadata, defining new sets of terms and attitudes between them. These sets of terms (”ontologies”) are more adapted for realization of queries and the analysis based on the semantic approach, than usual data sets. The ontologic data sets often contain millions of data elements and attitudes between them which can be grouped in triplets, using new model of data. Oracle supposes expansion to trillions of triplets for satisfaction of requirements of the majority of applications. What kind of storage principles of has 10g?

data are stored as directed, logic graph;

Subjects and objects are displayed as units, and predicates as ties at which the subject is the initial unit, and the object is final;

Ties are a full triplet;

the Data model supports three types of objects of a database:

Model ( graph, that consists of a set of triplets);

Base of rules (the set of rules);

the Index of a rule (directed graph).

Use of the proposed technology allows developers of a portal to create the uniform unified data presentation in all applications that will allow to find precisely the necessary information, simplify corporate data integration, reduce redundancy of data and provide unity of semantic values in all applications. All this, in turn, facilitates development, support and updating of applications within the limits of corporation.

The basic advantages of use 10g are:

Integration of data from different sources without using of programming;

Support of the decentralized management by data;

Support of all types of data;

SQL and restoration of models;

Realization of queries to Models, with use of the scheme the graph;

the Combination of queries to others SQL operators;

the Logic conclusion based on RDFS ( schemes) rules;

The logic conclusion based on rules, defined by the user in the application.

IV. Development of elements of the software of system

In a basis of the proposed approach is active use of metaknowledge not only for the description of syntax and semantics of language of knowledge representation, but also for ontologies constructing, describing the basic kinds between concepts of problem area, and also model of the user of the system. However, as it was already marked in the introduction, designing and development of ontologies, that is ontologic engineering, is not a trivial problem. It requires the developers to have professionally the knowledge engineering technologies — from methods of extraction of knowledge before their structurization and formalization [8].

Nowadays for the majority of ontologies construction tools the following principles are typical: first of all, though the main part of similar systems has a visual component, it is necessary to type some constructions manually, that raises a level of requirements to the ontologies developer – before starting the work directly, the expert is compelled to waste time for studying the language of representation of knowledge; secondly, a part of tools realizes the certain functionality for performance of ontologies queries, but, unfortunately, have no unified interface for formation and performance of queries from external applications; thirdly, practically there are no editors freely distributed and focused on the final user, which, naturally, slows down the development of all direction of engineering.

During the development of the tool environment for the developer we have tried to level minuses of analogues and to adopt their advantages. Any object of has graphic representation (not only classes and individuals, but also properties, ties, etc.). The system is the independent application which is capable to represent itself as an server. Now the editor completely supports designs of language of the description , work on expansion of its opportunities to language is conducted. On fig. 2 the architecture of the appendix is resulted.

In this article we have paid special attention to the development of the effective application of processing, creation and management of ontologies.

Let’s note, that each copy in the world of ontologies is a member of class THING, so that each class defined by us automatically is subclass THING.


Architecture of the developed system

Fig.2 – Architecture of the developed system

Work of the user in system begins with creation of new data model. In the given model the user can create own of a subject domain and in the further to edit it not mentioning other models. At the same time he has an opportunity at any moment to change current model of data and to start supporting another or in general to remove model from base (fig. 3).

For creation after model constructing the user passes on next tab “Classes”. In the left part of page the hierarchy of classes in the form of a tree realized by means of technology ajax is located.

When choosing any class in the right part of the window the properties belonging the given class, and also specimens concerning to them (fig. 3) are displayed. Here there is an opportunity of addition and removal of a class. Also on this page the user can attach properties to the chosen class and to add or delete specimens of a class. All changes are brought in base as – triplets.

On a tab “Property” the tree of properties is displayed, besides realization is based on technology ajax. In the given tree parental attitudes of properties to each other, i.e. hierarchy of properties are displayed. When choosing any property the tree of the instances showing their attitudes among themselves on given property.

On the given page there is an opportunity of addition of new property, removal of property and its editing. In property edition the user can change type of property (float, string, int, class), classes to which the given property can be attached, and also parents of property (fig. 4).

Representation of classes, their copies and properties

Fig.3 – Representation of classes, their copies and properties

The opportunity of the user independently to develop queries to a database is realized. Here we can combine usual sql queries with sparql queries. We shall consider a following example: to recognize all databases concerning to a class to spatial databases and to receive date of creation of base from other table. The given inquiry will look like that:

SELECT database_inf.createdate FROM database_inf, TABLE(SDO_RDF_MATCH(

‘(?m :type :Spatial_database)

(?m :nameOfDatabase ?name)’,

SDO_RDF_Models(’bk_sw_model’),

null,

SDO_RDF_Aliases(

SDO_RDF_Alias(”,sm_pkg.user_alias)),

null)

)t WHERE

sm_pkg.user_alias||database_inf.name=t.NAME


the Window of editing of property

Fig.4 – the Window of editing of property

Using the function SDO_RDF_MATCH we get access to our database of triplets. The first parameter is the basis sparql query, in which we particularly specify what we wish to receive, the second parameter is a model to which we address. The third parameter is the base of rules using which we get a possibility to make a logic conclusion .Fourth parameter is a space of model’s names. The fifth parameter is a filter, one of the parameters of sparql query. At first it is recommended to use parameter like “null” because for filter using it needs to be added into the rules base, which will be realized in the next version of the application.

The whole of the defined data domain, as it was mentioned earlier, is stored in a database like triplets. But triplets that are stored in any database do not bear any advantage, because the basis part of are agents, on queries they receive some kind of the certain resource description in the form of the text file described on or as in our case on language. In our system the module which gives out part of document, describing required object, by query of the intellectual agent or other system (the query is made using the http protocol) is realized. The module also gives the list of all objects, the information about which is stored in system. Agent requests formed document from database by the following address:

HTTP://<HOST_NAME>/<DATA_BASE_ACCESS_DESCRITION>/

<PROCEDURE_NAME>

<PARAMETERS_OF_QUERY>

The result of query of

http://localhost/apex/swagent?p=bk_sw the following -document comes back:

<? version=”1.0″?>

<: xmlns:=”http://www.w3.org/1999/02/22--syntax-ns#” xmlns:rdfs=http://www.w3.org/2000/01/rdf-schema# xmlns:model=”http://swhost.kture/swstore/dbl#”>

<:Description :about=”http://swhost.kture/swstore/dbl#bk_sw”>

<:type :resource=”http://swhost.kture/swstore/dbl#Spatial_database”/>

<model:model :resource=”http://swhost.kture/swstore/dbl#relational_mode”/><model:nameOfDatabase>bk_sw </model:nameOfDatabase>

</:Description>

</:>

Conclusions

In this article the way of storage of large and stable ontologies, using technology Spatial Database Oracle 10g is considered. The use of Oracle Database 10g for data management which are marked by semantic marking language. It allows to allocate a set of advantages in comparison with management approaches based on files or on specialized databases. First of all there is low risk, high quality, productivity and safety in this approach.

As a result of the analysis of storage and development existing systems of knowledge bases the following minuses [9] have been revealed:

Data is stored in files;

low productivity;

development of additional algorithms for convenience of metadata storage;

redundancy.

The information storage and retrieval system of development and support has been developed for elimination listed mines above.

As a result of the full description of objects and their properties, the data domain is presented as the complex of hierarchical knowledge base. It is possible to carry out “intellectual” operations on it, such as semantic and definition of integrity and reliability of data.

The basic advantages of the developed system are:

convenient storage in a spatial database;

access to ontologies granted by a server via web-service, preservation and extraction from depository;

absence of converter from format to the relational scheme and on the contrary realization necessity;

use of objective model, which represents concepts and attitudes from in a user-friendly object-oriented interface;

the convenient user interface;

granting of the object description in a text kind on user query.

One of the minuses of system is the complexity of introduction. Format has high complexity and it is not good for using by ordinary Internet users. Also this format does not allow to describe a data domain in corpore, therefore, support of the description by [5] will be stipulated in the future.

For many web-developers and programmers can be difficult to study and . Besides the main aim of the concept still is not known for many users. Work on popularization still is not finished, there are no practical examples.

The use of the proposed technology will allow developers to create the uniform unified data presentation in all applications. It will allow to find precisely the necessary information, will simplify corporate integration of data, will reduce redundancy of data and will provide unity of semantic values in all applications. All this, in turn, facilitates development, support and updating of applications.

References

[1] Filatov V.A., Khairova A.A. Technology of the educational web-services organization on the base of XMLDB, HTMLDB, // International scientific and technical magazine « Informational technologies and computer engineering »Vinnitsa: VNТU. – 2007г. – Ed.. 1 (18) – p. 240 – 247.

[2] Collins H. Enterprise knowledge portals: next generation portal solutions for dynamic information access, better decision making and maximum results. – N.Y.: AMACOM, 2003. – p. 403.

[3] Sherback S.S., Khairova А.А. Developing of education web-services as effective strategy of development network study// Scientific – practice forum «Informatization of business by yang people: progressive technologies,science, business undertakings » (17th – 18th of may 2007). – Kharkov: KNEU, 2007. – p. 73 – 74.

[4] Filatov V.A., Khairova A.A. Research of methods and tools for development educational web – services. // 11-th International youth forum « Radio electronics and youth in ХХІ a century ».Kharkov: KNURE, 2007. – p. 387.

[5] Berners-Lee, T. , Hendler, J., Lassilla O. The - a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities // Scientific American, May 2001.

[6] L.Stojanovic, J. Schneider, A. Maedche, S. Libischer, R. Studer, Th. Lumpp, A. Abecker, G. Breiter и J. Dinger. The role of ontologies in autonomic computing systems. - IBM Research Journal. 2004.

[7] Xavier Lopez, Susie Stephens, Jeam Ihm, Jayant Sharma, Melliyal Annamalai, Omar Olonso. Semantic Data integration for the Enterprise. March 2006.

[8] Ternier, S., Duval, E., Vandepitte, P. LOMster: Peer-to-peer Learning Object Metadata. In: P.Barker and S. Rebelsky (eds.) Proceedings of ED-MEDIA’2002 - World Conference on Educational Multimedia, Hypermedia and Telecommunications, Denver, CO, June 24-29, 2002, AACE - pp.1942-1943.

[9] Gavrilova T.A., Horoshevsky V.F. Knowledge base of intellectual systems: the Textbook for high schools. – SPb: “Peter”, 2000.


Понравилась статья, подписаться на новости можно здесь!

Популярность: 23%

1 Star2 Stars3 Stars4 Stars5 Stars (1 votes, average: 4 out of 5)
Loading ... Loading ...

{Онтологии+Spatial}

ORA-SPATIAL, Semantic Web, Онтологии 03.01.2008

РАЗРАБОТКА ВЫСОКОЭФФЕКТИВНЫХ СРЕДСТВ СОЗДАНИЯ И ОБРАБОТКИ ОНТОЛОГИЧЕСКИХ БАЗ ЗНАНИЙ

Филатов В.А., Щербак С.С., Хайрова А.А

Введение

С расширением Internet работа поисковых систем все более усложнялась: чтобы обеспечить достаточный охват, им приходилось индексировать и обрабатывать все больший объем информации. Но главная сложность заключалась даже не в увеличении количества индексируемых сайтов, а в том, чтобы обеспечить релевантные ответы на поисковые запросы пользователей, то есть выдавать пользователям ссылки на те ресурсы, которые, по их мнению, соответствуют тому, что они искали.

Современное состояние дел в отдельных областях компьютерных наук диктует необходимость привлечения методов инженерии знаний для решения широкого класса практических задач. Ярким примером тому является инициатива , основная цель которой – наделить огромные массивы данных, опубликованных в сети Internet большей осмысленностью, повысить удобство работы с этой информацией. Одним из главных достижений проекта стала разработка стандарта описания онтологий – ( Web Language), благодаря чему множество инженеров по знаниям, программистов и экспертов получили возможность использовать общие правила представления, хранения и обработки онтологий.

Существуют различные толкования самого понятия онтологии. В данной работе под онтологией понимается структурная спецификация некоторой предметной области, ее концептуальное описание в виде формализованного представления, которое включает словарь терминов предметной области и логические выражения, описывающее взаимосвязи этих понятий. Таким образом, онтология некоторой предметной области представляет собой тезаурус понятий этой предметной области, обеспечивающий возможность толкования терминов предметной области посредством интерпретации таких типов парадигматических отношений как «часть-целое», «класс-подкласс» и некоторых видов ассоциативных связей.

На волне интереса к онтологиям были созданы инструментальные средства и механизмы, специально ориентированные на широкое применение онтологий в задачах интеллектуального поиска, классификации, выявление несогласованности в данных, моделирования поведения интеллектуальных агентов. Однако даже наличие хорошего инструментального окружения не снимает проблем, связанных с трудностью проектирования и построения самих онтологий, а автоматизация процесса извлечения онтологий, как и в целом, задача извлечения знаний, и по настоящее время не имеют своего эффективного решения. Тем ценнее становятся уже разработанные онтологии и опыт их использования для решения широкого круга задач.

В процессе создания современных интеллектуальных информационных систем зачастую требуется интеграция знаний из разнородных источников и, как следствие, эффективное решение задач, связанных с тиражированием знаний. По-прежнему не имеет своего удовлетворительного решения проблема автоматизации процесса выбора адекватного специфике конкретной проблемной области и принятого в ней стиля рассуждения экспертов средства представления знаний. Поэтому и по сей день актуальны исследования, направленные на разработку такого подхода к представлению и тиражированию знаний, который с одной стороны позволял бы наиболее адекватно учитывать специфику проблемной области, а с другой – представлять и использовать знания в некотором унифицированном виде.

В начало

Актуальность и цель работы

Онтологические модели за время исследований в этой области претерпели значительное развитие. В настоящее время для создания и поддержки онтологий существует целый ряд инструментов, которые помимо общих функций редактирования и просмотра выполняют поддержку документирования онтологий, импорт и экспорт онтологий разных форматов и языков, поддержку графического редактирования, управление библиотеками онтологий и т.д.

Данные инструментарии построения онтологий обладают рядом существенных недостатков. Большинство инструментов хранит свои онтологии в текстовых файлах, что ограничивает размер онтологий, имеют низкую производительность, нужна дополнительная разработка алгоритмов для удобства работы с хранимыми метаданными, обладают избыточностью функций, что затрудняет работу пользователя.

Исходя из особенностей анализа недостатков существующих инструментариев, будем говорить, что тематикой статьи является рассмотрение проблемы хранения больших и стабильных онтологий в реляционной базе данных, а так же разработка информационно-поисковой системы создания и сопровождения онтологий.

Предлагается способ хранения больших и стабильных онтологий с помощью систем управления базами данных . При реализации данного модуля нам пришлось учитывать следующие свойства онтологий. В онтологиях знания формализуются в виде описаний предметной области с помощью иерархии классов. Для каждого класса задается свой набор свойств и объектов. Свойства в онтологиях имеют область определения – класс, для которого задается это свойство, а также область значений. В зависимости от областей значений свойства делятся на два типа: т-свойства (значениями которых являются константы заданного типа данных) и о-свойства (значениями которых являются объекты заданного класса).

Можно сказать, что иерархическая структура отологий проецируется на реляционную структуру баз данных. Следует понимать, что онтологии могут быть очень большими - в некоторых из них помимо сложной иерархии с множеством классов и свойств, могут храниться миллионы и миллионы объектов. В совокупности с ситуацией, когда в одной базе хранится множество онтологий, скорость выполнения запросов к базе данных сильно уменьшается. Так как рассматриваемая база данных является составной частью большого проекта, в котором обращение к базе происходит довольно часто, то от скорости выполнения запросов к базе напрямую зависит скорость работы приложения в целом.

Методы приложения должны позволить помещать в базу знаний информацию о предметной области в виде онтологий, а также обеспечивать высокую скорость выполнения запросов. В нем присутствуют методы работы с онтологиями, классами, объектами и свойствами объектов онтологий, а также управления сессией к базе данных.

Подводя итог, следует обратить внимание, что предлагаемый в данной работе способ хранения онтологий в реляционной базе и методы работы с ним являются универсальными, что позволяет широко использовать результаты предлагаемой работы в исследовательской и прикладной деятельности.

В начало

Семантическое описание данных

Онтологии разрабатываются и могут быть использованы при решении различных задач, в том числе для совместного применения людьми или программными агентами, для возможности накопления и повторного использования знаний в предметной области, для создания моделей и программ, оперирующих онтологиями, а не жестко заданными структурами данных, для анализа знаний в предметной области.

Для более интеллектуального обобщения разделов информации порталам необходимо определить свою онтологию, которая должна описывать терминологию, использующуюся в содержимом портала, и аксиомы, задающие правила использования этих терминов в контексте других терминов.

Базовый строительный блок модели данных - утверждение, представляющее собой тройку: ресурс, именованное свойство и его значение. В терминологии эти три части утверждения называются соответственно: субъект, предикат и объект.

Ресурсом называют все, что описывается средствами . Это может быть обыкновенная Web-страница или какая-то ее часть, например, отдельный элемент HTML или разметки, являющийся частью описываемого документа. Также ресурсом может быть целая коллекция страниц, например, отдельно взятый Web-сайт. И, наконец, в качестве ресурса может выступать нечто, не являющееся доступным непосредственно через Интернет, например, произвольный предмет из мира вещей. Одним словом, все, чему можно приписать некоторый URI (универсальный идентификатор) или URI с добавлением внутреннего имени объекта (имени якоря в HTML) может стать ресурсом и быть описано при помощи .

Под свойством следует понимать некий аспект, характеристику, атрибут или отношение, используемое для описания ресурса. Каждое свойство имеет свой специфический смысл, допустимые значения, тип ресурсов, к которым оно может быть применено, а также отношения с другими свойствами.

Согласно спецификации, значение свойства может иметь один из двух типов. Первый – это ресурс, задаваемый некоторым URI. Второй тип – литерал – есть некоторое текстовое значение характеристики. Впрочем, литерал может выражать собой значение любого примитивного типа данных, присутствующего в . Его тест также может содержать в себе некую разметку, например, , но отличительной особенностью такой разметки является то, что она не обрабатывается -процессором и воспринимается как обычная строка.

Реальное значение невозможно оценить, пока он используется для внутренних целей отдельно взятого приложения. Польза от внедрения будет тогда, когда он станет средством межпрограммного взаимодействия, обмена данными, когда машины получат способность комбинировать информацию, полученную из различных источников, тем самым, получая какую-то новую информацию. Чем больше приложений в Интернете смогут работать с данными, тем выше станет их ценность.

В начало

Описание технологий для разработки и сопровождения онтологий

Статус рекомендации W3C и наличие готовых интероперабельных программных решений делают технологии более привлекательными, чем другие технологические решения инженерии знаний.Ключевым моментом данного подхода является то, что кроме ресурсов в нашей базе данных хранятся так же метаданные для описания объектов хранилища и управления ими, метаданные описаны с помощь языка RDFS (рис. 1).


Модель хранения метаданных

Рисунок 1 – Модель хранения метаданных

Данный подход основан на технологии Oracle Spatial 10g. Oracle Spatial - это технология СУБД Oracle Database 10g, включающая дополнительные возможности по обработке пространственных данных для поддержки пространственных сервисов, различного рода ГИС-приложений, предназначенных для обработки или предоставления информации о местонахождении объектов и других информационных систем.

СУБД Oracle 10g включает поддержку /RDFS, давая возможность разработчикам приложений использовать преимущества платформы семантической организации данных. Прикладные разработчики могут дополнять значение к данным и метаданным, определяя новые наборы термов и отношений между ними. Эти наборы термов (”онтологии”) более приспособлены для осуществления запросов и анализа, основанного на семантическом подходе, чем обычные наборы данных. Онтологические наборы данных, часто содержащие миллионы элементов данных и отношений между ними, которые могут быть сгруппированы в триплеты, используя новую модель данных. Oracle допускает расширение биллионам триплетов для удовлетворения требований большинства приложений. Какие же собственно принципы хранения в Oracle Spatial 10g?

  • данные хранятся как направленный, логический граф;

  • Субъекты и объекты отображаются как узлы, а предикаты как связи, у которых субъект является начальным узлом, а объект конечным;

  • Связи представляют из себя полный триплет.

  • Oracle Spatial Модель данных

  • Модель данных поддерживает три типа объектов базы данных:

  • Модель ( граф, состоящий из набора триплетов);

  • База правил (набор правил);

  • Индекс правила (направленный граф).

Использование предложенной технологии позволит разработчикам портала создавать единое унифицированное представление данных во всех приложениях, что позволит точно находить необходимую информацию, упростит корпоративную интеграцию и интеграцию данных, сократит избыточность данных и обеспечит единство семантических значений во всех приложениях. Все это, в свою очередь, облегчает разработку, поддержку и обновление приложений в пределах корпорации.

  • Основными преимуществами использования Oracle Spatial 10g:

  • Интегрирование данных из разных источников без применения программирования;

  • Поддержка децентрализованного управления данными;

  • Поддержка всех типов данных;

  • SQL поиск и восстановление моделей;

  • Осуществление запросов к моделям, с использованием схемы графа;

  • Сочетание запросов с другими SQL операторами;

  • Логический вывод, основанный на RDFS ( схемы) правилах;