Огляд сучасних систем інтеграції неоднорідних баз даних і знань

Н.Г. Кеберле
Запорізький державний університет

З єдиних позицій проаналізовано сучасний стан систем інтеграції неоднорідних баз даних і знань

Ключові слова: неоднорідні бази знань, бази знань, семантична інтероперабельність,
онтологія предметних областей, онтологій задач, онтологія методів розв’язування
класів задач, формальна онтологія.

1. ВСТУП

Задача спільного використання неоднорідних баз даних, відома сьогодні також як окремий
випадок задачі досягнення інтероперабельності інформаційних ресурсів, виникла на
початку 80-х р.р. XX сторіччя.

На той час у розвинутих інформаційних системах (ІС) уже була потреба спільного використання
декількох (можливо, розподілених) баз даних, керованих різними СКБД, що супроводжувалося
значними зусиллями з боку розроблювачів цих інформаційних систем. Прикладами рішення
задачі про спільне використання мережних, ієрархічних і реляційних баз даних, що
відносяться до початку 80-х р.р., можуть бути проекти СИЗИФ [24, 25, 26], POLYPHEME[2],
проект Каліфорнійського університету [6] та інші.

На сьогоднішній день ця задача набула ще більш важливого значення, у зв’язку зі
зростанням кількості різноманітних за змістом, структурою, обсягом інформаційних
ресурсів (баз даних, баз знань, програмних компонентів і т.д.), створених на різних
програмно-апаратних платформах. Інформація, представлена цими ресурсами, багаторазово
дублюється, її спільне використання утруднене в силу різних специфікацій інформаційних
ресурсів, прийнятих різними розроблювачами. Така ситуація послужила причиною розвитку
досліджень в області спільного і повторного використання компонентів інформаційних
ресурсів. Важливість даної проблематики була підкреслена в [27] і виділена як один
із трьох базових напрямків у дослідженнях на поточне десятиріччя.

Наведемо основні використовувані надалі визначення.

Інтероперабельність означає можливість створення систем з довільних неоднорідних,
розподілених компонентів, на основі уніфікованих інтерфейсів [23].

Інтероперабельна інформаційна система складається з компонентів, що представляють
довільні інформаційні ресурси (програмні компоненти, бази даних, бази знань, файли
даних і т.д.), які розглядаються незалежно від апаратно-програмної платформи і розміщення
в просторі. Компоненти взаємодіють, обмінюючись заявками.

Задачу досягнення інтероперабельності різнорідних інформаційних ресурсів можна розбити
на дві підзадачі:

1.     Досягнення технічної інтероперабельності, тобто забезпечення
спільної роботи різнорідних апаратно-програмних платформ. У даному огляді питання
технічної інтероперабельності розглядатися не будуть, оскільки саме цю проблему
вирішував консорціум Object Management Group, OMG (потрібну інформацію можна почерпнути
в [17,18,19]).

2.     Досягнення семантичної інтероперабельності, тобто забезпечення
спільного використання різнорідних інформаційних ресурсів на семантичному рівні.

Розглянемо системи інтеграції неоднорідних баз даних і баз знань з погляду семантичної
інтероперабельності і використані в цих системах підходи.

2. СЕМАНТИЧНА ІНТЕРОПЕРАБЕЛЬНІСТЬ

У випадку створення ІС на неоднорідних інформаційних ресурсах, для досягнення семантичної
інтероперабельності необхідно вирішувати проблеми порівняння вмісту цих ресурсів,
відшукання відповідностей і вирозв’язування конфліктів між ними, а також проблему
сполучення різнорідних ресурсів. Отже, задача побудови семантично інтероперабельної
ІС складається з трьох частин:

1.      Вироблення специфікацій, достатньо уніфікованих
і повних з погляду конкретної задачі, для всіх інформаційних ресурсів.

2.      Вироблення засобів порівняння можливостей доступних
інформаційних ресурсів з потребами прикладних задач, розв’язуваних даною ІС.

3.      Створення несуперечливої й адекватної моделі предметної
області задачі шляхом композиції моделей предметних областей, які представлені конкретними
інформаційними ресурсами.

При цьому повна специфікація інформаційного ресурсу буде охоплювати:

·       специфікацію його структури і функцій (статичні
характеристики);

·       специфікацію обмежень цілісності;

·       специфікацію поведінки інформаційного ресурсу
(динамічні характеристики);

·       специфікацію контексту, тобто області, у якій
передбачається використання ресурсу.

Сучасні системи інтеграції неоднорідних інформаційних ресурсів використовують концепцію
медіатора (див. наприклад в [20]), тобто посередника між розподіленими інформаційними
ресурсами у межах інтероперабельної системи та користувачами цих ресурсів.

Структура і поведінка конкретного інформаційного ресурсу завжди визначена семантикою
предметної області, що її відображає цей ресурс. Специфікація цієї змістовної оболонки
даних може бути виконана у вигляді інформаційної схеми (як, наприклад, у структурованих
моделях даних типу реляційної). Однак на більш загальному рівні, будь-яку специфікацію
семантики даних можна записати деякою формалізованою мовою, наприклад, численням
предикатів першого порядку, або багатосортною логікою.

Як інструмент створення таких узагальнених специфікацій була запропонована ідея
використання онтологічних специфікацій.

У [23] наведено визначення онтологічної специфікації інформаційного компонента
як набору визначень і понять, а також правил (аксіом), пов’язаних з визначеннями
і поняттями з предметної області (прикладного контексту).

Термін “онтологія” сьогодні використовують у двох контекстах:

·         у філософському: онтологія
– система категорій, використовувана для розгляду з урахуванням конкретного бачення
світу [11];

·         у контексті інформаційних систем:
онтологія – формалізований опис загальноприйнятого розуміння деякої предметної
області, за допомогою якого можуть спілкуватися люди, комп’ютерні системи [22].
Програмні компоненти, для взаємодії між собою в рамках інтегрованої системи неоднорідних
ресурсів, використовують онтології. Передбачають, що онтологія не залежить
від мови представлення предметної області.

Онтологія, на відміну від бази знань, не містить ані знань про методи розв’язування
задач, що стосуються предметної області, ані знань, що дають змогу видавати відповіді
на прямі запити про предметну область [9].

На відміну від метаданих, таких як тип, розмір атрибута, онтології повинні мати
набагато багатші засоби вираження семантики даних. Онтологія може бути традиційною
ієрархією понять і типів об’єктів, разом з точним описом кожного типу, однак може
містити й аксіоми, що задають обмеження на можливі інтерпретації цих понять[9].

За сучасними уявленнями, розрізняють чотири типи онтологій: онтології предметних
областей
, онтології задач, онтології методів розв’язування
класів задач, і формальна онтологія [11].

Онтологія, специфічна для домену, або онтологія предметної області (domain-specific
ontology) – опис предметної області, що не залежить від її використання.

Онтологія задач (task ontology) – опис термінів предметної області, прийнятої в
конкретному класі задач.

Онтологія методів рішення класу задач (problem-solving methods ontology)– опис термінів
і правил, у яких задані методи рішення класу задач. При цьому методи рішення задач
– незалежні від предметної області специфікації алгоритму рішенні проблеми (задачі),
які можна використовувати для різних предметних областей і (можливо) різних класів
задач.

Формальна онтологія (formal ontology або top-level ontology) – опис абстрактних
понять, таких як “простір”, “час”, об’єкт”, “подія” тощо.

3. ДОСЛІДЖЕННЯ В ОБЛАСТІ ОНТОЛОГІЙ

Перші праці з дослідження онтологій з’явилися на стику таких галузей науки як штучний
інтелект, філософія, логіка і теорія баз даних.

Одним з найперших проектів, у якому використано поняття онтології, є проект CYC
[13]. Його мета – створення величезної (близько 100 000 000 аксіом) бази знань про
навколишній світ, яку можна було б використовувати в системах штучного інтелекту
для того, щоб перебороти обмеженість сприйняття такими системами навколишнього світу
в силу відсутності в їхніх базах знань набору загальноприйнятих понять, так званого
загальноприйнятого змісту (common sense).

У рамках проекту CYC була розроблена мова представлення знань CycL. База знань була
розділена на два рівні: епістемологічний (для визначення понять, їх зв’язків, аксіом,
що задають обмеження) і евристичний (представлений набором засобів логічного висновку,
таких як “генератор аргументу”, “порівняння аргументів”, “знаходження протиріч”,
“відновлення логічних висновків”, і функціонального інтерфейсу для спілкування з
евристичним рівнем бази знань CYC). База знань використовує онтологію, організовану
за принципом колекцій категорій (точніше, натуральних сортів Куайна), упорядкованих
за допомогою абстракцій узагальнення / спеціалізації.

Колектив розроблювачів зі Стенфордського університету з кінця 1980 р. займається
розробкою і стандартизацією мов представлення знань [8], інструментальними засобами
створення і модифікації онтологій [9]. У середовищі Ontolingua [9] можна створювати
онтології доменів, класів задач, методів розв’язування класів задач.

Особливе місце в дослідженні онтологій посідає розробка формальної онтології, яку
розглядають як “…теорію апріорних форм і суті об’єктів…”[12]. Метою цих досліджень
є розробка системи логічних примітивів (предикатів), представлених на деякій формалізованій
мові, структурованих на підставі множини розглянутих раніше онтологічних угод про
довільну предметну область. Особливу цінність здобуває формалізація визначень тієї
чи іншої категорії, для того, щоб при побудові онтології використовувати строгі
принципи поділу типів, а не інтуїтивні, евристичні правила [12].

Подальшою задачею є об’єднання цих систем примітивів, і приведення їх до загальної
формальної онтології.

4. СИСТЕМИ ІНТЕГРАЦІЇ НЕОДНОРІДНИХ БАЗ ДАНИХ

Відповідно до класифікації, запропонованої в [20], існуючі у світі інформаційні
системи можна розділити на три покоління, за рівнем інтероперабельності.

Перше покоління: інформаційні системи, засновані на структурованих базах даних.
Домінуючий підхід при розподілі даних – використання федеративних систем баз даних.
Основа для технічної інтероперабельності – локальні мережі.

Друге покоління: інформаційні системи ґрунтуються на структурованих базах даних,
частково структурованих даних (текст, гіпертекст у форматі SGML), на форматах даних,
специфічних для конкретної предметної області (наприклад, графіка, відео тощо).
Дані можуть зберігатися на десятках локальних мереж, об’єднаних між собою. Вважають
досягнутою технічну інтероперабельность, основну увагу приділяють узгодженню мов
звертання до даних і узгодження структур інформаційних компонентів.

Третє покоління: інформаційні системи, засновані на усіх відомих способах комп’ютерізованого
збереження даних, особливу увагу приділяють підтримці відео / просторових / часових
/ наукових даних. Дані можуть зберігатися як у глобальних корпоративних мережах,
так і в Інтернет. Вважають досягнутою технічну, синтаксичну, структурну інтероперабельність,
і особливу увагу приділяють узгодженню семантики використовуваних компонентів.

Вочевидь, сьогодні найрозвиненішими є інформаційні системи першого покоління інтероперабельності,
але для нас більш цікавими будуть системи другого і третьго поколінь.

Є декілька проектів систем другого покоління, що використовують погляд на світ з
боку семантики, закладеної в метаданих, і застосовують онтології. До таких проектів
відносяться SIMS [3], HERMES [1],
InfoSleuth [4], TSIMMIS [7], Information Manifold [14],
OBSERVER[16].

Ці проекти надають доступ до гетерогенних і розподілених інформаційних ресурсів.

Розглянемо ті з них, що надають можливість спільного використання неоднорідних баз
даних.

SIMS (sims)

Модель предметної області (application domain) створюється із використанням системи
представлення знань для того, щоб забезпечити фіксований словник описів об’єктів
предметної області, атрибутів і відносин між об’єктами. Кожному інформаційному ресурсу
ставиться у відповідність модель, у якій описана використовувана в цьому ресурсі
модель даних, мова запитів, розташування в мережі, приблизні розміри, і т.д., а
також зміст атрибутів цього ресурсу в термінах моделі предметної області. Запити
в SIMS формулюються загальною мовою високого рівня також в термінах моделі предметної
області. SIMS визначає потрібні інформаційні ресурси за допомогою знань, закладених
у модель предметної області й у моделях інформаційних ресурсів системи. Потрібні
інформаційні ресурси визначаються під час виконання запиту.

HERMES (hermes)

Зовнішні інформаційні ресурси представлені у вигляді доменів, що виконують визначені
функції з визначеними вхідними і вихідними типами даних. Опис зовнішніх ресурсів
виконується за допомогою гібридних баз знань [15]. Звертання
до цих доменів виконується за допомогою декларативної мови, заснованої на формальній
логіці. На технічному рівні інтероперабельності використовується архітектура медіаторів.

INFOSLEUTH (infosleuth)

Інформаційні ресурси доступні на рівні семантичних концепцій, що є досягненням автономії
даних. Інформаційні запити формулюються природно, незалежно від структури, розміщення
і навіть існування потрібних інформаційних ресурсів. INFOSLEUTH фільтрує ці запити,
сформульовані на семантичному рівні, і знаходить потрібні значення в доступних на
час запиту інформаційних ресурсах.

У проекті використовується загальна онтологія домену, і локальні відображення схем
баз даних у цю загальну онтологію. Система виконує попередню обробку і перетворює
дані з окремої бази даних у записи, атрибути яких є концепціями загальної онтології
домену.

TSIMMIS (tsimmis)

Підтримується модель даних і загальна мова запитів для об’єднання інформації зі
структурованих і частково структурованих джерел даних. Особлива увага приділяється
автоматичному створенню трансляторів і медіаторів для доступу до різнорідних ресурсів.
Результуюча інформація представляється в моделі обміну об’єктами (Object Exchange
Model).

Information Manifold (imhome.html)

Призначена для підтримки інформаційних ресурсів (структурованих і неструктурованих).
Архітектура система заснована на базі знань, що містить багату модель предметної
області, у термінах якої і відбувається опис ресурсів. Користувач має можливість
переглядати інформаційну базу як у виді бази знань, так і у вигляді окремих інформаційних
ресурсів, і задавати запит на пошук на декларативній мові запитів. Головною задачею
й особливістю цієї системи є можливість оптимізації запиту користувача.

Щодо систем 3-го покоління інтероперабельності зазначимо, що на сьогодня існує декілька,
наразі тільки рамкових, програм зі створення таких систем. Це:

Knowledge Sharing Effort (knowledge-sharing)

Intelligent Integration of Information (i3)

Digital Library Initiative (dli_home.html)

Як можна побачити, у сучасних системах використовуються дві концепції архітектури
медіатора:

1.          Централізований підхід,
за яким необхідно існує центральний медіатор. Цей медіатор визначає, до якого ресурсу
треба звернутися при відповіді на запит користувача, за допомогою центрального словника
даних, або загальної онтології ІС. (TSIMMIS, Information Manifold).

2.          Децентралізований підхід,
в якому кожен ресурс має програмного агента, що відображає онтологічну специфікацію
ресурсу в загальну онтологію даної ІС. Відповідь на запит формується після комунікації
агентів окремих ресурсів із агентом брокера ресурсів, який, на відміну від центрального
медіатора, визначає релевантні ресурси в процесі відповіді на запит, виходячи із
доступних/релевантних ресурсів (InfoSleuth, SIMS, HERMES).

5. СИСТЕМИ СПІЛЬНОГО ВИКОРИСТАННЯ ЗНАНЬ

В разі спільного використання різних баз даних цінність становить обсяг і семантика
даних, що зберігається в тій чи іншій базі. Водночас, розробка комплексних систем
знань пов’язана зі значними зусиллями по формалізації і представленню знань, тому
що цінність матимуть якість і повнота наявних концепцій. Тому поряд із системами
інтеграції неоднорідних баз даних, не менше значення мають дослідження в
області спільного використання компонентів баз знань.

Проект IBROW3 [5] призначений для розробки інтелектуального сервісу, що дозволить
використання компонентів знань від різних розроблювачів, з використанням технологій
WWW. У рамках проекту використовуються і онтології предметних областей, і онтології
класів задач, і онтології методів рішення класів задач. Як базову мову для опису
бібліотеки методів рішення задач в цьому проекті використовують мову UPML.

Паралельно IBROW3 розвивається проект DARPA за назвою High-Performance Knowledge
Bases (HPKB) (http://www.teknowledge.com:80/HPKB). Метою проекту було створення
масштабованих, повторно використовуваних компонентів знань і доступ до них за допомогою
Internet. Зараз на зміну проекту HPKB прийшов проект RKF (Rapid Knowledge Formation),
метою якого є розробка механізмів для швидкого проектування баз знань із компонент.

6. Доступ до різнорідних даних в Інтернет

Особливе місце в системах інтеграції неоднорідних компонентів відіграває Інтернет
і World – Wide Web. Величезна кількість інформації розсіяна по Мережі, і тут важливість
має пошук релевантної інформації і відсікання непотрібної інформації. Сучасні машини
пошуку (search engines), що застосуються на пошукових серверах, мають потребу в
додаткових засобах пошуку тільки релевантної інформації. Онтології предметних областей,
як засоби специфікації онтологічних угод між постачальниками інформації і користувачами,
можуть змінити ситуацію на краще. Використання онтологій дає змогу користувачу сформулювати
свій запит на вищому рівні абстракції, ніж це можливо при пошуку по ключових словах.

Розглянемо приклади систем, що використовують онтології для роботи з Інтернет.

OBSERVER (http://siul02.si.ehu.es/~jirgbdat/OBSERVER)

Ця система пропонує підхід використання безлічі вже існуючих онтологій для доступу
до гетерогенних, розподілених і незалежно розроблювальних репозиторіях даних [16]. Реалізація такого підходу — ідеологія брокера
онтологій предметних областей. Передбачається, що існує безліч заздалегідь створених
онтологій предметних областей, і користувачу необов’язково “підбудовуватися” під
конкретну онтологію. Користувач формулює свій запит на деякій мові, у термінах однієї
чи декількох онтологій, і брокер «шукає» релевантні інформаційні ресурси, виконуючи
транслювання запиту в придатні онтології, а в разі потреби, і сполучення декількох
онтологій для більш точної відповіді на запит.

OntoSeek [10]

Ця система розроблена для контекстного отримання інформації з он-лайнових “жовтих
сторінок” та каталогів продуктів. Система може працювати як з однорідними, так і
з неоднорідними каталогами продуктів. Для точної фіксації контексту може бути застосований
інтерактивний підхід, коли користувач поступово уточнює зміст ключових слів, за
допомогою лінгвістичної бази даних WordNet.
WordNet – це лінгвістична база даних, що складається із сінсетів(synsets) – груп
слів, еквівалентних за змістом. WordNet є водночас і лексичним словником (створеним
для декількох європейських мов), і онтологією, що представляє зв’язки між словами
у словнику. Опис ресурсу реалізується у вигляді лексичного концептуального графа[21],
де вершини відповідають словам, а іменовані дуги – семантичним відносинам між словами
(наприклад, відносини типа “частина”, або “підклас”, або ін.), назви вершин і дуг
також беруть із WordNet, під час створення концептуального графа конкретного ресурсу.
Знаходження ресурсів, відповідних до запиту користувача, базується на порівнянні
онтологій (лексичних концептуальних графів) цих ресурсів. А саме, при відборі ресурсів,
відповідних до запиту користувача, OntoSeek виконує порівняння концептуального графа
запиту із існуючими концептуальними графами ресурсів або з частинами цих графів.

OntoSeek має централізований сервер, на якому знаходиться база даних лексичних концептуальних
графів відомих системі ресурсів, але створення таких графів виконується з боку клієнта.

Підхід, використаний в OntoSeek, відрізняється від підходу, який застосовується
у моделі W3C Resourse Description Framework (W3C RDF,
http://www.w3c.org)
. У RDF опис структури даних (тобто, схема даних у вигляді
<subject, predicate, object>), додається прямо у HTML/XML документ, а не зберігається
окремо. Ніяких додаткових умов щодо семантичної узгодженості даних RDF не вимагає.

7. Підсумки

Отже, зроблено спробу конкретизації стану сучасних систем інтеграції неоднорідних
баз даних і баз знань, і підходів, використаних у цих системах.

Сьогодні задача інтеграції неоднорідних ресурсів має багато розв’язків. Однак, серед
узагальнювальних факторів її розв’язування виділимо такі:

1. використання онтологій як специфікацій предметних областей, задач, методів рішення
задач;

2. розвиток інтернет-технологій, що дають змогу зробити різнорідні інформаційні
ресурси «ближче до користувача»;

3. застосування систем інтелектуальних агентів для реалізації архітектури медіатора
неоднорідних розподілених інформаційних ресурсів.

ЛІТЕРАТУРА

1.
Adali S., Subrahmanian V.S. Amalgamating knowledge bases, II. Distributed mediators.
International Journal of Intelligent and Cooperative Information Systems 3(4): 349-383,
1994.

2.        Adiba M.et al.
POLYPHEME:An Experience in Distributed Data Base System Design and Implementation.-In:
Proc. of the International Symposium on Distributed Data Bases. Paris. Amsterdam:
North-Holland, 1980.

3.
Arens Y., Knoblock C.A., Shen W. Query Reformulation for Dynamic Information Integration.
Journal of Intelligent Information Systems. 1996.

4.
Bayardo et al. InfoSleuth: Semantic Integration of Information in Open and Dynamic
Environment. In Proceedings of the 1997 ACM International Conference on the Management
of Data (SIGMOD), Tucson, Arisona, May 1997.

5.        Benjamins V.R.
et al. IBROW3: An Intelligent Brokering Service for Knowledge-Component Reuse on
the World – Wide Web. Proceedings of the 11th Workshop on Knowledge Acquisition,
Modeling and Management, KAW’98
.

6.        Cardenas A.F, Pirahesh
M.H. Data Base Communication in a heterogeneous data base management system network.
-Information Systems, 1980, 5, p.55-79
.

7.        Garcia-Molino H.
et. Al. The TSIMMIS Approach to Mediation: Data Models and Languages. In Proceedings
of the NGITS (Next Generation Information Technologies and Systems), June 1995.

8.        Genesereth M.R.,
Fikes R.E., et.al. Knowledge Interchange Format Version 3.0 Reference Manual. Logic-92-1,
Stanford University Logic Group, 1992.

9.        Gruber T. A Translation
Approach to Portable Ontology Specifications. Knowledge Acquisition, 5:199-220,
1993.

10.     Guarino N., Masolo C., Vetere G.
Content-Based Access to the Web. IEEE Intelligent Systems,
May/June 1999,
p.70-80.

11.
Guarino N. The Role of Ontologies in Information Systems Design. Proceedings of
the First International Conference on Formal Ontologies, FOIS’98.

12.     Guarino N., The Ontological Level.
In: Casati R., Smith N. and White G.(eds.), Philosophy and the Cognitive Sciences,
Vienna: Ho:lder-Pichler-Tempsky, 1994.

13.     Lenat D. et al. CYC: Toward programs
with Common Sense, Communications of the ACM, Vol.33, No.8, august 1990, p. 30-49
.

14.     Levy A., Srivastara D., Kirk T.
Data Model and Query Evaluation in Global Information Systems, Journal of Intelligent
Information Systems, 5(2), September 1995.

15.
Lu J., Nerode A., Subrahmanian V.S. Hybrid Knowledge Bases, IEEE Transactions on
Knowledge and Data Engineering, 1994.

16.
Mena E., Kashyap V., Sheth A., Illaramendi A. OBSERVER: An Approach for Query Processing
in Global Information Systems based on Interoperation across Pre-Existing Ontologies.
In Proceedings of the First IFCIS International Conference on Cooperative Information
Systems (CoopIS’96), Brussels (Belgium), June. IEEE Computer Society Press, 1996.

17.
Object Managament Group, “Object Managament Architecture Guide”, OMG Document Number
91.11.1, September 1, 1992.

18.     Object Managament Group, “Object
Services Architecture”, Revision 8.0
.

19.     Object Managament Group, “The Common
Object Request Broker: Architecture and Specifications”, OMG Document Number 91.12.1,
December 1991
.

20.     Sheth
A.P. Changing Focus on Interoperability in Information Systems: from System, Syntax,
Structure to Semantics
.
In: Interoperating Geographic Information Systems. Goodchild M.F., Egenhofer M.J.,
Fegeas R. and Kottman C.A. (eds.). Kluver. 1998.

21.     Sowa J. Conseptual Structures: Information
processing in Mind and Machine. Addison-Wesley,
Reading, Mass.,1984.

22.     Uschold M., Gruninger M.
Ontologies: Principles, Methods and Applications. Knowledge Engineering Review,
11(2), 1996.


23.     Брюхов Д.О., Задорожный В.И., Калиниченко Л.А.,
Курошев М.Ю., Шумилов С.С. Интероперабельные информационные системы: архитектуры
и технологии. // СУБД. Москва, 1995, №4. – С.86-113.

24.     Калиниченко Л.А., Рывкин В.М., Чабан
И.А. Принципы организации и архитектура СИЗИФ — системы организации интегрированных
баз данных
// Программирование. – Москва, 1975,
№ 4.

25.     Калиниченко Л.А., Рывкин В.М., Чабан
И.А. Основные особенности языка манипулирования данными в системе интегрированного
запоминания информации СИЗИФ // Программирование.
– Москва, 1975, № 6.

26.     Калиниченко Л.А. 1983. Методы и
средства интеграции неоднородных баз данных.
– Москва: Финансы и Статистика,
1983. – 300 с.

27.     Программа
исследований в области баз данных на следующее десятилетие (Асиломарский отчет о
направлениях исследований в области баз данных)
// Открытые системы. – Москва,
1999, №1.

HETEROGENEOUS database and knowledge-based INTEGRATING SYSTEMS: THE REVIEW

N.G. Keberle

Zaporozhye State University In Zaporizhzhya

The short review of modern systems integrating information stored in heterogeneous
databases and knowledge-based systems is presented. Discussed are such systems which
use domain ontologies, problem-solving methods ontologies as the means of semantic
integration of heterogeneous information resources. Ontologies help in achieving
sharing and reuse of information resources, allowing formal representation of semantics
of correspondent domains.

Key words: heterogeneous information system; database system; knowledge-based system;
semantic interoperability; domain ontology; task ontology; problem-solving methods
ontology


Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *


Ответить с помощью ВКонтакте: