<<
>>

Структура и принципы организации базы данных и базы знаний

Предметная область представляется моделями данных нескольких уровней. Можно выделить три уровня моделей и соответствующие им этапы проектирования: инфологиче- ская, даталогическая и физическая модель предметной области [41-43].

Инфологическая модель предметной области. Для того чтобы спроектировать структуру БД, необходима исходная информация о предметной области. Желательно, чтобы информация была представлена в формализованном виде. Описание предметной области, выполненное без ориентации на используемые в дальнейшем программные и технические средства, называется инфологической моделью предметной области.

Основным требованием к инфологической модели является требование адекватного отображения предметной области. Модель должна быть непротиворечивой, она служит единым интегрированным описанием предметной области и отражает взгляды и потребности всех пользователей системы. При разработке не должна допускаться неоднозначная трактовка модели.

Инфологическая модель предметной области строится первой: предварительно еще на предпроектной стадии, а затем уточняется на более поздних стадиях проектирования ЭС. Затем на ее основе строится даталогическая модель.

Даталогическая модель БД. Представляет собой модель логического уровня и отражает логические связи между элементами данных безотносительно к их содержанию и среде хранения. Хотя даталогическое проектирование считается проектированием логической структуры БД, на него оказывают влияние возможности физической организации данных, предоставляемые конкретной системой управления базами данных (СУБД). Поэтому знание особенностей физической организации данных полезно при проектировании логической структуры.

Результат даталогического проектирования — описание логической структуры БД на языке описания данных.

Логическая структура БД, а также сама заполненная данными БД — отображения реальной предметной области. Поэтому на выбор проектных решений самое непосредственное влияние оказывает специфика отображаемой предметной области, отраженная в имитационной модели (ИМ).

Физическая модель БД. Третьим и самым нижним уровнем представления БД считается физический уровень. Физическое проектирование означает определение средств хранения, методов извлечения данных и индексов, используемых в БД. Физическая организация данных оказывает наибольшее влияние на эксплуатационные характеристики проектируемой системы, так как именно на этом уровне происходит ее привязка к физической памяти.

Физическое проектирование заключается в разработке спецификации БД, которая при этом разбивается на ряд отдельных файлов (таблиц), каждый из которых содержит определенную информацию о предметной области. Такое разбиение осуществляется в соответствии с проведенным заранее инфологическим и логическим проектированием.

Логическая структура БД определяет основу, на которой строит свою работу проектировщик. Логическая структура данных остается неизменной в течение процесса физического проектирования. Кроме того, физическое проектирование можно рассматривать как дальнейшее совершенствование логической структуры.

Физическое проектирование выполняют технические специалисты СИТ. Они должны точно знать как СУБД обрабатывает обращение к данным и какие методы обращения к данным будут наиболее эффективны. Их цель состоит в оптимизации общих затрат на оборудование, программном обеспечении и оплате персонала.

Физическая модель определяет используемые запоминающие устройства, способы физической организации данных в среде хранения. Модель физического уровня также строится с учетом возможностей, предоставляемых СУБД. Описание физической структуры БД называется схемой хранения. Рис. 3.4 показывает, какие уровни моделей проектирования БД существуют; здесь же приводятся соответствующие этим уровням примеры и типичные конструкции. Также видно направление перехода из одного уровня в другой.

Рис. 3.4. Три уровня моделей данных

Рис. 3.4. Три уровня моделей данных

На рис. 3.5 изображены три уровня моделей и соответствующие им этапы проектирования. Трехуровневая архитектура (инфологический, даталогический и физический уровни) позволяет обеспечить независимость хранимых данных от использующих их

программ (рис. 3.6). Администратор БД может при необходимости переписать хранимые данные на другие носители информации и реорганизовать их физическую структуру, изменив лишь физическую модель данных.

Рис. 3.5. Уровни моделей данных

Рис. 3.5. Уровни моделей данных

Концептуальное проектирование БД включает анализ информационных потребностей пользователей и определение необходимых им элементов данных. Результат концептуального проектирования — концептуальная схема, единое логическое описание всех элементов данных и отношений между ними.

Внешний уровень составляют пользовательские представления данных. Каждая поддающаяся определению пользовательская группа получает свое собственное представление данных в БД. Каждое такое представление данных дает ориентированное на пользователя описание элементов данных, из которых состоит представление данных и отношений между ними. Его можно напрямую вывести из концептуальной схемы. Совокупность всех таких пользовательских представлений данных и есть внешний уровень.

Внутренний уровень обеспечивает технологический взгляд на БД: дисководы, физические адреса, индексы, указатели. За этот уровень отвечают проектировщики физической БД, принимающие решение какие физические устройства будут хранить данные, какие методы доступа будут использоваться для извлечения и обновления данных и какие меры следует принять для поддержания или повышения быстродействия СУБД.

!supportMisalignedColumns]>

Администрирование базы данных

Конечный

Проектирование

Проектирование

пользователь

логической структуры

физической структуры

П ол ьзо вател ьское представление данных

П ол ьзо вател ьское представление данных

Пользовательское

представление

данных

Пользовательское

представление

данных

Пользовательское

представление

данных

П ол ьзо вательское представление данных

Внешний уровень              Концептуальный уровень Внутренний уровень

Рис.

3.6. Трехуровневая архитектура БД: и 2— преобразования данных

Этап концептуального проектирования включает создание концептуальной схемы БД. Спецификации разрабатываются в той степени, которая требуется для перехода к реализации. На этом этапе создаются подробные модели пользовательских представлений данных; затем они интегрируются в концептуальную модель (семантическая модель), фиксирующую все элементы корпоративных данных, которые будет содержать БД.

Реализация — это шаги, которые необходимо выполнить для превращения концептуальной модели в функционирующую БД (рис. 3.7).

В процессе реализации выбирается и приобретается СУБД. Затем подробная концептуальная модель превращается в проект реализации БД; создается словарь данных, БД наполняется данными, создаются прикладные программы и обучаются пользователи. В данном случае была выбрана реляционная СУБД.

С помощью процедур проектировщик преобразовал концептуальную модель в проект реализации и получил таблицы с помощью языка              „              _ , „

J              Рис. 3.7. Этап реализации

определения данных.              базы данных

Построение словаря данных представляет собой ключевой шаг в реализации БД, поскольку является центральным хранилищем определений структуры данных БД. Поскольку словарь содержит информацию о полномочиях доступа, правила защиты данных и контроля данных, он действует как управляющий центр системы. Затем разработчики изучают пользовательские представления данных и приложения, пользующиеся БД.

Рассмотрим более подробно особенности создания инфологической модели БД. Центральной компонентой этой модели считается описание объектов предметной области и связей между ними [41, 42 и др.]. При описании предметной области следует отразить связи между объектом и характеризующими его свойствами. Это изображается в виде линий, соединяющих обозначение объекта и его свойства.

В зависимости от назначения каждая информационная система имеет дело с той или иной частью реального мира, которую принято называть предметной областью системы. Проектирование БД выполняется на основе обследования предметной области.

Модель данных включает несколько объектов. Между объектами модели данных устанавливаются связи. Совокупность взаимосвязанных конкретных объектов модели для некоторой предметной области образует БД.

Предметная область данной информационной системы рассматривается как некоторая совокупность реальных объектов (сущностей), которые представляют интерес для ее пользователей. Примерами объектов предметной области могут служить персональные ЭВМ, программные продукты, их пользователи. Каждый из них обладает конкретным набором свойств (атрибутов). Так, компьютер характеризуется названием идентификатора модели, типом микропроцессора, объемом оперативной и внешней памяти, типом графической карты и т.д.

Сущность (entity) — это объект, который может быть идентифицирован неким способом, отличающим его от других объектов, т.е. это множество экземпляров реальных и абстрактных моделей, аспектов (людей, событий, предметов), обладающих общими атрибутами.

Обычно разбивают все множество объектов предметной части на группы объектов, однородных по их структуре и поведению (относительно рамок рассматриваемой предметной области), называемых типами объектов. При этом все объекты одного типа обладают одинаковыми наборами атрибутов. На практике анализ и синтез структуры предметной области осуществляются путем выявления типов объектов, установления общих свойств всех принадлежащих им объектов и эти свойства принимаются за свойства типа. Свойства типа «наследуются» каждым экземпляром объекта данного типа.

Любой объект системы может быть представлен только одной сущностью, которая должна быть уникальна и идентифицирована. Каждый объект предметной области должен отличаться от других объектов того типа, к которому он отнесен. С этой целью объектам данного типа назначается некоторый идентификатор, позволяющий на них однозначно ссылаться. Имя идентификатора должно отражать тип, класс объекта, но не его конкретный экземпляр. Такой идентификатор называют уникальным в силу взаим- но-однозначного соответствия между его значениями и конкретными объектами рассматриваемого типа. В качестве уникального идентификатора, называемого также

первичным ключом, может использоваться какой-либо атрибут или комбинация нескольких атрибутов объектов. Так, в качестве уникальных идентификаторов пользователей при условии отсутствия однофамильцев могли бы служить их фамилии.

В некоторых случаях существуют альтернативные варианты выбора уникальных идентификаторов объектов. Например, другим таким идентификатором пользователя экспертной системы мог бы стать идентификатор типа пользователя. Кроме того, на практике часто используются и не уникальные идентификаторы, называемые вторичными ключами и обозначающие множества объектов данного типа. К каждому такому множеству относятся объекты, которым соответствует одинаковое значение вторичного ключа.

Между объектами предметной области могут существовать связи. Связь (relation) — это ассоциация, установленная между несколькими сущностями.

В терминах типов объектов можно говорить о существовании связей между типами объектов, которые «материализуются» в виде связей (экземпляров связей данного типа) между экземплярами объектов соответствующих типов. Эти связи могут быть обязательными или факультативными (необязательными). Это свойство еще называют кардинальностью связи.

Если вновь порожденный объект одного из этих типов оказывается по необходимости связанным с каким-либо объектом другого типа из заданной пары, то между этими двумя типами объектов существует обязательная связь. В противном случае связь является факультативной.

Число сущностей, которое может быть ассоциировано через набор связей с другой сущностью, называют степенью связи. Рассмотрение степеней особенно полезно для бинарных связей.

Существуют следующие степени бинарных связей: один к одному (1 : 1) — в этой связи сущности с одной ролью всегда соответствует не более одной сущности с другой ролью; один ко многим (1 : п) — сущности с одной ролью может соответствовать любое число сущностей с другой ролью; многие к одному (п : 1) — связь аналогична отображению (1: и); многие ко многим (п : п) — каждая из сущностей может быть представлена любым количеством экземпляров.

Если существование сущности х зависит от существования сущности у, то х называется зависимой сущностью. Совокупность типов сущностей предметной области и типов связей между ними характеризует (типовую) структуру предметной области.

Множества типов объектов предметной области и объектов различных типов, значения атрибутов объектов и отношений между ними могут изменяться во времени. Изменения могут сводиться к появлению новых или исключению из рассмотрения некоторых существующих типов объектов в предметной области, обновлению новых или разрушению существующих типов и отношений между ними, появлению или исключению отдельных объектов имеющегося типа, к изменению значений атрибутов имеющихся объектов, к образованию или разрушению связей между ними (экземпляров связей).

Поэтому с каждым моментом времени можно сопоставить некоторое состояние предметной области. Состояния предметной области обладают совокупностью свойств,

которые характеризуют предметную область. Эти свойства могут быть заданы с помощью так называемых ограничений целостности, специфицируемых для типов объектов, типов связей и (или) их отдельных экземпляров. Ограничения, заданные для типа объектов или связей, имеют отношение к типу в целом как множеству экземпляров объектов или связей либо соотносятся с каждым экземпляром объекта или связи данного типа.

Ограничения целостности могут быть статическими, присущими всем состояниям предметной области, или динамическими, делающими возможность перехода предметной области из одного состояния в другое.

Часто для описания предметной области используют графическую диаграмму сущностей и связей, так называемую ER-диаграмму (диаграмма «сущность-связь»). Так, рис. 3.8 демонстрирует обозначения отношений, принятые на схемах ER-диаграмм объектов БД и БЗ в составе ЭС.

Наименование

связи

Запись

Структурное

обозначение

Один к одному

1 : 1

lt;              gt;

Один ко многим

1 : п

lt;              5»

п : 1

«              gt;

Многие к одному

или

или

1 : п

lt;

Многие ко многим

п : п

«              »

Рис. 3.8. Связи и их структурное обозначение на ER-диаграмме БД

Кардинальность связи служит для обозначения отношения числа. Идентифицирующая связь — связь, которая добавляет признаки идентичности в дочернюю сущность путем миграции ключей родительской сущности в область ключевых атрибутов дочерней, таким образом делая дочернюю сущность зависимой от родительской в смысле своей идентичности.

Связь, не ставящая дочернюю сущность в зависимость от родительской, называется неидентифицирующей. При неидентифицирующей связи атрибуты первичного ключа родительской сущности мигрируют в область данных (неключевая область), которая расположена под чертой в дочерней сущности.

Если атрибуты, мигрировавшие в неключевую область дочерней сущности, не нужны в этой сущности, то связь называется необязательной неидентифицирующей', подразумевается, что мигрировавшие атрибуты не нужны дочерней сущности для ее идентификации, и она может существовать и без этих атрибутов.

<< | >>
Источник: В.К. Чаадаев. Бизнес-процессы в компаниях связи. 2004

Еще по теме Структура и принципы организации базы данных и базы знаний: