Применение реляционной алгебры при обработке информации баз данных предприятий АПК

Автор: Жидченко Татьяна Викторовна, Жидченко Алексей Анатольевич

Журнал: Вестник аграрной науки Дона @don-agrarian-science

Рубрика: Механизация и электрификация животноводства, растениеводства

Статья в выпуске: 1 (17), 2012 года.

Бесплатный доступ

Рассмотрена основанная на теории множеств реляционная алгебра как формальная система манипулирования отношениями в реляционной модели данных, которая наряду с реляционным исчислением, основанным на математической логике, является способом получения результирующего информационного отношения.

База данных, обработка информации, модель данных, реляционная модель, реляционная алгебра, система

Короткий адрес: https://sciup.org/140204143

IDR: 140204143

Текст научной статьи Применение реляционной алгебры при обработке информации баз данных предприятий АПК

Использование баз данных и информационных систем становится неотъемлемой составляющей деловой деятельности современного общества и функционирования преуспевающих организаций и предприятий. Целью любой информационной системы является обработка данных об объектах реального мира. Реальная база данных – это совокупность сведений о конкретных объектах в какой-либо предметной области. Под предметной областью понимают часть реального мира, подлежащего изучению для организации управления и, в конечном счете, автоматизации.

База данных – хранилище данных, которое обеспечивает реализацию приложений (задач по запросу нужных данных о производстве для пользователя). База данных находится под управлением специализированного программного средства – системы управления базами данных (СУБД) [5].

Применение баз данных в сельскохозяйственных системах позволяет:

  • 1)    легко наращивать функции системы, используя ядро данных;

  • 2)    моделировать функции управления в сельскохозяйственном учете с помощью информационной модели;

  • 3)    выполнять анализ сельскохозяйственной информации;

  • 4)    повысить качество хранимых данных за счет полноты, согласованности и целостности, контроля достоверности вводимой информации;

  • 5)    исключить в прикладных программах функции непосредственного управления данными на машинных носителях и усилить функции логики обработки данных;

  • 6)    стандартизировать основные процедуры работы с данными (ввод и редактирование данных, поиск и извлечение данных, формирование отчетов);

  • 7)    снизить трудозатраты персонала по ведению учета и уменьшить расход вычислительных ресурсов.

Развитие рынка и усиление конкуренции в российском сельском хозяйстве вынуждает предприятия проводить обработку больших объемов информации и прилагать усилия для сокращения себестоимости производимой продукции и оптимизации расходов на производство и реализацию. Теория разработки и функционирования баз данных основывается на реляционной алгебре, предложенной и разработанной Э.Ф. Коддом [2].

Целью публикации является применение теории реляционной алгебры к обработке табличной информации сельскохозяйственных баз данных и сельскохозяйственного производства.

Функциональный набор сельскохо- в базах данных представляется в виде ре-зяйственных информационных объектов ляционных таблиц (табл. 1).

Таблица 1

Реляционный термин

Соответствующий "табличный" термин

База данных

Набор таблиц

Схема базы данных

Набор заголовков таблиц

Отношение

Таблица

Заголовок отношения

Заголовок таблицы

Тело отношения

Тело таблицы

Атрибут отношения

Наименование столбца таблицы

Кортеж отношения

Строка таблицы

Степень (n-арность) отношения

Количество столбцов таблицы

Мощность отношения

Количество строк таблицы

Домены и типы данных

Типы данных в ячейках таблицы

R = f ( f ( R n, R ^,...), f 2 ( R 21, R 22,. ••),-■■)-

Структурная часть описывает, какие объекты рассматриваются реляционной моделью. Единственной структурой данных, используемой в реляционной модели, являются нормализованные n-арные отношения.

Целостная часть описывает ограничения специального вида, которые должны выполняться для любых отношений. Это целостность сущностей и целостность внешних ключей .

Манипуляционная часть описывает два способа манипулирования реляционными данными – реляционную алгебру и реляционное исчисление . Основанная на теории множеств реляционная алгебра – формальная система манипулирования отношениями в реляционной модели данных [1, 2].

Наряду с реляционным исчислением, основанным на математической логике, она является способом получения результирующего информационного отношения.

Реляционная алгебра представляет собой набор операторов, использующих отношения в качестве аргументов, и возвращающие отношения в качестве результата.

R = f ( R„ R 2,..., Rn )

Теоретико-множественные операторы:

  • 1)    объединение;

  • 2)    пересечение;

  • 3)    вычитание;

  • 4)    декартово произведение.

Специальные реляционные операторы:

  • 1)    выборка;

  • 2)    проекция;

  • 3)    соединение;

  • 4)    деление.

Отношения совместимы по типу , если они имеют идентичные заголовки. Отношения имеют одно и то же множество имен атрибутов , то есть для любого атрибута в одном отношении найдется атрибут с таким же наименованием в другом отношении, Атрибуты с одинаковыми именами определены на одних и тех же доменах .

Объединением двух совместимых по типу отношений A и B называется отношение с тем же заголовком, что и у отношений A и B, телом, состоящим из кортежей, принадлежащих или A, или B, или обоим отношениям (рис. 1). При наличии, например, двух таблиц содержащих сведения о животных на ферме КРС, результатом объ-   чень имеющегося поголовья, без повторов единения информации будет полный пере-   записей.

Обозначение

Определение

LEAP

^и^

{г: г e^ vre^3)

r= (RI) union (R2)

Пример:

Рис. 1. Объединение информационных отношений

Пересечением двух совместимых по типу отношений и называется отношение с тем же заголовком, что и у отношений A и B, и телом, состоящим из кортежей, принадлежащих одновременно обоим отноше- ниям A и B (рис. 2). Результатом процедуры пересечения двух информационных таблиц будет перечень поголовья КРС, который содержат и первая, и вторая таблица.

Рис. 2. Пересечение информационных отношений

Вычитанием двух совместимых по типу отношений A и B называется отношение с тем же заголовком, что и у отноше- ний A и B, и телом, состоящим из кортежей, принадлежащих отношению A и не принадлежащих отношению B (рис. 3).

Обозначение

Определение

LEAP

-^1 "" -^2

(г:г e Л] лг ^2]

r= (RI) difference (R2) r= (RI) minus (R2)

Пример:

3 а

9 а

2 Ь

4 Ь

Обозначение

Определение

LEAP

Rx ®R3

һікі):леЛ^^ е^

r= (RI) product (R2)

Рис. 3. Разность информационных отношений

Рис. 4. Декартовое информационное произведение

Декартовым произведением двух отношений A и B называется отношение, заголовок которого является сцеплением заголовков отношений A и B: ( A1 , A 2,..., An , 5 1, 5 2, _ , Вт ) , а тело состоит из кортежей, являющихся сцеплением кортежей отношений A и B ( ^ i, a 2,..., an , bi , b 2,. , bm ) таких, что ( apa 2,.„, an ) e A ( b j, b 2,.„, bm ) e 5 (рис. 4). Эта процедура позволяет обработать таблицы, не являющиеся однотипными, и результирующее отношение будет содержать все столбцы и все записи исходных таблиц.

ей ) на отношении A с условием C называется отношение с тем же заголовком, что и у отношения A , и телом, состоящим из кортежей, значения атрибутов которых при подстановке в условие C дают значение ИСТИНА. C представляет собой логическое выражение, в которое могут входить атрибуты отношения A и (или) скалярные выражения (рис. 5). При обработке информации в базе данных это одна из распространенных операций, так как соответствует запросу по условию, созданному средствами системы управления базами данных.

Выборкой ( ограничением, селекци-

Рис. 5. Выборка

Проекцией отношения A по атрибутам X,Y… Z, где каждый из атрибутов принадлежит отношению A, называется отношение с заголовком (X,Y… Z) и телом, содержащим множество кортежей ви- да (x,y,...z), таких, для которых в отношении A найдутся кортежи со значением атрибута X равным x, значением атрибута Y равным у, .., значением атрибута Z равным z (рис. 6).

Обозначение

Определение

LEAP

{г[Л]: г еЛ}

r = project(R) (АіАг. An)

Пример:

х а у а z а w Ъ

Рис. 6. Проекция информационных отношений

Соединение имеет сходство с декартовым произведением. Однако здесь добавлено условие, согласно которому вместо полного произведения всех строк в результирующее отношение включаются только строки, ему удовлетворяющие. Условие представляет собой логическое выражение, в которое могут входить атрибуты отношений A и B и (или) скалярные выражения (рис. 7).

Операция соединения имеет большое значение для реляционных таблиц, так как в процессе нормализации исходное отношение разбивается на несколько более мелких отношений, которые по запросу пользователя необходимо вновь соединять для получения полной информации [3, 4].

LEAP :

bool (cond))

r= join (RI) (R2) ((con

Рис. 7. Соединение отношений

11

X ;

/ 1"

"1

11

X

Г

11

X J

) 2

1

11

X

2

11

У j

) 1

=

2

11

У

1

12

x 1

. 1

4

12

X

1

12

x >

2_

4

12

X

2

Зависимые реляционные операторы – можно выразить через другие реляционные операторы:

  • 1)    оператор соединения;

  • 2)    оператор пересечения;

  • 3)    оператор деления.

Примитивные реляционные операторы нельзя выразить друг через друга:

  • 1)    объединение;

  • 2)    вычитани;

  • 3)    декартово произведени;

  • 4)    выборк;

  • 5)    проекция.

Выводы:

Рассмотренные реляционные операции в той или иной мере реализуются в языке манипулирования данными систем управления базами данных и обеспечивают обработку реляционных таблиц. К таким языкам относится язык SQL (Structured Query Language), язык QBE (Query By Example) и другие языки запросов. Структура информации в сельском хозяйстве иногда очень сложна и информационные системы ориентированы главным образом на хранение, выбор и модификацию постоянно существующей информации. Для правильного понимания выходной информации в виде отчетов или реализации запросов при работе с базой данных необходимо иметь представление о математическом аппарате функционирования информационных таблиц. Правильно спроекти- рованные таблицы на основе теории реляционной алгебры позволяют:

  • 1)    моделировать функции управления в сельскохозяйственном учете с помощью информационной модели;

  • 2)    выполнять анализ сельскохозяйственной информации;

  • 3)    повысить качество хранимых данных за счет полноты, согласованности и целостности, контроля достоверности вводимой информации;

  • 4)    усилить функции логики обработки данных;

  • 5)    стандартизировать основные процедуры работы с данными (ввод и редактирование данных, поиск и извлечение данных, формирование отчетов);

  • 6)    снизить трудозатраты персонала по ведению учета и уменьшить расход вычислительных ресурсов.

Статья научная