Применение реляционной алгебры при обработке информации баз данных предприятий АПК
Автор: Жидченко Татьяна Викторовна, Жидченко Алексей Анатольевич
Журнал: Вестник аграрной науки Дона @don-agrarian-science
Рубрика: Механизация и электрификация животноводства, растениеводства
Статья в выпуске: 1 (17), 2012 года.
Бесплатный доступ
Рассмотрена основанная на теории множеств реляционная алгебра как формальная система манипулирования отношениями в реляционной модели данных, которая наряду с реляционным исчислением, основанным на математической логике, является способом получения результирующего информационного отношения.
База данных, обработка информации, модель данных, реляционная модель, реляционная алгебра, система
Короткий адрес: https://sciup.org/140204143
IDR: 140204143
Текст научной статьи Применение реляционной алгебры при обработке информации баз данных предприятий АПК
Использование баз данных и информационных систем становится неотъемлемой составляющей деловой деятельности современного общества и функционирования преуспевающих организаций и предприятий. Целью любой информационной системы является обработка данных об объектах реального мира. Реальная база данных – это совокупность сведений о конкретных объектах в какой-либо предметной области. Под предметной областью понимают часть реального мира, подлежащего изучению для организации управления и, в конечном счете, автоматизации.
База данных – хранилище данных, которое обеспечивает реализацию приложений (задач по запросу нужных данных о производстве для пользователя). База данных находится под управлением специализированного программного средства – системы управления базами данных (СУБД) [5].
Применение баз данных в сельскохозяйственных системах позволяет:
-
1) легко наращивать функции системы, используя ядро данных;
-
2) моделировать функции управления в сельскохозяйственном учете с помощью информационной модели;
-
3) выполнять анализ сельскохозяйственной информации;
-
4) повысить качество хранимых данных за счет полноты, согласованности и целостности, контроля достоверности вводимой информации;
-
5) исключить в прикладных программах функции непосредственного управления данными на машинных носителях и усилить функции логики обработки данных;
-
6) стандартизировать основные процедуры работы с данными (ввод и редактирование данных, поиск и извлечение данных, формирование отчетов);
-
7) снизить трудозатраты персонала по ведению учета и уменьшить расход вычислительных ресурсов.
Развитие рынка и усиление конкуренции в российском сельском хозяйстве вынуждает предприятия проводить обработку больших объемов информации и прилагать усилия для сокращения себестоимости производимой продукции и оптимизации расходов на производство и реализацию. Теория разработки и функционирования баз данных основывается на реляционной алгебре, предложенной и разработанной Э.Ф. Коддом [2].
Целью публикации является применение теории реляционной алгебры к обработке табличной информации сельскохозяйственных баз данных и сельскохозяйственного производства.
Функциональный набор сельскохо- в базах данных представляется в виде ре-зяйственных информационных объектов ляционных таблиц (табл. 1).
Таблица 1
Реляционный термин |
Соответствующий "табличный" термин |
База данных |
Набор таблиц |
Схема базы данных |
Набор заголовков таблиц |
Отношение |
Таблица |
Заголовок отношения |
Заголовок таблицы |
Тело отношения |
Тело таблицы |
Атрибут отношения |
Наименование столбца таблицы |
Кортеж отношения |
Строка таблицы |
Степень (n-арность) отношения |
Количество столбцов таблицы |
Мощность отношения |
Количество строк таблицы |
Домены и типы данных |
Типы данных в ячейках таблицы |
R = f ( f ( R n, R ^,...), f 2 ( R 21, R 22,. ••),-■■)-
Структурная часть описывает, какие объекты рассматриваются реляционной моделью. Единственной структурой данных, используемой в реляционной модели, являются нормализованные n-арные отношения.
Целостная часть описывает ограничения специального вида, которые должны выполняться для любых отношений. Это целостность сущностей и целостность внешних ключей .
Манипуляционная часть описывает два способа манипулирования реляционными данными – реляционную алгебру и реляционное исчисление . Основанная на теории множеств реляционная алгебра – формальная система манипулирования отношениями в реляционной модели данных [1, 2].
Наряду с реляционным исчислением, основанным на математической логике, она является способом получения результирующего информационного отношения.
Реляционная алгебра представляет собой набор операторов, использующих отношения в качестве аргументов, и возвращающие отношения в качестве результата.
R = f ( R„ R 2,..., Rn )
Теоретико-множественные операторы:
-
1) объединение;
-
2) пересечение;
-
3) вычитание;
-
4) декартово произведение.
Специальные реляционные операторы:
-
1) выборка;
-
2) проекция;
-
3) соединение;
-
4) деление.
Отношения совместимы по типу , если они имеют идентичные заголовки. Отношения имеют одно и то же множество имен атрибутов , то есть для любого атрибута в одном отношении найдется атрибут с таким же наименованием в другом отношении, Атрибуты с одинаковыми именами определены на одних и тех же доменах .
Объединением двух совместимых по типу отношений A и B называется отношение с тем же заголовком, что и у отношений A и B, телом, состоящим из кортежей, принадлежащих или A, или B, или обоим отношениям (рис. 1). При наличии, например, двух таблиц содержащих сведения о животных на ферме КРС, результатом объ- чень имеющегося поголовья, без повторов единения информации будет полный пере- записей.
Обозначение |
Определение |
LEAP |
^и^ |
{г: г e^ vre^3) |
r= (RI) union (R2) |
Пример:


Рис. 1. Объединение информационных отношений

Пересечением двух совместимых по типу отношений и называется отношение с тем же заголовком, что и у отношений A и B, и телом, состоящим из кортежей, принадлежащих одновременно обоим отноше- ниям A и B (рис. 2). Результатом процедуры пересечения двух информационных таблиц будет перечень поголовья КРС, который содержат и первая, и вторая таблица.

Рис. 2. Пересечение информационных отношений
Вычитанием двух совместимых по типу отношений A и B называется отношение с тем же заголовком, что и у отноше- ний A и B, и телом, состоящим из кортежей, принадлежащих отношению A и не принадлежащих отношению B (рис. 3).
Обозначение |
Определение |
LEAP |
-^1 "" -^2 |
(г:г e Л] лг ^2] |
r= (RI) difference (R2) r= (RI) minus (R2) |
Пример:
3 а
9 а
2 Ь
4 Ь
Обозначение |
Определение |
LEAP |
||
Rx ®R3 |
һікі):леЛ^^ е^ |
r= (RI) product (R2) |

Рис. 3. Разность информационных отношений

Рис. 4. Декартовое информационное произведение
Декартовым произведением двух отношений A и B называется отношение, заголовок которого является сцеплением заголовков отношений A и B: ( A1 , A 2,..., An , 5 1, 5 2, _ , Вт ) , а тело состоит из кортежей, являющихся сцеплением кортежей отношений A и B ( ^ i, a 2,..., an , bi , b 2,. „ , bm ) таких, что ( apa 2,.„, an ) e A ( b j, b 2,.„, bm ) e 5 (рис. 4). Эта процедура позволяет обработать таблицы, не являющиеся однотипными, и результирующее отношение будет содержать все столбцы и все записи исходных таблиц.
ей ) на отношении A с условием C называется отношение с тем же заголовком, что и у отношения A , и телом, состоящим из кортежей, значения атрибутов которых при подстановке в условие C дают значение ИСТИНА. C представляет собой логическое выражение, в которое могут входить атрибуты отношения A и (или) скалярные выражения (рис. 5). При обработке информации в базе данных это одна из распространенных операций, так как соответствует запросу по условию, созданному средствами системы управления базами данных.
Выборкой ( ограничением, селекци-

Рис. 5. Выборка
Проекцией отношения A по атрибутам X,Y… Z, где каждый из атрибутов принадлежит отношению A, называется отношение с заголовком (X,Y… Z) и телом, содержащим множество кортежей ви- да (x,y,...z), таких, для которых в отношении A найдутся кортежи со значением атрибута X равным x, значением атрибута Y равным у, .., значением атрибута Z равным z (рис. 6).
Обозначение |
Определение |
LEAP |
^И |
{г[Л]: г еЛ} |
r = project(R) (АіАг. An) |
Пример:


х а у а z а w Ъ
Рис. 6. Проекция информационных отношений
Соединение имеет сходство с декартовым произведением. Однако здесь добавлено условие, согласно которому вместо полного произведения всех строк в результирующее отношение включаются только строки, ему удовлетворяющие. Условие представляет собой логическое выражение, в которое могут входить атрибуты отношений A и B и (или) скалярные выражения (рис. 7).
Операция соединения имеет большое значение для реляционных таблиц, так как в процессе нормализации исходное отношение разбивается на несколько более мелких отношений, которые по запросу пользователя необходимо вновь соединять для получения полной информации [3, 4].

LEAP :
bool (cond))
r= join (RI) (R2) ((con


Рис. 7. Соединение отношений
11 |
X ; |
/ 1" |
"1 |
11 |
X |
Г |
|
11 |
X J |
) 2 |
1 |
11 |
X |
2 |
|
11 |
У j |
) 1 |
= |
2 |
11 |
У |
1 |
12 |
x 1 |
. 1 |
4 |
12 |
X |
1 |
|
12 |
x > |
2_ |
4 |
12 |
X |
2 |
Зависимые реляционные операторы – можно выразить через другие реляционные операторы:
-
1) оператор соединения;
-
2) оператор пересечения;
-
3) оператор деления.
Примитивные реляционные операторы нельзя выразить друг через друга:
-
1) объединение;
-
2) вычитани;
-
3) декартово произведени;
-
4) выборк;
-
5) проекция.
Выводы:
Рассмотренные реляционные операции в той или иной мере реализуются в языке манипулирования данными систем управления базами данных и обеспечивают обработку реляционных таблиц. К таким языкам относится язык SQL (Structured Query Language), язык QBE (Query By Example) и другие языки запросов. Структура информации в сельском хозяйстве иногда очень сложна и информационные системы ориентированы главным образом на хранение, выбор и модификацию постоянно существующей информации. Для правильного понимания выходной информации в виде отчетов или реализации запросов при работе с базой данных необходимо иметь представление о математическом аппарате функционирования информационных таблиц. Правильно спроекти- рованные таблицы на основе теории реляционной алгебры позволяют:
-
1) моделировать функции управления в сельскохозяйственном учете с помощью информационной модели;
-
2) выполнять анализ сельскохозяйственной информации;
-
3) повысить качество хранимых данных за счет полноты, согласованности и целостности, контроля достоверности вводимой информации;
-
4) усилить функции логики обработки данных;
-
5) стандартизировать основные процедуры работы с данными (ввод и редактирование данных, поиск и извлечение данных, формирование отчетов);
-
6) снизить трудозатраты персонала по ведению учета и уменьшить расход вычислительных ресурсов.