Подход к интеграции интеллектуального анализа данных в реляционную СУБД на основе генерации текстов хранимых процедур
Бесплатный доступ
Представлен подход к интеграции интеллектуального анализа данных (ИАД) в реляционную СУБД. Подход предполагает использование XML-разметки алгоритма ИАД, выраженного на языке SQL. Разметка позволяет выполнить автоматическую генерацию хранимых процедур на языке SQL, реализующих данный алгоритм, в зависимости от специфицированных пользователем таблиц исходных данных и параметров алгоритма. Приведено описание предложенного языка разметки. Если для решения задачи ИАД имеется несколько алгоритмов, подход предполагает генерацию SQL-кода, реализующего наиболее эффективный из них. Выбор наиболее эффективного алгоритма осуществляется на основе использования имеющейся в современных СУБД команды EXPLAIN, позволяющей получить оценку времени исполнения запроса SQL без его фактического выполнения. Описана модульная структура и интерфейс программной системы, реализующей данный подход.
Интеллектуальный анализ данных, реляционная субд
Короткий адрес: https://sciup.org/147160478
IDR: 147160478
Список литературы Подход к интеграции интеллектуального анализа данных в реляционную СУБД на основе генерации текстов хранимых процедур
- Ordonez C. Integrating K-Means Clustering with a Relational DBMS Using SQL//IEEE Transactions on Knowledge and Data Engineering. -2006. -Vol. 18, No. 2. -P. 188-201.
- Berthold M.R. KNIME: The Konstanz Information Miner/M.R. Berthold, N. Cebron, F. Dill, et al.//Proceedings of the 31st Annual Conference of the Gessellschaft fur Klassifikation. -Springer Berlin Heidelberg, 2008. -P. 319-326.
- Пан К.С. Параллельный алгоритм решения задачи анализа рыночной корзины на процессорах Cell/К.С. Пан, М.Л. Цымблер//Вестник ЮУрГУ. Серия «Математическое моделирование и программирование». -2010. -№ 16(192). -Вып. 5. -С. 4857.
- Chung S.M. Mining Association Rules from Relations on a Parallel NCR Teradata Database System/S.M. Chung, M. Mangamuri//Proc. of Int. Scientific Conference on Inf. Technology: Coding and Computing, 2004 (ITCC 2004). -Vol. 1. -P. 465-470.
- Wang F. SQL Implementation of a ScanOnce Algorithm for Large Database Mining/F. Wang, J. Gordon, N. Helian//Proceedings of the 5th Workshop on Engineering Federated Information Systems (EFIS 2003). -IOS Press, 2003. -P. 43-45.
- Миниахметов Р.М. Интеграция алгоритма кластеризации Fuzzy c-Means в Post-greSQL/Р.М. Миниахметов, М.Л. Цымблер//Вычислительные методы и программирование: Новые вычислительные технологии (Электронный научный журнал). -2012. -Т. 13. -С. 46-52.
- Miniakhmetov R.M. Integrating Fuzzy c-Means Clustering with PostgreSQL//Труды Института системного программирования РАН. -2011. -Т. 21. -С. 263-276.
- Ordonez С. A Data Mining System Based on SQL Queries and UDFs for Relational Databases//Proceedings of the 20th ACM International Conference on Information and Knowledge Management. -ACM, 2011. -P. 2521-2524.
- Agrawal R. Fast Algorithms for Mining Association Rules in Large Databases/R. Agrawal, R. Srikant//Proceedings of the 20th International Conference on Very Large Data Bases. -Morgan Kaufmann, 1994. -P. 487-499.
- Ioannidis Y.E. Query Optimization//ACM Computing Surveys. -1996. -Vol. 28, No. 1. -P. 121-123.
- Лепихов А.В. Обработка запросов в СУБД для кластерных систем/А.В. Лепихов, Л.Б. Соколинский//Программирование. -2010. -№ 4. -С. 25-39.
- Соколинский Л.Б. Организация параллельного выполнения запросов в многопроцессорной машине баз данных с иерархической архитектурой//Программирование. -2001. -№ 6. -С. 13-29.
- Соколинский Л.Б. Обзор архитектур параллельных систем баз данных//Программирование. -2004. -№ 6. -С. 49-63.
- Пан К.С. Разработка параллельной СУБД на основе последовательной СУБД PostgreSQL с открытым исходным кодом/К.С. Пан, М.Л. Цымблер//Вестник ЮУрГУ. Серия «Мат. моделирование и программирование». -2012. -№ 18(277). -Вып. 12. -С. 112-120.