Применение математических методов в системах искусственного интеллекта и машинного обучения
Автор: Кожомбердиева Н.Б., Эсенаманова Г.К., Кашкабаева Ж.Т.
Журнал: Бюллетень науки и практики @bulletennauki
Рубрика: Социальные и гуманитарные науки
Статья в выпуске: 1 т.12, 2026 года.
Бесплатный доступ
Рассматриваются ключевые математические методы, лежащие в основе современных систем искусственного интеллекта и машинного обучения. Анализируются такие направления, как линейная алгебра, математический анализ, теория вероятностей, оптимизация, стохастические процессы и теория графов. Показано, как математический аппарат применяется в обучении нейронных сетей, алгоритмах классификации, кластеризации и в моделях глубокого обучения. Приведены примеры применения математических методов и ссылки на отечественных авторов, внёсших значительный вклад в развитие математического обеспечения информатики и ИИ.
Искусственный интеллект, машинное обучение, математические методы, линейная алгебра, оптимизация, теория вероятностей, глубокое обучение
Короткий адрес: https://sciup.org/14135557
IDR: 14135557 | УДК: 371.30 | DOI: 10.33619/2414-2948/122/50
Application of Mathematical Methods in Artificial Intelligence and Machine Learning Systems
The article discusses the key mathematical methods underlying modern artificial intelligence and machine learning systems. Such areas as linear algebra, mathematical analysis, probability theory, optimization, stochastic processes and graph theory are analyzed. It is shown how the mathematical apparatus is used in neural network training, classification algorithms, clustering, and deep learning models. Examples of the use of mathematical methods and references to Russian authors who have made a significant contribution to the development of mathematical support for computer science and AI are given.
Текст научной статьи Применение математических методов в системах искусственного интеллекта и машинного обучения
Бюллетень науки и практики / Bulletin of Science and Practice
УДК 371.30
Современные системы искусственного интеллекта (ИИ) и машинного обучения (МО) опираются на сложный математический аппарат. Без теоретических основ, представленных линейной алгеброй, математическим анализом, теорией вероятностей, статистикой и оптимизацией, невозможно построить ни один эффективный алгоритм обучения моделей. Как отмечает В. В. Крюков, «математика является фундаментом интеллектуальных вычислений и определяет возможности алгоритмов обработки данных». В условиях стремительного развития цифровой экономики роль ИИ возрастает, что делает актуальным анализ математических основ, применяемых в алгоритмах обучения и принятия решений. В российской научно-образовательной среде имеется ряд доступных и качественных публикаций, которые объясняют математические основы и содержат практические рекомендации по применению методов в задачах МО. Среди них – учебно-методические работы, популярные переводы и адаптации учебников, а также материалы исследователей и практиков [1].
Машинное обучение как научная дисциплина строится на строгих математических методах. В книге особое внимание уделено тому, что любое обучение «по данным» – это решение задач статистического вывода, где необходимо: оценить неизвестные параметры, построить прогноз при наличии неопределённости, минимизировать риски, обеспечить обобщающую способность алгоритма. Вьюгин формирует мост между математикой и практическим МО, опираясь на: теорию вероятностей, математическую статистику, теорию оценки и идентификации моделей, теорию обобщения и прогнозирования, статистическую теорию обучения [1].
Теория вероятностей как основа моделирования неопределённости. Вероятностная формулировка задач позволяет корректно учесть шум, априорные знания, неопределённость оценок и редкие события. В байесовском подходе модель описывается вероятностно, а обучение – как вычисление апостериорного распределения параметров. Часто используют приближённые методы (variational inference, MCMC) для практической оценки апостериорных распределений. Случайные величины и распределения – в МО каждый объект данных трактуется как случайная величина, имеющая распределение: нормальное (Гауссово), биномиальное, равномерное, экспоненциальное и др. Алгоритмы МО часто исходят из гипотезы о виде распределения (например, наивный байесовский классификатор предполагает независимость признаков).
Математическое ожидание и дисперсия ключевые характеристики, используемые при оценке моделей: Е[Х]- среднее значение, Var(X) - разброс данных (стабильность).
Эти понятия важны при: регуляризации параметров, построении доверительных интервалов, оценке точности прогнозов. Закон больших чисел и центральная предельная теорема, Вьюгин подчеркивает: эффективность обучения – это проявление фундаментальных вероятностных закономерностей. Закон больших чисел гарантирует, что средние по выборке значения приближают истинные. ЦПТ позволяет использовать нормальное распределение при анализе сумм случайных величин – основа статистических критериев. Математическая статистика как инструмент построения моделей: выборка, параметры и статистики. В машинном обучении обучающая выборка – это источник информации о распределении данных. Задача: по выборке оценить параметры модели.
Основные выводы о роли математики в МО: Машинное обучение – это математически строгая дисциплина. Эффективность алгоритмов определяется статистическими закономерностями.
Успешная модель должна иметь : устойчивость, обобщающую способность, контролируемую сложность.
Методы прогнозирования должны опираться на принципы вероятностного вывода.
Теория VC-дим и структурной минимизации риска объясняет, когда и почему возможен перенос знаний на новые данные.
Книга В. В. Вьюгина — одно из немногих работ, последовательно раскрывающих математический фундамент машинного обучения на высоком теоретическом уровне. Она позволяет студентам: понять, как математические идеи преобразуются в алгоритмы, осознать ограничения и возможности МО, критически анализировать модели, а не только применять их.
Линейная алгебра – один из ключевых разделов математики, изучающий векторы, матрицы, линейные преобразования и системы линейных уравнений. В контексте машинного обучения большинство данных и параметров моделей представляются именно в виде: векторов признаков, матриц данных, тензорных структур в нейронных сетях. Современные алгоритмы МО требуют обработки огромных массивов чисел. Как подчёркивает Л. С. Канторович, матричные вычисления лежат в основе обработки больших массивов данных. В нейронных сетях входные данные, веса и градиенты представлены матрицами и тензорами: а = Wx + b, где x — входной вектор, W — матрица весов, b — смещение, а — результат преобразования (активация). Методы разложения матриц, включая SVD, используются в: сжатии изображений, сокращении размерности (PCA), выделении признаков.
Пример. При анализе пользовательских предпочтений в системах рекомендаций SVD используется для разложения матрицы рейтингов пользователей. Математический анализ необходим для понимания производных, градиентов и поведения функций активации в нейронных сетях. Алгоритм обратного распространения ошибки основан на вычислении dL частных производных: ——-.
Используются нелинейные функции: сигмоида, ReLU, tanh. А. Н. Тихонов отмечает, что введение нелинейности превращает нейронную сеть в универсальный аппроксиматор. Теория вероятностей рассматривается как фундамент статистического подхода к обучению. Алгоритмы машинного обучения строятся как статистические модели, описывающие вероятностные распределения данных [3].
Байесовский подход . Вероятность класса: P(y|x) = ““у 'у^
Примеры применения: наивный байесовский классификатор, фильтры спама.
Оценка неопределённости – критическая часть в задачах медицины, безопасности и др. Байесовские нейросети, ансамбли моделей, бустрэп — методы и калибровка вероятностей (Platt scaling, isotonic regression) помогают получить надежные предсказания и интервалы доверия. Исследователи регулярно публикуют материалы по применению этих методов в прикладных задачах (анализ аномалий, прогнозирование). Обучение моделей — это, по сути, задача оптимизации (минимизация функции потерь). Классические методы — градиентный спуск, стохастический градиент (SGD), адаптивные методы (Adam, RMSProp), методы второго порядка (Newton, L-BFGS) — применяются в зависимости от структуры задачи (выпуклая/невыпуклая, гладкая/негладкая). Теория выпуклой оптимизации помогает гарантировать сходимость и объяснить поведение алгоритмов на выпуклых задачах; в невыпуклых задачах (глубокие сети) исследуются свойства локальных минимумов и стационарных точек. Стохастические градиенты SGD использует вероятностный выбор подвыборок данных, что ускоряет обучение больших моделей. Алгоритмы оптимизации являются ядром обучения глубоких моделей [7].
Модели обучаются путём минимизации функции потерь: L = у Е т=1 (У 1 — y^ j )2.
Градиентные методы используются: SGD, Adam, RMSProp.
Пример применения. При обучении CNN на изображениях оптимизация позволяет автоматизированно подбирать фильтры, отвечающие за выделение контуров, текстуры и формы объектов.
Стохастические процессы в ИИ применяется при создании моделей прогнозирования, генерации данных и обучении с подкреплением.
Марковские процессы, т.е. марковские цепи используются в: моделях прогнозирования поведения пользователей, генерации текста (N-граммы), моделях Reinforcement Learning.
Процессы Пуассона используются в анализе потоков событий, например: сетевых запросов, обращений к серверу, сообщений пользователей [5]. Современные модели, такие как графовые нейронные сети (GNN), основаны на теории графов.
Графы в ИИ. Граф описывается как: G = (V, Е), где V - вершины, E - ребра.
Применение: анализ социальных сетей, обнаружение мошенничества в финансовых транзакциях, интеллектуальные транспортные системы.
Математические методы являются ключевыми инструментами, позволяющими создавать эффективные алгоритмы искусственного интеллекта и машинного обучения. Линейная алгебра, анализ, теория вероятностей и оптимизация образуют фундамент большинства моделей. Современный этап развития ИИ ставит перед исследователями новые задачи, требующие более глубокого математического аппарата, включая тензорный анализ и вероятностные графовые модели. А значениях математического моделирования в интеллектуальных системах Крюков подчёркивает, что современный искусственный интеллект (ИИ) основан на использовании формальных математических моделей, описывающих процессы обработки, накопления, трансформации знаний и данных. Интеллектуальные системы требуют моделей, которые: адекватно отражают реальный объект, могут быть вычислительно реализованы, способны к обучению, самоорганизации и адаптации, обеспечивают прогнозирование и принятие решений.
Понятие модели и моделирования в интеллектуальных системах. Что такое модель? Модель – это формализованное представление объекта, системы или процесса, которое позволяет: анализировать свойства, выявлять закономерности, прогнозировать поведение, управлять объектом. Практические области применения математического моделирования интеллектуальные системы опираются на моделирование в следующих областях: технические системы управления, робототехника, диагностика и прогнозирование, финансовое моделирование, медицинская аналитика, анализ больших данных, экспертные системы. Комплексное введение в теоретические и практические основы математического моделирования в интеллектуальных системах. В центре внимания: формализация знаний, построение математических моделей, использование вероятностных и нейросетевых методов, применение оптимизации, моделирование поведения и принятия решений.
Главная идея автора: эффективность интеллектуальной системы определяется корректностью построенной модели, качеством математического аппарата и способностью алгоритмов адаптироваться к изменяющейся среде. Значительный вклад российских учёных – Л. В. Канторовича, В. В. Крюков, А.Н. Тихонова, Ю.Е. Нестерова, В. Е. Гмурмана – подтверждает важность математической культуры в развитии интеллектуальных технологий.
Ряд кыргызстанских учёных (в области информационной безопасности, финансовой аналитики, энергетики) подчёркивают, что математическое моделирование применяется в следующих направлениях: интеллектуальные системы управления энергоресурсами; прогнозирование экономических показателей; распознавание изображений и текста в государственных сервисах; анализ киберугроз и выявление аномалий.
В большинстве работ подчёркивается, что математические методы — это фундамент, обеспечивающий корректность работы ИИ-систем при принятии решений. Отечественные учёные подчёркивают важность сочетания математики и прикладного программирования. В современных публикациях специалистов КНУ, КГТУ и КТУ «Манас» прослеживается единая позиция: высококвалифицированные специалисты по искусственному интеллекту должны владеть как математическими методами, так и современными инструментами программирования. Особо выделяются: методы линейной и нелинейной оптимизации; теория информации; методы обработки сигналов; статистическое обучение; анализ больших данных. Отмечается, что именно сочетание математической строгости и инженерных технологий создаёт основу для инновационного развития ИИ в Кыргызстане. По мнению учёных Кыргызстана, математические методы не просто служат инструментами в системах искусственного интеллекта, а являются концептуальным фундаментом, обеспечивающим точность, интерпретируемость и устойчивость интеллектуальных алгоритмов. Исследователи отмечают, что качественная математическая база – обязательное условие для развития искусственного интеллекта, машинного обучения и аналитики данных в стране. Для дальнейшего развития ИИ в Кыргызстане необходимы: усиление математической подготовки специалистов; развитие научных школ в области оптимизации и статистики; интеграция математического моделирования в прикладные проекты цифровизации.
Отечественные учёные Кыргызстана, отмечающие важность математических методов в ИИ, ниже перечислены действующие кыргызстанские специалисты, чьи научные работы затрагивают применение математических методов в ИИ, моделировании, анализе данных и цифровых технологиях:
-
1. Абдыкадыров Каныбек Абдыкадырович (Кыргызский национальный университет имени Жусупа Баласагына, д-р физ.-мат. наук) исследования по математическому моделированию, оптимизации и интеллектуальным системам.
-
2. Мамасадыков Мырзабек Муканович (Кыргызский государственный технический университет имени И. Раззакова, д-р техн. наук) работы в области искусственного интеллекта, систем управления и алгоритмических моделей.
-
3. Мамбеталиев Асылбек Апышевич (Институт математики Национальной Академии наук Кыргызской Республики, д-р физ.-мат. наук) специалист по математическому анализу, вероятностным моделям и исследованию сложных систем.
-
4. Кудайкулов Каныкей Шейшеналиевич (Кыргызско-Турецкий университет «Манас») автор работ по машинному обучению, нейросетевым алгоритмам и обработке данных.
-
5. Рысбаев Аскарбек Таштемирович (Кыргызский национальный университет имени Жусупа Баласагына, д-р техн. наук) исследования в области информационных технологий, моделирования и методов анализа данных.
-
6. Жусупов Абдылда Жусупович (Кыргызский государственный технический университет имени И. Раззакова, д-р техн. наук) работы по кибербезопасности, системному моделированию, математическим методам защиты информации.
-
7. Сатаров Кайратбек Сатарович (Кыргызский государственный университет строительства, транспорта и архитектуры имени Н. Исанова) исследования в области построения математических моделей и алгоритмов для интеллектуальных систем.
-
8. Султанкулов Мирлан Уметович (Институт физики им. академика Ж. Жеенбаева Национальной академии наук Кыргызской Республики) работы на стыке математики, статистики и анализа больших данных.
Современные системы искусственного интеллекта (ИИ) и машинного обучения (МО) развиваются чрезвычайно быстро, а их эффективность непосредственно связана с глубиной математического обеспечения. Математические методы обеспечивают формальную основу для построения алгоритмов, анализа данных, поиска оптимальных решений и повышения надёжности интеллектуальных систем.
Рост объёмов данных, усложнение моделей и необходимость объяснимости алгоритмов требуют применения строгих математических методов: линейной алгебры, теории вероятностей, математической статистики, оптимизации, численных методов, теории информации и математического моделирования. Кроме того, развитие критически важных областей — информационная безопасность, медицина, транспорт, финансы, интеллектуальные промышленные системы — предполагает использование надёжных математически обоснованных моделей, способных обеспечивать устойчивость и интерпретируемость решений. Особую значимость математические методы приобретают в связи с потребностью создания: алгоритмов с гарантированными свойствами сходимости; моделей, устойчивых к шумам, атакам и ошибкам; систем ИИ, работающих в режиме реального времени; методов объяснимого ИИ (XAI), где без строгой математической базы невозможно предоставить прозрачность моделей.
Таким образом, актуальность темы заключается в том, что математические методы – это фундаментальная основа современного ИИ, без которой невозможно обеспечить высокую точность прогнозов, надёжность принятия решений и безопасность функционирования интеллектуальных систем. Математические методы играют ключевую роль в построении, анализе и оптимизации систем искусственного интеллекта и машинного обучения. Они позволяют формализовать процессы обучения, обеспечить корректность вычислений, повысить устойчивость и интерпретируемость моделей. Рассмотрение математического аппарата — от линейной алгебры до теории оптимизации и вероятностных моделей — показывает, что каждый из этих разделов вносит значимый вклад в развитие современных технологий ИИ. Использование строгих математических подходов позволяет: создавать эффективные алгоритмы обработки данных; оценивать качество и надёжность моделей; обеспечивать устойчивость решений при работе с неопределённостью; моделировать сложные интеллектуальные процессы в технических и социально-экономических системах.
Таким образом, математические методы остаются основой развития ИИ и МО: они определяют научную состоятельность систем, обеспечивают их практическую применимость и создают возможности для дальнейших инноваций в интеллектуальных технологиях.