Информатика и вычислительная техника. Рубрика в журнале - Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника

Публикации в рубрике (108): Информатика и вычислительная техника
все рубрики
Об одном подходе к реализации информационной инфраструктуры обновляемого информационного поиска

Об одном подходе к реализации информационной инфраструктуры обновляемого информационного поиска

Шинкарев Александр Андреевич

Статья научная

Основные задачи в сфере информационных технологий, стоящие перед бизнесом сегодня, так или иначе касаются обработки информации и поиска новых сведений в ней. Используются статистические методы, модели машинного обучения и более простые методы и модели. Однако всем решениям, направленным на поиск информации, необходима информационная инфраструктура, которая была бы адекватна основным требованиям, предъявляемым к системам такого рода. Цель исследования: описание основных функциональных и технических требований, которые предъявляются к современным системам, в задачи которых входит реализация обновляемого информационного поиска; формирование основополагающих архитектурных предложений по дизайну системы в целом и ее ключевых частей в частности; выявление основных составляющих частей информационной системы и подходов к решению ключевых задач для решений, построенных на основе механизма обмена сообщениями. Материалы и методы. Рассматривается современная постановка задачи по созданию корпоративных информационных систем обновляемого информационного поиска. Сравниваются наиболее интересные в рамках рассматриваемой постановки задачи брокеры обмена сообщениями. Результаты. В статье обосновывается актуальность задачи создания информационных систем обновляемого поиска информации. Делается постановка задачи по созданию систем такого рода. Дается обзор дизайна архитектуры решения на высоком уровне абстракции. Раскрывается модульный состав рассматриваемой информационной системы. Обосновывается и принимается решение использовать в качестве брокера обмена сообщениями инструмент Kafka. Разбираются нюансы технических решений для устранения проблем дублирующихся записей и фильтрации последних результатов поиска информации.

Бесплатно

Обзор и анализ подходов и практических областей применения распознавания эмоций человека

Обзор и анализ подходов и практических областей применения распознавания эмоций человека

Орлов А.А., Миронов М.И., Абрамова Е.С.

Статья научная

Человеческие эмоции сложны и многогранны, что делает их сложными для количественной оценки и анализа. Однако с развитием технологий исследователи изучают возможности использования искусственного интеллекта для лучшего понимания и классификации человеческих эмоций. В частности, нейронные сети становятся все более популярными для распознавания и анализа эмоций благодаря их способности обучаться и адаптироваться на основе больших массивов данных.

Бесплатно

Объективные факторы и их смыслы

Объективные факторы и их смыслы

Гилв Денис Викторович, Мазуров Владимир Данилович

Статья научная

Рассматривается метод построения факторов и новый метод вычисления их смыслов. Предложенный подход к теории факторного анализа тесно связан с комитетными конструкциями, такими как совместные подсистемы неравенств, а также с математической лингвистикой. Рассматривается комитет как коллективное решение. Фактор - латентный источник динамики взаимозависимых признаков объектов и явлений. В одном из популярных методов факторного анализа исследуется структура матриц ковариаций и корреляций. В ниже изложенном подходе используются семантические окрестности признаков. Также в данной статье приводятся элементы математической статистики и распознавания образов. Рассматривается проблема имён и значений факторов как функций имён и значений признаков.

Бесплатно

Оптимизация алгоритмов в головоломке human resource machine по числу команд и операций

Оптимизация алгоритмов в головоломке human resource machine по числу команд и операций

Копотева Анна Владимировна, Кабиольский Евгений Алексеевич

Статья научная

Видеоигры являются одним из распространенных видов современного досуга, а также относятся к синтетическому искусству коллективного авторства. Достаточно много написано о вреде компьютерных игр, однако есть и исследования, свидетельствующие о пользе некоторых их видов, в том числе различных головоломок. Часть из них являются весьма специфическими продуктами, в частности, различные симуляторы программирования. Цель исследования. Данная работа посвящена оптимизации наиболее сложных алгоритмов в видеоигре Human Resource Machine в соответствии с принятыми в ней критериями оптимальности. Предполагается, что решение каждой задачи должно содержать не более заданного числа команд и выполняться не более чем за определенное количество шагов. Для большей части задач может быть найдено решение, одновременно удовлетворяющее обоим критериям, однако некоторые головоломки требуют реализации двух отдельных алгоритмов. Всего в игре 36 задач различного типа и уровня сложности, из них выбрано 6 доставивших автору наибольшие трудности при прохождении. Материалы и методы. В работе описываются идеи и алгоритмы решения задач на естественном языке, удовлетворяющие заданным ограничениям, а также приводятся результирующие значения количества команд в коде и операций в процессе его исполнения. Точные решения не приводятся, поскольку в силу громоздкости игрового языка соответствующие алгоритмы с комментариями оказались слишком объемны для статьи. Кроме того, данная статья призвана лишь констатировать возможность нахождения собственных оптимальных решений рассматриваемых головоломок. Результаты. Для двух задач из шести рассмотренных в работе удалось получить алгоритмы, удовлетворяющие ограничениям и по числу команд, и по количеству операций. Для оставшихся четырех задач разработано по паре алгоритмов, каждый из которых удовлетворяет одному из ограничений. Заключение. По результатам проделанной работы можно утверждать, что существуют компьютерные игры, которые являются не просто развлечением, а могут представлять собой весьма непростой интеллектуальный вызов. Нахождение оптимальных решений в головоломках Human Resource Machine оказалось весьма непростым и интересным занятием, позволившим избавиться от шаблонов и иначе взглянуть на некоторые классические задачи программирования.

Бесплатно

Особенности применения деревьев решений в задачах классификации

Особенности применения деревьев решений в задачах классификации

Кафтанников Игорь Леопольдович, Парасич Андрей Викторович

Статья научная

Рассматривается применение деревьев решений в задачах классификации. В последние годы деревья решений широко применяются в задачах компьютерного зрения, таких как распознавание объектов, классификация текстов, распознавание жестов, обнаружение спама, обучение ранжированию в информационном поиске, семантическая сегментация и кластеризация данных. Этому способствуют такие отличительные особенности деревьев решений как интерпретируемость, управляемость, возможность автоматического отбора информативных признаков. Однако имеется и ряд принципиальных недостатков, из-за которых задача обучения деревьев решений существенно усложняется. В статье приводится анализ преимуществ и недостатков деревьев решений, рассматриваются вопросы обучения и тестирования деревьев решений. Особое внимание уделяется проблемам сбалансированности обучающей выборки. Рассматриваются также леса решений и методы их обучения. Приводится краткий обзор методов снижения взаимозависимости ошибок деревьев решений при обучении лесов решений. Предлагаются методы преодоления недостатков деревьев решений, приводятся результаты работы данных методов.

Бесплатно

Оценивание неопределённости в машинном обучении

Оценивание неопределённости в машинном обучении

Арьков В.Ю., Шарипова А.М., Куликов Г.Г.

Статья научная

Большинство методов машинного обучения основаны на статистической теории обучения, при этом часто используется упрощение процедур для достижения приемлемой скорости вычислений. Цель исследования. Сформировать общий подход к оценке неопределенности в моделях машинного обучения. В эконометрике в любой модели в обязательном порядке ставится неопределенность в форме стандартного отклонения («сигмы») для коэффициентов и для прогнозов. Проблема заключается в том, что в машинном обучении нельзя аналитически посчитать неопределенность через «сигму». Поэтому вместо аналитических методов мы предлагаем использовать численные методы. Материалы и методы. Для детального рассмотрения вопроса оценивания неопределённости выбраны классические методы регрессионного анализа, в которых уделяется большое внимание неопределённости коэффициентов модели и - что более важно - точности прогнозов, полученных по такой модели. Результаты. Предлагается технология оценки неопределённости, демонстрируемая на модельном примере для того, чтобы показать, что она согласуется с традиционными классическими методами по результатам. В дальнейшей практике мы предлагаем использовать кросс-валидацию. Заключение. При использовании машинных моделей сложных процессов, в том числе прогнозов, построенных по таким моделям, при принятии управленческих решений становится всё более актуальной проблема оценивания неопределённости и вытекающих из этой неизбежной неопределённости рисков. Данная проблема может быть решена на основе непараметрических методов, хотя для этого потребуется гораздо большая вычислительная мощность, чем та, которая используется для обучения машинной модели. Предлагаемый подход можно обобщить и для других методов машинного обучения, например, для задачи классификации и кластеризации.

Бесплатно

Переобучение в машинном обучении: проблемы и решения

Переобучение в машинном обучении: проблемы и решения

Парасич В.А., Парасич И.В., Волович Г.И., Некрасов С.Г., Парасич А.В.

Статья научная

Переобучение является одним из важнейших факторов, влияющих на качество работы алгоритмов машинного обучения. При решении задач машинного обучения важно уметь эффективно решать проблему переобучения. Цель исследования. Цель данной статьи - изучить проблему переобучения в задачах машинного обучения. В статье рассматриваются эффективные приёмы обучения, направленные на предотвращение переобучения.

Бесплатно

Подход к формированию виртуальной метаструктуры цифрового проектного двойника корпоративной информационной системы машиностроительного предприятия

Подход к формированию виртуальной метаструктуры цифрового проектного двойника корпоративной информационной системы машиностроительного предприятия

Сапожников Алексей Юрьевич, Кузнецов Александр Андреевич, Маврина Анна Сергеевна, Куликов Григорий Геннадьевич

Статья научная

В настоящее время формируется методология системной инженерии, продуктом которой является, как правило, создание информационных моделей реальных объектов, дополненных виртуальными составляющими, и наоборот, виртуальных объектов, дополненных реальными составляющими. Например, информационная модель технологического объекта - спецификация реального оборудования, дополненная спецификацией приобретаемого оборудования какого-либо технологического процесса и наоборот. По аналогии с общей инженерией в области технической деятельности метаструктуры таких информационных моделей должны удовлетворять V-образной структуре процессов валидации и верификации. То есть модели в течение их жизненного цикла должны регулярно проверяться путем оценки степени соответствия её структуры и параметров реальным и виртуальным объектам. Сегодня существуют условия совместного решения задачи системного информационного моделирования технологических объектов с учетом их внутренней (физической) структуры и внешней структуры цифровой среды. В общетеоретическом плане в основе построения системных моделей лежит проблема формального непротиворечивого описания (грамматического исчисления) структуры и функциональных закономерностей множества объектов и их связей в исследуемой предметной области. В основу излагаемого подхода системного моделирования рассматриваемой предметной области положена классическая модель учебно-производственной деятельности машиностроительного предприятия (МП) и вуза. Цель исследования. Применить принципы проектного подхода для формирования метаструктуры цифрового двойника корпоративной информационной системы (КИС) машиностроительного предприятия, исследовать перспективы его применения, определить ключевые информационные компоненты в управлении предметно-ориентированными знаниями и данными, а также возможность масштабирования технологий при формировании цифровой среды для архитектуры современного МП, повышения эффективности взаимодействия участников бизнес-процессов. Методы исследования, использованные в работе: принципы методологии системной инженерии (процессного подхода, жизненного цикла и др.); комплексный подход и структурный анализ процесса проектирования по методологии SADT (Structured Analyze and Design Technology); методология TOGAF (The Open Group Architecture Framework). Результаты. Предложенный подход системного моделирования рассматриваемой предметной области является развитием работ коллектива авторов; демонстрируется возможность его масштабирования на примере взаимодействия участников НОЦ с использованием в составе вуза цифрового двойника КИС предприятия реального сектора экономики. Показана необходимость разработки модели управления знаниями, возрастающая роль информационно-поисковых систем. Заключение. Предложенный подход расширяет применение метаструктуры цифрового двойника, позволяет скорректировать архитектуру предприятия для повышения эффективности бизнес-процессов.

Бесплатно

Подходы к оценке защищённости информационных систем с криптографическим преобразованием объектов

Подходы к оценке защищённости информационных систем с криптографическим преобразованием объектов

Артюшина Лариса Андреевна, Полянский Дмитрий Александрович

Статья научная

Файловая система является одним из компонентов информационной системы, особенно уязвимых к атакам злоумышленников. Следовательно, повышение уровня защищённости информационной системы невозможно без обеспечения достаточного уровня защиты объектов файловой системы, атаки на которые затрагивают в том числе интересы пользователей информационных систем. Для принятия решений по использованию тех или иных механизмов защиты объектов файловой системы необходима регулярная оценка их текущего уровня защищённости. Цель исследования: построение модели оценки защищённости информационной системы с криптографическим преобразованием объектов файловой системы в условиях применения злоумышленником широкого спектра атак на файловую систему.

Бесплатно

Приложение метода парных расстояний к оцениванию радиуса сферической поверхности, имеющей случайные отклонения формы

Приложение метода парных расстояний к оцениванию радиуса сферической поверхности, имеющей случайные отклонения формы

Суховилов Борис Максович

Статья научная

Разработаны теоретические положения метода парных расстояний применительно к определению радиуса сферической поверхности, имеющей отклонения формы. Для реализации метода на исследуемой поверхности размещают реперные точки и измеряют между ними линейные расстояния. Рассмотрен наиболее общий случай определения радиуса, когда парные расстояния измеряются с погрешностями, а сфера имеет случайные отклонения формы. Рассматриваемый подход является развитием метода определения радиуса сферической поверхности по расстояниям, измеренным между 4 расположенным на поверхности точкам. Указанное количество точек является минимально необходимым для решения задачи. Представлена реализация метода для определения радиуса сферической поверхности по расстояниям, измеренным между произвольным, большим 4, количеством расположенных на поверхности точек. В рамках разработанного метода получены аналитические выражения радиуса сферической поверхности через расстояния между парами точек и вычислены среднеквадратические отклонения погрешностей оценок радиуса, вызванные погрешностями измерения расстояний и отклонением формы. Определены условия оптимальности конфигураций задаваемого количества точек на сфере, обеспечивающих минимальную дисперсию оценки радиуса. Метод позволяет исключить применение дорогостоящих координатных машин для получения оценки радиуса, так как для измерения парных расстояний можно использовать простой серийный измерительный инструмент. Оценка параметров методом парных расстояний целесообразна в случае крупногабаритных прерывистых поверхностей, когда измеряемая поверхность составляет только часть общей поверхности, прямые измерения невозможны из-за недоступности измерительных баз. Метод нашел приложение в комплексе работ по оценке параметров юстировки телевизионной системы измерения углового положения динамического стенда с газовой опорой.

Бесплатно

Применение большой языковой модели для уменьшения ложнопозитивных срабатываний в задачах выявления аномалий в сетевом трафике

Применение большой языковой модели для уменьшения ложнопозитивных срабатываний в задачах выявления аномалий в сетевом трафике

Болодурина И.П., Нефедов Д.А.

Статья научная

С каждым годом сетевые угрозы становятся все более изощренными и сложными, что требует от исследователей сферы сетевой безопасности искать и разрабатывать новые и более совершенные методы по обнаружению угроз безопасности. Несмотря на то, что ведутся постоянные исследования в данной области и исследователи совершенствуют алгоритмы машинного обучения, значительной проблемой остаются ложноположительные срабатывания систем обнаружения вторжений. В связи с этим разработка способов и подходов по уменьшению количества ложноположительных срабатываний является одной из наиболее актуальных задач. Цель исследования: изучить эффективность и возможности применения больших языковых моделей для снижения ложноположительных срабатываний систем обнаружения вторжений.

Бесплатно

Применение глубокого обучения для аугментации и генерации подводного набора данных с промышленными объектами

Применение глубокого обучения для аугментации и генерации подводного набора данных с промышленными объектами

Ахмад Авс, Андриянов Никита Андреевич, Соловьев Владимир Игоревич, Соломатин Денис Алексеевич

Статья научная

Цель исследования: разработка метода глубокого обучения для аугментации и генерации проблемно-ориентированного набора данных, содержащего промышленные объекты, в том числе разработка более эффективных алгоритмов генерации и аугментации данных, основанных на глубоком обучении, которые позволяют создавать более разнообразные и реалистичные данные, соответствующие промышленным объектам, которые могут быть перенесены из одного стилевого домена в другой. Поставленная в исследовании цель связана с наличием актуальной научно-технической задачи обеспечения компьютерного зрения в системах, работающих в подводной среде. Это могут быть автономные необитаемые подводные аппараты, которые ищут прорывы в трубопроводах, анализируют утечку нефти, движение косяков рыб и т. п. Однако достаточного количества данных, содержащих описанные объекты в условиях их реального существования, сегодня нет. Таким образом, необходимо обеспечить обучающую выборку реалистичными изображениями. Методы исследования: архитектура CycleGAN, обеспечивающая преобразование набора данных, содержащего изображения различных объектов, сделанные в лабораторной или в обычной надземной среде, в набор данных, содержащий характеристики подводной среды. Для оценки разработанного алгоритма аугментации предлагается использовать классификацию изображений по доменам, которая может быть выполнена с помощью сверточной нейронной сети ResNet. Результаты исследования. Представлен инструмент для решения проблемы отсутствия подводных наборов данных, разработана модель глубокого обучения, которая применяется для создания изображений с подводными элементами. Модель работает по принципу циклической генеративно-состязательной сети, которая получает на вход реальное изображение промышленного объекта в надводных условиях, а на выход возвращает сгенерированное изображение того же промышленного объекта в подводных условиях. Визуальный анализ изображений показывает, что такой метод достаточно адекватен. Кроме того, проверка на классификационной модели показала почти 100%-ную способность нейросети различать домены. Заключение. Исследование показало, что модель CycleGAN можно использовать для создания изображений различных объектов в подводной среде. В будущем возможен поиск дополнительных процедур аугментации, кроме того, могут быть использованы аугментации сгенерированного набора изображений, что также обеспечит исследователей и разработчиков достаточным материалом с промышленными объектами в подводной среде. Это может повысить качество разработок.

Бесплатно

Применение компьютерного зрения для определения реперных точек при оценке геометрии лица

Применение компьютерного зрения для определения реперных точек при оценке геометрии лица

Шитоев И.Д., Муравьев С.В., Иванова М.Д., Клоян Г.З.

Статья научная

Применение компьютерного зрения для определения геометрии лица при помощи реперных точек является относительно новым подходом в медицине. Актуальность данного исследования обусловлена не только необходимостью разработки новых методов и подходов в определении геометрии лица, но и растущим интересом к развитию и применению искусственного интеллекта в медицине. Цель исследования. Цель данной статьи - разработать математические и нейросетевые алгоритмы, определяющие геометрию лица при помощи реперных точек.

Бесплатно

Применение метода идеальной точки для поиска наилучшего способа аутентификации в корпоративных информационных системах

Применение метода идеальной точки для поиска наилучшего способа аутентификации в корпоративных информационных системах

Логиновский Олег Витальевич, Коваль Максим Евгеньевич, Шинкарев Александр Андреевич

Статья научная

В современном мире все популярнее становятся различные информационные системы, в том числе и корпоративные. Многие из таких систем хранят конфиденциальные данные своих пользователей. В основном эти данные защищены только логином и паролем, которые на сегодняшний день уже не могут обеспечить высокий уровень безопасности и гарантировать сохранность эти данных. Одновременно с развитием информационных систем развиваются методы и инструменты, с помощью которых злоумышленники могут завладеть конфиденциальной информацией. Довольно часто появляются новости о том, что какая-либо из крупных компаний допустила утечку личных данных пользователей. И для того чтобы минимизировать возможности для компрометации пользовательских данных, стоит более тщательно подходить к выбору способа аутентификации пользователей в системе. Цель исследования. Используя математический подход, определить наиболее подходящий способ аутентификации в корпоративных информационных системах с учетом определенных критериев. Материалы и методы. Рассматриваются такие виды аутентификации, как: аутентификация на основе многоразового пароля, TOTP (Time-based one-time password authentication), аутентификация на основе SMS, аутентификация на основе биометрии, OpenID, SAML (Security Assertion Markup Language). Используется метод построения множества Парето и определение с помощью метода идеальной точки наиболее предпочтительного для реализации метода аутентификации. Результаты. В статье авторами приводится описание рассматриваемых способов аутентификации, описание алгоритма их работы и диаграммы взаимодействия. С помощью метода идеальной точки было определено, что наиболее подходящим способом аутентификации является SAML.

Бесплатно

Применение технологий компьютерного зрения для разработки модели распознавания поражений культурных растений

Применение технологий компьютерного зрения для разработки модели распознавания поражений культурных растений

Янишевская Наталья Александровна, Болодурина Ирина Павловна

Статья научная

В Российской Федерации агропромышленный комплекс является одной из лидирующих отраслей экономики с объемом внутреннего валового продукта 4,5 %. России принадлежат 10 % всех пахотных земель мира. Согласно данным о посевных площадях по культурам в 2020 году, большую часть сельскохозяйственных площадей России занимает пшеница. Российская Федерация занимает третье место в рейтинге стран-лидеров по производству данного вида зерновых культур, а также лидирующие позиции по ее экспорту. Бурая (листовая) и линейная (стеблевая) ржавчина - наиболее вредоносная болезнь зерновых культур. Она является причиной изреженности посевов пшеницы и приводит к резкому снижению урожайности. Поэтому одной из главных задач аграриев является сохранение урожая от заболеваний. Помочь справиться с этой задачей способно применение таких областей искусственного интеллекта, как компьютерное зрение, машинное обучение и глубокое обучение. Данные технологии искусственного интеллекта позволяют успешно решать прикладные задачи агропромышленного комплекса при помощи автоматизированного анализа фотоматериалов. Цель исследования. Рассмотреть применение методов компьютерного зрения для задачи классификации поражений культурных растений на примере пшеницы. Материалы и методы. Набор данных CGIAR Computer Vision for Crop Disease для задачи распознавания поражений культурных растений взят из открытого источника Kaggle. Предлагается использовать подход к распознаванию поражений культурных растений с использованием известных нейросетевых моделей ResNet50, DenseNet169, VGG16 и EfficientNet-B0. На вход нейросетевым моделям поступают изображения пшеницы. Выходом нейронных сетей является класс поражения растения. Для преодоления эффекта переобучения нейронных сетей исследуются различные техники регуляризации. Результаты. Приводятся результаты качества классификации, оцениваемые с использованием метрики F1-score, являющейся среднегармоническим между мерами Precision и Recall. Заключение. В результате проведенного исследования установлено, что наилучшую точность распознавания показала модель DenseNet c применением комбинации технологии трансферного обучения и технологий регуляризации DropOut и L2 для преодоления эффекта переобучения. Применение данного подхода позволило достичь точности распознавания 91 %.

Бесплатно

Проблематика использования текстовых DSL в информационных системах

Проблематика использования текстовых DSL в информационных системах

Кирсанова Александра Александровна

Статья научная

Рассматривается современное положение дел в среде разработки информационных систем с точки зрения внедрения и использования предметно-ориентированных языков в системе для предоставления всего комплекса функционала пользователю. На сегодняшний день существует несколько методик по внедрению предметно-ориентированных языков в информационную систему. В первую очередь эти подходы различаются по типу внедряемого DSL: внутренний или внешний, API-подобный или полностью интегрированный. Если существующие подходы по внедрению предметно-ориентированных языков в информационные системы проанализировать на предмет выявления недостатков, то данные недостатки позволят определиться с кругом проблем, который возникает при использовании текстовых предметно-ориентированных языков в информационных системах. Подобный анализ позволит сформулировать задачи исследования, решение которых поможет преодолеть сложившуюся ситуацию с использованием текстовых предметно-ориентированных языков и соответствующих проблем, которые возникают при интеграции подсистемы интерпретации DSL в информационную систему.

Бесплатно

Проблемы формирования обучающей выборки в задачах машинного обучения

Проблемы формирования обучающей выборки в задачах машинного обучения

Кафтанников Игорь Леопольдович, Парасич Андрей Викторович

Статья научная

Правильное формирование обучающей выборки часто имеет решающее значение в задачах машинного обучения, что признаётся большинством специалистов в данной области. Зачастую решение задач машинного обучения сводится к грамотному формированию обучающей выборки. Несмотря на это, в современной литературе по машинному обучению вопросам формирования обучающей выборки почти не уделяется внимание, теоретическая база практически отсутствует. В настоящей статье постараемся исправить данный недостаток. В статье исследуются возможные проблемы и ошибки при формировании обучающей выборки, обобщается опыт авторов в решении задач машинного обучения, предлагаются теоретические модели для описания явлений, связанных с формированием множества обучающих данных, приводятся методы улучшения обучающей выборки. Даются практические рекомендации на основе разработанных теоретических моделей. В конце статьи представлены результаты экспериментов, демонстрирующие некоторые из проблем формирования обучающей выборки и методы их решения на примере задачи обучения деревьев решений.

Бесплатно

Прогнозирование количественных характеристик молока на основе инфракрасной спектроскопии с применением методов машинного обучения

Прогнозирование количественных характеристик молока на основе инфракрасной спектроскопии с применением методов машинного обучения

Легашев Леонид Вячеславович, Болодурина Ирина Павловна, Гришина Любовь Сергеевна, Лашнева Ирина Алексеевна, Сермягин Александр Александрович

Статья научная

Спектроскопия среднего инфракрасного диапазона с преобразованием Фурье представляет собой быстрый и дешевый способ анализа проб коровьего молока для определения содержания жира, белка, лактозы и других количественных и качественных показателей молока. Современные инструменты анализа данных позволяют выявить наиболее значимые зависимости между различными парами количественных и качественных признаков состава молока. Цель исследования. Выполнить прогнозирование ряда ключевых признаков состава молока коров с использованием данных инфракрасной спектроскопии для изучения точности разработанной математической модели. Методы. Работу проводили в зимний период 2022 года на базе экспериментального стада голштинизированного черно-пестрого скота (Краснодарский край). Анализ компонентов молока осуществляли с использованием автоматического анализатора MilkoScan (FOSS) с применением метода инфракрасной спектроскопии путем выгрузки полученных спектров при анализе состава сырого молока. Исследованы 23 показателя количественного состава молока: массовая доля жира, белка (истинного и общего), лактозы, СОМО (сухого обезжиренного молочного остатка), сухого вещества, казеина, следы ацетона и бета-гидроксибутирата, мочевина, точка замерзания, кислотность молока, миристиновая, пальмитиновая, стеариновая, олеиновая жирные кислоты (ЖК), длинноцепочечные ЖК, среднецепочечные ЖК, короткоцепочечные ЖК, мононенасыщенные и полиненасыщенные ЖК, насыщенные ЖК, трансизомеры жирных кислот. Рассмотрены методы на основе линейной регрессии (Linear Regression), подходы к регуляризации модели линейной регрессии (Ridge, Lasso и ElasticNet), а также полиномиальная регрессия, метод частичной регрессии (PLSRegression) и метод Байесовской регрессии для задачи прогнозирования ключевых признаков состава молока. Реализован метод снижения размерности данных инфракрасной спектроскопии на основе алгоритма случайного перебора считывания по длине окна и выделены наиболее значимые признаки. Результаты. Разработаны модели прогнозирования шести основных показателей качества молока - массовая доля жира ('Fat'), массовая доля казеина ('Cas.B'), жирных кислот - миристиновой ('C14:0') и олеиновой ('C18:1'), мононенасыщенных ('MUFA') и полиненасыщенные жирных кислот ('PUFA') - со средней абсолютной ошибкой, не превышающей 0,016. Заключение. Результаты, полученные в ходе проведенного исследования, позволят в дальнейшем улучшить предиктивную способность уравнения для определения качества, состава молока по новым селекционным признакам молочной продуктивности, снизить издержки анализа и проводить контроль за состоянием здоровья животных на ранних стадиях.

Бесплатно

Прогнозная модель процесса флокуляции на основе нейронной сети

Прогнозная модель процесса флокуляции на основе нейронной сети

Володина Юлия Игоревна, Затонский Андрей Владимирович, Рахимова Олеся Викторовна, Середкина Ольга Рафисовна

Статья научная

Обоснована задача построения прогнозной модели процесса флокуляции калийной руды. Показано, что результаты расчетов по традиционным моделям неудовлетворительно воспроизводят экспериментальные данные, а применение регрессионно-дифференциальной модели вызывает затруднения в объяснении ее коэффициентов. Предложено для моделирования процесса использовать нейронную сеть. Обоснованы выбор алгоритма обратного распространения для обучения сети и сигмоидальной активационной функции. Использована программная система реализации нейронных сетей на основе библиотеки FANN. На основании пяти экспериментов произведено обучение сети. Оценены статистические показатели нейронной сети данной структуры. Тестирование по данным шестого эксперимента показало удовлетворительное качество модели. Изучены вопросы рациональной организации обучения и тестирования нейронной сети для моделирования процесса флокуляции. В итоге показана возможность использования нейронных сетей для моделирования процесса флокуляции в конкретном оборудовании.

Бесплатно

Программно-алгоритмический комплекс прогнозирования динамики арктических озер России на основе спутниковых снимков и энтропийно-рандомизированного подхода

Программно-алгоритмический комплекс прогнозирования динамики арктических озер России на основе спутниковых снимков и энтропийно-рандомизированного подхода

Сокол Е.С., Тогачев А.А., Попков А.Ю., Дубнов Ю.А., Полищук В.Ю., Попков Ю.С., Мельников А.В., Полищук Ю.М.

Статья научная

Статья посвящена проблеме прогнозирования эволюции термокарстовых озер в зонах мерзлоты как интенсивных источников природной эмиссии парниковых газов в атмосферу на арктических территориях. Цель работы. Целью работы является рассмотрение вопросов создания программно-алгоритмического комплекса прогнозирования пространственно-временной динамики озер Российской Арктики на основе методов и алгоритмов рандомизированного машинного обучения.

Бесплатно

Журнал