Прикладные информационные технологии. Биоинформатика. Рубрика в журнале - Проблемы информатики

Публикации в рубрике (7): Прикладные информационные технологии. Биоинформатика
все рубрики
Dynmicrobiotcch: программный модуль для автоматической реконструкции фреймовых динамических моделей генных сетей микроорганизмов

Dynmicrobiotcch: программный модуль для автоматической реконструкции фреймовых динамических моделей генных сетей микроорганизмов

Лашин С.А., Казанцев Ф.В., Лахова Т.Н., Матушкин Ю.Г.

Статья научная

Современные генетические технологии используются в промышленной биотехнологии для конструирования микробиологических штаммов-продуцентов с целевыми характеристиками на основе тесной интеграции экспериментальных и информационно-компьютерных подходов. Все большая доступность геномных данных и методов их функциональной аннотации требует разработки новых методов системной биологии, в частности, методов реконструкции генных сетей и метаболических путей, контролирующих целевые процессы и характеристики микроорганизмов, на основе информации о секвенированных геномах, а также методов построения математических моделей этих сетей и путей. В данной работе представлен программный модуль DyiiMicrobiotcch для автоматической реконструкции фреймовых математических моделей на основе метода обобщенного химико-кинетического моделирования. Входными данными для модуля являются аннотация и разметка генома, выходными - сгенерированная модель в виде системы обыкновенных дифференциальных уравнений, записанная в формате SBML.

Бесплатно

Вычислительный конвейер по распознаванию сайтов связывания транскрипционных факторов в бактериальных геномах de novo

Вычислительный конвейер по распознаванию сайтов связывания транскрипционных факторов в бактериальных геномах de novo

Мухин А.М., Ощепков Д.Ю., Лашин С.А.

Статья научная

Задача поиска сайтов связывания транскрипционных факторов (ССТФ) в бактериальных геномах является одним из важнейших этапов их изучения и последующего использования в задачах биотехнологии и микробиологии. Характерная длина ССТФ - 5-20 пар нуклеотидов, и каждый транскрипционный фактор обладает способностью связываться с набором сайтов, сходных по последовательности. Поэтому поиск таких коротких последовательностей, имеющих достаточное, т. е. не случайное, сходство - т. и. мотивов - лежит в основе аннотации бактериальных геномов сайтами связывания. В статье описаны набор вычислительных конвейеров по поиску мотивов, которые принимают на вход данные бактериального генома и его первичной аннотации. Предлагаемые конвейеры, использующие два разных подхода (полногеномный поиск и филогенетический футпринтинг) к поиску мотивов, предоставляют исследователю исчерпывающий набор настроек для получения на выходе максимально полной аннотации сайтами как всего генома, так и более детально - регуляторного района выбранного гена. Представленные конвейеры реализованы как с использованием современной платформы Nextflow, так и скриптами на языке программирования Python. Разработанная нами индексируемая база метаданных для известных бактериальных геномов с использованием встраиваемой СУБД SQLite позволяет существенно ускорить извлечение данных для дальнейших расчетов.

Бесплатно

Комбинированный подход к реконструкции ассоциативных сетей: объединение GraphSAGE и статистики совместной встречаемости

Комбинированный подход к реконструкции ассоциативных сетей: объединение GraphSAGE и статистики совместной встречаемости

Иванисенко Т.В., Деменков П.С., Иванисенко В.А.

Статья научная

Исследование посвящено разработке гибридного подхода к предсказанию молекулярногенетических взаимодействий, объединяющего графовые нейронные сети (ГНС) и анализ совместной встречаемости сущностей в научной литературе. Эффективность метода продемонстрирована на примере ассоциативной сети Escherichia coli, реконструированной с использованием системы ANDSvstcm и ее модуля ANDDigcst. Результаты показали значительное улучшение точности предсказания взаимодействий относительно соответствия топологии исходного графа, по сравнению с использованием только ГНС. Комбинация подходов позволила улучшить Fl-меру с 0.815 до 0.97, а также снизить значение функции потерь с 0.405 до 0.08. Оценка на экспериментально подтвержденных белок-белок взаимодействиях также продемонстрировала высокую эффективность модели (Fl-мера 0.9799, коэффициент корреляции Мэттьюса 0.9597). Предложенный метод может найти применение при анализе сложных биологических систем, планировании экспериментов и оптимизации биотехнологических процессов.

Бесплатно

Метод предсказания количества белка в клетках дрожжей на основе их геномных последовательностей

Метод предсказания количества белка в клетках дрожжей на основе их геномных последовательностей

Вензель А.С., Клименко А.И., Иванисенко Т.В., Деменков П.С., Лашин С.А., Иванисенко В.А.

Статья научная

В работе представлен новый метод предсказания количества белка в клетках пекарских дрожжей Saccharomyces cerevisiae, основанный на анализе их биологических последовательностей с использованием предобученных языковых моделей. Для обработки последовательностей были применены модели семейства ESM2 для аминокислотных последовательностей и модель GENA-LM для нуклеотидных последовательностей генов, что позволило получить информативные векторные представления входных данных. В работе оценивается влияние различных архитектур и размеров предобученных языковых моделей на точность предсказания. Предложенный метод имеет потенциал для применения в биотехнологии, оптимизации процессов биосинтеза и компьютерном дизайне штаммов-продуцентов с повышенной экспрессией генов целевых белков. Результаты исследования могут способствовать более глубокому пониманию механизмов регуляции генетической экспрессии и открывают перспективы для предсказания количества белков в других микроорганизмах.

Бесплатно

Программный конвейер предсказания влияния мутаций на стабильность пространственных структур белков с использованием методов оценки изменения свободной энергии и искусственного интеллекта

Программный конвейер предсказания влияния мутаций на стабильность пространственных структур белков с использованием методов оценки изменения свободной энергии и искусственного интеллекта

Вензель А.С., Иванисенко Т.В., Деменков П.С., Иванисенко В.А.

Статья научная

В данной работе был разработан программный конвейер для предсказания влияния мутаций на стабильность пространственной структуры белка. В конвейере применяются комбинированный подход, использующий современные методы искусственного интеллекта для предсказания структуры белка, и классические алгоритмы оценки изменения свободной энергии. Конвейер включает в себя предсказание структуры белка с помощью модели ESM3 и последующий расчет изменения свободной энергии мутантных форм с помощью pyRosctta. Такой подход позволяет преодолеть ограничения существующих методов, объединяя преимущества глубокого обучения и интерпретируемость энергетических расчетов. Разработанный инструмент может найти применение в задачах структурной биоинформатики, биотехнологии и медицины, особенно в условиях ограниченного количества экспериментально определенных структур белков.

Бесплатно

Программный модуль для исследования регуляции метаболических путей бактерии методами математического моделирования

Программный модуль для исследования регуляции метаболических путей бактерии методами математического моделирования

Лахова Т.Н., Казанцев Ф.В., Хлебодарова Т.М., Матушкин Ю.Г., Лашин С.А.

Статья научная

Математическое моделирование широко применяется в задачах микробиологической биотехнологии. Оно используется для описания и понимания потоков метаболитов и изменения их концентраций, позволяет рассматривать пути биосинтеза белков и делать прогнозы по затратам сред культивирования на выход целевых продуктов и т. д. Стандартные подходы моделирования метаболизма бактерий обычно упускают процессы регуляции, работающие на генетическом уровне. Между тем, развитие вычислительных методов геномного анализа выявляет все больше таких регуляторных отношений. Учет регуляторных отношений в процессе реконструкции моделей позволит исследовать более тонкие детали управления метаболизмом бактерий. В работе представлен программный модуль, который осуществляет генерацию фреймовых математических моделей по структуре генной сети бактерии, расширенный инструментарием учета регуляторных отношений в геноме бактерий. Генерация модели осуществляется в терминах обыкновенных дифференциальных уравнений в рамках стандарта SBML. Исследование результирующей математической модели в итоге доступно во множестве профильных сред моделирования.

Бесплатно

Цифровая платформа «Микробиотех»: архитектура и назначение

Цифровая платформа «Микробиотех»: архитектура и назначение

Деменков П.С., Мухин А.М., Иванисенко В.А., Лашин С.А., Колчанов Н.А.

Статья научная

В статье рассматривается архитектура разработанной цифровой платформы «Микробиотех» для решения широкого круга задач системной и структурной биологии, обсуждается использование программного обеспечения, интегрированного в платформу для обработки и анализа больших объемов генетической информации, а также для предсказания структуры и функции белков. Использование цифровой платформы «Микробиотех» позволяет увеличить производительность исследования, улучшить точность анализа данных и способствовать развитию новых методов исследования

Бесплатно

Журнал