Прикладные информационные технологии. Биоинформатика. Рубрика в журнале - Проблемы информатики

Статья научная
Современные генетические технологии используются в промышленной биотехнологии для конструирования микробиологических штаммов-продуцентов с целевыми характеристиками на основе тесной интеграции экспериментальных и информационно-компьютерных подходов. Все большая доступность геномных данных и методов их функциональной аннотации требует разработки новых методов системной биологии, в частности, методов реконструкции генных сетей и метаболических путей, контролирующих целевые процессы и характеристики микроорганизмов, на основе информации о секвенированных геномах, а также методов построения математических моделей этих сетей и путей. В данной работе представлен программный модуль DyiiMicrobiotcch для автоматической реконструкции фреймовых математических моделей на основе метода обобщенного химико-кинетического моделирования. Входными данными для модуля являются аннотация и разметка генома, выходными - сгенерированная модель в виде системы обыкновенных дифференциальных уравнений, записанная в формате SBML.
Бесплатно

Статья научная
Задача поиска сайтов связывания транскрипционных факторов (ССТФ) в бактериальных геномах является одним из важнейших этапов их изучения и последующего использования в задачах биотехнологии и микробиологии. Характерная длина ССТФ - 5-20 пар нуклеотидов, и каждый транскрипционный фактор обладает способностью связываться с набором сайтов, сходных по последовательности. Поэтому поиск таких коротких последовательностей, имеющих достаточное, т. е. не случайное, сходство - т. и. мотивов - лежит в основе аннотации бактериальных геномов сайтами связывания. В статье описаны набор вычислительных конвейеров по поиску мотивов, которые принимают на вход данные бактериального генома и его первичной аннотации. Предлагаемые конвейеры, использующие два разных подхода (полногеномный поиск и филогенетический футпринтинг) к поиску мотивов, предоставляют исследователю исчерпывающий набор настроек для получения на выходе максимально полной аннотации сайтами как всего генома, так и более детально - регуляторного района выбранного гена. Представленные конвейеры реализованы как с использованием современной платформы Nextflow, так и скриптами на языке программирования Python. Разработанная нами индексируемая база метаданных для известных бактериальных геномов с использованием встраиваемой СУБД SQLite позволяет существенно ускорить извлечение данных для дальнейших расчетов.
Бесплатно

Статья научная
Исследование посвящено разработке гибридного подхода к предсказанию молекулярногенетических взаимодействий, объединяющего графовые нейронные сети (ГНС) и анализ совместной встречаемости сущностей в научной литературе. Эффективность метода продемонстрирована на примере ассоциативной сети Escherichia coli, реконструированной с использованием системы ANDSvstcm и ее модуля ANDDigcst. Результаты показали значительное улучшение точности предсказания взаимодействий относительно соответствия топологии исходного графа, по сравнению с использованием только ГНС. Комбинация подходов позволила улучшить Fl-меру с 0.815 до 0.97, а также снизить значение функции потерь с 0.405 до 0.08. Оценка на экспериментально подтвержденных белок-белок взаимодействиях также продемонстрировала высокую эффективность модели (Fl-мера 0.9799, коэффициент корреляции Мэттьюса 0.9597). Предложенный метод может найти применение при анализе сложных биологических систем, планировании экспериментов и оптимизации биотехнологических процессов.
Бесплатно

Метод предсказания количества белка в клетках дрожжей на основе их геномных последовательностей
Статья научная
В работе представлен новый метод предсказания количества белка в клетках пекарских дрожжей Saccharomyces cerevisiae, основанный на анализе их биологических последовательностей с использованием предобученных языковых моделей. Для обработки последовательностей были применены модели семейства ESM2 для аминокислотных последовательностей и модель GENA-LM для нуклеотидных последовательностей генов, что позволило получить информативные векторные представления входных данных. В работе оценивается влияние различных архитектур и размеров предобученных языковых моделей на точность предсказания. Предложенный метод имеет потенциал для применения в биотехнологии, оптимизации процессов биосинтеза и компьютерном дизайне штаммов-продуцентов с повышенной экспрессией генов целевых белков. Результаты исследования могут способствовать более глубокому пониманию механизмов регуляции генетической экспрессии и открывают перспективы для предсказания количества белков в других микроорганизмах.
Бесплатно

Статья научная
В данной работе был разработан программный конвейер для предсказания влияния мутаций на стабильность пространственной структуры белка. В конвейере применяются комбинированный подход, использующий современные методы искусственного интеллекта для предсказания структуры белка, и классические алгоритмы оценки изменения свободной энергии. Конвейер включает в себя предсказание структуры белка с помощью модели ESM3 и последующий расчет изменения свободной энергии мутантных форм с помощью pyRosctta. Такой подход позволяет преодолеть ограничения существующих методов, объединяя преимущества глубокого обучения и интерпретируемость энергетических расчетов. Разработанный инструмент может найти применение в задачах структурной биоинформатики, биотехнологии и медицины, особенно в условиях ограниченного количества экспериментально определенных структур белков.
Бесплатно

Статья научная
Математическое моделирование широко применяется в задачах микробиологической биотехнологии. Оно используется для описания и понимания потоков метаболитов и изменения их концентраций, позволяет рассматривать пути биосинтеза белков и делать прогнозы по затратам сред культивирования на выход целевых продуктов и т. д. Стандартные подходы моделирования метаболизма бактерий обычно упускают процессы регуляции, работающие на генетическом уровне. Между тем, развитие вычислительных методов геномного анализа выявляет все больше таких регуляторных отношений. Учет регуляторных отношений в процессе реконструкции моделей позволит исследовать более тонкие детали управления метаболизмом бактерий. В работе представлен программный модуль, который осуществляет генерацию фреймовых математических моделей по структуре генной сети бактерии, расширенный инструментарием учета регуляторных отношений в геноме бактерий. Генерация модели осуществляется в терминах обыкновенных дифференциальных уравнений в рамках стандарта SBML. Исследование результирующей математической модели в итоге доступно во множестве профильных сред моделирования.
Бесплатно

Цифровая платформа «Микробиотех»: архитектура и назначение
Статья научная
В статье рассматривается архитектура разработанной цифровой платформы «Микробиотех» для решения широкого круга задач системной и структурной биологии, обсуждается использование программного обеспечения, интегрированного в платформу для обработки и анализа больших объемов генетической информации, а также для предсказания структуры и функции белков. Использование цифровой платформы «Микробиотех» позволяет увеличить производительность исследования, улучшить точность анализа данных и способствовать развитию новых методов исследования
Бесплатно