Архитектура и дизайн мобильного приложения для генерации 3D-моделей по видеоданным

Автор: Беляев А.Л., Зеленова Ю.И.

Журнал: Бюллетень науки и практики @bulletennauki

Рубрика: Технические науки

Статья в выпуске: 4 т.12, 2026 года.

Бесплатный доступ

Современное развитие технологий компьютерного зрения, мобильных вычислений и трёхмерной графики способствует появлению новых инструментов для автоматического создания цифровых моделей реальных объектов. Одним из перспективных направлений является использование мобильных устройств для получения визуальных данных и последующей реконструкции трёхмерной геометрии объектов на их основе. Особый интерес представляют системы, способные преобразовывать видеозаписи объектов в полноценные 3D-модели без использования специализированного оборудования. В данной работе рассматривается дизайн-концепция мобильного приложения, предназначенного для автоматического преобразования видеоизображений в 3D-модели объектов. В статье анализируются современные методы реконструкции трёхмерной геометрии, основанные на алгоритмах компьютерного зрения и фотограмметрии. Описываются основные этапы обработки видеоданных, включая извлечение кадров из видеопотока, обнаружение и сопоставление характерных точек изображения, построение облака точек, генерацию полигональной сетки и наложение текстур. Особое внимание уделяется архитектуре мобильного приложения и принципам проектирования пользовательского интерфейса, обеспечивающим простоту использования и эффективное взаимодействие пользователя с системой. Рассматриваются функциональные возможности приложения, а также методы оптимизации вычислительных процессов для работы на мобильных устройствах. Предложенная концепция может быть применена в различных областях, включая промышленный дизайн, архитектурное проектирование, электронную коммерцию, системы дополненной и виртуальной реальности, а также образовательные и научные проекты.

Еще

Цифровые технологии, пользовательский интерфейс, 3D-модель, фотограмметрия

Короткий адрес: https://sciup.org/14135143

IDR: 14135143   |   УДК: 004.738.5:004.42   |   DOI: 10.33619/2414-2948/125/12

Architecture and Design of a Mobile Application for Generating 3D Models from Video Data

The rapid development of computer vision technologies, mobile computing, and three-dimensional graphics contributes to the emergence of new tools for the automated creation of digital models of real-world objects. One of the most promising directions is the use of mobile devices for acquiring visual data and reconstructing the three-dimensional geometry of objects based on these data. Of particular interest are systems capable of converting video recordings of objects into complete 3D models without the need for specialized scanning equipment. This paper presents a design concept for a mobile application intended for the automatic conversion of video images into 3D models. The study analyzes modern methods of 3D reconstruction based on computer vision and photogrammetry algorithms. The main stages of video data processing are described, including frame extraction from video streams, detection and matching of feature points, construction of a point cloud, generation of a polygonal mesh, and texture mapping. Special attention is given to the architecture of mobile applications and the principles of user interface design that ensure ease of use and effective interaction between the user and the system. The functional capabilities of the application are considered, along with approaches for optimizing computational processes to enable efficient operation on mobile devices. The proposed concept can be applied in various fields, including industrial design, architectural modeling, e-commerce, augmented and virtual reality systems, as well as educational and scientific projects.

Еще

Текст научной статьи Архитектура и дизайн мобильного приложения для генерации 3D-моделей по видеоданным

Бюллетень науки и практики / Bulletin of Science and Practice

УДК 004.738.5:004.42                            

Современные цифровые технологии активно внедряются в процессы создания и визуализации 3D объектов. В последние годы наблюдается значительный рост интереса к методам автоматического построения 3D-моделей на основе изображений и видеоданных. Подобные технологии находят применение в различных областях, включая промышленный дизайн, архитектурное проектирование, электронную коммерцию, игровую индустрию и системы дополненной реальности. Традиционные методы создания 3D-моделей требуют использования специализированного программного обеспечения и значительных навыков в области 3D-моделирования. В то же время развитие алгоритмов компьютерного зрения позволяет существенно автоматизировать данный процесс. Одним из перспективных направлений является разработка мобильных приложений, способных формировать трёхмерные модели объектов на основе видеозаписи, выполненной камерой смартфона. Использование мобильных устройств делает технологию доступной для широкого круга пользователей и упрощает процесс сбора исходных данных. Целью данной работы является разработка концепции мобильного приложения для преобразования видеоизображений в 3D-модели объектов, а также определение основных принципов проектирования интерфейса и архитектуры системы. Процесс преобразования видеоизображения в 3D-модель включает несколько последовательных этапов обработки данных. Общая схема данного процесса представлена на Рисунке. В основе автоматического построения цифровых 3D-моделей лежат методы компьютерного зрения и фотограмметрии. Основная задача заключается в восстановлении геометрической структуры объекта на основе набора изображений, полученных с различных ракурсов. Наиболее распространёнными методами являются Structure from Motion (SfM), позволяющий восстанавливать пространственную структуру сцены и параметры камеры на основе анализа последовательности изображений, и Multi-View Stereo (MVS), применяемый для построения плотного облака точек по множеству изображений. Также используются алгоритмы оценки глубины изображения и нейросетевые методы реконструкции трёхмерных сцен. Несмотря на активное развитие данных технологий, большинство существующих решений реализовано в виде настольных программ или облачных сервисов. Мобильные приложения для автоматической реконструкции 3D-моделей находятся на стадии активного развития [1-3].

Цифровая 30-модель / Digital 3D Model

Наложение текстуры / Texture Mapping

Извлечение кадров / Frame Extraction

Обнаружение ключевых точек / Feature Point Detection

Сопоставление признаков / Feature Matching

Построение облака точек / Point Cloud Reconstruction

Генерация полигональной сетки / Polygonal Mesh Generation

Видеозапись объекта / Object Video Recording

Рисунок. Схема процесса преобразования видеоизображений в 3D-модель

Основными ограничениями мобильных систем являются ограниченные вычислительные ресурсы устройства, необходимость оптимизации алгоритмов обработки данных, требования к энергоэффективности и необходимость разработки удобного пользовательского интерфейса. В связи с этим разработка эффективной концепции мобильного приложения является актуальной задачей.

Предлагаемое мобильное приложение предназначено для автоматического создания 3D-моделей объектов на основе видеозаписи, выполненной пользователем. Принцип работы системы заключается в том, что пользователь выполняет видеосъёмку объекта, перемещая камеру вокруг него, после чего приложение автоматически анализирует видеоданные и формирует 3D-модель объекта. Основные функциональные возможности приложения включают запись видео объекта, автоматический анализ кадров, построение облака точек, генерацию полигональной сетки, создание текстурированной модели, просмотр полученной модели и экспорт модели в стандартные форматы. Основной задачей при разработке приложения является обеспечение простоты использования и минимизация действий пользователя при получении результата.

Архитектура мобильного приложения включает несколько функциональных модулей. Модуль захвата данных обеспечивает запись видео и предварительную обработку изображений, основной задачей которого является получение достаточного количества ракурсов объекта. Модуль обработки изображений выполняет анализ видеокадров, включая извлечение ключевых кадров, определение характерных точек изображения и сопоставление признаков между кадрами. Далее модуль реконструкции геометрии выполняет восстановление пространственной структуры объекта и формирует облако точек. После этого модуль генерации 3D-модели преобразует облако точек в полигональную сетку и выполняет наложение текстуры. Модуль визуализации позволяет пользователю просматривать и взаимодействовать с полученной трёхмерной моделью, изменяя её масштаб и угол обзора [2].

При проектировании интерфейса мобильного приложения необходимо учитывать особенности взаимодействия пользователя с мобильными устройствами. Основными принципами дизайна являются интуитивность интерфейса, минимальное количество действий пользователя, использование визуальных подсказок при съёмке объекта и наглядное отображение результатов обработки. Интерфейс приложения может включать несколько основных экранов: главный экран, экран съёмки объекта, экран обработки данных, экран просмотра 3D-модели и экран экспорта модели. Использование визуальных подсказок во время съёмки позволяет значительно повысить качество получаемых моделей, поскольку пользователь получает рекомендации по перемещению камеры и расстоянию до объекта.

Процесс преобразования видеоизображения в цифровую 3D-модель включает несколько последовательных этапов. На первом этапе выполняется извлечение кадров, при котором видеозапись разделяется на набор отдельных изображений. Затем осуществляется обнаружение ключевых точек, когда алгоритмы компьютерного зрения определяют характерные элементы изображения. Далее выполняется сопоставление признаков, позволяющее находить совпадающие точки на различных изображениях. На основе полученных данных выполняется построение облака точек, формирующего пространственную структуру объекта. После этого создаётся полигональная сетка, представляющая геометрическую поверхность объекта. Заключительным этапом является наложение текстуры, обеспечивающее реалистичную визуализацию модели [3].

Функциональные возможности приложения включают захват видео, анализ кадров, генерацию 3D-модели, просмотр полученной модели и экспорт файлов в распространённые форматы, такие как OBJ, STL или FBX. Эти функции позволяют пользователю получить цифровую копию реального объекта и использовать её в различных программных системах, включая программы трёхмерного моделирования, игровые движки и системы дополненной реальности.

Одним из важных аспектов разработки мобильного приложения для преобразования видеоизображений в 3D-модели является обеспечение достаточной точности реконструкции геометрии объектов. Точность построения модели зависит от качества исходных данных, количества кадров, полученных в процессе видеосъёмки, а также от эффективности алгоритмов обработки изображений. При съёмке объекта пользователю рекомендуется перемещать камеру вокруг объекта по плавной траектории, обеспечивая равномерное покрытие всех сторон объекта. Такой подход позволяет получить достаточное количество перекрывающихся изображений, необходимых для корректного сопоставления ключевых точек и последующего построения пространственной структуры объекта [4].

Важным фактором является также освещение объекта во время съёмки. Недостаточное или неравномерное освещение может привести к снижению качества обнаружения характерных точек на изображениях. Для повышения точности реконструкции рекомендуется использовать равномерное освещение без резких теней и бликов. В мобильном приложении могут быть реализованы автоматические рекомендации для пользователя, которые анализируют качество изображения в реальном времени и предлагают корректировки условий съёмки.

Особое внимание при разработке подобных систем уделяется оптимизации вычислительных процессов. Алгоритмы компьютерного зрения, применяемые для реконструкции 3D-моделей, требуют значительных вычислительных ресурсов. В связи с этим возникает необходимость адаптации данных алгоритмов для работы на мобильных устройствах, обладающих ограниченной производительностью. Одним из решений является использование аппаратного ускорения графических процессоров (GPU), встроенных в современные мобильные устройства. Это позволяет значительно ускорить выполнение операций обработки изображений и построения геометрии [5].

Другим эффективным подходом является распределённая обработка данных, при которой часть вычислений выполняется непосредственно на мобильном устройстве, а более ресурсоёмкие операции передаются на облачные серверы. Такой подход позволяет значительно повысить производительность системы и сократить время построения 3D-модели. В данном случае мобильное приложение выполняет предварительную обработку данных и отправляет полученную информацию на сервер, где выполняется более сложная реконструкция геометрии объекта.

Важной задачей является также оптимизация объёма данных, передаваемых между устройством и сервером. Для этого могут использоваться методы сжатия изображений и выборочной передачи кадров. Например, система может автоматически определять наиболее информативные кадры видеопоследовательности и использовать только их для построения модели. Это позволяет значительно снизить объём передаваемых данных без существенной потери качества реконструкции.

Не менее важным аспектом является обеспечение удобного пользовательского взаимодействия с системой. Пользовательский интерфейс мобильного приложения должен быть интуитивно понятным и не требовать от пользователя специальных знаний в области 3D-моделирования или компьютерного зрения. Основной акцент в интерфейсе делается на визуальных элементах и простых управляющих действиях [6].

Во время процесса съёмки приложение может отображать графические подсказки, указывающие пользователю оптимальную траекторию движения камеры. Например, на экране может отображаться виртуальная окружность вокруг объекта, по которой пользователю рекомендуется перемещать устройство. Дополнительно могут отображаться индикаторы качества съёмки, показывающие, какие области объекта уже были успешно зафиксированы, а какие требуют дополнительной съёмки.

После завершения обработки пользователь получает возможность просмотреть полученную 3D-модель в интерактивном режиме. Модель может вращаться, масштабироваться и отображаться с различных ракурсов. Это позволяет пользователю оценить качество реконструкции и при необходимости повторить процесс съёмки для получения более точного результата.

Дополнительной функцией приложения может стать возможность редактирования полученной модели. Например, пользователь может выполнять простые операции редактирования, такие как обрезка лишних элементов, сглаживание поверхности или корректировка текстуры. Подобные инструменты позволяют повысить качество модели без необходимости использования сложного профессионального программного обеспечения.

Полученные 3D-модели могут использоваться в различных областях. В сфере электронной коммерции они могут применяться для создания интерактивных каталогов товаров, позволяющих покупателям рассматривать объекты со всех сторон. В промышленном дизайне такие модели могут использоваться для предварительной визуализации изделий и прототипирования. В образовательной сфере 3D-модели могут применяться для создания интерактивных учебных материалов [7].

Также перспективным направлением является интеграция подобных приложений с технологиями дополненной реальности. В этом случае пользователь сможет размещать созданные 3D-модели в реальном пространстве с помощью камеры мобильного устройства. Это открывает новые возможности для визуализации архитектурных проектов, дизайна интерьеров и демонстрации различных объектов.

Таким образом, разработка мобильного приложения для преобразования видеоизображений в 3D-модели объектов представляет собой комплексную задачу, включающую разработку алгоритмов компьютерного зрения, оптимизацию вычислительных процессов и проектирование удобного пользовательского интерфейса. Современные достижения в области мобильных технологий и искусственного интеллекта позволяют создавать эффективные решения, которые делают технологии 3D-моделирования доступными для широкого круга пользователей.