Правила остановки для адаптивного варианта метода Франка – Вульфа в условиях относительно неточной информации о градиенте

Автор: Денисов Г.А., Стонякин Ф.С.

Журнал: Труды Московского физико-технического института @trudy-mipt

Рубрика: Математика

Статья в выпуске: 1 (69) т.18, 2026 года.

Бесплатный доступ

В данной работе предложен и исследован критерий остановки для вариантов метода Франк - Вульфа в ситуации использования градиента с относительной погрешностью. Предложенное правило остановки базируется на анализе в случае относительной погрешности зазора двойственности, который выполняет роль критерия близости значения функции к оптимальному решению, аналогичную норме градиента для задач без ограничений. Зазор двойственности позволяет судить о качестве текущего решения не только с точки зрения значения целевой функции, но и с учётом свойств допустимого множества, что особенно важно для задач с ограничениями. Актуальность рассматриваемой тематики обусловлена тем, что в реальных задачах оптимизации, особенно для задач с большими данными и в машинном обучении, часто невозможно получить на каждой итерации точную информацию о градиенте целевой функции: вычисления могут быть основаны на неполных данных, квантизированы, усреднены по мини-батчам или содержать вычислительные ошибки. В таких условиях влияние относительной погрешности, пропорциональной норме точного градиента, становится важным фактором, определяющим сходимость и качество численных методов. В работе подробно анализируются случаи выбора шага минимизации по одномерной квадратичной модели как при постоянной, так и при адаптивно подбираемой константе Липшица градиента. Для обеих ситуаций получены оценки числа итераций, достаточного для гарантии достижения заданной точности решения задачи. При этом отметим, что использование соответствующего аналога шага, зависящего от константы Липшица градиента позволило, в частности, для c-градиентно доминируемых функций получить результат о близкой к линейной скорости сходимости в условиях относительной погрешности и внутренней точки минимума допустимого множества. Проведенные численные эксперименты для функции линейной регрессии и функции ошибки логистической регрессии подтверждают теоретические выводы, демонстрируя устойчивость критерия остановки и эффективность адаптивного выбора шага даже при различных вариантах относительной неточности оракула. Особое внимание уделено сопоставлению реального числа итераций с теоретическими оценками, что позволяет выявить преимущество предложенного правила остановки для задач с относительной погрешностью.

Еще

Относительно неточный оракул, адаптивный метод, метод франк - вульфа

Короткий адрес: https://sciup.org/142247866

IDR: 142247866   |   УДК: 519.8

Stopping rules for adaptive variant of Frank–Wolfe method with relative inexact gradient

In this paper, we propose and study a stopping rule for variants of the Frank - Wolfe method with relative inexact gradient. Our approach relies on analyzing a duality gap with relative inexactness, which effectively serves as a practical stopping criterion for constrained optimization, playing a role analogous to the gradient norm in unconstrained optimization. The duality gap allows assessing the quality of the current solution not only in terms of the objective function value but also considering the properties of the feasible set, which is particularly important for constrained problems. This research is motivated by the fact that in many real-world large-scale optimization problems and machine learning applications, exact gradient information at each iteration may not be available due to subsampling, quantization, mini-batch averaging, or computational errors. In these cases, the relative error, proportional to the exact gradient norm, becomes a significant factor determining the convergence and quality of numerical methods. We provide a rigorous theoretical analysis of step-size selection strategies based on one-dimensional quadratic models, for both constant and adaptive choices of the Lipschitz constant. For these cases, we derive explicit upper bounds on the number of iterations required to reach a desired solution accuracy, including nearly-linear convergence rates in c-gradient dominated settings with relative error, especially when the minimizer lies in the interior of the feasible set. Numerical experiments on linear and logistic regression objectives support our theoretical results, illustrating that the proposed stopping rule is robust with respect to various types of relative oracle inexactness. We emphasize the comparison of the actual iteration count with the theoretical bounds, demonstrating the proposed stopping rule’s effectiveness for problems with relative error.

Еще