Научные статьи \ Общество \ Социология \ Социология культуры. Культурный контекст социальной жизни

Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Автор: Синица С.А.

Журнал: Международный журнал гуманитарных и естественных наук @intjournal

Статья в выпуске: 6-2 (105), 2025 года.

Бесплатный доступ

Статья посвящена исследованию влияния когнитивных нагрузок и UX-метрик на уровень лояльности пользователей при взаимодействии с ИИ-интерфейсами. Актуальность обусловлена широким внедрением ИИ в цифровые продукты, что требует учёта изменений в распределении ментальных ресурсов. Новизна работы заключается в междисциплинарном аналитическом подходе, объединяющем психофизиологические, поведенческие и опросные методы оценки. В рамках работы обобщены результаты научных публикаций, включая теорию когнитивной нагрузки, исследования UX-метрик и механизмы отображения неопределённости прогноза ИИ. Изучены физиологические сенсоры (EEG, окулометрия), поведенческие индикаторы (время реакции, число ошибок) и опросники (NASA-TLX, SUS). Особое внимание уделено процедурам выбора метрик и алгоритмам динамической адаптации интерфейсов. Проведён анализ эмпирических и теоретических подходов, проверены основные гипотезы и выработаны рекомендации по улучшению пользовательского опыта. Работа ставит задачу систематизировать методы измерения, установить взаимосвязи между нагрузками и лояльностью, а также предложить практические рекомендации. Для решения используются методы систематического обзора, медиаторного анализа и A/B-тестирования. В заключении описаны ключевые выводы и направления применения. Статья будет полезна разработчикам ИИ-интерфейсов, исследователям HCI и UX-специалистам.

Еще

Когнитивная нагрузка, ux-метрики, пользовательская лояльность, ии-интерфейсы, опросные методики, физиологические измерения, окулометрия, адаптивный интерфейс, медиаторный анализ, a/b-тестирование

Короткий адрес: https://sciup.org/170210644

IDR: 170210644 | DOI: 10.24412/2500-1000-2025-6-2-18-22

Текст научной статьи Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Современные цифровые продукты всё активнее используют искусственный интеллект, что трансформирует способы взаимодействия и предъявляет новые требования к восприятию интерфейсов. При этом уровень ментальных затрат при работе с ИИ-интерфейсами прямо влияет на эффективность выполнения задач и сохранение интереса пользователя.

Цель исследования – выявить взаимосвязь между когнитивными нагрузками, UX-метриками и уровнем лояльности аудитории при использовании адаптивных и прозрачных интерфейсных решений.

Для достижения поставленной цели решены следующие задачи:

1) Провести систематический обзор публикаций по измерению когнитивной нагрузки в области человеко-компьютерного взаимодействия.
2) Классифицировать методы оценки нагрузки – опросники, физиологические и по-
веденческие метрики – и сопоставить их возможности в условиях ИИ-интерфейсов.

3) Разработать рекомендации по проектированию адаптивных интерфейсов с учётом прозрачности неопределённости алгоритмических прогнозов.

Новизна работы состоит в комплексном объединении психофизиологических, опросных и поведенческих подходов к оценке, а также в предложении процедуры выбора оптимального набора метрик и алгоритмической схемы динамической настройки интерфейса.

1 . Теоретические основания и таксономия метрик когнитивных нагрузок в HCI

Первые результаты исследования когнитивных нагрузок в контексте взаимодействия с интерфейсами базируются на теории когнитивной нагрузки Свеллера, предложенной в 1980-х годах. В рамках этой теории нагрузка подразделена на три компонента: внутренняя (intrinsic load), уместная (germane load) и по-
сторонняя (extraneous load) [1]. Внутренняя нагрузка отражает присущую задаче сложность и зависит от уровня подготовки пользователя, уместная нагрузка характеризует усилия, направленные на усвоение схем решения, а посторонняя нагрузка определяется особенностями визуального представления интерфейса.

Kosch et al. систематизировали 579 публикаций по измерению когнитивной нагрузки в HCI, классифицировав методы на субъективные (вопросники), физиологические (EEG, fNIRS, ECG), окулометрические (диаметр зрачка, саккады, фиксации), поведенческие (время реакции, точность задач) и дополнительные (речевые маркеры, EMG, биомаркеры) [1]. Результаты исследования показали, что:

- Опрашиваемые методики (NASA-TLX, SUS, RSME) используются в 67% случаев ввиду простоты развертывания, но дают только агрегированную оценку за экспериментальную сессию;
- Физиологические сенсоры (EEG-диапазоны, fNIRS) обеспечивают более детализированную временную динамику, но требуют контролируемой среды;
- Окулометрия (диаметр зрачка) демонстрирует высокую корреляцию с кратковременными всплесками нагрузки и может применяться в полевых условиях;
- Поведенческие показатели (время выполнения, ошибки) выступают индикаторами совокупных затрат когнитивных ресурсов;
- Гибридные решения (сочетание нескольких методик) встречаются в 12% публикаций и показывают наилучшее соответствие реальным пользовательским сценариям.

Для выбора оптимального набора метрик предложена четырёхшаговая процедура:

1) Подтвердить актуальность измерения когнитивной нагрузки в исследовании.
2) Определить необходимость одноточечной (опросник) или непрерывной (физиология, окула) оценки.
3) Выяснить, будет ли система адаптироваться в реальном времени.
4) Сопоставить требования к скорости обработки данных и объёму анализа.
2. Суммативная и конструктивная оценка интерфейсов
3. Влияние прозрачности алгоритма на внимательность
4. Роль UX-метрик в генеративных ИИ-интерфейсах
5. Интонационно-адаптивный UX-цикл в электронной коммерции

Анализ последующих работ показал, что взаимодействие между внутренней и ментальной нагрузкой под давлением времени значительно модифицирует субъективные оценки и физиологические показатели пользователей. В экспериментах наблюдались изменения уровня бодрствования, вариабельности сердечного ритма и показателей электро-дермальной активности при повышении сложности задачи или ухудшении визуализации [1]. Эти данные демонстрируют, что единичная метрика когнитивной нагрузки не может полно охватить все проявления ментальных затрат: необходимо сочетание опросников, физиологических сенсоров и поведенческих индикаторов.

В HCI-исследованиях когнитивная нагрузка используется двумя подходами: сумматив-ным и конструктивным. Первое направление направлено на сравнение уже существующих систем, например, при оценке разных типов навигационных структур или методов аутентификации, а второе – на улучшение дизайна в ходе ранних прототипных испытаний. Оба подхода опираются на одни и те же метрики, но преследуют разные цели: суммативная оценка выявляет относительные преимущества конкретных решений, а конструктивная позволяет оперативно вносить изменения в интерфейс на основе обратной связи.

Например, в полевом квазиисследовании по проекту Hu et al. участники оценивали навигационные структуры двух веб-сайтов, где проводился анализ путей кликов и скорости выполнения типовых задач. Посредством медиаторного анализа было установлено, что когнитивная нагрузка полностью медиирует влияние опыта пользователя на удовлетворённость, а частично – влияние структуры навигации [2]. При этом коэффициент полной медиаторной зависимости для когнитивной нагрузки был выше, чем коэффициент для скорости выполнения задач, что подчёркивает ведущую роль ментальных затрат в формировании удовлетворённости.

Tsai et al. провели рандомизированное контролируемое исследование с участием 30 фармацевтов, выполнявших 200 задач верификации медикаментов с и без поддержки ИИ [3]. Использовалась система трекинга взгляда: сначала участники работали без по- мощи алгоритма, затем с «чёрным ящиком» без отображения неопределённости, и наконец – с учётом неопределённости прогноза.

При анализе было зафиксировано, что при отображении области с рекомендациями ИИ 19-26% всех фиксаций смещались к соответствующим визуальным регионам [3]. Неполезные советы ИИ вызывали увеличение времени зрительной фиксации на опорных элементах интерфейса, а включение индикатора неопределённости прогноза увеличивало общее время обработки экрана. Эти данные свидетельствуют о перераспределении когнитивных ресурсов: при повышенной прозрачности схема принятия решения усложнялась, что вызывало удлинение цикла «ознакомление – выбор» и дополнительно нагружало рабочую память.

Изучение UX ChatGPT в исследовании Jeon et al. включало сбор данных о восприятии полезности, интерактивности, вовлечённости и намерении повторного использования с учё- том уровня потребности в познании (Need for Cognition – NFC). Выяснилось, что пользователи с высоким NFC оценивают полезность ИИ-системы на 23% выше, интерактивность – на 18%, вовлечённость – на 27% и намерение повторного использования – на 31% по сравнению с теми, у кого NFC ниже среднего [4]. Медиаторный анализ подтвердил, что NFC выступает значимым посредником в цепочке «UX-метрика → вовлечённость → лояльность», что подчёркивает необходимость учитывать когнитивные особенности аудитории при разработке генеративных интерфейсов.

Впервые системный метод интонационноадаптивного UX-цикла (UX–IAC) был апробирован на цифровой платформе сферы электронной коммерции. При A/B-тестировании контрольной (статический интерфейс) и экспериментальной (интерфейс с адаптацией в реальном времени) групп участвовали 118 пользователей [5] (табл.).

Таблица. Количественные показатели тестирования [5]

Метрика	Контрольная группа	Экспериментальная группа	Изменение
Среднее время выполнения сценария, сек	67,4	51,8	–23,1%
Уровень удовлетворённости (SUS), баллы	72,3	88,7	+22,6%
Завершённость задач, %	64,2	89,1	+38,8%
Возвратность, %	58,7	74,6	+27,1%
Среднее число ошибок на сценарий	2,3	0,9	–60,9%

Участники экспериментальной группы отмечали более интуитивную структуру, снижение фрустрации и ощущение «диалога» с интерфейсом, что подтверждает эффективность динамической настройки на поведение пользователя.

Сопоставляя данные по NFC, прозрачности алгоритма, навигационной структуре и данные UX–IAC, можно выделить три ключевых фактора, определяющих успешность взаимодействия:

1) Прозрачность алгоритма: отображение неопределённости прогноза приводит к перераспределению внимания и удлинению цикла принятия решения [3].
2) Когнитивные особенности пользователя: высокий NFC усиливает положительный эффект UX-метрик на лояльность, повышая её [4].
3) Адаптивность интерфейса: динамическая настройка по поведению снижает количество ошибок и время выполнения сценариев [5].

На основании обобщённых результатов следует:

- При проектировании ИИ-интерфейсов интегрировать индикаторы неопределённости, чтобы пользователи могли соизмерять собственные когнитивные ресурсы с надёжностью алгоритма.
- Выбирать сочетание метрик (опросники + физиология + окула) для комплексной оценки, учитывая требования задачи и условий проведения эксперимента.
- Учитывать индивидуальные различия, такие как NFC, – для групп с высоким NFC разрабатывать более глубокие адаптивные сценарии взаимодействия.
- Внедрять прототипные тесты с динамической адаптацией (UX–IAC), позволяющие быстро оценивать и корректировать интерфейс в процессе разработки.

Вышеизложенные результаты создают прочный теоретико-практический фундамент для разработки ИИ-интерфейсов, которые минимизируют ментальные затраты, повышают эффективность взаимодействия и укрепляют лояльность пользователей.

В ходе систематического анализа научных работ по методам оценки когнитивных нагрузок в человеко-компьютерном взаимодействии установлено, что применение лишь одного инструмента даёт фрагментарную картину перераспределения ментальных ресурсов: опросники обеспечивают сводную оценку за весь сеанс, физиологические сенсоры фиксируют лишь кратковременные всплески активности, а поведенческие метрики отражают конечные результаты выполнения задач [6, 7]. Сочетание данных EEG-диапазонов, показателей окулометрии и повременной реакции пользователя продемонстрировало более надёжную корреляцию со скоростью и точностью взаимодействия с ИИ-интерфейсами. Эксперименты с визуализацией неопределён- ности алгоритмических прогнозов выявили перераспределение внимания и увеличение времени обработки экранов, причём повышение прозрачности расчётов привело к снижению числа ошибок.

Медиаторный анализ показал, что степень потребности в познании усиливает влияние UX-метрик на намерение повторного использования системы, а реализация динамической адаптации интерфейса по поведенческим паттернам обеспечила сокращение среднего времени выполнения сценариев и уменьшение числа ошибок [8].

На этой базе предложен интонационноадаптивный UX-цикл, объединяющий прозрачную визуализацию неопределённости и процедуру выбора оптимального набора метрик, который проявил высокую эффективность в A/B-тестировании на платформе электронной коммерции. Внедрение данных рекомендаций позволит разработчикам ИИ-интерфейсов повысить эффективность взаимодействия, снизить ментальные затраты и укрепить лояльность пользователей, создавая продукты, максимально отвечающие меняющимся потребностям аудитории.