Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность
Автор: Синица С.А.
Журнал: Международный журнал гуманитарных и естественных наук @intjournal
Рубрика: Технические науки
Статья в выпуске: 6-2 (105), 2025 года.
Бесплатный доступ
Статья посвящена исследованию влияния когнитивных нагрузок и UX-метрик на уровень лояльности пользователей при взаимодействии с ИИ-интерфейсами. Актуальность обусловлена широким внедрением ИИ в цифровые продукты, что требует учёта изменений в распределении ментальных ресурсов. Новизна работы заключается в междисциплинарном аналитическом подходе, объединяющем психофизиологические, поведенческие и опросные методы оценки. В рамках работы обобщены результаты научных публикаций, включая теорию когнитивной нагрузки, исследования UX-метрик и механизмы отображения неопределённости прогноза ИИ. Изучены физиологические сенсоры (EEG, окулометрия), поведенческие индикаторы (время реакции, число ошибок) и опросники (NASA-TLX, SUS). Особое внимание уделено процедурам выбора метрик и алгоритмам динамической адаптации интерфейсов. Проведён анализ эмпирических и теоретических подходов, проверены основные гипотезы и выработаны рекомендации по улучшению пользовательского опыта. Работа ставит задачу систематизировать методы измерения, установить взаимосвязи между нагрузками и лояльностью, а также предложить практические рекомендации. Для решения используются методы систематического обзора, медиаторного анализа и A/B-тестирования. В заключении описаны ключевые выводы и направления применения. Статья будет полезна разработчикам ИИ-интерфейсов, исследователям HCI и UX-специалистам.
Когнитивная нагрузка, ux-метрики, пользовательская лояльность, ии-интерфейсы, опросные методики, физиологические измерения, окулометрия, адаптивный интерфейс, медиаторный анализ, a/b-тестирование
Короткий адрес: https://sciup.org/170210644
IDR: 170210644 | DOI: 10.24412/2500-1000-2025-6-2-18-22
Текст научной статьи Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность
Современные цифровые продукты всё активнее используют искусственный интеллект, что трансформирует способы взаимодействия и предъявляет новые требования к восприятию интерфейсов. При этом уровень ментальных затрат при работе с ИИ-интерфейсами прямо влияет на эффективность выполнения задач и сохранение интереса пользователя.
Цель исследования – выявить взаимосвязь между когнитивными нагрузками, UX-метриками и уровнем лояльности аудитории при использовании адаптивных и прозрачных интерфейсных решений.
Для достижения поставленной цели решены следующие задачи:
-
1) Провести систематический обзор публикаций по измерению когнитивной нагрузки в области человеко-компьютерного взаимодействия.
-
2) Классифицировать методы оценки нагрузки – опросники, физиологические и по-
- веденческие метрики – и сопоставить их возможности в условиях ИИ-интерфейсов.
-
3) Разработать рекомендации по проектированию адаптивных интерфейсов с учётом прозрачности неопределённости алгоритмических прогнозов.
Новизна работы состоит в комплексном объединении психофизиологических, опросных и поведенческих подходов к оценке, а также в предложении процедуры выбора оптимального набора метрик и алгоритмической схемы динамической настройки интерфейса.
-
1 . Теоретические основания и таксономия метрик когнитивных нагрузок в HCI
Первые результаты исследования когнитивных нагрузок в контексте взаимодействия с интерфейсами базируются на теории когнитивной нагрузки Свеллера, предложенной в 1980-х годах. В рамках этой теории нагрузка подразделена на три компонента: внутренняя (intrinsic load), уместная (germane load) и по-
- сторонняя (extraneous load) [1]. Внутренняя нагрузка отражает присущую задаче сложность и зависит от уровня подготовки пользователя, уместная нагрузка характеризует усилия, направленные на усвоение схем решения, а посторонняя нагрузка определяется особенностями визуального представления интерфейса.
Kosch et al. систематизировали 579 публикаций по измерению когнитивной нагрузки в HCI, классифицировав методы на субъективные (вопросники), физиологические (EEG, fNIRS, ECG), окулометрические (диаметр зрачка, саккады, фиксации), поведенческие (время реакции, точность задач) и дополнительные (речевые маркеры, EMG, биомаркеры) [1]. Результаты исследования показали, что:
-
- Опрашиваемые методики (NASA-TLX, SUS, RSME) используются в 67% случаев ввиду простоты развертывания, но дают только агрегированную оценку за экспериментальную сессию;
-
- Физиологические сенсоры (EEG-диапазоны, fNIRS) обеспечивают более детализированную временную динамику, но требуют контролируемой среды;
-
- Окулометрия (диаметр зрачка) демонстрирует высокую корреляцию с кратковременными всплесками нагрузки и может применяться в полевых условиях;
-
- Поведенческие показатели (время выполнения, ошибки) выступают индикаторами совокупных затрат когнитивных ресурсов;
-
- Гибридные решения (сочетание нескольких методик) встречаются в 12% публикаций и показывают наилучшее соответствие реальным пользовательским сценариям.
Для выбора оптимального набора метрик предложена четырёхшаговая процедура:
-
1) Подтвердить актуальность измерения когнитивной нагрузки в исследовании.
-
2) Определить необходимость одноточечной (опросник) или непрерывной (физиология, окула) оценки.
-
3) Выяснить, будет ли система адаптироваться в реальном времени.
-
4) Сопоставить требования к скорости обработки данных и объёму анализа.
-
2. Суммативная и конструктивная оценка интерфейсов
-
3. Влияние прозрачности алгоритма на внимательность
-
4. Роль UX-метрик в генеративных ИИ-интерфейсах
-
5. Интонационно-адаптивный UX-цикл в электронной коммерции
Анализ последующих работ показал, что взаимодействие между внутренней и ментальной нагрузкой под давлением времени значительно модифицирует субъективные оценки и физиологические показатели пользователей. В экспериментах наблюдались изменения уровня бодрствования, вариабельности сердечного ритма и показателей электро-дермальной активности при повышении сложности задачи или ухудшении визуализации [1]. Эти данные демонстрируют, что единичная метрика когнитивной нагрузки не может полно охватить все проявления ментальных затрат: необходимо сочетание опросников, физиологических сенсоров и поведенческих индикаторов.
В HCI-исследованиях когнитивная нагрузка используется двумя подходами: сумматив-ным и конструктивным. Первое направление направлено на сравнение уже существующих систем, например, при оценке разных типов навигационных структур или методов аутентификации, а второе – на улучшение дизайна в ходе ранних прототипных испытаний. Оба подхода опираются на одни и те же метрики, но преследуют разные цели: суммативная оценка выявляет относительные преимущества конкретных решений, а конструктивная позволяет оперативно вносить изменения в интерфейс на основе обратной связи.
Например, в полевом квазиисследовании по проекту Hu et al. участники оценивали навигационные структуры двух веб-сайтов, где проводился анализ путей кликов и скорости выполнения типовых задач. Посредством медиаторного анализа было установлено, что когнитивная нагрузка полностью медиирует влияние опыта пользователя на удовлетворённость, а частично – влияние структуры навигации [2]. При этом коэффициент полной медиаторной зависимости для когнитивной нагрузки был выше, чем коэффициент для скорости выполнения задач, что подчёркивает ведущую роль ментальных затрат в формировании удовлетворённости.
Tsai et al. провели рандомизированное контролируемое исследование с участием 30 фармацевтов, выполнявших 200 задач верификации медикаментов с и без поддержки ИИ [3]. Использовалась система трекинга взгляда: сначала участники работали без по- мощи алгоритма, затем с «чёрным ящиком» без отображения неопределённости, и наконец – с учётом неопределённости прогноза.
При анализе было зафиксировано, что при отображении области с рекомендациями ИИ 19-26% всех фиксаций смещались к соответствующим визуальным регионам [3]. Неполезные советы ИИ вызывали увеличение времени зрительной фиксации на опорных элементах интерфейса, а включение индикатора неопределённости прогноза увеличивало общее время обработки экрана. Эти данные свидетельствуют о перераспределении когнитивных ресурсов: при повышенной прозрачности схема принятия решения усложнялась, что вызывало удлинение цикла «ознакомление – выбор» и дополнительно нагружало рабочую память.
Изучение UX ChatGPT в исследовании Jeon et al. включало сбор данных о восприятии полезности, интерактивности, вовлечённости и намерении повторного использования с учё- том уровня потребности в познании (Need for Cognition – NFC). Выяснилось, что пользователи с высоким NFC оценивают полезность ИИ-системы на 23% выше, интерактивность – на 18%, вовлечённость – на 27% и намерение повторного использования – на 31% по сравнению с теми, у кого NFC ниже среднего [4]. Медиаторный анализ подтвердил, что NFC выступает значимым посредником в цепочке «UX-метрика → вовлечённость → лояльность», что подчёркивает необходимость учитывать когнитивные особенности аудитории при разработке генеративных интерфейсов.
Впервые системный метод интонационноадаптивного UX-цикла (UX–IAC) был апробирован на цифровой платформе сферы электронной коммерции. При A/B-тестировании контрольной (статический интерфейс) и экспериментальной (интерфейс с адаптацией в реальном времени) групп участвовали 118 пользователей [5] (табл.).
Таблица. Количественные показатели тестирования [5]
Метрика |
Контрольная группа |
Экспериментальная группа |
Изменение |
Среднее время выполнения сценария, сек |
67,4 |
51,8 |
–23,1% |
Уровень удовлетворённости (SUS), баллы |
72,3 |
88,7 |
+22,6% |
Завершённость задач, % |
64,2 |
89,1 |
+38,8% |
Возвратность, % |
58,7 |
74,6 |
+27,1% |
Среднее число ошибок на сценарий |
2,3 |
0,9 |
–60,9% |
Участники экспериментальной группы отмечали более интуитивную структуру, снижение фрустрации и ощущение «диалога» с интерфейсом, что подтверждает эффективность динамической настройки на поведение пользователя.
Сопоставляя данные по NFC, прозрачности алгоритма, навигационной структуре и данные UX–IAC, можно выделить три ключевых фактора, определяющих успешность взаимодействия:
-
1) Прозрачность алгоритма: отображение неопределённости прогноза приводит к перераспределению внимания и удлинению цикла принятия решения [3].
-
2) Когнитивные особенности пользователя: высокий NFC усиливает положительный эффект UX-метрик на лояльность, повышая её [4].
-
3) Адаптивность интерфейса: динамическая настройка по поведению снижает количество ошибок и время выполнения сценариев [5].
На основании обобщённых результатов следует:
-
- При проектировании ИИ-интерфейсов интегрировать индикаторы неопределённости, чтобы пользователи могли соизмерять собственные когнитивные ресурсы с надёжностью алгоритма.
-
- Выбирать сочетание метрик (опросники + физиология + окула) для комплексной оценки, учитывая требования задачи и условий проведения эксперимента.
-
- Учитывать индивидуальные различия, такие как NFC, – для групп с высоким NFC разрабатывать более глубокие адаптивные сценарии взаимодействия.
-
- Внедрять прототипные тесты с динамической адаптацией (UX–IAC), позволяющие быстро оценивать и корректировать интерфейс в процессе разработки.
Вышеизложенные результаты создают прочный теоретико-практический фундамент для разработки ИИ-интерфейсов, которые минимизируют ментальные затраты, повышают эффективность взаимодействия и укрепляют лояльность пользователей.
В ходе систематического анализа научных работ по методам оценки когнитивных нагрузок в человеко-компьютерном взаимодействии установлено, что применение лишь одного инструмента даёт фрагментарную картину перераспределения ментальных ресурсов: опросники обеспечивают сводную оценку за весь сеанс, физиологические сенсоры фиксируют лишь кратковременные всплески активности, а поведенческие метрики отражают конечные результаты выполнения задач [6, 7]. Сочетание данных EEG-диапазонов, показателей окулометрии и повременной реакции пользователя продемонстрировало более надёжную корреляцию со скоростью и точностью взаимодействия с ИИ-интерфейсами. Эксперименты с визуализацией неопределён- ности алгоритмических прогнозов выявили перераспределение внимания и увеличение времени обработки экранов, причём повышение прозрачности расчётов привело к снижению числа ошибок.
Медиаторный анализ показал, что степень потребности в познании усиливает влияние UX-метрик на намерение повторного использования системы, а реализация динамической адаптации интерфейса по поведенческим паттернам обеспечила сокращение среднего времени выполнения сценариев и уменьшение числа ошибок [8].
На этой базе предложен интонационноадаптивный UX-цикл, объединяющий прозрачную визуализацию неопределённости и процедуру выбора оптимального набора метрик, который проявил высокую эффективность в A/B-тестировании на платформе электронной коммерции. Внедрение данных рекомендаций позволит разработчикам ИИ-интерфейсов повысить эффективность взаимодействия, снизить ментальные затраты и укрепить лояльность пользователей, создавая продукты, максимально отвечающие меняющимся потребностям аудитории.