Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Бесплатный доступ

Статья посвящена исследованию влияния когнитивных нагрузок и UX-метрик на уровень лояльности пользователей при взаимодействии с ИИ-интерфейсами. Актуальность обусловлена широким внедрением ИИ в цифровые продукты, что требует учёта изменений в распределении ментальных ресурсов. Новизна работы заключается в междисциплинарном аналитическом подходе, объединяющем психофизиологические, поведенческие и опросные методы оценки. В рамках работы обобщены результаты научных публикаций, включая теорию когнитивной нагрузки, исследования UX-метрик и механизмы отображения неопределённости прогноза ИИ. Изучены физиологические сенсоры (EEG, окулометрия), поведенческие индикаторы (время реакции, число ошибок) и опросники (NASA-TLX, SUS). Особое внимание уделено процедурам выбора метрик и алгоритмам динамической адаптации интерфейсов. Проведён анализ эмпирических и теоретических подходов, проверены основные гипотезы и выработаны рекомендации по улучшению пользовательского опыта. Работа ставит задачу систематизировать методы измерения, установить взаимосвязи между нагрузками и лояльностью, а также предложить практические рекомендации. Для решения используются методы систематического обзора, медиаторного анализа и A/B-тестирования. В заключении описаны ключевые выводы и направления применения. Статья будет полезна разработчикам ИИ-интерфейсов, исследователям HCI и UX-специалистам.

Еще

Когнитивная нагрузка, ux-метрики, пользовательская лояльность, ии-интерфейсы, опросные методики, физиологические измерения, окулометрия, адаптивный интерфейс, медиаторный анализ, a/b-тестирование

Короткий адрес: https://sciup.org/170210644

IDR: 170210644   |   DOI: 10.24412/2500-1000-2025-6-2-18-22

Evaluating the quality of user interaction with AI interfaces: cognitive loads, UX metrics, and user loyalty

The article is devoted to the study of the influence of cognitive loads and UX metrics on the level of user loyalty when interacting with AI interfaces. The relevance is due to the widespread introduction of AI into digital products, which requires taking into account changes in the allocation of mental resources. The novelty of the work lies in an interdisciplinary analytical approach combining psychophysiological, behavioral and questionnaire assessment methods. The paper summarizes the results of more than 50 publications, including the theory of cognitive load, research on UX metrics, and mechanisms for displaying AI prediction uncertainty. Physiological sensors (EEG, oculometry), behavioral indicators (reaction time, number of errors) and questionnaires (NASA-TLX, SUS) were studied. Special attention is paid to the procedures for selecting metrics and algorithms for dynamic interface adaptation. The analysis of empirical and theoretical approaches has been carried out, the main hypotheses have been tested and recommendations for improving the user experience have been developed. The work aims to systematize measurement methods, establish the relationship between workload and loyalty, and offer practical recommendations. Methods of systematic review, mediation analysis and A/B testing are used for the solution. The conclusion describes the key findings and areas of application. The article will be useful for AI interface developers, HCI researchers, and UX specialists.

Еще

Текст научной статьи Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Современные цифровые продукты всё активнее используют искусственный интеллект, что трансформирует способы взаимодействия и предъявляет новые требования к восприятию интерфейсов. При этом уровень ментальных затрат при работе с ИИ-интерфейсами прямо влияет на эффективность выполнения задач и сохранение интереса пользователя.

Цель исследования – выявить взаимосвязь между когнитивными нагрузками, UX-метриками и уровнем лояльности аудитории при использовании адаптивных и прозрачных интерфейсных решений.

Для достижения поставленной цели решены следующие задачи:

  • 1)    Провести систематический обзор публикаций по измерению когнитивной нагрузки в области человеко-компьютерного взаимодействия.

  • 2)    Классифицировать методы оценки нагрузки – опросники, физиологические и по-

  • веденческие метрики – и сопоставить их возможности в условиях ИИ-интерфейсов.
  • 3)    Разработать рекомендации по проектированию адаптивных интерфейсов с учётом прозрачности неопределённости алгоритмических прогнозов.

Новизна работы состоит в комплексном объединении психофизиологических, опросных и поведенческих подходов к оценке, а также в предложении процедуры выбора оптимального набора метрик и алгоритмической схемы динамической настройки интерфейса.

  • 1 . Теоретические основания и таксономия метрик когнитивных нагрузок в HCI

    Первые результаты исследования когнитивных нагрузок в контексте взаимодействия с интерфейсами базируются на теории когнитивной нагрузки Свеллера, предложенной в 1980-х годах. В рамках этой теории нагрузка подразделена на три компонента: внутренняя (intrinsic load), уместная (germane load) и по-

  • сторонняя (extraneous load) [1]. Внутренняя нагрузка отражает присущую задаче сложность и зависит от уровня подготовки пользователя, уместная нагрузка характеризует усилия, направленные на усвоение схем решения, а посторонняя нагрузка определяется особенностями визуального представления интерфейса.

Kosch et al. систематизировали 579 публикаций по измерению когнитивной нагрузки в HCI, классифицировав методы на субъективные (вопросники), физиологические (EEG, fNIRS, ECG), окулометрические (диаметр зрачка, саккады, фиксации), поведенческие (время реакции, точность задач) и дополнительные (речевые маркеры, EMG, биомаркеры) [1]. Результаты исследования показали, что:

  • -    Опрашиваемые методики (NASA-TLX, SUS, RSME) используются в 67% случаев ввиду простоты развертывания, но дают только агрегированную оценку за экспериментальную сессию;

  • -    Физиологические сенсоры (EEG-диапазоны, fNIRS) обеспечивают более детализированную временную динамику, но требуют контролируемой среды;

  • -    Окулометрия (диаметр зрачка) демонстрирует высокую корреляцию с кратковременными всплесками нагрузки и может применяться в полевых условиях;

  • -    Поведенческие показатели (время выполнения, ошибки) выступают индикаторами совокупных затрат когнитивных ресурсов;

  • -    Гибридные решения (сочетание нескольких методик) встречаются в 12% публикаций и показывают наилучшее соответствие реальным пользовательским сценариям.

Для выбора оптимального набора метрик предложена четырёхшаговая процедура:

  • 1)    Подтвердить актуальность измерения когнитивной нагрузки в исследовании.

  • 2)    Определить необходимость одноточечной (опросник) или непрерывной (физиология, окула) оценки.

  • 3)    Выяснить, будет ли система адаптироваться в реальном времени.

  • 4)    Сопоставить требования к скорости обработки данных и объёму анализа.

  • 2.    Суммативная и конструктивная оценка интерфейсов

  • 3.    Влияние прозрачности алгоритма на внимательность

  • 4.    Роль UX-метрик в генеративных ИИ-интерфейсах

  • 5.    Интонационно-адаптивный UX-цикл в электронной коммерции

Анализ последующих работ показал, что взаимодействие между внутренней и ментальной нагрузкой под давлением времени значительно модифицирует субъективные оценки и физиологические показатели пользователей. В экспериментах наблюдались изменения уровня бодрствования, вариабельности сердечного ритма и показателей электро-дермальной активности при повышении сложности задачи или ухудшении визуализации [1]. Эти данные демонстрируют, что единичная метрика когнитивной нагрузки не может полно охватить все проявления ментальных затрат: необходимо сочетание опросников, физиологических сенсоров и поведенческих индикаторов.

В HCI-исследованиях когнитивная нагрузка используется двумя подходами: сумматив-ным и конструктивным. Первое направление направлено на сравнение уже существующих систем, например, при оценке разных типов навигационных структур или методов аутентификации, а второе – на улучшение дизайна в ходе ранних прототипных испытаний. Оба подхода опираются на одни и те же метрики, но преследуют разные цели: суммативная оценка выявляет относительные преимущества конкретных решений, а конструктивная позволяет оперативно вносить изменения в интерфейс на основе обратной связи.

Например, в полевом квазиисследовании по проекту Hu et al. участники оценивали навигационные структуры двух веб-сайтов, где проводился анализ путей кликов и скорости выполнения типовых задач. Посредством медиаторного анализа было установлено, что когнитивная нагрузка полностью медиирует влияние опыта пользователя на удовлетворённость, а частично – влияние структуры навигации [2]. При этом коэффициент полной медиаторной зависимости для когнитивной нагрузки был выше, чем коэффициент для скорости выполнения задач, что подчёркивает ведущую роль ментальных затрат в формировании удовлетворённости.

Tsai et al. провели рандомизированное контролируемое исследование с участием 30 фармацевтов, выполнявших 200 задач верификации медикаментов с и без поддержки ИИ [3]. Использовалась система трекинга взгляда: сначала участники работали без по- мощи алгоритма, затем с «чёрным ящиком» без отображения неопределённости, и наконец – с учётом неопределённости прогноза.

При анализе было зафиксировано, что при отображении области с рекомендациями ИИ 19-26% всех фиксаций смещались к соответствующим визуальным регионам [3]. Неполезные советы ИИ вызывали увеличение времени зрительной фиксации на опорных элементах интерфейса, а включение индикатора неопределённости прогноза увеличивало общее время обработки экрана. Эти данные свидетельствуют о перераспределении когнитивных ресурсов: при повышенной прозрачности схема принятия решения усложнялась, что вызывало удлинение цикла «ознакомление – выбор» и дополнительно нагружало рабочую память.

Изучение UX ChatGPT в исследовании Jeon et al. включало сбор данных о восприятии полезности, интерактивности, вовлечённости и намерении повторного использования с учё- том уровня потребности в познании (Need for Cognition – NFC). Выяснилось, что пользователи с высоким NFC оценивают полезность ИИ-системы на 23% выше, интерактивность – на 18%, вовлечённость – на 27% и намерение повторного использования – на 31% по сравнению с теми, у кого NFC ниже среднего [4]. Медиаторный анализ подтвердил, что NFC выступает значимым посредником в цепочке «UX-метрика → вовлечённость → лояльность», что подчёркивает необходимость учитывать когнитивные особенности аудитории при разработке генеративных интерфейсов.

Впервые системный метод интонационноадаптивного UX-цикла (UX–IAC) был апробирован на цифровой платформе сферы электронной коммерции. При A/B-тестировании контрольной (статический интерфейс) и экспериментальной (интерфейс с адаптацией в реальном времени) групп участвовали 118 пользователей [5] (табл.).

Таблица. Количественные показатели тестирования [5]

Метрика

Контрольная группа

Экспериментальная группа

Изменение

Среднее время выполнения сценария, сек

67,4

51,8

–23,1%

Уровень удовлетворённости (SUS), баллы

72,3

88,7

+22,6%

Завершённость задач, %

64,2

89,1

+38,8%

Возвратность, %

58,7

74,6

+27,1%

Среднее число ошибок на сценарий

2,3

0,9

–60,9%

Участники экспериментальной группы отмечали более интуитивную структуру, снижение фрустрации и ощущение «диалога» с интерфейсом, что подтверждает эффективность динамической настройки на поведение пользователя.

Сопоставляя данные по NFC, прозрачности алгоритма, навигационной структуре и данные UX–IAC, можно выделить три ключевых фактора, определяющих успешность взаимодействия:

  • 1)    Прозрачность алгоритма: отображение неопределённости прогноза приводит к перераспределению внимания и удлинению цикла принятия решения [3].

  • 2)    Когнитивные особенности пользователя: высокий NFC усиливает положительный эффект UX-метрик на лояльность, повышая её [4].

  • 3)    Адаптивность интерфейса: динамическая настройка по поведению снижает количество ошибок и время выполнения сценариев [5].

На основании обобщённых результатов следует:

  • -    При проектировании ИИ-интерфейсов интегрировать индикаторы неопределённости, чтобы пользователи могли соизмерять собственные когнитивные ресурсы с надёжностью алгоритма.

  • -    Выбирать сочетание метрик (опросники + физиология + окула) для комплексной оценки, учитывая требования задачи и условий проведения эксперимента.

  • -    Учитывать индивидуальные различия, такие как NFC, – для групп с высоким NFC разрабатывать более глубокие адаптивные сценарии взаимодействия.

  • -    Внедрять прототипные тесты с динамической адаптацией (UX–IAC), позволяющие быстро оценивать и корректировать интерфейс в процессе разработки.

Вышеизложенные результаты создают прочный теоретико-практический фундамент для разработки ИИ-интерфейсов, которые минимизируют ментальные затраты, повышают эффективность взаимодействия и укрепляют лояльность пользователей.

В ходе систематического анализа научных работ по методам оценки когнитивных нагрузок в человеко-компьютерном взаимодействии установлено, что применение лишь одного инструмента даёт фрагментарную картину перераспределения ментальных ресурсов: опросники обеспечивают сводную оценку за весь сеанс, физиологические сенсоры фиксируют лишь кратковременные всплески активности, а поведенческие метрики отражают конечные результаты выполнения задач [6, 7]. Сочетание данных EEG-диапазонов, показателей окулометрии и повременной реакции пользователя продемонстрировало более надёжную корреляцию со скоростью и точностью взаимодействия с ИИ-интерфейсами. Эксперименты с визуализацией неопределён- ности алгоритмических прогнозов выявили перераспределение внимания и увеличение времени обработки экранов, причём повышение прозрачности расчётов привело к снижению числа ошибок.

Медиаторный анализ показал, что степень потребности в познании усиливает влияние UX-метрик на намерение повторного использования системы, а реализация динамической адаптации интерфейса по поведенческим паттернам обеспечила сокращение среднего времени выполнения сценариев и уменьшение числа ошибок [8].

На этой базе предложен интонационноадаптивный UX-цикл, объединяющий прозрачную визуализацию неопределённости и процедуру выбора оптимального набора метрик, который проявил высокую эффективность в A/B-тестировании на платформе электронной коммерции. Внедрение данных рекомендаций позволит разработчикам ИИ-интерфейсов повысить эффективность взаимодействия, снизить ментальные затраты и укрепить лояльность пользователей, создавая продукты, максимально отвечающие меняющимся потребностям аудитории.