Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Бесплатный доступ

Статья посвящена исследованию влияния когнитивных нагрузок и UX-метрик на уровень лояльности пользователей при взаимодействии с ИИ-интерфейсами. Актуальность обусловлена широким внедрением ИИ в цифровые продукты, что требует учёта изменений в распределении ментальных ресурсов. Новизна работы заключается в междисциплинарном аналитическом подходе, объединяющем психофизиологические, поведенческие и опросные методы оценки. В рамках работы обобщены результаты научных публикаций, включая теорию когнитивной нагрузки, исследования UX-метрик и механизмы отображения неопределённости прогноза ИИ. Изучены физиологические сенсоры (EEG, окулометрия), поведенческие индикаторы (время реакции, число ошибок) и опросники (NASA-TLX, SUS). Особое внимание уделено процедурам выбора метрик и алгоритмам динамической адаптации интерфейсов. Проведён анализ эмпирических и теоретических подходов, проверены основные гипотезы и выработаны рекомендации по улучшению пользовательского опыта. Работа ставит задачу систематизировать методы измерения, установить взаимосвязи между нагрузками и лояльностью, а также предложить практические рекомендации. Для решения используются методы систематического обзора, медиаторного анализа и A/B-тестирования. В заключении описаны ключевые выводы и направления применения. Статья будет полезна разработчикам ИИ-интерфейсов, исследователям HCI и UX-специалистам.

Еще

Когнитивная нагрузка, ux-метрики, пользовательская лояльность, ии-интерфейсы, опросные методики, физиологические измерения, окулометрия, адаптивный интерфейс, медиаторный анализ, a/b-тестирование

Короткий адрес: https://sciup.org/170210644

IDR: 170210644   |   DOI: 10.24412/2500-1000-2025-6-2-18-22

Текст научной статьи Оценка качества взаимодействия пользователя с ИИ-интерфейсами: когнитивные нагрузки, UX-метрики и пользовательская лояльность

Современные цифровые продукты всё активнее используют искусственный интеллект, что трансформирует способы взаимодействия и предъявляет новые требования к восприятию интерфейсов. При этом уровень ментальных затрат при работе с ИИ-интерфейсами прямо влияет на эффективность выполнения задач и сохранение интереса пользователя.

Цель исследования – выявить взаимосвязь между когнитивными нагрузками, UX-метриками и уровнем лояльности аудитории при использовании адаптивных и прозрачных интерфейсных решений.

Для достижения поставленной цели решены следующие задачи:

  • 1)    Провести систематический обзор публикаций по измерению когнитивной нагрузки в области человеко-компьютерного взаимодействия.

  • 2)    Классифицировать методы оценки нагрузки – опросники, физиологические и по-

  • веденческие метрики – и сопоставить их возможности в условиях ИИ-интерфейсов.
  • 3)    Разработать рекомендации по проектированию адаптивных интерфейсов с учётом прозрачности неопределённости алгоритмических прогнозов.

Новизна работы состоит в комплексном объединении психофизиологических, опросных и поведенческих подходов к оценке, а также в предложении процедуры выбора оптимального набора метрик и алгоритмической схемы динамической настройки интерфейса.

  • 1 . Теоретические основания и таксономия метрик когнитивных нагрузок в HCI

    Первые результаты исследования когнитивных нагрузок в контексте взаимодействия с интерфейсами базируются на теории когнитивной нагрузки Свеллера, предложенной в 1980-х годах. В рамках этой теории нагрузка подразделена на три компонента: внутренняя (intrinsic load), уместная (germane load) и по-

  • сторонняя (extraneous load) [1]. Внутренняя нагрузка отражает присущую задаче сложность и зависит от уровня подготовки пользователя, уместная нагрузка характеризует усилия, направленные на усвоение схем решения, а посторонняя нагрузка определяется особенностями визуального представления интерфейса.

Kosch et al. систематизировали 579 публикаций по измерению когнитивной нагрузки в HCI, классифицировав методы на субъективные (вопросники), физиологические (EEG, fNIRS, ECG), окулометрические (диаметр зрачка, саккады, фиксации), поведенческие (время реакции, точность задач) и дополнительные (речевые маркеры, EMG, биомаркеры) [1]. Результаты исследования показали, что:

  • -    Опрашиваемые методики (NASA-TLX, SUS, RSME) используются в 67% случаев ввиду простоты развертывания, но дают только агрегированную оценку за экспериментальную сессию;

  • -    Физиологические сенсоры (EEG-диапазоны, fNIRS) обеспечивают более детализированную временную динамику, но требуют контролируемой среды;

  • -    Окулометрия (диаметр зрачка) демонстрирует высокую корреляцию с кратковременными всплесками нагрузки и может применяться в полевых условиях;

  • -    Поведенческие показатели (время выполнения, ошибки) выступают индикаторами совокупных затрат когнитивных ресурсов;

  • -    Гибридные решения (сочетание нескольких методик) встречаются в 12% публикаций и показывают наилучшее соответствие реальным пользовательским сценариям.

Для выбора оптимального набора метрик предложена четырёхшаговая процедура:

  • 1)    Подтвердить актуальность измерения когнитивной нагрузки в исследовании.

  • 2)    Определить необходимость одноточечной (опросник) или непрерывной (физиология, окула) оценки.

  • 3)    Выяснить, будет ли система адаптироваться в реальном времени.

  • 4)    Сопоставить требования к скорости обработки данных и объёму анализа.

  • 2.    Суммативная и конструктивная оценка интерфейсов

  • 3.    Влияние прозрачности алгоритма на внимательность

  • 4.    Роль UX-метрик в генеративных ИИ-интерфейсах

  • 5.    Интонационно-адаптивный UX-цикл в электронной коммерции

Анализ последующих работ показал, что взаимодействие между внутренней и ментальной нагрузкой под давлением времени значительно модифицирует субъективные оценки и физиологические показатели пользователей. В экспериментах наблюдались изменения уровня бодрствования, вариабельности сердечного ритма и показателей электро-дермальной активности при повышении сложности задачи или ухудшении визуализации [1]. Эти данные демонстрируют, что единичная метрика когнитивной нагрузки не может полно охватить все проявления ментальных затрат: необходимо сочетание опросников, физиологических сенсоров и поведенческих индикаторов.

В HCI-исследованиях когнитивная нагрузка используется двумя подходами: сумматив-ным и конструктивным. Первое направление направлено на сравнение уже существующих систем, например, при оценке разных типов навигационных структур или методов аутентификации, а второе – на улучшение дизайна в ходе ранних прототипных испытаний. Оба подхода опираются на одни и те же метрики, но преследуют разные цели: суммативная оценка выявляет относительные преимущества конкретных решений, а конструктивная позволяет оперативно вносить изменения в интерфейс на основе обратной связи.

Например, в полевом квазиисследовании по проекту Hu et al. участники оценивали навигационные структуры двух веб-сайтов, где проводился анализ путей кликов и скорости выполнения типовых задач. Посредством медиаторного анализа было установлено, что когнитивная нагрузка полностью медиирует влияние опыта пользователя на удовлетворённость, а частично – влияние структуры навигации [2]. При этом коэффициент полной медиаторной зависимости для когнитивной нагрузки был выше, чем коэффициент для скорости выполнения задач, что подчёркивает ведущую роль ментальных затрат в формировании удовлетворённости.

Tsai et al. провели рандомизированное контролируемое исследование с участием 30 фармацевтов, выполнявших 200 задач верификации медикаментов с и без поддержки ИИ [3]. Использовалась система трекинга взгляда: сначала участники работали без по- мощи алгоритма, затем с «чёрным ящиком» без отображения неопределённости, и наконец – с учётом неопределённости прогноза.

При анализе было зафиксировано, что при отображении области с рекомендациями ИИ 19-26% всех фиксаций смещались к соответствующим визуальным регионам [3]. Неполезные советы ИИ вызывали увеличение времени зрительной фиксации на опорных элементах интерфейса, а включение индикатора неопределённости прогноза увеличивало общее время обработки экрана. Эти данные свидетельствуют о перераспределении когнитивных ресурсов: при повышенной прозрачности схема принятия решения усложнялась, что вызывало удлинение цикла «ознакомление – выбор» и дополнительно нагружало рабочую память.

Изучение UX ChatGPT в исследовании Jeon et al. включало сбор данных о восприятии полезности, интерактивности, вовлечённости и намерении повторного использования с учё- том уровня потребности в познании (Need for Cognition – NFC). Выяснилось, что пользователи с высоким NFC оценивают полезность ИИ-системы на 23% выше, интерактивность – на 18%, вовлечённость – на 27% и намерение повторного использования – на 31% по сравнению с теми, у кого NFC ниже среднего [4]. Медиаторный анализ подтвердил, что NFC выступает значимым посредником в цепочке «UX-метрика → вовлечённость → лояльность», что подчёркивает необходимость учитывать когнитивные особенности аудитории при разработке генеративных интерфейсов.

Впервые системный метод интонационноадаптивного UX-цикла (UX–IAC) был апробирован на цифровой платформе сферы электронной коммерции. При A/B-тестировании контрольной (статический интерфейс) и экспериментальной (интерфейс с адаптацией в реальном времени) групп участвовали 118 пользователей [5] (табл.).

Таблица. Количественные показатели тестирования [5]

Метрика

Контрольная группа

Экспериментальная группа

Изменение

Среднее время выполнения сценария, сек

67,4

51,8

–23,1%

Уровень удовлетворённости (SUS), баллы

72,3

88,7

+22,6%

Завершённость задач, %

64,2

89,1

+38,8%

Возвратность, %

58,7

74,6

+27,1%

Среднее число ошибок на сценарий

2,3

0,9

–60,9%

Участники экспериментальной группы отмечали более интуитивную структуру, снижение фрустрации и ощущение «диалога» с интерфейсом, что подтверждает эффективность динамической настройки на поведение пользователя.

Сопоставляя данные по NFC, прозрачности алгоритма, навигационной структуре и данные UX–IAC, можно выделить три ключевых фактора, определяющих успешность взаимодействия:

  • 1)    Прозрачность алгоритма: отображение неопределённости прогноза приводит к перераспределению внимания и удлинению цикла принятия решения [3].

  • 2)    Когнитивные особенности пользователя: высокий NFC усиливает положительный эффект UX-метрик на лояльность, повышая её [4].

  • 3)    Адаптивность интерфейса: динамическая настройка по поведению снижает количество ошибок и время выполнения сценариев [5].

На основании обобщённых результатов следует:

  • -    При проектировании ИИ-интерфейсов интегрировать индикаторы неопределённости, чтобы пользователи могли соизмерять собственные когнитивные ресурсы с надёжностью алгоритма.

  • -    Выбирать сочетание метрик (опросники + физиология + окула) для комплексной оценки, учитывая требования задачи и условий проведения эксперимента.

  • -    Учитывать индивидуальные различия, такие как NFC, – для групп с высоким NFC разрабатывать более глубокие адаптивные сценарии взаимодействия.

  • -    Внедрять прототипные тесты с динамической адаптацией (UX–IAC), позволяющие быстро оценивать и корректировать интерфейс в процессе разработки.

Вышеизложенные результаты создают прочный теоретико-практический фундамент для разработки ИИ-интерфейсов, которые минимизируют ментальные затраты, повышают эффективность взаимодействия и укрепляют лояльность пользователей.

В ходе систематического анализа научных работ по методам оценки когнитивных нагрузок в человеко-компьютерном взаимодействии установлено, что применение лишь одного инструмента даёт фрагментарную картину перераспределения ментальных ресурсов: опросники обеспечивают сводную оценку за весь сеанс, физиологические сенсоры фиксируют лишь кратковременные всплески активности, а поведенческие метрики отражают конечные результаты выполнения задач [6, 7]. Сочетание данных EEG-диапазонов, показателей окулометрии и повременной реакции пользователя продемонстрировало более надёжную корреляцию со скоростью и точностью взаимодействия с ИИ-интерфейсами. Эксперименты с визуализацией неопределён- ности алгоритмических прогнозов выявили перераспределение внимания и увеличение времени обработки экранов, причём повышение прозрачности расчётов привело к снижению числа ошибок.

Медиаторный анализ показал, что степень потребности в познании усиливает влияние UX-метрик на намерение повторного использования системы, а реализация динамической адаптации интерфейса по поведенческим паттернам обеспечила сокращение среднего времени выполнения сценариев и уменьшение числа ошибок [8].

На этой базе предложен интонационноадаптивный UX-цикл, объединяющий прозрачную визуализацию неопределённости и процедуру выбора оптимального набора метрик, который проявил высокую эффективность в A/B-тестировании на платформе электронной коммерции. Внедрение данных рекомендаций позволит разработчикам ИИ-интерфейсов повысить эффективность взаимодействия, снизить ментальные затраты и укрепить лояльность пользователей, создавая продукты, максимально отвечающие меняющимся потребностям аудитории.

Статья научная