Открытие чёрного ящика: Извлечение семантических факторов Осгуда из языковой модели word2vec

Илья Алексеевич Суров

doi:10.15622/ia.21.5.3

Scientific articles \ Prolegomena. Fundamentals of knowledge and culture. Propaedeutics \ Computer science and technology. Computing. Data processing \ Artificial intelligence

Открытие чёрного ящика: Извлечение семантических факторов Осгуда из языковой модели word2vec

Author: Илья Алексеевич Суров

Journal: Информатика и автоматизация (Труды СПИИРАН) @ia-spcras

Section: Искусственный интеллект, инженерия данных и знаний

Article in issue: Том 21 № 5, 2022.

Free access

Современные модели искусственного интеллекта развиваются в парадигме чёрного ящика, когда значима только информация на входе и выходе системы, тогда как внутренние представления интерпретации не имеют. Такие модели не обладают качествами объяснимости и прозрачности, необходимыми во многих задачах. Статья направлена на решение данной проблемы путём нахождения семантических факторов Ч. Осгуда в базовой модели машинного обученния word2vec, представляющей слова естественного языка в виде 300-мерных неинтерпретируемых векторов. Искомые факторы определяются на основе восьми семантических прототипов, составленных из отдельных слов. Ось оценки в пространстве word2vec находится как разность между положительным и отрицательным прототипами. Оси силы и активности находятся на основе шести процессно-семантических прототипов (восприятие, анализ, планирование, действие, прогресс, оценка), представляющих фазы обобщённого кругового процесса в данной плоскости. Направления всех трёх осей в пространстве word2vec найдены в простой аналитической форме, не требующей дополнительного обучения. Как и ожидается для независимых семантических факторов, полученные направления близки к попарной ортогональности. Значения семантических факторов для любого объекта word2vec находятся с помощью простой проективной операции на найденные направления. В соответствии с требованиями к объяснимому ИИ, представленный результат открывает возможность для интерпретации содержимого алгоритмов типа "чёрный ящик'' в естественных эмоционально-смысловых категориях. В обратную сторону, разработанный подход позволяет использовать модели машинного обучения в качестве источника данных для когнитивно-поведенческого моделирования.

Аффект, семантика, пространство, Осгуд, смысл, язык, word2vec, чёрный ящик, интерпретация

Short address: https://sciup.org/14127400

IDR: 14127400 | UDC: 004.82 | DOI: 10.15622/ia.21.5.3