Система анализа тональности текста на телугу на основе нового пассивно-агрессивного классификатора с нечетким взвешиванием

Дж Джанардана Найду; M Сешашаяи

doi:10.15622/ia.23.1.2

Scientific articles \ Prolegomena. Fundamentals of knowledge and culture. Propaedeutics \ Computer science and technology. Computing. Data processing \ Computer communication. Computer networks

Система анализа тональности текста на телугу на основе нового пассивно-агрессивного классификатора с нечетким взвешиванием

Author: Дж Джанардана Найду, M Сешашаяи

Journal: Информатика и автоматизация (Труды СПИИРАН) @ia-spcras

Section: Искусственный интеллект, инженерия данных и знаний

Article in issue: Том 23 № 1, 2024.

Free access

Обработка естественного языка (NLP) — это разновидность искусственного интеллекта, демонстрирующая, как алгоритмы могут взаимодействовать с людьми на их уникальных языках. Кроме того, анализ настроений в NLP лучше проводится во многих программах, включая оценку настроений на телугу. Для обнаружения текста на телугу используются несколько неконтролируемых алгоритмов машинного обучения, таких как кластеризация k-средних с поиском с кукушкой. Однако эти методы с трудом справляются с кластеризацией данных с переменными размерами и плотностью кластеров, низкой скоростью поиска и плохой точностью сходимости. В ходе этого исследования была разработана уникальная система анализа настроений на основе машинного обучения для текста на телугу, позволяющая устранить указанные недостатки. Первоначально, на этапе предварительной обработки, предлагаемый алгоритм линейного преследования (LPA) удаляет слова в пробелах, знаках препинания и остановках. Затем для маркировки POS в этом исследовании было предложено условное случайное поле с лексическим взвешиванием; После этого предлагается надуманный пассивно-агрессивный классификатор с нечетким взвешиванием (CPSC-FWC) для классификации настроений в тексте на телугу. Следовательно, предлагаемый нами метод дает эффективные результаты с точки зрения точности, воспроизводимости и показателя f1.

Машинное обучение, обработка естественного языка, полярность, анализ настроений, телугу

Short address: https://sciup.org/14128707

IDR: 14128707 | UDC: 004.7 | DOI: 10.15622/ia.23.1.2