Анализ алгоритмов кодирования категориальных данных
Автор: Ш.А. Турсунов, А.Э. Рашидов
Журнал: Проблемы информатики @problem-info
Рубрика: Параллельное системное программирование и вычислительные технологии
Статья в выпуске: 2 (67), 2025 года.
Бесплатный доступ
Известно, что эффективность искусственного интеллекта, признанного наиболее полезным инструментом во всех сферах, тесно связана с рядом факторов. Один из ключевых факторов — необходимость преобразования входных данных в формат, понятный алгоритмам ИИ, поскольку они основаны на математических операциях. Однако часто встречаются данные, на которых невозможно напрямую выполнять арифметические действия. Удаление таких данных может негативно повлиять на результат, поэтому требуется их преобразование в числовую форму. Существуют различные методы кодирования категориальных данных, и выбор наилучшего из них представляет собой сложную исследовательскую задачу. В данной работе проводится анализ 12 методов преобразования текстовых данных. Рассматриваются преимущества и недостатки каждого подхода, а также проводится их сравнительный анализ с выводами.
Искусственный интеллект, кодирование категориальных данных, методы кодирования данных
Короткий адрес: https://sciup.org/143185032
IDR: 143185032 | УДК: 519 | DOI: 10.24412/2073-0667-2025-2-65-80