Сравнительный обзор методов машинного обучения для анализа больших данных
Автор: Алексеева Е.С., Мазурова В.Д.
Журнал: Международный журнал гуманитарных и естественных наук @intjournal
Рубрика: Технические науки
Статья в выпуске: 12-3 (99), 2024 года.
Бесплатный доступ
Современная медицина активно внедряет методы машинного обучения для анализа медицинских данных и повышения точности диагностики. Применение таких методов в классификации диабета позволяет автоматизировать процесс выявления заболевания, улучшая результаты и снижая вероятность пропуска случаев заболевания. В данной статье проведён сравнительный анализ пяти популярных алгоритмов машинного обучения: линейной регрессии, логистической регрессии, дерева решений, случайного леса и градиентного бустинга. Исследование показало, что градиентный бустинг демонстрирует наилучший баланс между точностью и полнотой, минимизируя количество ошибок классификации. Применение машинного обучения в медицинской диагностике способствует раннему выявлению диабета и улучшению качества лечения, позволяя медицинским специалистам принимать более обоснованные решения.
Машинное обучение, линейная регрессия, логистическая регрессия, дерево решений, случайный лес, градиентный бустинг, классификация
Короткий адрес: https://sciup.org/170208575
IDR: 170208575 | DOI: 10.24412/2500-1000-2024-12-3-262-266
Список литературы Сравнительный обзор методов машинного обучения для анализа больших данных
- Джункеев У. Прогнозирование инфляции в России на основе градиентного бустинга и нейронных сетей // Деньги и кредит. - 2024. - Т. 83. № 1. - С. 53-76. EDN: RKGTAF
- Петров С.В. Использование метода "случайный лес" при построении моделей надежности // Информатика, моделирование, автоматизация проектирования (ИМАП-2022). XIV Международная научно-практическая конференция студентов, аспирантов и молодых ученых: сборник научных трудов. - Ульяновск, 2022. - C. 84-88. EDN: HBAMFW
- Стрельников В.Г., Трунов А.С. Применение метода логистической регрессии для задачи классификации текстов судебных решений // Телекоммуникации и информационные технологии. - 2017. - Т. 4. № 2. - С. 75-78. EDN: YMHZQJ
- Трифонова О.Н. Анализ методов поиска идей для решения проблем в бизнесе методом построения дерева проблем и дерева решений // Фундаментальные и прикладные исследования в современном мире. - 2015. - № 9 (2). - С. 131-135. EDN: TNJIZZ
- Хижняк С.В. Множественная линейная регрессия vs простая линейная регрессия в фитопатологии // Наука и образование: опыт, проблемы, перспективы развития. Материалы XIV международной научно-практической конференции. Том Часть II. - 2015. - C. 178-181. EDN: VOUULD
- Cheng Sh. Classification of spam e-mail based on naïve bayes classification model // Highlights in science, engineering and technology. - 2023. - № 39. - C. 749-753. EDN: THFNQK
- Kaggle. - [Электронный ресурс]. - Режим доступа: https://www.kaggle.com/(Дата обращения 27.11.2024).
- Masrom S., Abdul Samad N.H., Septiyanti R., Roslan N., Rahman.A. Machine learning prediction for academic misconduct prediction: an analysis of binary classification metrics // Bulletin of electrical engineering and informatics. - 2024. - № 13 (1). - С. 388-395. EDN: OFWQAB