Алгоритмы машинного обучения

Автор: Макаров Д.А., Шибанова А.Д.

Журнал: Теория и практика современной науки @modern-j

Статья в выпуске: 6 (36), 2018 года.

Бесплатный доступ

В данной статье рассмотрена технология машинного обучения. Проведен анализ алгоритмов машинного обучения. Указана область применения каждого из них. Сделан вывод об актуальности технологии машинного обучения, описаны плюсы ее внедрения в производство.

Машинное обучение, алгоритм, регрессия

Короткий адрес: https://sciup.org/140273657

IDR: 140273657

Текст научной статьи Алгоритмы машинного обучения

Рассмотрим алгоритмы, которые активно применяются в технологии машинного обучения.

1. Дерево принятия решений. В этом методе используется древовидный граф: дерево состоит из минимального числа вопросов с ответами «да» либо «нет». Отвечая последовательно на эти вопросы можно получить итоговый ответ. Данный метод структурирует и систематизирует проблему, а конечное решение получается из логических выводов.
2. Наивная байесовская классификация. Наивные байесовские классификаторы воспринимают различные функции как независимые, это представляет из себя наивное предположение. Такая классификация
3. Метод наименьших квадратов. Метод наименьших квадратов принадлежит к линейной регрессии. Обычно с ее помощью находят решение задачи по подгонке прямой, которая проходит через некоторое количество точек. Линия, у которой сумма квадратов расстояний будет наименьшей, принимается искомой. Метод применяется для уменьшения количества погрешностей с помощью создания метрики ошибок.
4. Логистическая регрессия. Логистическая регрессия – это метод вычисления зависимости между категориально зависимыми и независимыми переменными. Для этого используется логистическая функция. Логистическая регрессия представляет из себя мощное статистическое средство предсказания событий, включающее независимые переменные. Это может быть использовано в оценке успеха рекламных кампаний, прогнозе спроса на определенный товар и т.д.
5. Метод опорных векторов (SVM). Так называются алгоритмы, которые используются для решения задач классификации и регрессионного анализа. SVM и его модифицированные версии решают сложные задачи машинного обучения, такие как вырезание определённых нуклеотидных последовательностей ДНК, определение пола человека по фотографии и т.д.
6. Метод главных компонент (PCA). Данный метод – это операция из статистики по преобразованию, переводит процесс наблюдения за как-то связанными между собой переменными, которые могут быть как-то взаимосвязаны между собой, в набор не связанных между собой значений. Задачи, где применяется этот метод – задачи упрощения, минимизации количества данных, их визуализация. Но метод не подходит для ситуаций, где данные слабо упорядочены, недостаточно изучена предметная область.
7. Анализ независимых компонент (ICA). Это метод из статистики, который выявляет скрытые факторы, влияющие на случайные величины. Данный

используется в таких областях: поиск спама, распознавание предметов на фотографиях и т.д.

метод формирует на основе многофакторных данных специальную модель. Метод эффективен, когда классические подходы по каким-либо причинам не способны предоставить объективную модель. Он позволяет обнаружить причины явлений, которые не доступны для анализа классическим методам, что позволяет активно применять данный метод в астрономии, анализе данных, распознавании речи.

Рассмотрим диагностику заболеваний. Необходимо представить пациентов как объекты, а признаками - их болезни, симптомы, пол, возраст и т.д. Некоторые признаки целесообразно принять бинарными. Состояния пациентов различной степени тяжести - порядковые признаки, а иные -количественные, такие как рост, вес, объем грудной клетки, принимаемые препараты и т.д. С помощью информации о данных признаках и специальной программы с машинным обучением можно определить вид заболевания, просчитать возможное лечение и необходимые препараты, определить возможные осложнения и рассчитать действия, необходимые для их предотвращения. Человек не способен быстро обработать такие большие объемы информации, а самое главное - он способен при анализе допустить ошибку. Таким образом, машинное обучение становится незаменимым помощником в сфере медицины и здравоохранения.

Технологии машинного обучения подвластно даже определение наличия полезных ископаемых. В качестве признаков принимаются сведения о нахождении определенных ископаемых на данной территории: наличие на территории местности каких-либо пород, их свойства, как химические, так и физические. Эти свойства можно принять за количественные и качественные признаки. Для обучения программы используется набор территорий со списком их признаков, где полезные ископаемые точно есть. Однако в данном случае существует некоторая специфика, иногда количество признаков много больше количества объектов, поэтому традиционные методы не работают. Так что в машинном обучении внимание акцентируется на поиск зависимостей в ряде уже обнаруженных данных. Данный метод позволяет сэкономить значительный объем средств.

Машинное обучение предоставляет человеку грандиозные возможности, недоступные ранее. Например, система мониторинга состояния здоровья, учитывающая индивидуальные данные, привычки и наследственность пациента. Улучшение систем защиты, которые будут самостоятельно определять взлом или кражу данных и предпринимать попытки к устранению проникновения, возможность организовывать «умную» защиту общественных мест, таких как кафе, стадионы, центральные площади, с помощью технологии распознавания лиц. Внедрение беспилотных автомобилей, которые способны самостоятельно строить маршрут и оценивать дорожную обстановку. Защита банковских карт, качественный перевод с одного языка на другой. Это лишь немногие области применения машинного обучения. Внедрение машинного обучения приведет к оптимизации процесса производства и упрощению ежедневного труда, но вызовет сокращение количества рабочих мест. Самообучающиеся программы заменяют труд человека не только в рутинных процессах, но и требующих интеллектуального труда, с часто встречающимися нестандартными случаями. Такие программы справляются с задачами гораздо лучше человека, что исключает человеческий фактор и значительно ускоряет процесс решения.

Список литературы Алгоритмы машинного обучения

Машинное обучение: виды, алгоритмы, примеры. [Электронный ресурс]. Режим доступа: https://www.gd.ru/articles/9348-mashinnoe-obuchenie (дата обращения 20.06.2018).
Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. - Санкт-Петербург: Питер, 2017. - 336 с.
Машинное обучение. [Электронный ресурс]. Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение (дата обращения 20.06.2018).
Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. -Москва: ДМК Пресс, 2015. -400 с.