Алгоритмы машинного обучения

Автор: Макаров Д.А., Шибанова А.Д.

Журнал: Теория и практика современной науки @modern-j

Рубрика: Медицина и здоровье

Статья в выпуске: 6 (36), 2018 года.

Бесплатный доступ

В данной статье рассмотрена технология машинного обучения. Проведен анализ алгоритмов машинного обучения. Указана область применения каждого из них. Сделан вывод об актуальности технологии машинного обучения, описаны плюсы ее внедрения в производство.

Машинное обучение, алгоритм, регрессия

Короткий адрес: https://sciup.org/140273657

IDR: 140273657

Текст научной статьи Алгоритмы машинного обучения

Рассмотрим алгоритмы, которые активно применяются в технологии машинного обучения.

  • 1.    Дерево принятия решений. В этом методе используется древовидный граф: дерево состоит из минимального числа вопросов с ответами «да» либо «нет». Отвечая последовательно на эти вопросы можно получить итоговый ответ. Данный метод структурирует и систематизирует проблему, а конечное решение получается из логических выводов.

  • 2.    Наивная байесовская классификация. Наивные байесовские классификаторы воспринимают различные функции как независимые, это представляет из себя наивное предположение. Такая классификация

  • 3.    Метод наименьших квадратов. Метод наименьших квадратов принадлежит к линейной регрессии. Обычно с ее помощью находят решение задачи по подгонке прямой, которая проходит через некоторое количество точек. Линия, у которой сумма квадратов расстояний будет наименьшей, принимается искомой. Метод применяется для уменьшения количества погрешностей с помощью создания метрики ошибок.

  • 4.    Логистическая регрессия. Логистическая регрессия – это метод вычисления зависимости между категориально зависимыми и независимыми переменными. Для этого используется логистическая функция. Логистическая регрессия представляет из себя мощное статистическое средство предсказания событий, включающее независимые переменные. Это может быть использовано в оценке успеха рекламных кампаний, прогнозе спроса на определенный товар и т.д.

  • 5.    Метод опорных векторов (SVM). Так называются алгоритмы, которые используются для решения задач классификации и регрессионного анализа. SVM и его модифицированные версии решают сложные задачи машинного обучения, такие как вырезание определённых нуклеотидных последовательностей ДНК, определение пола человека по фотографии и т.д.

  • 6.    Метод главных компонент (PCA). Данный метод – это операция из статистики по преобразованию, переводит процесс наблюдения за как-то связанными между собой переменными, которые могут быть как-то взаимосвязаны между собой, в набор не связанных между собой значений. Задачи, где применяется этот метод – задачи упрощения, минимизации количества данных, их визуализация. Но метод не подходит для ситуаций, где данные слабо упорядочены, недостаточно изучена предметная область.

  • 7.    Анализ независимых компонент (ICA). Это метод из статистики, который выявляет скрытые факторы, влияющие на случайные величины. Данный

используется в таких областях: поиск спама, распознавание предметов на фотографиях и т.д.

метод формирует на основе многофакторных данных специальную модель. Метод эффективен, когда классические подходы по каким-либо причинам не способны предоставить объективную модель. Он позволяет обнаружить причины явлений, которые не доступны для анализа классическим методам, что позволяет активно применять данный метод в астрономии, анализе данных, распознавании речи.

Рассмотрим диагностику заболеваний. Необходимо представить пациентов как объекты, а признаками - их болезни, симптомы, пол, возраст и т.д. Некоторые признаки целесообразно принять бинарными. Состояния пациентов различной степени тяжести - порядковые признаки, а иные -количественные, такие как рост, вес, объем грудной клетки, принимаемые препараты и т.д. С помощью информации о данных признаках и специальной программы с машинным обучением можно определить вид заболевания, просчитать возможное лечение и необходимые препараты, определить возможные осложнения и рассчитать действия, необходимые для их предотвращения. Человек не способен быстро обработать такие большие объемы информации, а самое главное - он способен при анализе допустить ошибку. Таким образом, машинное обучение становится незаменимым помощником в сфере медицины и здравоохранения.

Технологии машинного обучения подвластно даже определение наличия полезных ископаемых. В качестве признаков принимаются сведения о нахождении определенных ископаемых на данной территории: наличие на территории местности каких-либо пород, их свойства, как химические, так и физические. Эти свойства можно принять за количественные и качественные признаки. Для обучения программы используется набор территорий со списком их признаков, где полезные ископаемые точно есть. Однако в данном случае существует некоторая специфика, иногда количество признаков много больше количества объектов, поэтому традиционные методы не работают. Так что в машинном обучении внимание акцентируется на поиск зависимостей в ряде уже обнаруженных данных. Данный метод позволяет сэкономить значительный объем средств.

Машинное обучение предоставляет человеку грандиозные возможности, недоступные ранее. Например, система мониторинга состояния здоровья, учитывающая индивидуальные данные, привычки и наследственность пациента. Улучшение систем защиты, которые будут самостоятельно определять взлом или кражу данных и предпринимать попытки к устранению проникновения, возможность организовывать «умную» защиту общественных мест, таких как кафе, стадионы, центральные площади, с помощью технологии распознавания лиц. Внедрение беспилотных автомобилей, которые способны самостоятельно строить маршрут и оценивать дорожную обстановку. Защита банковских карт, качественный перевод с одного языка на другой. Это лишь немногие области применения машинного обучения. Внедрение машинного обучения приведет к оптимизации процесса производства и упрощению ежедневного труда, но вызовет сокращение количества рабочих мест. Самообучающиеся программы заменяют труд человека не только в рутинных процессах, но и требующих интеллектуального труда, с часто встречающимися нестандартными случаями. Такие программы справляются с задачами гораздо лучше человека, что исключает человеческий фактор и значительно ускоряет процесс решения.

Список литературы Алгоритмы машинного обучения

  • Машинное обучение: виды, алгоритмы, примеры. [Электронный ресурс]. Режим доступа: https://www.gd.ru/articles/9348-mashinnoe-obuchenie (дата обращения 20.06.2018).
  • Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. - Санкт-Петербург: Питер, 2017. - 336 с.
  • Машинное обучение. [Электронный ресурс]. Режим доступа: http://www.machinelearning.ru/wiki/index.php?title=Машинное_обучение (дата обращения 20.06.2018).
  • Флах П. Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных. -Москва: ДМК Пресс, 2015. -400 с.
Статья научная