Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга
Автор: Николаев Никита Алексеевич
Журнал: Теория и практика сервиса: экономика, социальная сфера, технологии @tps-esst
Рубрика: Теория и технологии сферы услуг
Статья в выпуске: 3 (33), 2017 года.
Бесплатный доступ
С развитием микрофинансирования в Российской Федерации всё большую актуальность набирает направление кредитного скоринга. В сложившихся условиях тесной конкуренции и высокой регуляторной нагрузки со стороны Центрального Банка микрофинансовые организации начинают применять всё более нетрадиционные инструменты обогащения данных о заёмщике. Таким инструментом стал визуальный скоринг. В данной статье автор приводит примеры практик визуального скоринга, используемых онлайн МФО, и делится результатами своего исследования, согласно которому допускается гипотеза о возможности наличия связи между чертами лица заёмщика и вероятностью просроченной задолженности по кредиту. Весь анализ и выводы к статье являются результатом применения технологий машинного обучения, глубинного обучения и базовых алгоритмов компьютерного зрения, доступных рядовому пользователю.
Машинное обучение, распознавание лиц, кредитный скоринг, нейронные сети, визуальный скоринг
Короткий адрес: https://sciup.org/14876215
IDR: 14876215
Текст научной статьи Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга
В ходе своего рабочего процесса любая кредитная организация неизбежно несет два вида потерь: во-первых, выдача кредита плохому заёмщику, который не вернет кредит, и, во-вторых, невыдача кредита хорошему заёмщику, который бы его вернул [1]. В классическом понимании проблема того, стоит ли выдавать деньги или нет, существует уже несколько тысячелетий, со времен появления ростовщичества в древнем мире. Но в ходе истории не утратила актуальности и, более того, набрала еще большую значимость.
Мы живем во времена четвертой промышленной революции, когда воспользоваться госуслуга-ми и получить заграничный паспорт можно не вставая с дивана, аналогичным образом стала реальностью и оплата коммунальных платежей, заказ доставки еды из любимого ресторана. Так почему же человек не может получить займ онлайн, если по какой-либо причине испытывает финансовые трудности? С появлением поколения людей данного типа появился и новый вид микрофинансирования, а именно, онлайн-займы, которые можно получить в течение пятнадцати минут после подачи заявки на сайте МФО.
Во-первых, в онлайн-займах кредитный инспектор не может очно познакомиться с заёмщиком. Данная проблема сводится к так называемому визуальному скорингу, который состоит из целого ряда опорных пунктов: получение ответов на вопросы «почему он хочет получить кредит», «сколько зарабатывает», «где живет» и др. [3] В ходе данного вида тестирования инспектор проверяет соответствие реальных ответов и заполненных полей в заявке, с другой стороны – оценивает заёмщика на такие факторы, как хронические болезни, алкогольное опьянение. Следующей опорной точкой визуальной оценки заёмщика является внешний вид (одежда) и, наконец, последним опорным пунктом является оценка «привлекательности, доверительности» по лицу, мимике, поведению заёмщика.
Во-вторых, возрастает вероятность мошенничества со стороны клиента. В случае с онлайн-займом компании сложнее проверить подлинность заявителя по заявке на выдачу кредита. Основными рисками считаются: подделка документов и сканов документов, прилагаемых к заявке, обработка чужих оригинальных документов в фотошопе, использование украденных документов. Минимизировать данные риски призван отдельный вид скоринга, а именно fraud scoring или же скоринг на мошенничество.
В-третьих, ввиду сжатого периода рассмотрения заявки на выдачу кредита возникает проблема необходимости существования автоматизированной системы рассмотрения заявок и принятия по ним решения. Итак, в случае с онлайн-микрофинансированием компания-кредитор вынуждена максимально автоматизировать бизнес-процессы, в том числе в процессе принятия решения по заявке на получение кредита (скоринг). Беря во внимание факт сжатого временного промежутка на принятие решения, а именно – 15 минут, можно сделать вывод, что процесс скоринга должен работать с помощью модели на базе машинного обучения. Она, с одной стороны, может быстро выдавать ответ на заявку (одобрение или отказ), с другой – заменить кредитных инспекторов, что, несомненно, является преимуществом для бизнеса.
В специфике работы офлайн микрофинансовые организации сталкиваются с теми же трудностями, что и онлайн, но с меньшими рисками мошенничества со стороны клиентов. Сам же скоринг призван решать целый ряд задач: увеличение выдачи займов, снижение просроченной задолженности, снижение уровня мошенничества, максимизация прибыли, автоматизация и ускорение процесса обработки заявки на выдачу кредита, уменьшение влияния человеческого фактора при рассмотрении заявки на кредит.
Визуальный скоринг в РФ
Вместе с ростом спроса на микрозаймы в последние годы растет и регуляторная нагрузка со стороны Центрального Банка Российской Федерации к качеству кредитного портфеля. Данная комбинация факторов сделала необходимым применение визуального кредитного скоринга. Сама же визуальная оценка заёмщика на сегодняшний день проводится в основном с целью выявления кредитного мошенничества и лишь в небольшом ряде случаев для обогащения аппликативных (анкетных) данных о заёмщике.
Например, ряд онлайн микрофинансовых организаций использует визуальный скоринг при выезде на место жительство заёмщика с целью оценки следующих факторов:
-
1. Не является ли данное жилье арендованным лишь для получения микрозайма. Для идентификации данного фрод-фактора используется ряд вопросов. Среди которых выезжающий на объект эксперт может попросить показать зубную щётку потенциального заёмщика или же попросить при входе в квартиру тапочки. Если же клиент затрудняется в ответе или же впадает в ступор – это может являться стоп-фактором для выдачи кредита.
-
2. Финансовое благосостояние заёмщика. С целью выявления уровня достатка заёмщика эксперт микрофинансовой организации тщательно оценивает гардероб заёмщика. При этом, одежда не должна быть обязательно дорогой, но ей следует быть в надлежащем состоянии (чистой). В квартире должно быть убрано. Эти данные после проверки эксперта попадают в анкету заёмщика на выдачу кредита, которые в дальнейшем используются в аппликативном скоринге. Аналогичным образом производится беглая оценки мебели и техники на месте жительства заёмщика.
-
3. Лицо заёмщика. При оценке данного параметра выезжающему на объект эксперту необходимо установить расовую принадлежность заёмщика, параметр гигиены (ухода за собой), здоровье заёмщика (визуально), склонность потенциального клиента к употреблению алкоголя или наркотических веществ.
При визуальной оценке заёмщика со стороны офлайн микрофинансовых организаций применяется уже абсолютно другой набор значимых параметров.
Первый. Консультируется ли клиент активно по телефону с каким-либо из лиц по поводу получения микрозайма и заполнения анкеты. Данные об этом дополнительно вносятся в анкету, используются в аппликативном скоринге (скоринге заявки). Очень активные консультации со стороны третьего лица могут быть помехой в получении кредита [5].
Второй. Кто совместно с клиентом зашел в микрофинансовую организацию. Если контингент людей, сопровождающих заёмщика, выглядит весьма сомнительно [5], высока вероятность мошенничества и/или номинального получения микрозайма. Вероятнее всего такому клиенту откажут в выдаче займа.
При этом есть и ряд факторов, в оценке которых онлайн и офлайн микрофинансовые компании сходятся во мнениям. Данные параметры оценивают и одни, и другие: расовую принадлежность, стоимость и аккуратность (чистоту гардероба) заёмщика, склонность субъекта к употреблению алкоголя и/или наркотических веществ [5].
Рынок микрофинансирования от года к году развивается. Такими же темпами растет и интерес к новым методам к визуальной оценки заёмщика. Не секрет, что испокон веков и до середины 19 века существовала такая наука, как физиогномика (с середины 19 века утратила статус науки из-за отсутствия научных методов), согласно которой о человеке многое может рассказать его лицо. Например: сила характера, эмоциональность, общительность, склонность к обману в целях достижения своей личной цели и так далее.
Методика исследования
В рамках своей научной работы автор поставил перед собой задачу: выяснить с помощью методов машинного обучения и глубинного обучения – могут ли черты лица (внешность заёмщика) влиять на то, вернет ли он кредит в срок.
Объектом исследования являются данные о заемщиках в микрофинансовых организациях, кредитных потребительских кооперативах и банках, предоставленные Бюро кредитных историй, а также их фотографии, связанные хэш-тегами с соответствующими им кредитными историями.
Внешность заемщиков влияет на принятие решений о предоставлении займа среди кредиторов P2P направления (кредитование между физическими лицами), афроамериканцы больше подвержены дефолту, привлекательным людям (по фото) с большей вероятностью выдают кредит, нежели непривлекательным и так далее [6].
Методы исследования: машинное обучение, искусственные нейронные сети, компьютерное зрение (DLIP), математический классификатор [4].
Проанализировав информацию о 624 421 займах (сумма договора, пол и возраст заёмщика, количество дней просрочки и имя файла с его фотографией), мы получили определенные результаты.
На первом этапе были извлечены определённые числовые характеристики из всех фотографий. Так как фотографии сделаны на абсолютно разном расстоянии, была написана программа, которая определяет лицо, вырезает его, определяет глаза заемщика и приводит фотографию к разрешению, удобному для анализа.
Затем, используя преобученную модель, основанную на методе комитета регрессионных деревьев, методами градиентного бустинга для каждого лица были найдены 64 точки, соответствующие границам различных частей лица (глаза, рот, нос, брови, подбородок, виски). После этого была проанализирована информация: расстояние между глазами, ширина носа, высота носа, ширина рта, расстояние от носа до подбородка, расстояние от носа до рта, среднее расстояние от носа до глаз, ширина глаз [6] и еще более двух тысяч измерений.
Была написана программа, которая анализирует данные платежеспособности, анализирует черты лица в относительных размерах. То есть, абсолютные величины анализировать нельзя, ввиду того, что фотографии всегда производятся на разном расстоянии от заемщика и анализировать черты лица можно только исходя из базовых признаков: овал лица и уровень глаз. Таким образом, стало возможной идентификация черт лица, влияющих на своевременную выплату, дефолт, просрочку.
Следующий этап – машинное обучение модели. Необходимо было сделать модель самообучае-мой, чтобы она, получив в свое распоряжение новые фотографии заемщиков и скоринговые данные, формировала новые, более правильные прогнозы по заемщику [4].
Результаты
Различные варианты моделей машинного для включения биометрических данных в скоринг предоставляют различные варианты точности классификации. При этом наибольшую точность показывает именно CNN (нейронные сети). Точность классификации при использовании таких данных как пол, возраст, фотография даёт AUC на уровне 0,74, что свидетельствует о средней точности классификации. При этом, включение отдельно биометрии (скоринг по фото) предоставляет AUC на уровне 0,63 – низкая точность, но отличается от случайного предсказания (0,5) [2].
При включении биометрии в скоринг при наличии большего числа данных: кредитная история, социальные сети, анкетные данные, rtb-данные, значимость биометрических переменных очень сильно снижается и может давать прирост AUC в пределах 0,01. Для качественного источника данных прирост AUC может составлять от 0,05 и выше [4].
Таким образом, использование биометрических данных в аппликативном скоринге отлично подходит для микрофинансовых организаций, которые имеют лишь небольшой набор данных о заёмщике для принятия решения по заявке. В случае же наличия данных по кредитной истории, большого объема анкетных данных и т.д., включением лицевых черт в скоринг компании лучше пренебречь ввиду небольшого прироста точности от исходной модели и высокой трудоёмкости процесса.
Список литературы Методы идентификации качества клиентов в системах автоматизированного кредитования с помощью визуального скоринга
- Обзор ключевых показателей микрофинансовых институтов за 2-й квартал 2017 года/Центральный Банк РФ. М., 22 с.
- Эйтшгтон В.Н., Анохин С.А. Прогнозирование банкротства: основные методики и проблемы. М.: ИНФРА-М, 2007. 124 с.
- Serrano-Cinca C. A social and environmental approach to microfinance credit scoring. University of Bucara-manga, Colombia. 75 p.
- Kraus A. Recent Methods from Statistics and Machine Learning for Credit Scoring. Cuvillier Verlag, 2014. 166 p.
- Augsburg B., Fouillet C. Profit empowerment: The microfinance institution's mission drift. University of Oxford, 2013. 233 p.
- Ravinna E. Love & Loans. The Effect of Beauty and Personal Characteristics in Credit Markets. Columbia business school, 2012. 79 p.