Способы работы с пропущенными данными для задач кредитного скоринга

Бесплатный доступ

Одной из важных проблем, возникающих в ходе построения моделей кредитного скоринга, является необходимость работать с пропусками в данных. Пропущенные наблюдения могут иметь очевидную экономическую природу, либо не иметь ее вовсе и быть вызванными техническими ошибками в системах хранения данных. В связи с этим возникает необходимость восстанавливать пропущенные значения таким образом, чтобы максимизировать целевую метрику качества - коэффициент Джини. Основной интерес представляет способ восстановления пропущенных значений на основе генеративных состязательных сетей, предложенный в работе Gain: Missing data imputation using generative adversarial nets, так как предлагает принципиально новый алгоритм восстановления пропущенных значений по сравнению с традиционно используемыми в индустрии.

Еще

Моделирование, кредитный скоринг, машинное обучение, пропуски в данных, бинарная классификация

Короткий адрес: https://sciup.org/142223599

IDR: 142223599   |   DOI: 10.17513/vaael.1157

Список литературы Способы работы с пропущенными данными для задач кредитного скоринга

  • Yoon J., Jordon J., Van Der Schaar M. Gain: Missing data imputation using generative adversarial nets // arXiv preprint arXiv:1806.02920. 2018.
  • Rezac M., Rezac F. How to measure the quality of credit scoring models // Finance a Uver. 2011. Т. 61. № 5. Р. 486.
  • Frunza M.C. Computing a standard error for the Gini coefficient: an application to credit risk model validation // The Journal of Risk Model Validation. 2013. Т. 7. № 1. Р. 61.
  • Friedman J., Hastie T., Tibshirani R. The elements of statistical learning. New York, NY, USA: Springer series in statistics, 2001. Т. 1. № 10.
  • Hand D.J., Henley W.E. Statistical classification methods in consumer credit scoring: a review // Journal of the Royal Statistical Society: Series A (Statistics in Society). 1997. Т. 160. № 3. С. 523-541.
  • Siddiqi N. Credit risk scorecards: developing and implementing intelligent credit scoring. John Wiley & Sons, 2012. Т. 3.
Статья научная