Способы работы с пропущенными данными для задач кредитного скоринга
Автор: Архипов В.А.
Журнал: Вестник Алтайской академии экономики и права @vestnik-aael
Рубрика: Экономические науки
Статья в выпуске: 6-1, 2020 года.
Бесплатный доступ
Одной из важных проблем, возникающих в ходе построения моделей кредитного скоринга, является необходимость работать с пропусками в данных. Пропущенные наблюдения могут иметь очевидную экономическую природу, либо не иметь ее вовсе и быть вызванными техническими ошибками в системах хранения данных. В связи с этим возникает необходимость восстанавливать пропущенные значения таким образом, чтобы максимизировать целевую метрику качества - коэффициент Джини. Основной интерес представляет способ восстановления пропущенных значений на основе генеративных состязательных сетей, предложенный в работе Gain: Missing data imputation using generative adversarial nets, так как предлагает принципиально новый алгоритм восстановления пропущенных значений по сравнению с традиционно используемыми в индустрии.
Моделирование, кредитный скоринг, машинное обучение, пропуски в данных, бинарная классификация
Короткий адрес: https://sciup.org/142223599
IDR: 142223599 | DOI: 10.17513/vaael.1157
Список литературы Способы работы с пропущенными данными для задач кредитного скоринга
- Yoon J., Jordon J., Van Der Schaar M. Gain: Missing data imputation using generative adversarial nets // arXiv preprint arXiv:1806.02920. 2018.
- Rezac M., Rezac F. How to measure the quality of credit scoring models // Finance a Uver. 2011. Т. 61. № 5. Р. 486.
- Frunza M.C. Computing a standard error for the Gini coefficient: an application to credit risk model validation // The Journal of Risk Model Validation. 2013. Т. 7. № 1. Р. 61.
- Friedman J., Hastie T., Tibshirani R. The elements of statistical learning. New York, NY, USA: Springer series in statistics, 2001. Т. 1. № 10.
- Hand D.J., Henley W.E. Statistical classification methods in consumer credit scoring: a review // Journal of the Royal Statistical Society: Series A (Statistics in Society). 1997. Т. 160. № 3. С. 523-541.
- Siddiqi N. Credit risk scorecards: developing and implementing intelligent credit scoring. John Wiley & Sons, 2012. Т. 3.