Оценивание неопределённости в машинном обучении

Бесплатный доступ

Большинство методов машинного обучения основаны на статистической теории обучения, при этом часто используется упрощение процедур для достижения приемлемой скорости вычислений. Цель исследования. Сформировать общий подход к оценке неопределенности в моделях машинного обучения. В эконометрике в любой модели в обязательном порядке ставится неопределенность в форме стандартного отклонения («сигмы») для коэффициентов и для прогнозов. Проблема заключается в том, что в машинном обучении нельзя аналитически посчитать неопределенность через «сигму». Поэтому вместо аналитических методов мы предлагаем использовать численные методы. Материалы и методы. Для детального рассмотрения вопроса оценивания неопределённости выбраны классические методы регрессионного анализа, в которых уделяется большое внимание неопределённости коэффициентов модели и - что более важно - точности прогнозов, полученных по такой модели. Результаты. Предлагается технология оценки неопределённости, демонстрируемая на модельном примере для того, чтобы показать, что она согласуется с традиционными классическими методами по результатам. В дальнейшей практике мы предлагаем использовать кросс-валидацию. Заключение. При использовании машинных моделей сложных процессов, в том числе прогнозов, построенных по таким моделям, при принятии управленческих решений становится всё более актуальной проблема оценивания неопределённости и вытекающих из этой неизбежной неопределённости рисков. Данная проблема может быть решена на основе непараметрических методов, хотя для этого потребуется гораздо большая вычислительная мощность, чем та, которая используется для обучения машинной модели. Предлагаемый подход можно обобщить и для других методов машинного обучения, например, для задачи классификации и кластеризации.

Еще

Неопределённость параметров, обучение с учителем, моделирование, методы прогнозирования

Короткий адрес: https://sciup.org/147241768

IDR: 147241768   |   DOI: 10.14529/ctcr230305

Список литературы Оценивание неопределённости в машинном обучении

  • Arkov V.U. Uncertainty estimation in mechanical and electrical engineering. In: International Conference on Electrotechnical Complexes and Systems ICOECS. Manchester, U.K. 2021. P. 436-440.
  • Lakshminarayanan B., Pritzel A., Blundell C. Simple and Scalable Predictive Uncertainty Estimation using Deep Ensembles. In: 31st Conference on Neural Information Processing Systems NIPS. Curran Associates Inc., Red Hook, NY, USA. 2017. P. 6405-6416.
  • James G., Witten D., Hastie T., Tibshirani R. An Introduction to Statistical Learning. Springer, NY; 2021. 426 p.
  • Saxena A., Celaya J., Saha B., Saha S., Goebel K. Evaluating prognostics performance for algorithms incorporating uncertainty estimates. In: IEEE Aerospace Conference Proceedings. 2010. P. 1-11. DOI: 10.1109/AER0.2010.5446828
  • Vater J., Harscheidt L., Knoll A. Smart Manufacturing with Prescriptive Analytics. In: Proceedings of the 8th International Conference on Industrial Technology and Management ICITM. 2019. P.224-228.
  • Wang L., Garnier H. System Identification, Environmental Modelling, and Control System Design. Springer, London; 2012. 648 p.
  • El-Sayed A.F. Aircraft Propulsion and Gas Turbine Engines. CRC Press, Boca Raton; 2017. 1476 p.
  • Leskovec J., Rajaraman A., Ullman J. Mining of Massive Datasets. Cambridge: Cambridge University Press; 2020. 565 p.
  • Tukey J.W. Exploratory data analysis. Addison-Wesley; 1977. 712 p.
  • Bruce P., Bruce A. Practical Statistics for Data Scientists. O'Reilly Media; 2017. 368 p.
  • Korngiebel D., Mooney S. Considering the possibilities and pitfalls of Generative Pre-trained Transformer (GPT-3) in healthcare delivery. Digital Medicine. 2021;4(1):93. DOI: 10.1038/s41746-021-00464-x
  • Snedecor G.W. Statistical methods. Iowa State University Press; 1938. 356 p.
  • Fomby T.B., Johnson S.R., Hill R.C. Review of Ordinary Least Squares and Generalized Least Squares. In: Advanced Econometric Methods. Springer, New York, NY; 1984. DOI: 10.1007/978-1-4419-8746-4_2
  • Kong Q., Siauw T., Bayen A. Least Squares Regression. In: Python Programming and Numerical Methods: A Guide for Engineers and Scientists. Academic Press. 2021. P. 279-293.
  • Lyche T. Least Squares. In: Numerical Linear Algebra and Matrix Factorizations. Texts in Computational Science and Engineering book series 22. Springer International Publishing. 2020. P. 199-222.
  • Drygas H. Consistency of the least squares and Gauss-Markov estimators in regression models. Z. Wahrscheinlichkeitstheorie verw Gebiete. 1971;17:309-326.
  • Zimmerman D.L. Least Squares Estimation for the Gauss-Markov Model. In: Linear Model Theory. Springer, Cham. 2020.
  • Greene W. Econometric Analysis. Pearson, New York; 2020.
  • Kiusalaas J. Numerical Methods in Engineering with Python 3. Cambridge University Press, Cambridge; 2013.
  • Sohil F., Sohail M., Shabbir J. An introduction to statistical learning with applications in R. Springer Science and Business Media. New York; 2013.
  • Reuther A. et al. Interactive Supercomputing on 40,000 Cores for Machine Learning and Data Analysis. In: 2018 IEEE High Performance extreme Computing Conference (HPEC). 2018. P. 1-6. DOI: 10.1109/HPEC.2018.8547629
  • Raschka S., Patterson J., Nolet C. Machine Learning in Python: Main developments and technology trends in data science, machine learning, and artificial intelligence. 2020. arXiv:2002.04803v2. DOI: 10.48550/arXiv.2002.04803
  • Feurer M. et al. Auto-sklearn: Efficient and Robust Automated Machine Learning. In: Automated Machine Learning. 2019.
Еще
Статья научная