Смеси вероятностных распределений в задачах регрессии и проверки на аномальность и их применение для PVT-свойств
Автор: Волков Н.А., Буденный С.А., Андрианова А.М.
Журнал: Труды Московского физико-технического института @trudy-mipt
Рубрика: Информатика и управление
Статья в выпуске: 3 (47) т.12, 2020 года.
Бесплатный доступ
В статье рассмотрены основные математические свойства смеси вероятностных распределений. Отдельное внимание уделяется многомерному распределению Стьюдента и связанным с ним распределениям, для которых доказываются свойства, необходимые для практического применения. Также приведен вывод EM-алгоритма для оценки параметров смеси распределений Стьюдента, в котором на E-шаге применяется вариационный байесовский вывод. На основе смеси распределений Стьюдента построен метод машинного обучения, позволяющий с помощью одной модели решать задачи регрессии по любому набору признаков, кластеризации, обнаружения аномалий. Каждая из этих задач может быть решена моделью при наличии пропусков в данных. Метод протестирован на данных PVT-свойств пластовых флюидов, на которых результаты модели не противоречат основным физическим свойствам, а предсказания во многих случаях точнее широко известных методов машинного обучения по метрикам MAPE и RMSPE.
Смесь распределений стьюдента, em-алгоритм, вариационный байесовский вывод, кластеризация, регрессия, аномалии, пропуски в данных, pvt-свойства
Короткий адрес: https://sciup.org/142230086
IDR: 142230086
Список литературы Смеси вероятностных распределений в задачах регрессии и проверки на аномальность и их применение для PVT-свойств
- Лагутин М.Б. Наглядная математическая статистика. Москва : Бином, 2009.
- Козлов М.В., Прохоров А.В. Введение в математическую статистику. Москва : МГУ, 1987.
- Kotz S., Nadarajah S. Multivariate T-Distributions and their Applications. Cambridge : Cambridge University Press, 2004.
- Genz A., Bretz F. Computation of Multivariate Normal and Probabilities. New York : Springer, Dordrecht, 2009.
- Kibria B.M.G., Joarder A.H. A short review of multivariate ¿-distribution // Journal of Statistical Research. 2006. V. 40. P. 256-422.
- Bishop C.M. Pattern Recognition and Machine Learning. New York : Springer, 2006.
- Peel D., Mclachlan G. Robust Mixture Modelling Using the ¿-distribution // Statistics and Computing. 2000. V. 10. P. 339-348.
- Shoham S., Fellows M., Nermann R. Robust, automatic spike sorting using mixtures of Multivariate T-Distributions // Journal of neuroscience methods. 2003. V. 127. P. 111-122.
- Bishop C.M., Svensen M. Robust Bavesian Mixture Modelling // Neurocomputing. 2004. V. 64. P. 235-252.
- Fruhwirth-Schnatter S. Finite Mixture and Markov Switching Models. New York : Springer, 2006.
- Ширяев A.H. Вероятность. Москва : МЦНМО, 2004.
- Eaton M.L. Multivariate Statistics: a Vector Space Approach. Beachwood, Ohio : Institute of Mathematical Statistics, 2007.
- Грант,махер Ф.Р. Теория матриц. Москва : Физматлит, 2010.
- Smith W.B., Hocking R.R. Algorithm AS 53: Wishart Variate Generator // Applied Statistics. 1972. V. 21. P. 341-345.
- Thomas P.M. Old and New Matrix Algebra Useful for Statistics // MIT Media Lab note, https: / / tminka.github.io / papers / matrix/
- Брусиловский A.H. Фазовые превращения при разработке месторождений нефти и газа. Москва : Грааль, 2002.
- Alakbari F., Elkatatny S., Baarimah S. Prediction of Bubble Point Pressure Using Artificial Intelligence AI Techniques // Proc. of the SPE Middle East Artificial Lift Conference and Exhibition. 2016. 10.2118/184208-MS.
- Numbere O.G., Azuibuike I.I., Ikiensikimama S.S. Bubble Point Pressure Prediction Model for Niger Delta Crude using Artificial Neural Network Approach // Society of Petroleum Engineers. 2013. doi:10.2118/167586-MS.
- Alcocer Y., Patricia R. Neural Networks Models for Estimation of Fluid Properties // Proc. of the SPE Latin American and Caribbean Petroleum Engineering Conference. 2001. 10.2523/69624-MS.
- Osman E.A., Abdel-Wahhab O.A., Al-Marhoun M.A. Prediction of Oil PVT Properties Using Neural Networks // Society of Petroleum Engineers. 2001. doi:10.2118/68233-MS.
- El-Sebakhy E.A., Sheltami T., Al-Bokhitan S.Y., Shaaban Y., Raharja P.D., Khaeruzzaman Y. Support Vector Machines Framework for Predicting the PVT Properties of Crude Oil Systems // Society of Petroleum Engineers. 2007. doi:10.2118/105698-MS.