Детерминированная прогнозная модель управления сигналами светофоров в интеллектуальных транспортных и геоинформационных системах

Автор: Мясников Владислав Валерьевич, Агафонов Антон Александрович, Юмаганов Александр Сергеевич

Журнал: Компьютерная оптика @computer-optics

Рубрика: Численные методы и анализ данных

Статья в выпуске: 6 т.45, 2021 года.

Бесплатный доступ

В работе предлагается метод адаптивного управления сигналами/фазами светофоров в интеллектуальных транспортных и геоинформационных системах, основанный на детерминированной прогнозной модели. Под детерминированной прогнозной моделью в работе понимается набор явных аналитических закономерностей и / или операций, связывающих информацию о движении транспортных средств в окрестности конкретного перекрёстка, с данными о прогнозируемом «потоке» транспортных средств через перекрёсток за одну конкретную фазу светофорного цикла. Предлагаемый метод управления основывается на выборе фазы светофорного цикла, прогнозируемый поток для которой оказывается максимален. Таким образом, метод обеспечивает управление сигналами / фазами светофоров на основе данных о движении транспорта, включая данные с подключенных и автономных транспортных средств. Экспериментальные исследования были проведены в системе микроскопического моделирования транспортных потоков SUMO. Представлено сравнение предложенного метода с решениями, обладающими лучшими в своём классе показателями эффективности: эмпирическими алгоритмами управления и методами управления на основе обучения с подкреплением. Показано преимущество предложенного метода, определены направления дальнейших исследований.

Еще

Анализ данных, интеллектуальная транспортная система, управление сигналами светофора, детерминированная модель, обучение с подкреплением, подключенные и автономные транспортные средства

Короткий адрес: https://sciup.org/140290291

IDR: 140290291   |   DOI: 10.18287/2412-6179-CO-1031

Список литературы Детерминированная прогнозная модель управления сигналами светофоров в интеллектуальных транспортных и геоинформационных системах

  • The economist. The cost of traffic jams [Electronical Resource]. - URL: https://www.economist.com/blogs/economist-explains/2014/11/economist-explains-1 (request date 20.08.2021).
  • Schrank, D. TTI's 2012 urban mobility report [Electronical Resource] / D. Schrank, B. Eisele, T. Lomax. - 2012. - URL: https://static.tti.tamu.edu/tti.tamu.edu/documents/umr/archive /mobility-report-2012.pdf (request date 20.08.2021).
  • Wei, H. A survey on traffic signal control methods [Electronical Resource] / H. Wei, G. Zheng, V. Gayah, Z. Li // arXiv Preprint. - 2020. - URL: http://arxiv.org/abs/1904.08117 (request date 20.08.2021).
  • Агафонов, А.А. Исследование численного метода резервирования маршрутов в геоинформационной задаче маршрутизации автономных транспортных средств / A.А. Агафонов, В.В. Мясников // Компьютерная оптика. - 2018. - Т. 42, № 5. - С. 912-920. - DOI: 10.18287/24126179-2018-42-5-912-920.
  • Агафонов, А.А. Анализ больших данных в геоинформационной задаче краткосрочного прогнозирования параметров транспортного потока на базе метода к ближайших соседей / А.А. Агафонов, А.С. Юмаганов, B.В. Мясников // Компьютерная оптика. - 2018. - Т. 42, № 6. - С. 1101-1111. - DOI: 10.18287/2412-6179-201842-6-1101-1111.
  • Hunt, P.B. The SCOOT on-line traffic signal optimisation technique / P.B. Hunt, D.I. Robertson, R.D. Bretherton, M.C. Royle // Traffic Engineering & Control. - 1982. -Vol. 23, Issue 4. - P. 190-192.
  • Hunt, P.B. SCOOT, a traffic responsive method of coordinating signals / P.B. Hunt, D.I. Robertson, R.D. Bretherton, M.C. Royle. - Laboratory report, Vol. 1014. - Transport and Road Research Laboratory, 1981. - 41 p.
  • Lowrie, P.R. SCATS-a traffic responsive method of controlling urban traffic / P.R. Lowrie. - Roads and Traffic Authority NSW, 1990. - 28 p.
  • Постановление Правительства РФ от 23.10.1993 № 1090 (ред. от 31.12.2020) "О Правилах дорожного движения" (с изм. и доп., вступ. в силу с 01.03.2021).
  • Webster, F. Traffic signal settings / F. Webster. - Technical Paper no.39. - Road Research Laboratory, 1958. - 44 p.
  • Varaiya, P. The max-pressure controller for arbitrary networks of signalized intersections / P. Varaiya. - In: Advances in dynamic network modeling in complex transportation systems. Vol. 2. Complex networks and dynamic systems / ed. by S.V. Ukkusuri, K. Ozbay. - New York: Springer, 2013. -P. 27-66. - DOI: 10.1007/978-1 -4614-6243-9_2.
  • Gershenson, C. Self-organizing traffic lights [Electronical Resource] / C. Gershenson // arXiv Preprint. - 2004. -URL: https://arxiv.org/abs/nlin/0411066 (request date 20.08.2021).
  • Cools, S.B. Self-organizing traffic lights: A realistic simulation / S.B. Cools, C. Gershenson, B.D. Hooghe. - In: Advances in applied self-organizing systems / ed. by M. Prokopenko. - 2nd ed. - London: Springer-Verlag, 2013. - P. 43-55. - DOI: 10.1007/978-1-4471-5113-5_3.
  • Genders, W. An open-source framework for adaptive traffic signal control [Electronical Resource] / W. Genders, S. Razavi // arXiv Preprint. - 2019. - URL: https://arxiv.org/abs/1909.00395 (request date 20.08.2021).
  • Li, L. A survey of traffic control with vehicular communications / L. Li, D. Wen, D. Yao // IEEE Transactions on Intelligent Transportation Systems. - 2014. - Vol. 15, Issue 1. - P. 425-432. - DOI: 10.1109/TITS.2013.2277737.
  • Papageorgiou, M. Review of road traffic control strategies / M. Papageorgiou, C. Diakaki, V. Dinopoulou, A. Kotsialos, Y. Wang // Proceedings of the IEEE. - 2003. - Vol. 91, Issue 12. - P. 2043-2067. - DOI: 10.1109/JPR0C.2003.819610.
  • Roess, R.P. Traffic engineering / R.P. Roess, E.S. Prassas, W.R. McShane. - Upper Saddle River: Prentice Hall, 2004. -786 p.
  • Gokulan, B.P. Distributed geometric fuzzy multiagent urban traffic signal control / B.P. Gokulan, D. Srinivasan // IEEE Transactions on Intelligent Transportation Systems. -2010. - Vol. 11, Issue 3. - P. 714-727. - DOI: 10.1109/TITS.2010.2050688.
  • Teodorovic, D. Swarm intelligence systems for transportation engineering: Principles and applications / D. Teodorovic // Transportation Research, Part C: Emerging Technologies. - 2008. - Vol. 16, Issue 6. - P. 651-667. -DOI: 10.1016/j.trc.2008.03.002.
  • Mikami, S. Genetic reinforcement learning for cooperative traffic signal control / S. Mikami, Y. Kakazu // Proceedings of the First IEEE Conference on Evolutionary Computation. - 1994. - P. 223-228. - DOI: 10.1109/ICEC.1994.350012.
  • Lee, J. Real-time optimization for adaptive traffic signal control using genetic algorithms / J. Lee, B. Abdulhai, A. Shalaby, E.-H. Chung // Journal of Intelligent Transportation Systems. - 2005. - Vol. 9, Issue 3. - P. 111-122. -DOI: 10.1080/15472450500183649.
  • Ricalde, E. Evolving adaptive traffic signal controllers for a real scenario using genetic programming with an epigenetic mechanism / E. Ricalde, W. Banzhaf // 16th IEEE International Conference on Machine Learning and Applications. - 2017. - P. 897-902. - DOI: 10.1109/ICMLA.2017.00-41.
  • Wei, H. IntelliLight: A reinforcement learning approach for intelligent traffic light control / H. Wei, G. Zheng, H. Yao, Z. Li // Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. - 2018. - P. 2496-2505. - DOI: 10.1145/3219819.3220096.
  • Wei, H. CoLight: Learning network-level cooperation for traffic signal control / H. Wei, N. Xu, H. Zhang, G. Zheng, X. Zang, C. Chen, W. Zhang, Y. Zhu, K. Xu, Z. Li // Proceedings of the 28th ACM International Conference on Information and Knowledge Management. - 2019. - P. 19131922. - DOI: 10.1145/3357384.3357902.
  • Chen, C. Toward a thousand lights: decentralized deep reinforcement learning for large-scale traffic signal control / C. Chen, H. Wei, N. Xu, G. Zheng, M. Yang, Y. Xiong, K. Xu, Z. Li // Proc AAAI Conf on Artificial Intelligence. -2020. - Vol. 34, Issue 4. - P. 3414-3421. - DOI: 10.1609/aaai.v34i04.5744.
  • Liu, Y. Intelligent traffic light control using distributed multi-agent Q learning / Y. Liu, L. Liu, W.-P. Chen // 2017 IEEE 20th International Conference on Intelligent Transportation Systems (ITSC). - 2017. - P. 1-8. - DOI: 10.1109/ITSC.2017.8317730.
  • Li, Z. Networkwide traffic signal control optimization using a multi-agent deep reinforcement learning / Z. Li, H. Yu, G. Zhang, S. Dong, C.-Z. Xu // Transportation Research, Part C: Emerging Technologies. - 2021. - Vol. 125. - DOI: 10.1016/j.trc.2021.103059.
  • Yau, K.A. A survey on reinforcement learning models and algorithms for traffic signal control / K.A. Yau, J. Qadir, H.L. Khoo // ACM Computing Surveys. - 2017. - Vol. 50, Issue 3. - P. 1-38. - DOI: 10.1145/3068287.
  • Mannion, P. An experimental review of reinforcement learning algorithms for adaptive traffic signal control / P. Mannion, J. Duggan, E. Howley. - In: Autonomic road transport support systems / ed. by Th.L. McCluskey, A. Kotsialos, J.P. Müller, F. Klügl, O. Rana. - Switzerland: Springer International Publishing, 2016. - P. 47-66. - DOI: 10.1007/978-3-319-25808-9_4.
  • Chu, T. Multi-agent deep reinforcement learning for large-scale traffic signal control / T. Chu, J. Wang, L. Codeca, Z. Li // IEEE Transactions on Intelligent Transportation Systems. - 2019. - Vol. 21, Issue 3. - P. 1086-1095. - DOI: 10.1109/TITS.2019.2901791.
  • Greguric, M. Application of deep reinforcement learning in traffic signal control: An overview and impact of open traffic data / M. Greguric, M. Vujic, C. Alexopoulos, M. Miletic // Applied Sciences. - 2020. - Vol. 10, Issue 11. - DOI: 10.3390/app10114011.
  • Qadri, S.S.S.M. State-of-art review of traffic signal control methods: challenges and opportunities / S.S.S.M. Qadri, M.A. Gökje, E. Öner // European Transport Research Review. - 2020. - Vol. 12. - 55. - DOI: 10.1186/s12544-020-00439-1.
  • Watkins, C.J.C.H Learning from delayed rewards [Electronical Resource] / C.J.C.H. Watkins. - 1989. - URL: http://www.cs.rhul.ac.uk/~chrisw/thesis.html (request date 20.08.2021).
  • Ronald, W.J. Simple statistical gradient-following algorithms for connectionist reinforcement learning / W.J. Ronald // Machine Learning. - 1992. - Vol. 8. -P. 229-256. - DOI: 10.1007/BF00992696.
  • Sutton, R.S. Policy gradient methods for reinforcement learning with function approximation / R.S. Sutton, D. McAllester, Y. Mansour // Proceedings of the 12th International Conference on Neural Information Processing Systems. - 1999. - P. 1057-1063.
  • Van Hasselt, H. Double Q-learning / H. Van Hasselt // Advances in Neural Information Processing Systems 23 (NIPS 2010). - 2010. - P. 2613-2622.
  • Mnih, V. Asynchronous methods for deep reinforcement learning / V. Mnih, A.P. Badia, M. Mirza, A. Graves, T. Lillicrap, T. Harley, D. Silver, K. Kavukcuoglu // Proceedings of the 33rd International Conference on Machine Learning. - 2016. - P. 1928-1937.
  • Haarnoja, T. Soft Actor-Critic: Off-policy maximum entropy deep reinforcement learning with a stochastic actor / T. Haarnoja, A. Zhou, P. Abbeel, S. Levine // Proceedings of the 35th International Conference on Machine Learning. -2018. - P. 1861-1870.
  • Martinez, F.J. A survey and comparative study of simulators for vehicular ad hoc networks (VANETs) / F.J. Martinez, C.K. Toh, J.-C. Cano, C.T. Calafate, P. Manzoni // Wireless Communications and Mobile Computing. - 2011. - Vol. 11, Issue 7. - P. 813-828. - DOI: 10.1002/wcm.859.
Еще
Статья научная