Единый реестр населения как источник данных для проведения социально-демографического анализа

Автор: Юсифов Фархад Фирудин Оглу, Ахундова Нармина Эльшан Гызы

Журнал: Народонаселение @narodonaselenie

Рубрика: Демография: вопросы теории и практики

Статья в выпуске: 1 т.25, 2022 года.

Бесплатный доступ

В статье рассматривается анализ демографических характеристик на основе данных единого реестра населения. Исследуется роль реестров населения, которые считаются важнейшим источником данных о населении. Изучается возможность более широкого использования данных единого реестра населения в социально-демографических исследованиях. Были проанализированы демографические характеристики в контексте пандемии COVID-19 на основе данных отдельных лиц, интегрированных в единый реестр для экспериментальной оценки. Опыт показывает, что хотя данные из реестров населения в настоящее время используются в демографических исследованиях, нужны подходы к использованию данных из других государственных реестров. Одной из основных особенностей проведения демографического анализа с использованием данных, собранных из разных государственных реестров, является наличие единого идентификационного номера для каждого человека. В исследовании информация о лицах представляет собой гипотетические данные, взятые из двух отдельных реестров (реестры населения и реестры здоровья). Были отобраны данные о 1000 лицах, объединённых в единый реестр. В этот набор данных были собраны личные данные и информация о здоровье населения. Набор данных включает PIN-код каждого человека, пол, возраст, сферу деятельности, количество членов семьи, национальность, наличие хронических заболеваний, включая диабет, бронхиальную астму, инфекцию COVID-19, смерть от COVID-19, выздоровление от COVID-19. Результаты показывают, что создание единого интегрированного реестра на основе реестра населения - системы электронной демографии, требует увеличения количества доступных статистических показателей, интеграции различных государственных реестров для более детального анализа. Это позволит обрабатывать данные и выполнять статистический анализ более тщательно и за более длительные периоды времени.

Еще

Электронная демография, единый реестр населения, данные о населении, государственные реестры, пандемия covid-19, персональный идентификационный номер

Короткий адрес: https://sciup.org/143178615

IDR: 143178615

Текст научной статьи Единый реестр населения как источник данных для проведения социально-демографического анализа

Международный опыт показывает, что постоянное обновление данных реестра населения формирует условия для создания стандарта демографических данных. Открытые, прозрачные и не прошедшие цензуру демографические данные необходимы для построения современной системы демографических данных: их прозрачность помогает оценить успех стратегий и программ, принятых правительствами, системы демографических данных лучше организованы в странах-лидерах по индексу человеческого развития, эти данные позволяют децентрализованно решать многие социально-экономические проблемы.

Система регистрации населения — это один из механизмов непрерывной регистрации, обеспечивающий выявление актуальной информации о численности населения и характеристиках каждой личности за выбранный период времени. Такой подход позволяет осуществлять в любой стране наиболее полный и своевременный сбор данных о населении. Во многих развитых странах, таких как Нидерланды, Дания, Финляндия, Исландия, Норвегия, Швеция, Бельгия, в течение десятилетий в подобных реестрах проводились обновления данных. Например, система регистрации населения используется в Бельгии с 1846 г., а в Нидерландах с 1850 г. [1; 2]. Кроме того, технологические инновации и преимущества при использовании реестра населения с целью административного управления и предоставления услуг повысили интерес к дальнейшему развитию существующих или созданию новых реестров [3; 4].

В то же время растущий спрос на своевременные и неагрегированные данные привел к созданию в качестве источника статистических данных реестра населения [3–7]. В частности, пандемия COVID-19 выдвинула на первый план важность увеличения числа источников данных, включая использование административных данных, таких как элек- тронные реестры, расширения применения к ним статистических методов для эффективного проведения демографических исследований [8; 9]. Например, невозможно точно и своевременно рассчитать уровень смертности и сделать прогнозы, не зная точно, подвержено ли население вирусу. Наличие в стране электронной системы медицинской демографии для принятия профилактических мер поможет охватить все медицинские учреждения и подавляющее большинство населения.

В большинстве случаев реестры населения создаются для поддержки процессов и услуг электронного правительства, а не для статистических целей, поэтому для создания надежного источника информации необходим определенный процесс преобразования, включая тщательную проверку, очистку и редактирование данных. В результате могут потребоваться компромиссы для обеспечения полного использования источника данных. Использование данных единого реестра в качестве источника имеет такие преимущества, как снижение затрат, своевременное обновление данных, гибкое принятие решений, управление потоками данных, получение точных статистических данных, анализ отдельных данных на основе PIN-кода и многое другое.

Расширение технологических возможностей увеличивает интерес к более широкому использованию данных реестра. Однако эта тенденция может привести к несанкционированному вмешательству в данные реестра, а также к неправильному использованию данных. Это создаёт потенциальные риски для безопасности личных данных и требует дополнительных мер предосторожности. В статье исследуется роль реестров населения как важнейшего источника получения данных о населении. Изучаются возможности использования реестров населения для получения статистических данных и проведения демографических исследований.

Реестр населения как источник данных для демографических исследований

Cбором, управлением и хранением данных при изучении социально-экономического положения населения, проведением переписей и ведением административных записей традиционно занимались государственные учреждения. Использование индивидуальных регистрационных данных в демографических исследованиях, а также увеличение индивидуальных данных переписей и их координация с данными других реестров способствовали повышению эффективности деятельности лиц, принимающих решения [8; 10]. Развитие электронного правительства обеспечивает замену традиционного процесса переписи интеллектуальной системой, основанной на больших объемах данных, собранных в государственных реестрах. Такая система имеет большое значение для управления демографическими процессами, принятия решений и прогнозирования. Для управления демографическими процессами в первую очередь важно создать платформу электронной демографии с использованием современных информационных технологий. Создание национальной демографической системы поможет анализировать демографические процессы и на основании проведенного анализа осуществлять деятельность, направленную на обеспечение здоровья населения, улучшение условий жизни, укрепление семьи, решение миграционных вопросов, развитие человеческого и научного потенциала.

Для прогнозирования демографических процессов обычно используются подходы, основанные на моделировании [11]. Электронная демография также основана на моделировании отношений между конкретными группами населения и на построении связей с эмпирическими данными, полученными из социальных сетей [8; 12; 13]. Использование моделирования демографических процессов может облегчить процесс генерации различных сценариев и помочь преодолеть огра- ничения, которые могут возникнуть при получении некоторых данных. С помощью моделирования также можно изучать влияние различных сценариев на поведение человека или определенных групп. Политика реализации электронной демографии рассматривается как неотъемлемая часть системы электронного правительства и требует разработки и других систем и реестров для оценки существующей демографической ситуации и анализа демографических процессов [12; 13]. В статье [4] показано, какие задачи решает электронная демографическая система. Основными задачами электронной демографической системы являются удовлетворение потребностей населения и оптимальное использование человеческих ресурсов.

Для эффективного использования единого реестра личный идентификационный номер (Personal Identification Number, PIN) должен быть присвоен при рождении. В настоящее время около 70 стран присваивают PIN-код гражданину или резиденту страны на любом этапе жизни1. В прошлом уникальные номера часто указывали на пол человека, дату рождения, место рождения или адрес проживания [3]. Согласно отчету ООН о народонаселении в странах Северной Европы PIN-коды применялись почти во всех реестрах, используемых для стати-стики2. Современные технологии позволяют в короткие сроки связать все существующие государственные реестры, используя только PIN-коды. В отчёте также было отмечено, что одной из причин успешного применения административных реестров в Северной Европы, является небольшое, компактное и однородное население стран. В крупных странах со- здание административных реестров государственного уровня представляется более проблематичным из-за технических и организационных ограничений. В настоящее время успешно внедренные в странах платформы электронного правительства имеют широкий спектр возможностей и инструментов для интеграции разных реестров [14].

Одним из основных факторов, делающих возможным проводить статистический анализ с использованием данных, собранных в государственных реестрах, является наличие единой системы идентификации (единого номера) для разных источников и ресурсов. В отсутствие единой системы идентификации очень сложно согласовывать и интегрировать разные реестры. Минимальным требованием на индивидуальном уровне для базовых реестров является наличие единого идентификационного номера. В различных реестрах на основании PIN-кода он анализируется и таким образом создаётся виртуальное «облако» каждого гражданина. Разные «облака» можно объединять по разным критериям (образование, медицина и другие). Реестры представляют собой базы больших данных, а PIN-код позволяет связывать большое количество данных и определять отношения между ними.

В последних исследованиях изучалось использование данных, собранных в реестрах населения, в качестве нового источника информации для демографических исследований [3-6]. Для ведения демографической статистики национальные статистические управления реализовали ряд инициатив по трансферу демографических данных из реестров населения [2; 3; 15]. Использование данных реестра населения в статистических исследованиях очень важно не только с точки зрения традиционной оценки численности населения и социально-демографической структуры, а также для анализа изменений численности населения и его отдельных показателей в динамике. Реестр населения основан на обмене между интегрированны- ми базами данных как агрегированными, так и индивидуальными данными3. В реестре актов гражданского состояния собираются данные о регистрации рождений и смертей, регистрации браков и расторжении браков, регистрации смены имени, отчества, фамилии и так далее. С помощью PIN-кода реестр населения связывает реестр актов гражданского состояния с данными различных административных реестров (например, социального обеспечения, налогов, образования) [4]. В табл. 1 представлена структура реестров населения трех стран — России, Азербайджана и Эстонии.

Таким образом, реестр населения, в который включены данные о рождении, смерти, браке, разводе, смене адреса, смене имени, гражданства, миграции и другие, постоянно обновляется и позволяет правительству хранить обновленную и надежную информацию для выполнения некоторых административных функций, связанных с налогами, голосованием, миграцией населения. Реестр населения имеет много преимуществ, позволяя осуществлять экономичный и эффективный обмен информацией между базами данных, принадлежащих различным государственным учреждениям, на основе PIN-кода. Эффективное функционирование реестра населения позволяет отдельным лицам более легко пользоваться услугами, сохраняя при этом личную безопасность, поскольку интеграция реестра населения с другими реестрами основана на связывании ограниченных данных каждой личности в каждом реестре.

Анализ демографических данных на основе единого реестра населения

В данном исследовании в качестве эксперимента проводился анализ демографических характеристик в контексте пандемии COVID-19 на основе данных отдельных

Таблица 1

Структура реестров населения

Table 1

Structure of population registers

Структура единого реестра населения России

Структура Государственного реестра населения Азербайджана

Структура реестра населения Эстонии

Фамилия, имя, отчество

Личный идентификационный номер

Личный идентификационный номер

Дата и место рождения

Фамилия (предыдущие фамилии) и имя

Имя и фамилия

Пол, гражданство

Отчество

Дата и место рождения

Семейное положение, личность супруга(и)

Дата и место рождения

Пол, гражданство

Записи о военной службе

Пол, гражданство

Регистрационная информация

Информация о регистрации в системе пенсионного, медицинского и социального страхования

Семейное положение, супруг(а), родители, дети, дата смерти

Контакты (почтовый адрес, телефон, электронная почта)

Регистрация в службе занятости

Отношение к военной службе

Дата и место смерти (причина смерти)

Записи в единой системе идентификации и аутентификации

Регистрационная информация

Семейное положение, супруг(а), родители, дети

Информация об образовании

Информация в удостоверении личности

Право на опеку

Ученая степень и звание

Биометрические данные человека старше 16 лет

Этническая принадлежность, родной язык

Источники: [1–3]; Федеральный закон от 8 июня 2020 г. № 168-ФЗ «О едином федеральном информационном регистре, содержащем сведения о населении Российской Федерации»; Указ Президента Азербайджанской Республики от 14 октября 2004 года об утверждении «Положения о порядке ведения Государственного реестра населения Азербайджанской Республики»; А. Rivera, A. Milena, К. Vassil. Estonia: A Successfully Integrated Population-Registration and Identity Management System // The World Bank Group, 2015: [сайт].— URL: https://openknowledge.worldbank. org/handle/10986/28077 (дата обращения: 23.12.2021).

лиц, интегрированных в единый реестр. Демографические показатели, представленные в исследовании являются гипотетическими. Анализ проводился с помощью языка программирования Python в среде Jupyter Notebook 6.1.4.

Предположим, что персональная информация хранится в двух отдельных реестрах (реестр населения и реестр здоровья). Был взят набор из 1000 персональных данных, которые были объединены в единый реестр. Каждый человек в этом наборе данных имеет личный идентификационный номер, пол, возраст, должность, количество членов семьи, национальность, хронические заболевания, включая диабет, бронхиальную астму, инфекцию COVID-19, смерть и выздоровление от COVID-19. В табл. 2 в качестве приме- ра представлены личные данные населения. Персональная информация о человеке представлена в 6 показателях. В табл. 3 показаны данные о состоянии здоровья населения. Здесь даны 7 показателей по информации о здоровье населения.

В табл. 4 оба набора данных объединены с использованием PIN-кода. Здесь с помощью PIN-кода можно одновременно получить как личную информацию, так и информацию о здоровье каждого человека.

Далее на представленных рисунках согласно выше указанным данным выведены следующие диаграммы. На рис. 1 показано распределение данных о выздоровлении и смерти лиц, инфицированных COVID-19, по полу. На рис. 2 показано распределение лиц, инфицированных COVID-19, по сферам деятельности.

Таблица 2

Персональные данные

Table 2

Personal data

PIN

Пол

Возраст

Профессия или сфера деятельности

Семья (количество человек)

Национальность

100213

муж

59

инженер

1

азербайджанцы

100214

жен

56

здравоохранение

4

талыши

100215

жен

41

маркетинг

1

азербайджанцы

100216

жен

55

врач

2

русские

100217

муж

54

маркетинг

4

лезгины

Источник: составлено авторами.

Таблица 3

Данные о здоровье населения

Table 3

Health data

PIN

Хроническое заболевание

Диабет

Бронхиальная астма

COVID подтверждён

COVID смерть

COVID выздоровел

100213

да

нет

нет

да

нет

да

100214

нет

нет

нет

да

да

нет

100215

да

нет

нет

нет

нет

нет

100216

да

нет

нет

да

да

нет

100217

нет

нет

нет

нет

да

нет

Источник: составлено авторами.

Таблица 4

Информация о населении

Table 4

Information about the population

Показатель

PIN

100213

100214

100215

100216

100217

Пол

муж

жен

жен

жен

муж

Возраст

59

56

41

55

54

Профессия

инженер

здравоохранение

маркетинг

врач

маркетинг

Семья

1

4

1

2

4

Национальность

азербайджанцы

талыши

азербайджанцы

русские

лезгины

Хроническое заболевание

да

нет

да

да

нет

Диабет

нет

нет

нет

нет

нет

Бронхиальная астма

нет

нет

нет

нет

нет

COVID подтверждён

да

да

нет

да

да

COVID смерть

нет

да

нет

да

да

COVID выздоровел

да

нет

нет

нет

нет

Источник: составлено авторами.

I I Мужчина 1=1 Женщина

Рис. 1. Распределение лиц, инфицированных COVID-19 и выздоровевших, по полу, человек

Fig. 1. Distribution of person infected with COVID-19 and recovered by gender, persons Источник: составлено авторами.

Рис. 2. Распределение лиц, инфицированных COVID-19 и выздоровевших, по сферам деятельности, человек

Fig. 2. Distribution of person infected with COVID-19 and recovered by field of activity, persons Источник: составлено авторами.

Рис. 3. Распределение лиц, скончавшихся от COVID-19, по возрасту, человек

Fig. 3. Distribution of person who died from COVID-19 by age, people Источник: составлено авторами.

Рис. 4. Распределение лиц, не инфицированных COVID-19, по полу и возрасту, человек

Fig. 4. Distribution of person not infected with COVID-19 by gender and age, persons Источник: составлено авторами.

На рис. 5 анализируется наличие хронических заболеваний среди людей, выздоровевших и скончавшихся от COVID-19.

Рис. 5. Распределение хронических заболеваний среди выздоровевших и скончавшихся от COVID-19, человек

Fig. 5. Distribution of chronic diseases among those who recovered and died from COVID-19, persons Источник: составлено авторами.

Есть хроническое заболевание Нет хронического заболеваня

* * *

Таким образом, можно сделать вывод, что создание и обновление реестра населения, увеличение количества доступных статистических показателей требует интеграции различных источников данных (реестров). Это означает создание единого интегрированного реестра — системы электронной демографии на основе реестра населения. Интеграция данных (сбор данных из различных источников в единую базу данных) предоставляет широкие возможности для более детальной обработки данных и проведения статистического анализа большего количества данных в динамике за длительный отрезок времени.

Реестры населения открывают новые возможности для углубленных демографических исследований. Управление демографическими процессами, изучение демографического поведения, создание единой системы на основе реестра населения для демографических исследований являются одними из актуальных вопросов. В статье исследован существующий

международный опыт в области создания системы реестра населения. Также проанализировано современное состояние исследований в области создания единого реестра населения. Кроме того, в статье на основе гипотетических данных отдельных лиц, интегрированных в единый реестр, показана возможность анализа демографических характеристик (в частности, были объединены данные персональные и о здоровье).

Пандемия COVID-19 ещё раз подчеркнула важность расширения статистических методов и источников данных для демографических исследований, включая использование административных данных, таких как электронные реестры. Наличие в стране электронной системы медицинской демографии поможет охватить все медицинские учреждения и подавляющее большинство населения для принятия профилактических мер для борьбы с возможными заболеваниями. Будущие исследования будут сосредоточены на более широком социально-демографическом анализе в различных областях и интеллектуальном анализе данных.

Список литературы Единый реестр населения как источник данных для проведения социально-демографического анализа

  • Gutmann, M. New Sources for Social and Demographic History: The Belgian Population Registers / M. Gutmann, E. Van de Walle // Social Science History. - 1978.- No. 2(2).- P. 121-143. DOI: 10.1017/ S0145553200022367 (дата обращения: 23.12.2021).
  • Prins, K. Population register data, basis for the Netherlands Population Statistics / К. Prins // Statistics Netherlands, Hague. — 2017: [сайт].—URL: www.cbs.nl/-/media/_pdf/2017/38/population-registerdata.pdf (дата обращения: 23.12.2021).
  • Poulain, M. Central population registers as a source of demographic statistics in Europe / М. Poulain, А. Herm // Population.— 2013.—Vol. 68(2) — P. 183-212. DOI: 10.3917/popu.1302.0215.
  • Алгулиев, Р.М. Формирование электронной демографии как эффективного инструмента социальных исследований и мониторинга данных о населении / Р. М. Алгулиев, Р. М. Алыгулиев, Ф. Ф. Юсифов, И. Я Алекперова // Вопросы государственного и муниципального управления.— 2019.— № 4. — С. 61-86.
  • Nabibayova, G. Decision Support System in Electronic Demography. / G. Nabibayova // CEUR Workshop Proceedings. UkrPROG2020, 12th International Conference of Programming. Kyiv, Ukraine: [сайт].—URL: http://ceur-ws.org/Vol-2866/ceur_228-236_nabibayova.pdf. (дата обращения: 10.12.2021).
  • Yusifov, F. Using Public Registers for Development of Electronic Demography System: The Case of Azerbaijan / F. Yusifov // International Journal of Computing and Digital Systems. — 2021.—Iss. 1.— P. 1251-1261.
  • Billari, F. Big data and population processes: a revolution? / F. Billari, E. Zagheni // Petrucci A., Verde R. (eds.) Statistics and Data Science: new challenges, new generations. Proceedings of the Conference of the Italian Statistical Society (28-30 June 2017, Florencey). — Florencey : Firenze University Press, 2017.—Р. 167-178.
  • Population Registers: A Key Resource for Producing Vital Statistics // UN ESCAP Statistics Division. — 2020. — No. 26.— 12 p.
  • Alguliyev, R. Graph Modelling for Tracking the COVID-19 Pandemic Spread / R. Alguliyev, R. Aliguliyev, F. Yusifov // Infectious disease modelling.— 2021.—Vol. 6. — P. 112-122.
  • Lyngstad, T.H. Nordic register data and their untapped potential for criminological knowledge / T. H. Lyngstad, Т. Skardhamar // Crime and Justice.— 2011.—Vol. 40(1). — Р. 613-645.
  • Courgeau, В. Model-Based Demography: Towards a Research Agenda / В. Courgeau, J. Bijak, R. Franck, Е. Silverman // Agent-Based Modelling in Population Studies.— 2016.—Vol. 48. — Р. 2951.
  • Henderson, J. V. Measuring economic growth from outer space / J. V. Henderson, А. Storeygard, D. N. Weil // The American Economic Review.— 2012.—Vol. 102. — No. 2. — P. 994-1028.
  • Weber, I. Digital Demography / I. Weber, B. State // Prosessing of the International World Wide Web Conference Committee (IW3C2, 3-7 April 2017, Perth, Australia). — Perth, 2017. — Р. 935-939.
  • Чудиновских, О. Большие данные и статистика миграции / О. Чудиновских // Вопросы статистики.— 2018. — Т. 25.— № 2. — С. 48-56.
  • Careja, R. Using Population Registers for Migration and Integration Research: Examples from Denmark and Sweden / R. Careja, Р. Bevelander // Comparative Migration Studies. — 2018. Vol. 6.— No. 1. — P. 6-19.
Еще
Статья научная