Правовые и практические вопросы использования синтетических данных для целей государственного управления в России
Автор: Мартынов А.В., Ширеева Е.В.
Журнал: Вестник Пермского университета. Юридические науки @jurvestnik-psu
Рубрика: Публично-правовые (государственно-правовые) науки
Статья в выпуске: 4 (70), 2025 года.
Бесплатный доступ
Введение: данные становятся основным стратегическим ресурсом, без которого невозможен качественный переход к развитому генеративному искусственному интеллекту и совершенствование методов и подходов к работе с большими данными. Однако обеспечение доступа к большим объемам данных широкого круга пользователей сталкивается с рядом существенных и очень устойчивых правовых барьеров. Цель настоящего исследования – определить практическое значение публичных цифровых озер для создания синтетических данных, а также рассмотреть перспективы их использования для целей публичного управления. Методы: исследование базируется на совокупности общенаучных (анализ, синтез, индукция, дедукция), частнонаучных (статистический, социологический) и специальных методов познания (формально-юридический, сравнительно-правовой, метод правового моделирования). Результаты и выводы: ключевым вопросом становится определение прав в отношении данных (установление обладателя данных) и наличия в массивах данных чувствительной информации, общий доступ к которой, в силу ряда причин, невозможен и несет в себе существенные риски для государства, общества или личности. В рамках этой тенденции оптимальным решением видится формирование крупных массивов данных (озер данных), управляемых государством, а также распространение практики использования синтетических данных. Россия на пути к экономике данных активно формирует публичные озера данных, которые в потенциале могут стать основой для создания на их основе синтетических данных. С этой целью был проанализирован российский и зарубежный опыт правового регулирования в указанной сфере, выявлены и сформулированы практические и правовые проблемы применения цифровых озер для синтетических данных в целях публичного управления.
Синтетические данные; озеро данных; государственное управление; органы исполнительной власти; искусственный интеллект; правовое регулирование; генеративный искусственный интеллект; машинное обучение
Короткий адрес: https://sciup.org/147253719
IDR: 147253719 | УДК: 342 | DOI: 10.17072/1995-4190-2025-70-526-538
Legal and Practical Issues of Synthetic Data Use for Public Administration Purposes in Russia
Introduction: data are becoming the main strategic source, without which it is impossible to make a qualitative transition to advanced generative artificial intelligence and improve methods and approaches to big data processing. However, there are some significant and deep-rooted legal barriers on the way to providing access to large amounts of data for a wide range of users. Purpose: the study aims to substantiate the practical importance of public data lakes for creating synthetic data as well as to explore the prospects for their use for public administration purposes. Methods: the research is based on a combination of general scientific methods (analysis, synthesis, induction, deduction), special scientific methods (statistical, sociological), and specialized methods of cognition (formal legal, comparative legal methods, legal modeling). Results and conclusions: the key issues are the rights in relation to data (who owns the data) and the presence in datasets of sensitive information that, for a number of reasons, must not be openly shared and carries significant risks for the state, society, or the individual. What seems to be the most optimal solution is the formation of large arrays of data (data lakes) managed by the state as well as the spread of the practice of using synthetic data. On its way to a data economy, Russia is actively developing the practice of creation of public data lakes, which can potentially become the source for creating synthetic data. The paper analyzes Russian and foreign experience of legal regulation in this area, identifying practical and legal issues of the use of synthetic data for public administration purposes.