Анализ судебных решений с помощью больших языковых моделей

Автор: Сердюк Ю.П., Власова Н.А., Момот С.Р., Сулейманова Е.А.

Журнал: Программные системы: теория и приложения @programmnye-sistemy

Рубрика: Искусственный интеллект и машинное обучение

Статья в выпуске: 1 (70) т.17, 2026 года.

Бесплатный доступ

В статье рассматривается использование больших языковых моделей последнего поколения (таких как ChatGPT, Grok, DeepSeek, GigaChat, YandexGPT) для анализа судебных решений. В анализе использовались дела гражданской, административной и уголовной категорий. Составлен датасет текстов судебных решений, взятых из базы судебных и нормативных актов РФ, с официального портала судов общей юрисдикции г. Москвы, с сайта Российского агентства правовой и судебной информации. Предложено и реализовано несколько видов тестов больших моделей, сформулированы принципы выбора эталонных ответов, а также тексты запросов (промпты). Проверялись возможности больших моделей в прогнозировании апелляционных решений, квалификации преступных деяний, оценке решений нескольких видов инстанций по одному делу. Также проверялась способность моделей к вынесению собственных последовательных решений. Результаты тестирования показали, что точность прогнозирования судебных решений на реальных случаях с помощью больших языковых моделей лишь в отдельных случаях превышает 50%. Приведен обзор статей по использованию ИИ в юридической практике.

Еще

Большие языковые модели, БЯМ, судебные решения, датасет, промпт, ИИ в юриспруденции, LegalAI

Короткий адрес: https://sciup.org/143185569

IDR: 143185569   |   УДК: 004.89:343.15   |   DOI: 10.25209/2079-3316-2026-17-1-21-56

Legal judgement analysis using large language models

The article examines the use of the latest-generation large language models (LLMs) — such as ChatGPT, Grok, DeepSeek, GigaChat, and YandexGPT — for analyzing legal judgments. The analysis involved civil, administrative, and criminal cases. A dataset of legal judgments was compiled from the database of judicial and regulatory acts of the Russian Federation, the official portal of the Moscow courts of general jurisdiction, and the website of the Russian Agency for Legal and Judicial Information. Several types of large model tests were proposed and implemented, ground-truth selection principles were outlined, and queries (prompts) were formulated. The models were tested on their ability to predict appellate decisions, map crime descriptions to law articles, and evaluate decisions of multiple judicial authorities in a single case. The ability of the models to make their own consistent decisions was also examined. Testing showed that the correct prediction rate of LLMs on real-world juducial decisions rarely surpasses 50%. A brief overview of recent publications on the use of AI in legal practice is provided.

Еще