119602, г. Москва, Муниципальный округ Тропарёво-Никулино, ул. Тропарёвская, д. 4, стр. 1, помещение 6А/2

Главная
→
Исследования
→
Мониторинг и анализ нормативно-правовых актов с помощью ИИ

Изменения в законах — в одном дашборде: ИИ‑анализ НПА 24/7

Мониторинг и анализ нормативно-правовых актов с помощью ИИ

Общая информация

Корпоративная группа, занимающаяся производством и передачей электрической и тепловой энергии, горячим водоснабжением и водоотведением, должна постоянно отслеживать изменения в нормативно‑правовой базе (НПА). В функциональных требованиях проекта указывается, что сегодня процесс мониторинга и анализа выполняется вручную: специалисты регулярно просматривают федеральные порталы (regulation.gov.ru, publication.pravo.gov.ru), сайты ФОИВ (ФАС, Минэнерго, Минстрой, Минэкономразвития), площадки досудебных и судебных разногласий и скачивают тексты НПА; затем они оценивают влияние каждого документа на деятельность компании, выделяют риски, готовят аналитическую справку в формате Word или PDF и передают её ответственным подразделениям.

Такой подход требует больших трудовых затрат и не гарантирует оперативной реакции на изменения. Подчёркивается, что целью проекта является автоматизация и оптимизация этих процессов: от поиска документов до формирования аналитической справки.

Поиск, сбор и предварительная обработка документов

Поиск и сбор документов

Задача: Регулярно получать новые нормативные акты и проекты изменений с официальных сайтов (портал проектов НПА, сайты министерств и судов) и сохранять их в хранилище с разбивкой по датам и темам.
Решение: Использовать web-скраперы (например, Scrapy, BeautifulSoup), которые ежедневно посещают ресурсы, скачивают новые документы (PDF, DOCX, HTML) и извлекают метаданные (название, дата, орган принятия), сохраняя их в репозитории.
Извлечение структурированных реквизитов

После получения текста выделите ключевые поля: реквизиты НПА (номер, дата, орган), область регулирования, статус и т.д., используя NER. В русскоязычной практике эффективны модели spaCy (ru_core_news_lg) или DeepPavlov NER, которые можно дообучить на примерах НПА. Дополняют NER регулярные выражения для поиска стандартных паттернов, таких как «Постановление № 1234-Р от 12.12.2025». Полученные сущности используются для индексации и поиска внутренних документов (подробнее в разделе «Интеграция с 1С»).
Распознавание и извлечение текста

НПА бывают в форматах PDF, DOCX и сканы. Перед анализом структурируем их.
PDF/DOCX: Используем pdfminer.six или python-docx для выделения текста.
Сканы: Применяем OCR. Для русскоязычных документов подходят Tesseract с lang='rus+eng' или PaddleOCR
Краулинг
Краулинг собирает сырой материал. Затем извлекаются текст и метаданные для индексации и поиска внутренних документов (см. раздел «Интеграция с 1С»).
Для устойчивости краулинга:
- Проверяем доступность источника и наличие новых номеров.
- Загружаем документы по дате и номеру, сохраняя их в структурированных папках.
- Для сложных порталов используем Selenium, Playwright или сервисы цифрового сбора данных

Классификация и категоризация документов

Задача. Определить, к какой тематике (электроэнергетика, теплоснабжение, водоснабжение) относится документ и насколько он актуален для компании.

Используемые модели. Лучшими результатами в юридической предметной области обладают языковые модели на базе трансформеров. Адаптация модели BERT под юридические тексты требует обработки длинных документов (до 1600 токенов) и предобучения на тематических корпусах; отсутствие такой адаптации приводит к падению качества. Необходимо специально обучать модель на юридических данных и применять техники разбиения текста на части, что улучшает точность классификации. LegalBERT и Longformer в свою очередь, предобученные на судебных решениях, дают прирост точности классификации по сравнению с обычным BERT и повышают показатели ROUGE при суммаризации.
Для русских НПА подойдёт RuBERT (разработан Сбером) или DeepPavlov/rubert-base-cased, дообученные на корпусе законодательных актов.

Алгоритм классификации

Преобразование текста

Текст документа преобразуется в вектор с помощью выбранной модели (BERT, LegalBERT, RuBERT)

Обучение классификатора

Поверх трансформера обучается классификатор (Linear/Softmax или SVM), который выдаёт вероятность принадлежности документу к определённой теме и типу (закон, приказ, постановление, проект)

Порог вероятности

Порог вероятности позволяет фильтровать не относящиеся документы.

Дообучение

Модель периодически дообучается на новых размеченных примерах, чтобы учитывать изменения в структуре нормативных актов

Суммаризация и аналитика

Задача. Составить краткое содержание документа и выделить ключевые положения, влияющие на деятельность компании, для включения в аналитическую справку.

Согласно исследованиям, юридические документы отличаются большим объёмом и сложной структурой, поэтому сравниваются различные методы суммаризации: от простых извлечений предложений (LexRank, PacSum) до современных трансформеров (BERTSUM, T5, Longformer). Эксперименты по суммаризации судебных дел показывают, что современные модели требуют приспособления к длинным входам.

В прикладном решении можно использовать два подхода: Наш путь к автоматизации не обошелся без препятствий, но каждая сложность дала толчок к эффективным решениям.

Извлекательная суммаризация

Выделяются наиболее информативные предложения с помощью алгоритмов TF‑IDF + SVM, TextRank или PacSum. Этот подход прост и легко интерпретируем: предложения, содержащие слова «вступает в силу», «тарифы», «обязан», «право», будут иметь высокий вес
Абстрактивная суммаризация

Генерируется новый текст, сохраняющий смысл, но сокращающий объём документа. Для длинных НПА подходят модели вроде LongformerEncoderDecoder (LED), PEGASUS или RuT5. Обучение производится на размеченной выборке: оригинальный документ и его ручной конспект. Практика показывает, что обучение на юридическом корпусе повышает показатели ROUGE.

Оценка влияния и рисков

Опытная эксплуатация доказала работоспособность и выявила точки роста.

Самая сложная часть – оценка того, как изменения в НПА повлияют на конкретные виды деятельности компании. Это требует предметной экспертизы, однако ИИ может помочь выделить потенциальные риски и сформировать черновик заключения.

Методы:

Классификация по уровню риска

Модель предсказывает категорию влияния НПА: «значительное», «умеренное», «несущественное». Используются алгоритмы логистической регрессии, Gradient Boosting и трансформеры для поиска предикторов риска
Извлечение отношений

С помощью техник relationship extraction и шаблонов автоматически определяются связи между актом и объектами (подразделениями, видами услуг), чтобы понять, какие подразделения затронуты.
LLM‑ассистент

Большие языковые модели (GPT‑5, Gemini 1.5 и др.) могут анализировать текст и отвечать на вопросы «Какие требования предъявляются к производителям электроэнергии?», «Описаны ли новые штрафы?»; они позволяют формировать пояснения на естественном языке.
Правила и экспертные системы

Для критичных ситуаций (например, изменение расчёта тарифов) создаются правила, генерирующие рекомендации: «принять меры по корректировке бюджета», «обновить договоры»

Автоматизированные уведомления и отчёты
После классификации и анализа система должна своевременно уведомлять ответственных сотрудников и хранить архив документов. Здесь полезны готовые решения для законодательного мониторинга. Современные инструменты конвертируют официальные документы в текст, используют семантический анализ для поиска изменений и формируют уведомления с выделением правок. Платформы также генерирует планы действий и чек‑листы, назначая ответственных и сроки исполнения, и поддерживает интеграцию с внутренними системами через REST‑API. Эти принципы можно перенести и на корпоративную систему: уведомления отправляются в мессенджер или по электронной почте, формируются задачи в Jira, а отчёты (Word, PDF) сохраняются в общем хранилище.

Интеграция с внутренними системами (1С и др.)

Для использования аналитических данных в операционной работе их нужно связать с конкретными объектами учёта (договоры, проекты, сканы). Интеграцию лучше строить через API:

Сервис поиска в 1С

По извлечённым реквизитам (номер, дата, орган) система ищет соответствующий документ в базе 1С (OData или HTTP‑сервисы). Если документ найден, к нему прикрепляется текст НПА и аналитическая справка
Передача уведомлений

Через REST‑API 1С можно создавать напоминания и задачи для сотрудников
Журналирование

Все операции фиксируются в журнале регистрации 1С, что обеспечивает прозрачность и ответственность

Заключение

Автоматизация мониторинга и анализа нормативно-правовых актов сокращает трудозатраты, снижает риски пропуска изменений и ускоряет реакцию компании. Решение использует искусственный интеллект.

Краулинг и извлечение

Автоматический сбор документов с официальных порталов
OCR и NER

Преобразование текстов и выделение реквизитов
Классификация трансформерами

Тематическая и типовая категоризация НПА, где предобученные на юридических корпусах модели (LegalBERT, RuBERT) дают значительное улучшение точности
Суммаризация

Подготовка кратких конспектов с использованием экстрактивных и абстрактивных моделей, учитывающих специфику длинных юридических документов
Оценка влияния

Применение моделей классификации рисков, LLM‑ассистентов и экспертных правил для определения потенциального воздействия акта на бизнес
Уведомления и интеграция

Формирование чек‑листов, планов действий и загрузка справок в корпоративные системы через API

Используя описанные инструменты, компания сможет выстроить непрерывный процесс мониторинга и реакции на изменения в законодательстве, сократив время обработки и минимизировав риски нарушения законодательства.

Ответственность до конца

Доводим систему до запуска и результата.

Мы управляем внедрением как проектом — с прогнозируемыми этапами, прозрачными процессами и гарантией результата.

Консультация

Почему компании выбирают Райс

Прозрачные процессы

Этапы и сроки понятны всем участникам.

Минимум рисков

Внедрение предсказуемое и под контролем.