Анализ данных в финансовых организациях: роль ИИ
#507877_300_d#
#507876_300_d#
В статье, опубликованной в прошлом номере журнала «Бюджет», мы рассказали об эволюции архитектуры обработки данных. Во второй части материала мы подробнее поговорим о моделях ИИ, используемых в Федеральном казначействе, а также о переходе к мультиагентным системам.
Александр Сергеевич Албычев, заместитель руководителя Федерального казначейства
Александр Александрович Червяков, начальник Управления развития информационных систем Федерального казначейства
Ольга Леонтьевна Яблонская, руководитель Межрегионального управления Федерального казначейства по централизованной обработке данных
Практика внедрения моделей ИИ в Федеральном казначействе
Модели ИИ, внедренные и внедряемые в настоящее время в Федеральном казначействе, представлены на всех этапах ключевых сквозных бизнес-процессов обработки платежей, управления ликвидностью, аналитики и поддержки принятия решений при управлении национальными проектами.
Модель распознавания договоров и спецификаций, а также модель построения цепочек кооперации
Базовые модели этапов «первичная обработка входящей „информации“» и «получение „данных“ из „информации“». Они используют технологии оптического распознавания символов (Optical Character Recognition, OCR) и распознавания именованных сущностей (Named Entity Recognition, NER) соответственно.
Эти модели применяются сразу для нескольких бизнес-процессов. Например, для обеспечения автоматизированного выявления рисков завышения цен государственных контрактов, а также контрактов, заключенных в целях исполнения указанных государственных контрактов. Большая часть документации поступает в сканированном виде, и контролерам приходится анализировать огромные массивы информации. Требуется большое количество человеческих ресурсов, зачастую имеющих соответствующую квалификацию.
Разрабатываемая система анализа контрактов на базе этих двух моделей в ближайшей перспективе позволит на базе первичных документов учета проводить анализ на предмет выявления фактов завышения цен. Мы ожидаем, что сроки анализа контрактов сократятся вдвое.
Антифрод-система
Также представляет собой базовую функциональность, которая ставится в разрыв транзакционных процессов финансовых организаций. Антифрод-система анализирует транзакции, действия пользователей и другую информацию в режиме реального времени, используя правила, фильтры и технологии машинного обучения для выявления подозрительных признаков. В Федеральном казначействе служит для осуществления функции по противодействию легализации (отмыванию) доходов, полученных преступным путем, финансированию терроризма и финансированию распространения оружия массового уничтожения.
Модель автосанкционирования платежей
В установленных случаях операции на лицевых счетах, открытых участникам казначейского сопровождения, осуществляются казначейством только после проведения проверки на предмет соответствия фактически поставленных товаров (выполненных работ, оказанных услуг) данным раздельного учета. А именно, справке о стоимости выполненных работ и затрат, проектной и рабочей документации, положительному заключению государственной экспертизы, исполнительной документации на выполненный объем работ, иным документам, подтверждающим фактическое выполнение работ (в том числе с фото- и видеоматериалами).
Большая часть документации поступает в сканированном виде, и казначеи вынуждены анализировать массивы разноформатной документации. Чтобы сократить эти трудозатраты, в настоящее время разрабатывается система анализа документации, предоставляемой при расширенном казначейском сопровождении. Она включает анализ соответствия работ, анализ нормативов прибыли, анализ фактически выполненных работ. Помимо большой языковой модели (LLM), также будут использованы инструменты OCR и NER.
#507858_300_d#
Модель прогнозирования рисков отзыва
В конце года образуются невостребованные остатки средств на счетах главных распорядителей, распорядителей и получателей бюджетных средств. Происходит это вследствие ограниченных возможностей по внедрению методов раннего выявления невостребованных остатков, которые не будут использованы до конца текущего года. В результате на счетах находятся временно свободные средства, к которым не применяются инструменты управления ликвидностью.
Для повышения эффективности использования бюджетных средств федерального бюджета, бюджетов субъектов Российской Федерации, а также муниципальных образований необходим прогноз невостребованных остатков на каждый момент времени года. Модель прогнозирования рисков отзыва, внедряемая в Федеральном казначействе, относится к моделям, извлекающим «знания» из «данных».
Модель прогнозирования ликвидности
Одной из важных задач Федерального казначейства является таргетирование остатка денежных средств на ЕКС и управление остатками. Здесь под таргетированием понимается совокупность мероприятий по управлению размером ежедневного сальдо. Все свободные остатки инвестируются в различные финансовые инструменты.
Таким образом, для поддержки процессов управления на федеральном уровне необходимо решение актуальной задачи разработки информационно-аналитического обеспечения (ИАО), основанного на моделях процессов, позволяющих осуществлять прогнозирование группы рядов в форме достоверных интервальных оценок. Модель прогнозирования ликвидности — это также модель, извлекающая «знания» из «данных».
Модель прогноза рисков неисполнения мероприятий национальных проектов
Данная модель собрана с учетом кросс-системных данных, имеющихся в централизованном хранилище данных (DWH).
Более 20% контрольных точек нацпроектов выполняются с опозданием. Соответственно, были разработаны предупредительные индикаторы риска просрочки контрольных точек. Непосредственная связка выявленного риска и предлагаемой для назначения пользователю меры реагирования в автоматическом режиме базируется на причинах формирования риска, выявленных негативных фактах, вероятности наступления негативного последствия и признаках эффективности данной меры (на основе ретроспективных данных).
Таким образом, система инцидент-менеджмента реагирует на потенциальные риски до их реализации. Как следствие, обеспечена ритмичность и прогнозируемость расходования бюджетных средств. 100% контрольных точек анализируются с помощью искусственного интеллекта для прогнозирования рисков их неисполнения. С момента внедрения системы количество инцидентов несвоевременного закрытия контрольных точек проектов сократилось на 40%.
Модель поиска связи показателей и мероприятий национальных проектов
Данная модель собрана с применением LLM. Мероприятия национальных проектов — ключевой структурный элемент, достижение результатов которых ведет к достижению показателей национальных целей (НЦР). Однако запланированные значения параметров проектов снижаются к концу проекта, не всегда полно определены связи мероприятий и показатели национальных целей, что в совокупности не гарантирует достижение значений НЦР.
Требовалось выявить влияние изменений в проектах на показатели национальных целей развития России, а также определить эффективность изменений параметров проектов, влияющих на показатели НЦР. Руководству аппарата Правительства РФ необходима оперативная информация о степени влияния данных изменений на достижение национальных целей России. Также важно определить все связи между мероприятиями проектов и показателями национальных целей России. Кроме того, как и в предыдущей модели, необходимо было обеспечить ритмичность и прогнозируемость расходования бюджетных средств.
На текущий момент 100% параметров национальных проектов и государственных программ (мероприятий и показателей) анализируются с помощью искусственного интеллекта для поиска дополнительных связей с показателями национальных целей. На ручное сравнение всех возможных пар показателей и мероприятий потребовалось бы 38 экспертов из 19 предметных областей, которым пришлось бы проанализировать два миллиона потенциальных связей: это заняло бы более четырех лет. Разработанная на базе LLM с применением RAG (Retrieval Augmented Generation) ИИ-модель перебирает тысячу связей за минуту, то есть тратит на полный логический анализ экспертного уровня всех взаимосвязей показателей и мероприятий около 33 часов.
Голосовой помощник навигации и поиска информации на дашбордах и AI-ассистент на базе LLM-моделей
Две эти модели реализуют интерактивное общение со «знаниями» ФК.
Первая модель — это интеллектуальная система для управления 3D-витринами в Координационном центре Правительства РФ. Голосовой помощник активирует действия на 3D-витрине через голосовые команды с микрофонов аудитории. Команды подаются на естественном языке, с использованием синонимов. Команду может подать любой участник рабочей группы, активировавший микрофон и обратившийся к помощнику. При этом названия проектов, объектов для поиска вводятся голосом, в том числе частями.
#507859_300_d#
Вторая модель — AI-ассистент для клиентов и сотрудников ФК. Сотрудникам операционного отдела и отдела расходов, а также иных отделов ФК, сотрудникам 1-й и 2-й линий сопровождения ИТ-систем необходимо оперативное получение информации по нормативно-правовому регулированию, работе ИТ-систем, а также помощь при санкционировании платежей. Для поиска ответов на текущие вопросы зачастую требуется серьезная аналитическая работа с НПА, технологическими регламентами, инструкциями. Кроме того, базы знаний для погружения в материал новых сотрудников хотя и структурированы, но из-за сложности и узкой специализации финансовых процессов дополнительно требуют систему навигации и систему FAQ.
Положительные эффекты от внедрения модели — сокращение времени и трудозатрат на поиск оперативных ответов на вопросы по бюджетному процессу, разгрузка 1-й и 2-й линий сопровождения, повышение прозрачности работы с базами НПА, техрегламентов и инструкций. Доля обращений, обрабатываемых без участия сотрудника контактного центра, в 2025–2026 годах будет увеличена с 10 до 50%, а время обработки обращений будет сокращено на 20% (с 2,5 минуты до двух минут на одно обращение).
Мультиагентный подход агрегации моделей
В условиях наличия множества моделей, применяемых на различных этапах анализа данных в организации, становится очевидной необходимость их систематизации и интеграции. Разнообразие моделей, используемых на разных уровнях зрелости организации, требует создания единой архитектуры, способной объединить их функциональность и обеспечить согласованную работу. Переход к мультиагентным системам позволяет эффективно агрегировать модели, обеспечивая их взаимодействие и повышая общую результативность процессов анализа данных. Первая мультиагентная система (МАС), внедряемая в Федеральном казначействе, разработана для комплексного анализа мероприятий национальных проектов и демонстрирует перспективность данного подхода.
Мультиагентная система представляет собой архитектуру, в которой множество автономных агентов взаимодействуют друг с другом для достижения общей цели. Каждый агент в такой системе выполняет специализированные функции, обрабатывая данные или выполняя задачи, соответствующие определенным этапам анализа. Агенты могут быть представлены как отдельные модели, алгоритмы или программные модули, которые обмениваются информацией и координируют свои действия в рамках единой системы.
В контексте анализа мероприятий национальных проектов мультиагентный подход позволяет объединить модели, отвечающие за разные аспекты анализа — от прогнозирования и оценки эффективности до мониторинга и оптимизации процессов. Такая архитектура обеспечивает гибкость, масштабируемость и возможность адаптации к изменяющимся условиям.
Преимущества мультиагентного подхода
1. Модульность и масштабируемость. Мультиагентные системы позволяют легко интегрировать новые модели или модифицировать существующие без необходимости полной перестройки архитектуры. Это особенно важно для организаций, находящихся на разных уровнях зрелости, где новые модели могут добавляться по мере роста компетенций.
2. Децентрализованное управление. Каждый агент работает автономно, что снижает нагрузку на центральную систему управления и минимизирует риски сбоев. Это обеспечивает устойчивость системы даже при сбоях отдельных компонентов.
3. Гибкость и адаптивность. Агенты могут динамически адаптироваться к изменениям данных или внешних условий, что позволяет оперативно реагировать на новые требования или вызовы.
4. Эффективное взаимодействие моделей. МАС обеспечивает согласованную работу различных моделей, позволяя им обмениваться данными и результатами. Это улучшает качество анализа, так как данные, обработанные одной моделью, могут быть использованы другой для уточнения прогнозов или рекомендаций.
5. Повышение точности и надежности. Благодаря распределенной обработке и возможности кросс-валидации между агентами мультиагентные системы способны минимизировать ошибки и повышать достоверность результатов.
6. Оптимизация ресурсов. МАС позволяет распределять вычислительные задачи между агентами, что оптимизирует использование ресурсов и сокращает время обработки данных.
Первый разработанный агент — агент для поиска связей между мероприятиями и показателями национальных целей — работает на базе LLM и использует RAG для хранения методик расчета показателей в целях более точного поиска связей. Второй агент — агент для прогноза задержек реализации мероприятий по историческим данным.
В разработке находится еще два новых агента. Во-первых, это агент, анализирующий внешний новостной фон из интернета и учитывающий риски при реализации мероприятий — например, наводнения и другие стихийные бедствия. Во-вторых, это перспективный агент, ищущий связи и зависимости между разными мероприятиями проектов. Например, он может определить, что мероприятия развития квантовых сетей окажутся в зоне риска, если будут задержки в реализации мероприятий по развитию квантовых вычислений.
Мультиагентный подход к агрегации моделей предоставляет организациям мощный инструмент для интеграции и координации множества аналитических моделей. Мультиагентная система, созданная для комплексного анализа мероприятий национальных проектов, подтверждает эффективность этой архитектуры. Разработанная в Федеральном казначействе система анализирует Единый план развития Российской Федерации. Агенты ищут скрытые связи между целями и мероприятиями национальных проектов, выявляют ключевые мероприятия, риски реализации мероприятий, предлагают новые мероприятия, помогающие достигнуть целей.
Преимущества МАС, такие как модульность, адаптивность и децентрализованное управление, делают ее оптимальным решением для организаций, стремящихся к повышению зрелости процессов анализа данных. Конечно, мультиагентный подход нельзя назвать единственным вариантом эволюции архитектурных подходов в финансовых организациях, активно внедряющих ИИ-модели в свои бизнес-процессы. Скорее, на текущий момент это одно из видений развития архитектур. Многие предпринимают попытки создания таких систем, но они по большей части существуют в виде тестовых примеров и далеки от промышленного внедрения.
Однако данный подход хорошо справляется с задачами комплексного анализа сложных объектов управления. Помимо описанной выше мультиагентной системы анализа мероприятий, перспективными направлениями разработки являются мультиагентные системы комплексного санкционирования платежей, мониторинга рисков и эффективности субсидий, а также мультиагентные системы, реализующие новейшие методы — анализ, наблюдение и контроль в финансово-бюджетной сфере.