проректор по цифровой трансформации и информационной безопасности СПбГУ
Владимир Андреевич Старостенко
НЬЮСМЕЙКЕР
заместитель главного редактора по подготовке и выпуску изданий Издательства СПбГУ
Татьяна Игоревна
Селиванова
НЬЮСМЕЙКЕР
Кейсы
Специалисты СПбГУ разработали чат-бот сервиса анализа документов «Призма» для мессенджера МAX. Он создан в качестве дополнительного инструмента использования сервиса, который позволяет проверить научные статьи, диссертации и другие документы на наличие упоминаний объектов из реестров Министерства юстиции РФ. На это уйдет в среднем от нескольких секунд до одной минуты.
IT-специалисты СПбГУ усовершенствовали поиск по тексту
12.02.26
Программы и базы данных
IT
Для чего?
С помощью чат-бота пользователи мессенджера могут бесплатно проводить анализ документов и текстов на упоминания объектов из реестров Минюста РФ. Загружать на проверку можно файлы размером до 5 Мб в электронных форматах .txt, .docx, .pdf. Эффективность и качество анализа от формата не зависят.

Виртуальный помощник был создан за месяц и сейчас проходит пилотное тестирование на платформе мессенджера MAX. «Чат-боты для использования тех или иных сервисов — один из основных трендов в сфере развития коммуникационных систем. Работа ботов происходит в диалоговом режиме, что помогает человеку решить стоящую перед ним задачу без дополнительных усилий — не нужно тратить время на освоение интерфейса и принципы работы сервиса. Поэтому разработка бота для сервиса „Призма“ стала ответом на существующий на рынке запрос пользователей», — говорит Владимир Андреевич Старостенко, проректор по цифровой трансформации и информационной безопасности СПбГУ.

Еще одна причина — перевод корпоративных коммуникаций внутри вузов на национальный кросс-платформенный мессенджер МAX. «Поскольку он становится доминирующим, логичным является и перенос на данную платформу или разработка на ней сервисов для студентов, преподавателей и сотрудников образовательных учреждений», — объясняет Владимир Старостенко. Целевая аудитория бота, конечно, значительно шире и не ограничивается студентами и сотрудниками образовательных учреждений. Бот также может быть востребован журналистами и редакторами средств массовой информации, блогерами, которые обязаны маркировать упоминаемых в статьях физических и юридических лиц из реестров Минюста РФ.

Чат-ботом сервиса «Призма» на платформе МAX может воспользоваться любой человек. «Это хорошая возможность познакомить пользователей с возможностями „Призмы“, которые значительно шире. В отличие от бота, который осуществляет поиск только по реестрам, сервис можно настроить на поиск упоминаний по индивидуальным потребностям пользователя, — добавляет Владимир Старостенко. — У сервиса нет аналогов и конкурентов на рынке».
Вне конкуренции
Сервис «Призма» специалисты СПбГУ разработали в 2023 году. Инициатором тогда выступил коллектив Издательства СПбГУ. «Санкт-Петербургский государственный университет является учредителем и издателем трех десятков научных журналов. Большинство из них зарегистрировано в качестве средств массовой информации. Мы в издательстве внимательно следим за исполнением законодательства в отношении всех наших журналов, особенно в отношении зарегистрированных изданий, которые регулярно становятся объектами плановых проверок Роскомнадзора. Согласно законодательству об иностранных агентах, все упоминания о них должны быть обязательно промаркированы. Проверять все выпуски всех 30 журналов вручную — огромный труд, за автоматизацией которого мы и обратились к коллегам из УСИТ», — рассказывает Татьяна Игоревна Селиванова, заместитель главного редактора по подготовке и выпуску изданий Издательства СПбГУ.

Аналогов сервиса не было ни среди отечественных, ни среди зарубежных разработок. «Задачу решали с нуля», — подчеркивает Владимир Старостенко. Итогом работы стало создание программы, которая позволяет быстро проверять большие массивы текстов на наличие упоминаний из пяти реестров. Воспользоваться сервисом можно, оставив заявку на сайте.
Сервис осуществляет поиск упоминаний в следующих реестрах:
1.     Перечень иностранных и международных неправительственных организаций, деятельность которых признана нежелательной на территории Российской Федерации.
2.     Единый федеральный список организаций, в том числе иностранных и международных организаций, признанных в соответствии с законодательством Российской Федерации террористическими.
3.     Реестр незарегистрированных общественных объединений, выполняющих функции иностранного агента.
4.     Реестр иностранных агентов.
5.     Перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным федеральным законом от 25.07.2002 № 114-фз «О противодействии экстремистской деятельности».
Преимущества
Важным преимуществом разработки является гарантия актуальности проведенного анализа упоминаний. Сервис производит онлайн-обновление данных из реестров Минюста РФ. Еще одно достоинство — скорость. «Говоря о быстроте анализа, мы нисколько не преувеличиваем. Несколько секунд — столько в среднем требуется сервису на анализ текста», — отмечает Владимир Старостенко.

Способность программы обрабатывать большие массивы данных делает ее настоящей палочкой-выручалочкой. Особенно для крупных учреждений и групп компаний с масштабным документооборотом. «СПбГУ, будучи такой организацией, регулярно проводит аудит различного рода документации. Это хоть и ежедневные, но объемные задачи, требующие вовлечения большого количества ресурсов. „Призма“ позволяет решать такие рутинные, но высокоресурсные задачи быстро и — что важно — качественно. Так, например, совсем недавно с помощью „Призмы“ для одного из подразделений СПбГУ был проведен анализ 200 000 документов (рабочих программ дисциплин), состоящих из порядка трех миллионов страниц. Просто представьте, сколько было бы потрачено времени сначала на поиск, а потом на проверку выявленных упоминаний в ручном режиме. „Призма“ справилась с этим за два с половиной дня. Это почти 1000 страниц в минуту», — рассказывает Владимир Старостенко.
Слова разработчиков полностью подтверждают и пользователи. «Работа по проверке выпусков журналов ведется постоянно. Ежегодно в Издательстве СПбГУ выходит в свет более ста номеров журналов и несколько десятков новых книг. Все они обязательно проходят проверку через сервис „Призма“. Перед каждой отправкой в печать мы проводим последнюю проверку, чтобы удостовериться, что на дату выхода издания в свет все включенные в реестры лица и организации промаркированы. В издательском портфеле есть журналы политической тематики, в которых появление таких лиц особенно ожидаемо, — говорит Татьяна Селиванова. — Вычитка всего номера журнала заняла бы не один день, а поиск с использованием сервиса позволяет проверить текст за считанные минуты. После оформления результата проверки ответственному за это направление сотруднику издательства нужно еще некоторое время на анализ обнаруженных результатов, так как сервис ищет все слова из названия организации. Но и эта проверка занимает не более часа даже для по-настоящему крупных проектов».

Владимир Старостенко подчеркивает, что качество при работе с разными объемами текстов остается неизменно высоким. Сервис с одинаковой эффективностью анализирует как одностраничный документ, так и многостраничные книги или диссертации. Благодаря этому разработка специалистов СПбГУ значительно экономит пользователям не только время на выполнение тех или иных обязательных задач, но и средства, которые были бы потрачены на оплату труда сотрудников. «Выпуски журналов бывают разные по объему, поэтому оценить, сколько времени и средств экономит сервис, в абсолютных цифрах вряд ли возможно, но это однозначно рабочие часы, складывающиеся в рабочие дни», — говорит Татьяна Селиванова.

Настоящим козырем сервиса является возможность настроить поиск объектов в текстах согласно индивидуальным требованиям пользователя. Поэтому «Призма» может быть полезна не только издательствам, но и всем организациям, имеющим большие архивы и потребность в быстром поиске информации в них, таким как СМИ, нотариальные конторы и юридические компании, коммуникативные, рекламные и PR-агентства, социологические организации, НИИ и другие.
Вера Свиридова
Автор статьи
Слушать подкаст
Ученые СПбГУ отвечают на важные вопросы
Научно-популярные новости СПбГУ, исследования, видеолекции, интервью с учеными Университета
Ландау позвонит
Оставить заявку
Укажите контактную информацию, мы вам перезвоним и ответим на интересующие вопросы
Наши эксперты готовы ответить на ваши вопросы
Получить консультацию
Подписывайтесь на наши соцсети
Подпишитесь на соцсети СПбГУ, чтобы быть в курсе актуальных новостей
Простым языком об исследованиях и разработках ученых СПбГУ
Журнал «Санкт-Петербургский университет»