Архитектура системы

Построено на Microsoft Presidio: архитектура разделяет анализ, анонимизацию и обработку на отдельные сервисы для максимальной надежности.

Ключевые компоненты

Сервис анализа

Обнаруживает PII с помощью 317 индивидуальных распознающих шаблонов (регулярных выражений) для структурированных данных, таких как идентификаторы и налоговые номера, а также spaCy/Stanza/XLM-RoBERTa NLP для имен и местоположений. Все модели работают на наших серверах — данные никогда не передаются сторонним AI-провайдерам. Возвращает позиции сущностей, их типы и оценки уверенности.

Сервис анонимизации

Применяет выбранный вами метод преобразования. Поддерживает замену, скрытие, хеширование, шифрование и маскирование.

Веб-приложение

Фронтенд на Next.js с обработкой в реальном времени. Адаптивный дизайн для всех устройств.

REST API

RESTful-эндпоинты для программного доступа. Аутентификация по JWT. Ограничение частоты запросов.

Поток данных

Документы проходят через наши сервисы по защищенному и поддающемуся аудиту конвейеру.

  1. 1

    Клиент отправляет документ через HTTPS

  2. 2

    Сервис анализа выявляет PII-сущности

  3. 3

    Результаты возвращаются с позициями и оценками

  4. 4

    Клиент выбирает метод анонимизации

  5. 5

    Анонимизатор применяет преобразование

  6. 6

    Анонимизированный документ возвращается клиенту

Стройте на нашей архитектуре

Доступ к API включен во все тарифы. Полная документация доступна.