Архитектура системы
Построено на Microsoft Presidio: архитектура разделяет анализ, анонимизацию и обработку на отдельные сервисы для максимальной надежности.
Ключевые компоненты
Сервис анализа
Обнаруживает PII с помощью 317 индивидуальных распознающих шаблонов (регулярных выражений) для структурированных данных, таких как идентификаторы и налоговые номера, а также spaCy/Stanza/XLM-RoBERTa NLP для имен и местоположений. Все модели работают на наших серверах — данные никогда не передаются сторонним AI-провайдерам. Возвращает позиции сущностей, их типы и оценки уверенности.
Сервис анонимизации
Применяет выбранный вами метод преобразования. Поддерживает замену, скрытие, хеширование, шифрование и маскирование.
Веб-приложение
Фронтенд на Next.js с обработкой в реальном времени. Адаптивный дизайн для всех устройств.
REST API
RESTful-эндпоинты для программного доступа. Аутентификация по JWT. Ограничение частоты запросов.
Поток данных
Документы проходят через наши сервисы по защищенному и поддающемуся аудиту конвейеру.
- 1
Клиент отправляет документ через HTTPS
- 2
Сервис анализа выявляет PII-сущности
- 3
Результаты возвращаются с позициями и оценками
- 4
Клиент выбирает метод анонимизации
- 5
Анонимизатор применяет преобразование
- 6
Анонимизированный документ возвращается клиенту