시스템 아키텍처
Microsoft Presidio 기반으로, 분석·익명화·처리를 전용 서비스로 분리하여 최대 신뢰성 확보.
핵심 구성요소
Analyzer 서비스
317개의 맞춤형 정규식 인식기(신분증, 세금번호 등 구조화 데이터)와 spaCy/Stanza/XLM-RoBERTa NLP로 이름·위치 탐지. 모든 모델은 자체 서버에서 실행 — 제3자 AI 제공업체로 데이터 전송 없음. 엔터티 위치, 유형, 신뢰도 점수 반환.
Anonymizer 서비스
선택한 변환 방식 적용. 치환, 마스킹, 해시, 암호화, 가리기 지원.
웹 애플리케이션
Next.js 프론트엔드, 실시간 처리. 모든 기기에서 반응형 디자인.
REST API
프로그램 연동을 위한 RESTful 엔드포인트. JWT 인증. 속도 제한.
데이터 흐름
문서는 안전하고 감사 가능한 파이프라인을 통해 서비스로 전달됩니다.
- 1
클라이언트가 HTTPS로 문서 전송
- 2
Analyzer 서비스가 PII 엔터티 탐지
- 3
위치 및 점수와 함께 결과 반환
- 4
클라이언트가 익명화 방식 선택
- 5
Anonymizer가 변환 적용
- 6
익명화된 문서가 클라이언트에 반환