Πώς Λειτουργεί η Ανίχνευση
Αντιστοίχιση Μοτίβων Regex (Δομημένα PII)
317 προσαρμοσμένοι PatternRecognizers με μοτίβα regex ανιχνεύουν δομημένα δεδομένα όπως εθνικά αναγνωριστικά, φορολογικούς αριθμούς, διαβατήρια και άδειες οδήγησης. Κάθε μοτίβο χρησιμοποιεί οριακές δηλώσεις για να αποτρέψει ψευδείς αντιστοιχίες σε κώδικα ή δομημένα δεδομένα.
Αναγνώριση Ονομάτων Οντοτήτων NLP (Ονόματα & Τοποθεσίες)
Τα spaCy (25 γλώσσες), Stanza NER (7 γλώσσες) και μετασχηματιστές XLM-RoBERTa (16 γλώσσες) ανιχνεύουν μη δομημένα PII όπως ονόματα προσώπων, τοποθεσίες και οργανισμούς που δεν μπορούν να καταγραφούν μόνο με regex. Όλα τα μοντέλα εκτελούνται στους δικούς μας διακομιστές στη Γερμανία — κανένα δεδομένο δεν αποστέλλεται ποτέ σε Meta, Google, Stanford ή οποιονδήποτε τρίτο.
Βαθμολόγηση Εμπιστοσύνης
Κάθε ανίχνευση περιλαμβάνει μια βαθμολογία εμπιστοσύνης (0.0–1.0) για αποφάσεις με ανθρώπινη παρέμβαση. Ιδιαίτερα συγκεκριμένες μορφές (π.χ., Γερμανικό IBAN DE89 3704 0044 0532 0130 00) βαθμολογούνται με 0.85+, ενώ γενικά μοτίβα ψηφίων βαθμολογούνται με 0.3–0.5 και βασίζονται σε λέξεις συμφραζομένων για επιβεβαίωση. Οι ομάδες συμμόρφωσης μπορούν να αναθεωρήσουν και να παρακάμψουν τις ανιχνεύσεις πριν την ανωνυμοποίηση.
Ανάλυση Λέξεων Συμφραζομένων
Κάθε αναγνωριστής έχει λέξεις συμφραζομένων στη σχετική γλώσσα (π.χ., 'Personalausweis' για Γερμανικά IDs, 'kitambulisho' για Κενυατικά IDs). Όταν οι λέξεις συμφραζομένων εμφανίζονται κοντά σε μια αντιστοιχία, η βαθμολογία εμπιστοσύνης αυξάνεται.
Υποστηριζόμενοι Τύποι Οντοτήτων
Πλήρης κάλυψη τύπων προσωπικών πληροφοριών ανά κατηγορία
Προσωπικά Αναγνωριστικά
- Ονόματα Προσώπων
- Διευθύνσεις Email
- Αριθμοί Τηλεφώνου
- Ημερομηνία Γέννησης
- Ηλικία
- Φύλο
- Εθνικότητα
Οικονομικές Πληροφορίες
- Αριθμοί Πιστωτικών Καρτών
- IBAN
- BIC/SWIFT
- Αριθμοί Τραπεζικών Λογαριασμών
- Φορολογικοί Αριθμοί
- Αριθμοί ΦΠΑ
Κυβερνητικά Αναγνωριστικά
- Αριθμοί Κοινωνικής Ασφάλισης (SSN)
- Εθνικοί Αριθμοί Αναγνώρισης
- Αριθμοί Διαβατηρίων
- Άδειες Οδήγησης
- Αναγνωριστικά Ασφάλισης Υγείας
Δεδομένα Τοποθεσίας
- Διευθύνσεις Οδών
- Πόλεις
- Ταχυδρομικοί Κώδικες
- Χώρες
- Συντεταγμένες GPS
Ψηφιακά Αναγνωριστικά
- Διευθύνσεις IP (v4/v6)
- Διευθύνσεις MAC
- URLs
- Ονόματα Τομέων
- Αναγνωριστικά Χρηστών
Δεδομένα Οργανισμών
- Ονόματα Εταιρειών
- Αναγνωριστικά Οργανισμών
- Αριθμοί Εγγραφής
- Ονόματα Τμημάτων
Χρονικά Δεδομένα
- Ημερομηνίες
- Ώρες
- Χρονικά Διαστήματα
- Χρονικές Σφραγίδες
Διεθνείς Μορφές
- Γερμανικό ID (Personalausweis)
- Βρετανική Εθνική Ασφάλιση
- Ισπανικό DNI/NIE
- Ιταλικό Codice Fiscale
- Και 70+ περισσότερες μορφές συγκεκριμένες για χώρες
Υποστήριξη Προσαρμοσμένων Οντοτήτων
Χρειάζεστε να ανιχνεύσετε προσαρμοσμένα μοτίβα; Δημιουργήστε τους δικούς σας τύπους οντοτήτων με μοτίβα regex ή χρησιμοποιήστε τον δημιουργό μοτίβων με AI.
Χειροκίνητη Δημιουργία Μοτίβου
Ορίστε μοτίβα regex για ιδιόκτητα αναγνωριστικά όπως εσωτερικά αναγνωριστικά υπαλλήλων, κωδικούς έργων ή προσαρμοσμένους αριθμούς αναφοράς.
Δημιουργός Μοτίβων AI
Περιγράψτε τι θέλετε να ανιχνεύσετε σε απλή γλώσσα, και το AI μας θα δημιουργήσει βελτιστοποιημένα μοτίβα regex για εσάς.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient