Regex-First: Γιατί Έχει Σημασία
Η Προσέγγισή μας: Regex + NLP
- 317 αναγνωριστές regex: 100% αναπαραγώγιμοι για δομημένα δεδομένα
- NLP για ονόματα & τοποθεσίες με βαθμολογία εμπιστοσύνης
- Πλήρως ελεγχόμενο — κάθε εντοπισμός ανιχνεύσιμος σε μοτίβο ή μοντέλο
- Διαφάνεια: γνωρίζετε πάντα τι ταίριαξε και γιατί
- Γρήγορη, προβλέψιμη απόδοση
- 48 γλώσσες σε 3 μηχανές NLP
Αποκλειστικά AI Προσεγγίσεις
- Όλοι οι εντοπισμοί είναι πιθανολογικοί
- Δεν μπορεί να εξηγηθεί γιατί έγινε επισήμανση
- Απαιτούνται μεγάλα σύνολα εκπαίδευσης
- Δύσκολος έλεγχος για συμμόρφωση
- Υψηλότερο κόστος υπολογισμού (απαραίτητο GPU)
- Η απόκλιση μοντέλου μειώνει την ακρίβεια με τον χρόνο
Η Διαδικασία σε 10 Βήματα
Από την εισαγωγή έως την εξαγωγή, δείτε ακριβώς τι συμβαίνει στο έγγραφό σας
Εισαγωγή Κειμένου
Υποβάλετε το έγγραφό σας μέσω web, API ή Office Add-in
Ανίχνευση Γλώσσας
Το σύστημα αναγνωρίζει τη γλώσσα του εγγράφου για βέλτιστη επεξεργασία
Κατακερματισμός (Tokenization)
Το κείμενο διασπάται σε tokens για αντιστοίχιση μοτίβων
Αντιστοίχιση Μοτίβων
317 αναγνωριστές regex και μοντέλα NLP σαρώνουν για 320+ τύπους οντοτήτων σε 70+ χώρες
Ανάλυση Συμφραζομένων
Το περιβάλλον κείμενο βελτιώνει την ακρίβεια εντοπισμού
Βαθμολόγηση Εμπιστοσύνης
Κάθε εντοπισμός λαμβάνει βαθμολογία εμπιστοσύνης (0.0–1.0) για λήψη αποφάσεων με ανθρώπινη παρέμβαση
Κατηγοριοποίηση Οντοτήτων
Τα εντοπισμένα στοιχεία κατηγοριοποιούνται ανά τύπο
Ανασκόπηση από Άνθρωπο
Ελέγξτε όλους τους εντοπισμούς, διορθώστε ψευδώς θετικά και εγκρίνετε πριν την ανωνυμοποίηση
Εφαρμογή Ανωνυμοποίησης
Επιλέξτε μέθοδο: Αντικατάσταση, Απόκρυψη, Hash, Κρυπτογράφηση ή Μάσκα
Έγγραφο Εξόδου
Κατεβάστε το ανωνυμοποιημένο έγγραφό σας
MCP Server: Ενσωμάτωση AI με Προτεραιότητα στην Ιδιωτικότητα
Πώς τα δεδομένα σας διακινούνται μέσω του MCP Server για ασφαλή χρήση AI εργαλείων
Ο MCP Server λειτουργεί ως ασπίδα ιδιωτικότητας, αναχαιτίζοντας αιτήματα από AI εργαλεία, ανωνυμοποιώντας το PII, επεξεργαζόμενος τα ασφαλή δεδομένα μέσω AI και, προαιρετικά, επαναφέροντας τις αρχικές τιμές.
Αίτημα AI Εργαλείου
Το AI εργαλείο σας (Cursor, Claude) στέλνει αίτημα που περιέχει PII
Αναχαίτιση από MCP Server
Ο server αναλύει και εντοπίζει όλες τις οντότητες PII
Ανωνυμοποίηση
Το PII αντικαθίσταται με tokens ή αποκρύπτεται
Επεξεργασία AI
Το AI λαμβάνει και επεξεργάζεται μόνο ανωνυμοποιημένα δεδομένα
Επιστροφή Απάντησης
Η απάντηση του AI επιστρέφει μέσω του MCP Server
Απο-τοκενικοποίηση
Προαιρετικά: Επαναφορά αρχικών τιμών για τον χρήστη
Συχνές Ερωτήσεις
Χρησιμοποιεί το cloak.business AI για εντοπισμό;
Όχι. Ο εντοπισμός γίνεται με ντετερμινιστικά μοτίβα regex και μοντέλα NLP (spaCy, Stanza). Αυτό διασφαλίζει 100% αναπαραγώγιμα αποτελέσματα — η ίδια είσοδος παράγει πάντα την ίδια έξοδο, σε αντίθεση με τις πιθανολογικές προσεγγίσεις AI.
Γιατί μοτίβα regex αντί για AI;
Τα μοτίβα regex είναι ελεγχόμενα, αναπαραγώγιμα και συμμορφούμενα. Μπορείτε να δείτε ακριβώς τι ταιριάζει κάθε μοτίβο. Ο εντοπισμός με AI δεν είναι ντετερμινιστικός — τα αποτελέσματα διαφέρουν μεταξύ εκτελέσεων, δυσκολεύοντας την τεκμηρίωση συμμόρφωσης.
Πόσο ακριβής είναι ο εντοπισμός;
Με 317 custom αναγνωριστές μοτίβων και έλεγχο ακεραιότητας (Luhn, IBAN, SSN), το cloak.business επιτυγχάνει σημαντικά υψηλότερη ακρίβεια από γενικά μοντέλα NER, ειδικά για δομημένα αναγνωριστικά όπως πιστωτικές κάρτες, ΑΦΜ και αριθμούς ταυτότητας.
Ποιες γλώσσες υποστηρίζονται;
Υποστηρίζονται 48 γλώσσες με εξειδικευμένα μοντέλα NLP για αναγνώριση ονομάτων οντοτήτων. Ο εντοπισμός με μοτίβα (regex) λειτουργεί σε όλες τις γλώσσες, καθώς ταιριάζει σε χαρακτήρες ανεξαρτήτως γλώσσας.
Μπορώ να προσθέσω custom μοτίβα οντοτήτων;
Ναι. Το API υποστηρίζει custom ορισμούς αναγνωριστών ώστε να προσθέσετε μοτίβα για ιδιόκτητα αναγνωριστικά, εσωτερικούς αριθμούς αναφοράς ή δεδομένα συγκεκριμένου τομέα.