cloak.business

Πώς λειτουργεί το cloak.business

Εντοπισμός PII με προτεραιότητα το Regex: 317 ντετερμινιστικοί αναγνωριστές μοτίβων για δομημένα δεδομένα (ταυτότητες, ΑΦΜ, πιστωτικές κάρτες), καθώς και spaCy, Stanza και XLM-RoBERTa NLP για ονόματα και τοποθεσίες σε 48 γλώσσες.

Regex-First: Γιατί Έχει Σημασία

Η Προσέγγισή μας: Regex + NLP

  • 317 αναγνωριστές regex: 100% αναπαραγώγιμοι για δομημένα δεδομένα
  • NLP για ονόματα & τοποθεσίες με βαθμολογία εμπιστοσύνης
  • Πλήρως ελεγχόμενο — κάθε εντοπισμός ανιχνεύσιμος σε μοτίβο ή μοντέλο
  • Διαφάνεια: γνωρίζετε πάντα τι ταίριαξε και γιατί
  • Γρήγορη, προβλέψιμη απόδοση
  • 48 γλώσσες σε 3 μηχανές NLP

Αποκλειστικά AI Προσεγγίσεις

  • Όλοι οι εντοπισμοί είναι πιθανολογικοί
  • Δεν μπορεί να εξηγηθεί γιατί έγινε επισήμανση
  • Απαιτούνται μεγάλα σύνολα εκπαίδευσης
  • Δύσκολος έλεγχος για συμμόρφωση
  • Υψηλότερο κόστος υπολογισμού (απαραίτητο GPU)
  • Η απόκλιση μοντέλου μειώνει την ακρίβεια με τον χρόνο

Η Διαδικασία σε 10 Βήματα

Από την εισαγωγή έως την εξαγωγή, δείτε ακριβώς τι συμβαίνει στο έγγραφό σας

1

Εισαγωγή Κειμένου

Υποβάλετε το έγγραφό σας μέσω web, API ή Office Add-in

2

Ανίχνευση Γλώσσας

Το σύστημα αναγνωρίζει τη γλώσσα του εγγράφου για βέλτιστη επεξεργασία

3

Κατακερματισμός (Tokenization)

Το κείμενο διασπάται σε tokens για αντιστοίχιση μοτίβων

4

Αντιστοίχιση Μοτίβων

317 αναγνωριστές regex και μοντέλα NLP σαρώνουν για 320+ τύπους οντοτήτων σε 70+ χώρες

5

Ανάλυση Συμφραζομένων

Το περιβάλλον κείμενο βελτιώνει την ακρίβεια εντοπισμού

6

Βαθμολόγηση Εμπιστοσύνης

Κάθε εντοπισμός λαμβάνει βαθμολογία εμπιστοσύνης (0.0–1.0) για λήψη αποφάσεων με ανθρώπινη παρέμβαση

7

Κατηγοριοποίηση Οντοτήτων

Τα εντοπισμένα στοιχεία κατηγοριοποιούνται ανά τύπο

8

Ανασκόπηση από Άνθρωπο

Ελέγξτε όλους τους εντοπισμούς, διορθώστε ψευδώς θετικά και εγκρίνετε πριν την ανωνυμοποίηση

9

Εφαρμογή Ανωνυμοποίησης

Επιλέξτε μέθοδο: Αντικατάσταση, Απόκρυψη, Hash, Κρυπτογράφηση ή Μάσκα

10

Έγγραφο Εξόδου

Κατεβάστε το ανωνυμοποιημένο έγγραφό σας

MCP Server: Ενσωμάτωση AI με Προτεραιότητα στην Ιδιωτικότητα

Πώς τα δεδομένα σας διακινούνται μέσω του MCP Server για ασφαλή χρήση AI εργαλείων

Ο MCP Server λειτουργεί ως ασπίδα ιδιωτικότητας, αναχαιτίζοντας αιτήματα από AI εργαλεία, ανωνυμοποιώντας το PII, επεξεργαζόμενος τα ασφαλή δεδομένα μέσω AI και, προαιρετικά, επαναφέροντας τις αρχικές τιμές.

Αίτημα AI Εργαλείου

Το AI εργαλείο σας (Cursor, Claude) στέλνει αίτημα που περιέχει PII

Αναχαίτιση από MCP Server

Ο server αναλύει και εντοπίζει όλες τις οντότητες PII

Ανωνυμοποίηση

Το PII αντικαθίσταται με tokens ή αποκρύπτεται

Επεξεργασία AI

Το AI λαμβάνει και επεξεργάζεται μόνο ανωνυμοποιημένα δεδομένα

Επιστροφή Απάντησης

Η απάντηση του AI επιστρέφει μέσω του MCP Server

Απο-τοκενικοποίηση

Προαιρετικά: Επαναφορά αρχικών τιμών για τον χρήστη

Συχνές Ερωτήσεις

Χρησιμοποιεί το cloak.business AI για εντοπισμό;

Όχι. Ο εντοπισμός γίνεται με ντετερμινιστικά μοτίβα regex και μοντέλα NLP (spaCy, Stanza). Αυτό διασφαλίζει 100% αναπαραγώγιμα αποτελέσματα — η ίδια είσοδος παράγει πάντα την ίδια έξοδο, σε αντίθεση με τις πιθανολογικές προσεγγίσεις AI.

Γιατί μοτίβα regex αντί για AI;

Τα μοτίβα regex είναι ελεγχόμενα, αναπαραγώγιμα και συμμορφούμενα. Μπορείτε να δείτε ακριβώς τι ταιριάζει κάθε μοτίβο. Ο εντοπισμός με AI δεν είναι ντετερμινιστικός — τα αποτελέσματα διαφέρουν μεταξύ εκτελέσεων, δυσκολεύοντας την τεκμηρίωση συμμόρφωσης.

Πόσο ακριβής είναι ο εντοπισμός;

Με 317 custom αναγνωριστές μοτίβων και έλεγχο ακεραιότητας (Luhn, IBAN, SSN), το cloak.business επιτυγχάνει σημαντικά υψηλότερη ακρίβεια από γενικά μοντέλα NER, ειδικά για δομημένα αναγνωριστικά όπως πιστωτικές κάρτες, ΑΦΜ και αριθμούς ταυτότητας.

Ποιες γλώσσες υποστηρίζονται;

Υποστηρίζονται 48 γλώσσες με εξειδικευμένα μοντέλα NLP για αναγνώριση ονομάτων οντοτήτων. Ο εντοπισμός με μοτίβα (regex) λειτουργεί σε όλες τις γλώσσες, καθώς ταιριάζει σε χαρακτήρες ανεξαρτήτως γλώσσας.

Μπορώ να προσθέσω custom μοτίβα οντοτήτων;

Ναι. Το API υποστηρίζει custom ορισμούς αναγνωριστών ώστε να προσθέσετε μοτίβα για ιδιόκτητα αναγνωριστικά, εσωτερικούς αριθμούς αναφοράς ή δεδομένα συγκεκριμένου τομέα.

Δείτε το σε Δράση

Δοκιμάστε δωρεάν τον εντοπισμό και την ανωνυμοποίηση PII με 200 tokens ανά κύκλο.