Tespit Nasıl Çalışır
Regex Desen Eşleştirme (Yapılandırılmış PII)
Regex desenleriyle 317 özel PatternRecognizer, ulusal kimlikler, vergi numaraları, pasaportlar ve sürücü belgeleri gibi yapılandırılmış verileri tespit eder. Her desen, kod veya yapılandırılmış verilerde yanlış eşleşmeleri önlemek için sınır beyanları kullanır.
NLP Adlandırılmış Varlık Tanıma (İsimler ve Konumlar)
spaCy (25 dil), Stanza NER (7 dil) ve XLM-RoBERTa dönüştürücüler (16 dil), yalnızca regex ile yakalanamayan kişi isimleri, konumlar ve organizasyonlar gibi yapılandırılmamış PII'yi tespit eder. Tüm modeller Almanya'daki kendi sunucularımızda çalışır - hiçbir veri Meta, Google, Stanford veya başka bir üçüncü tarafa gönderilmez.
Güven Skorlaması
Her tespit, insan-döngü kararları için bir güven skoru (0.0–1.0) içerir. Çok özel formatlar (örneğin, Alman IBAN DE89 3704 0044 0532 0130 00) 0.85+ puan alırken, genel rakam desenleri 0.3–0.5 puan alır ve onay için bağlam kelimelerine dayanır. Uyumluluk ekipleri, anonimleştirmeden önce tespitleri inceleyebilir ve geçersiz kılabilir.
Bağlam Kelime Analizi
Her tanıyıcı, ilgili dilde bağlam kelimelerine sahiptir (örneğin, Alman kimlikleri için 'Personalausweis', Kenyalı kimlikleri için 'kitambulisho'). Bir eşleşmenin yakınında bağlam kelimeleri göründüğünde, güven skoru artırılır.
Desteklenen Varlık Türleri
Kategoriler arasında kişisel bilgi türlerinin kapsamlı kapsama alanı
Kişisel Tanımlayıcılar
- Kişi İsimleri
- E-posta Adresleri
- Telefon Numaraları
- Doğum Tarihi
- Yaş
- Cinsiyet
- Uyruk
Finansal Bilgiler
- Kredi Kartı Numaraları
- IBAN
- BIC/SWIFT
- Banka Hesap Numaraları
- Vergi Kimlikleri
- KDV Numaraları
Devlet Kimlikleri
- Sosyal Güvenlik Numaraları (SSN)
- Ulusal Kimlik Numaraları
- Pasaport Numaraları
- Sürücü Belgesi
- Sağlık Sigortası Kimlikleri
Konum Verileri
- Sokak Adresleri
- Şehirler
- Posta Kodları
- Ülkeler
- GPS Koordinatları
Dijital Tanımlayıcılar
- IP Adresleri (v4/v6)
- MAC Adresleri
- URL'ler
- Alan Adları
- Kullanıcı Kimlikleri
Organizasyon Verileri
- Şirket İsimleri
- Organizasyon Kimlikleri
- Kayıt Numaraları
- Departman İsimleri
Zamansal Veriler
- Tarihler
- Saatler
- Tarih Aralıkları
- Zaman Damgaları
Uluslararası Formatlar
- Alman Kimliği (Personalausweis)
- İngiltere Ulusal Sigorta
- İspanyol DNI/NIE
- İtalyan Codice Fiscale
- Ve 70'ten fazla ülkeye özgü format
Özel Varlık Desteği
Özel desenler tespit etmeniz mi gerekiyor? Regex desenleriyle kendi varlık türlerinizi oluşturun veya AI destekli desen oluşturucumuzu kullanın.
Manuel Desen Oluşturma
Dahili çalışan kimlikleri, proje kodları veya özel referans numaraları gibi özel tanımlayıcılar için regex desenleri tanımlayın.
AI Desen Oluşturucu
Ne tespit etmek istediğinizi basit bir dille açıklayın ve AI'mız sizin için optimize edilmiş regex desenleri oluştursun.
Is This Right For You?
Best For
- ✦Teams needing 320+ entity types across personal, financial, government, and organizational data
- ✦Multilingual PII detection (48 languages) for global compliance and audit requirements
- ✦GDPR, HIPAA, or air-gapped environments requiring local processing and regex-first detection
- ✦Auditable detection workflows using hybrid regex + NLP + ML with confidence scoring
- ✦Structured and unstructured data (CSV, JSON, plain text, email) with custom entity patterns
Not For
- ✦Real-time processing with <10ms latency requirements (NLP models add ~50ms overhead)
- ✦Image-only PII detection workflows (use the dedicated image-redaction feature instead)
- ✦Simple English-only use cases where basic regex or keyword matching is sufficient