الانتقال إلى المحتوى الرئيسي

نظرة عامة

إخفاء البيانات الشخصية (PII Redaction) هو ميزة في CrewAI AMP تكتشف تلقائياً وتُقنّع معلومات التعريف الشخصية (PII) في تتبعات تنفيذ الطواقم والتدفقات. يضمن ذلك عدم كشف البيانات الحساسة مثل أرقام بطاقات الائتمان وأرقام الضمان الاجتماعي وعناوين البريد الإلكتروني والأسماء في تتبعات CrewAI AMP. يمكنك أيضاً إنشاء مُعرّفات مخصصة لحماية البيانات الخاصة بمؤسستك.
إخفاء البيانات الشخصية متاح في خطة Enterprise. يجب أن يكون إصدار النشر 1.8.0 أو أعلى.
نظرة عامة على إخفاء البيانات الشخصية

أهمية إخفاء البيانات الشخصية

عند تشغيل وكلاء الذكاء الاصطناعي في بيئة الإنتاج، غالباً ما تمر معلومات حساسة عبر طواقمك:
  • بيانات العملاء من تكاملات CRM
  • معلومات مالية من معالجات الدفع
  • تفاصيل شخصية من إرسالات النماذج
  • بيانات الموظفين الداخلية
بدون إخفاء مناسب، تظهر هذه البيانات في التتبعات، مما يجعل الامتثال للوائح مثل GDPR وHIPAA وPCI-DSS أمراً صعباً. يحل إخفاء البيانات الشخصية هذه المشكلة عن طريق إقناع البيانات الحساسة تلقائياً قبل تخزينها في التتبعات.

كيف يعمل

  1. الاكتشاف - مسح بيانات أحداث التتبع بحثاً عن أنماط PII المعروفة
  2. التصنيف - تحديد نوع البيانات الحساسة (بطاقة ائتمان، SSN، بريد إلكتروني، إلخ.)
  3. الإقناع/الإخفاء - استبدال البيانات الحساسة بقيم مُقنّعة بناءً على تهيئتك
Original: "Contact john.doe@company.com or call 555-123-4567"
Redacted: "Contact <EMAIL_ADDRESS> or call <PHONE_NUMBER>"

تفعيل إخفاء البيانات الشخصية

يجب أن تكون على خطة Enterprise وأن يكون إصدار النشر 1.8.0 أو أعلى لاستخدام هذه الميزة.
1

الانتقال إلى إعدادات الطاقم

في لوحة تحكم CrewAI AMP، اختر طاقمك المنشور وانتقل إلى أحد عمليات النشر/الأتمتة، ثم انتقل إلى SettingsPII Protection.
2

تفعيل حماية البيانات الشخصية

فعّل PII Redaction for Traces. سيؤدي ذلك إلى تفعيل المسح والإخفاء التلقائي لبيانات التتبع.
تحتاج إلى تفعيل إخفاء البيانات الشخصية يدوياً لكل عملية نشر.
تفعيل إخفاء البيانات الشخصية
3

تهيئة أنواع الكيانات

اختر أنواع البيانات الشخصية التي تريد اكتشافها وإخفاءها. يمكن تفعيل أو تعطيل كل كيان بشكل فردي.
تهيئة الكيانات
4

الحفظ

احفظ تهيئتك. سيكون إخفاء البيانات الشخصية نشطاً في جميع عمليات تنفيذ الطاقم اللاحقة، دون الحاجة لإعادة النشر.

أنواع الكيانات المدعومة

يدعم CrewAI أنواع كيانات PII التالية، منظمة حسب الفئة.

الكيانات العالمية

الكيانالوصفمثال
CREDIT_CARDأرقام بطاقات الائتمان/الخصم”4111-1111-1111-1111”
CRYPTOعناوين محافظ العملات الرقمية”bc1qxy2kgd…”
DATE_TIMEالتواريخ والأوقات”January 15, 2024”
EMAIL_ADDRESSعناوين البريد الإلكترونيjohn@example.com
IBAN_CODEأرقام الحسابات المصرفية الدولية”DE89 3704 0044 0532 0130 00”
IP_ADDRESSعناوين IPv4 وIPv6”192.168.1.1”
LOCATIONالمواقع الجغرافية”New York City”
MEDICAL_LICENSEأرقام التراخيص الطبية”MD12345”
NRPالجنسيات أو المجموعات الدينية أو السياسية-
PERSONالأسماء الشخصية”John Doe”
PHONE_NUMBERأرقام الهواتف بتنسيقات مختلفة”+1 (555) 123-4567”
URLعناوين URLhttps://example.com

كيانات خاصة بالولايات المتحدة

الكيانالوصفمثال
US_BANK_NUMBERأرقام الحسابات المصرفية الأمريكية”1234567890”
US_DRIVER_LICENSEأرقام رخص القيادة الأمريكية”D1234567”
US_ITINرقم تعريف دافع الضرائب الفردي”900-70-0000”
US_PASSPORTأرقام جوازات السفر الأمريكية”123456789”
US_SSNأرقام الضمان الاجتماعي”123-45-6789”

إجراءات الإخفاء

لكل كيان مُفعّل، يمكنك تهيئة كيفية إخفاء البيانات:
الإجراءالوصفمثال على المخرجات
maskالاستبدال بتسمية نوع الكيان<CREDIT_CARD>
redactإزالة النص بالكامل(فارغ)

المُعرّفات المخصصة

بالإضافة إلى الكيانات المدمجة، يمكنك إنشاء مُعرّفات مخصصة لاكتشاف أنماط PII الخاصة بمؤسستك.
المُعرّفات المخصصة

أنواع المُعرّفات

لديك خياران للمُعرّفات المخصصة:
النوعالأفضل لـمثال على حالة الاستخدام
قائم على النمط (Regex)بيانات منظمة بتنسيقات متوقعةمبالغ الرواتب، معرّفات الموظفين، رموز المشاريع
قائمة الحظر (Deny-list)مطابقة النصوص بالضبطأسماء الشركات، الأسماء الرمزية الداخلية، مصطلحات محددة

إنشاء مُعرّف مخصص

1

الانتقال إلى المُعرّفات المخصصة

انتقل إلى SettingsOrganizationAdd Recognizer في إعدادات مؤسستك.
2

تهيئة المُعرّف

تهيئة المُعرّف
هيّئ الحقول التالية:
  • Name: اسم وصفي للمُعرّف
  • Entity Type: تسمية الكيان التي ستظهر في المخرجات المُخفاة (مثل EMPLOYEE_ID، SALARY)
  • Type: اختر بين Regex Pattern أو Deny List
  • Pattern/Values: نمط Regex أو قائمة نصوص للمطابقة
  • Confidence Threshold: الحد الأدنى للنتيجة (0.0-1.0) المطلوبة لتفعيل الإخفاء عند المطابقة. القيم الأعلى (مثل 0.8) تقلل الإيجابيات الخاطئة لكن قد تفوّت بعض المطابقات. القيم الأقل (مثل 0.5) تلتقط المزيد من المطابقات لكن قد تُفرط في الإخفاء. القيمة الافتراضية هي 0.8.
  • Context Words (اختياري): كلمات تزيد ثقة الاكتشاف عند وجودها بالقرب
3

الحفظ

احفظ المُعرّف. سيكون متاحاً للتفعيل في عمليات النشر الخاصة بك.

فهم أنواع الكيانات

يحدد Entity Type كيفية ظهور المحتوى المُطابق في التتبعات المُخفاة:
Entity Type: SALARY
Pattern: salary:\s*\$\s*\d+
Input: "Employee salary: $50,000"
Output: "Employee <SALARY>"

استخدام كلمات السياق

تحسّن كلمات السياق الدقة عن طريق زيادة الثقة عند ظهور مصطلحات محددة بالقرب من النمط المُطابق:
Context Words: "project", "code", "internal"
Entity Type: PROJECT_CODE
Pattern: PRJ-\d{4}
عندما تظهر كلمة “project” أو “code” بالقرب من “PRJ-1234”، يكون لدى المُعرّف ثقة أعلى بأنها مطابقة حقيقية، مما يقلل الإيجابيات الخاطئة.

عرض التتبعات المُخفاة

بمجرد تفعيل إخفاء البيانات الشخصية، ستعرض تتبعاتك قيماً مُخفاة بدلاً من البيانات الحساسة:
Task Output: "Customer <PERSON> placed order #12345.
Contact email: <EMAIL_ADDRESS>, phone: <PHONE_NUMBER>.
Payment processed for card ending in <CREDIT_CARD>."
القيم المُخفاة مُعلّمة بوضوح بأقواس زاوية وتسمية نوع الكيان (مثل <EMAIL_ADDRESS>)، مما يسهّل فهم البيانات التي تمت حمايتها مع السماح لك بتصحيح الأخطاء ومراقبة سلوك الطاقم.

أفضل الممارسات

اعتبارات الأداء

1

فعّل الكيانات المطلوبة فقط

كل كيان مُفعّل يضيف عبء معالجة. فعّل فقط الكيانات ذات الصلة ببياناتك.
2

استخدم أنماطاً محددة

للمُعرّفات المخصصة، استخدم أنماطاً محددة لتقليل الإيجابيات الخاطئة وتحسين الأداء. أنماط Regex هي الأفضل عند تحديد أنماط معينة في التتبعات مثل الرواتب ومعرّفات الموظفين ورموز المشاريع وغيرها. مُعرّفات قائمة الحظر هي الأفضل عند تحديد نصوص بعينها في التتبعات مثل أسماء الشركات والأسماء الرمزية الداخلية وغيرها.
3

استفد من كلمات السياق

تحسّن كلمات السياق الدقة عن طريق تفعيل الاكتشاف فقط عندما يتطابق النص المحيط.

استكشاف الأخطاء وإصلاحها

الأسباب المحتملة:
  • نوع الكيان غير مُفعّل في التهيئة
  • النمط لا يتطابق مع تنسيق البيانات
  • المُعرّف المخصص يحتوي على أخطاء في الصياغة
الحلول:
  • تحقق من أن الكيان مُفعّل في Settings → Security
  • اختبر أنماط Regex مع بيانات نموذجية
  • تحقق من السجلات بحثاً عن أخطاء التهيئة
الأسباب المحتملة:
  • أنواع كيانات واسعة جداً مُفعّلة (مثل DATE_TIME تلتقط التواريخ في كل مكان)
  • أنماط المُعرّف المخصص عامة جداً
الحلول:
  • عطّل الكيانات التي تسبب إيجابيات خاطئة
  • اجعل الأنماط المخصصة أكثر تحديداً
  • أضف كلمات سياق لتحسين الدقة
الأسباب المحتملة:
  • عدد كبير جداً من الكيانات المُفعّلة
  • الكيانات القائمة على NLP (مثل PERSON وLOCATION وNRP) مكلفة حسابياً لأنها تستخدم نماذج تعلم الآلة
الحلول:
  • فعّل فقط الكيانات التي تحتاجها فعلاً
  • فكّر في استخدام بدائل قائمة على الأنماط حيثما أمكن
  • راقب أوقات معالجة التتبعات في لوحة التحكم

مثال عملي: مطابقة نمط الراتب

يوضح هذا المثال كيفية إنشاء مُعرّف مخصص لاكتشاف وإقناع معلومات الرواتب في تتبعاتك.

حالة الاستخدام

يعالج طاقمك بيانات موظفين أو بيانات مالية تتضمن معلومات رواتب بتنسيقات مثل:
  • salary: $50,000
  • salary: $125,000.00
  • salary:$1,500.50
تريد إقناع هذه القيم تلقائياً لحماية بيانات التعويضات الحساسة.

التهيئة

تهيئة مُعرّف الراتب
الحقلالقيمة
NameSALARY
Entity TypeSALARY
TypeRegex Pattern
Regex Patternsalary:\s*\$\s*\d{1,3}(,\d{3})*(\.\d{2})?
ActionMask
Confidence Threshold0.8
Context Wordssalary, compensation, pay, wage, income

تحليل نمط Regex

مكون النمطالمعنى
salary:يطابق النص الحرفي “salary:“
\s*يطابق صفر أو أكثر من أحرف المسافات البيضاء
\$يطابق علامة الدولار (مُهرّبة)
\s*يطابق صفر أو أكثر من أحرف المسافات البيضاء بعد $
\d{1,3}يطابق 1-3 أرقام (مثل “1”، “50”، “125”)
(,\d{3})*يطابق الآلاف المفصولة بفواصل (مثل “,000”، “,500,000”)
(\.\d{2})?يطابق اختيارياً السنتات (مثل “.00”، “.50”)

أمثلة على النتائج

Original: "Employee record shows salary: $125,000.00 annually"
Redacted: "Employee record shows <SALARY> annually"

Original: "Base salary:$50,000 with bonus potential"
Redacted: "Base <SALARY> with bonus potential"
إضافة كلمات سياق مثل “salary” و”compensation” و”pay” و”wage” و”income” تساعد في زيادة ثقة الاكتشاف عند ظهور هذه المصطلحات بالقرب من النمط المُطابق، مما يقلل الإيجابيات الخاطئة.

تفعيل المُعرّف لعمليات النشر

إنشاء مُعرّف مخصص على مستوى المؤسسة لا يفعّله تلقائياً لعمليات النشر. يجب عليك تفعيل كل مُعرّف يدوياً لكل عملية نشر تريد تطبيقه عليها.
بعد إنشاء المُعرّف المخصص، فعّله لكل عملية نشر:
1

الانتقال إلى عملية النشر

انتقل إلى عملية النشر/الأتمتة وافتح SettingsPII Protection.
2

اختيار المُعرّفات المخصصة

تحت Mask Recognizers، سترى المُعرّفات المحددة على مستوى مؤسستك. حدد المربع بجانب المُعرّفات التي تريد تفعيلها.
تفعيل المُعرّف المخصص
3

حفظ التهيئة

احفظ تغييراتك. سيكون المُعرّف نشطاً في جميع عمليات التنفيذ اللاحقة لعملية النشر هذه.
كرر هذه العملية لكل عملية نشر تحتاج فيها إلى المُعرّف المخصص. يمنحك ذلك تحكماً دقيقاً في المُعرّفات النشطة في البيئات المختلفة (مثل بيئة التطوير مقابل بيئة الإنتاج).