الانتقال إلى المحتوى الرئيسي

نظرة عامة

حاجز الهلوسة هو ميزة مؤسسية تتحقق من المحتوى المولّد بالذكاء الاصطناعي لضمان أنه مبني على الحقائق ولا يحتوي على هلوسات. يحلل مخرجات المهام مقابل سياق مرجعي ويوفر ملاحظات مفصلة عند اكتشاف محتوى محتمل الهلوسة.

ما هي الهلوسات؟

تحدث هلوسات الذكاء الاصطناعي عندما تولّد نماذج اللغة محتوى يبدو معقولاً لكنه غير صحيح من الناحية الواقعية أو غير مدعوم بالسياق المقدم. يساعد حاجز الهلوسة في منع هذه المشكلات من خلال:
  • مقارنة المخرجات مع السياق المرجعي
  • تقييم الأمانة للمادة المصدرية
  • توفير ملاحظات مفصلة حول المحتوى المشكل
  • دعم عتبات مخصصة لصرامة التحقق

الاستخدام الأساسي

إعداد الحاجز

from crewai.tasks.hallucination_guardrail import HallucinationGuardrail
from crewai import LLM

# الاستخدام الأساسي - سيستخدم expected_output للمهمة كسياق
guardrail = HallucinationGuardrail(
    llm=LLM(model="gpt-4o-mini")
)

# مع سياق مرجعي صريح
context_guardrail = HallucinationGuardrail(
    context="AI helps with various tasks including analysis and generation.",
    llm=LLM(model="gpt-4o-mini")
)

الإضافة إلى المهام

from crewai import Task

# إنشاء مهمتك مع الحاجز
task = Task(
    description="Write a summary about AI capabilities",
    expected_output="A factual summary based on the provided context",
    agent=my_agent,
    guardrail=guardrail  # إضافة الحاجز للتحقق من المخرجات
)

التهيئة المتقدمة

التحقق بعتبة مخصصة

للتحقق الأكثر صرامة، يمكنك تعيين عتبة أمانة مخصصة (مقياس 0-10):
# حاجز صارم يتطلب درجة أمانة عالية
strict_guardrail = HallucinationGuardrail(
    context="Quantum computing uses qubits that exist in superposition states.",
    llm=LLM(model="gpt-4o-mini"),
    threshold=8.0  # يتطلب درجة >= 8 لاجتياز التحقق
)

تضمين سياق استجابة الأدوات

عندما تستخدم مهمتك أدوات، يمكنك تضمين استجابات الأدوات لتحقق أكثر دقة:
# حاجز مع سياق استجابة الأدوات
weather_guardrail = HallucinationGuardrail(
    context="Current weather information for the requested location",
    llm=LLM(model="gpt-4o-mini"),
    tool_response="Weather API returned: Temperature 22°C, Humidity 65%, Clear skies"
)

كيف يعمل

عملية التحقق

  1. تحليل السياق: يقارن الحاجز مخرجات المهمة مع السياق المرجعي المقدم
  2. تسجيل الأمانة: يستخدم مقيّمًا داخليًا لتعيين درجة أمانة (0-10)
  3. تحديد الحكم: يحدد ما إذا كان المحتوى أمينًا أو يحتوي على هلوسات
  4. التحقق من العتبة: إذا تم تعيين عتبة مخصصة، يتحقق مقابل تلك الدرجة
  5. توليد الملاحظات: يوفر أسبابًا مفصلة عند فشل التحقق

منطق التحقق

  • الوضع الافتراضي: يستخدم التحقق المبني على الحكم (FAITHFUL مقابل HALLUCINATED)
  • وضع العتبة: يتطلب أن تلبي درجة الأمانة العتبة المحددة أو تتجاوزها
  • معالجة الأخطاء: يتعامل بسلاسة مع أخطاء التقييم ويوفر ملاحظات إعلامية

نتائج الحاجز

يعيد الحاجز نتائج منظمة تشير إلى حالة التحقق:
# مثال على هيكل نتيجة الحاجز
{
    "valid": False,
    "feedback": "Content appears to be hallucinated (score: 4.2/10, verdict: HALLUCINATED). The output contains information not supported by the provided context."
}

خصائص النتيجة

  • valid: قيمة منطقية تشير إلى ما إذا اجتازت المخرجات التحقق
  • feedback: شرح مفصل عند فشل التحقق، يتضمن:
    • درجة الأمانة
    • تصنيف الحكم
    • أسباب محددة للفشل

التكامل مع نظام المهام

التحقق التلقائي

عند إضافة حاجز إلى مهمة، يتحقق تلقائيًا من المخرجات قبل اعتبار المهمة مكتملة:
# تدفق التحقق من مخرجات المهمة
task_output = agent.execute_task(task)
validation_result = guardrail(task_output)

if validation_result.valid:
    # المهمة تكتمل بنجاح
    return task_output
else:
    # المهمة تفشل مع ملاحظات التحقق
    raise ValidationError(validation_result.feedback)

تتبع الأحداث

يتكامل الحاجز مع نظام أحداث CrewAI لتوفير المراقبة:
  • بدء التحقق: عند بدء تقييم الحاجز
  • اكتمال التحقق: عند انتهاء التقييم بالنتائج
  • فشل التحقق: عند حدوث أخطاء تقنية أثناء التقييم

أفضل الممارسات

إرشادات السياق

1

توفير سياق شامل

أدرج جميع المعلومات الواقعية ذات الصلة التي يجب أن يبني عليها الذكاء الاصطناعي مخرجاته:
context = """
Company XYZ was founded in 2020 and specializes in renewable energy solutions.
They have 150 employees and generated $50M revenue in 2023.
Their main products include solar panels and wind turbines.
"""
2

الحفاظ على صلة السياق

أدرج فقط المعلومات المرتبطة مباشرة بالمهمة لتجنب الارتباك:
# جيد: سياق مركّز
context = "The current weather in New York is 18°C with light rain."

# تجنب: معلومات غير ذات صلة
context = "The weather is 18°C. The city has 8 million people. Traffic is heavy."
3

تحديث السياق بانتظام

تأكد من أن السياق المرجعي يعكس معلومات حالية ودقيقة.

اختيار العتبة

1

البدء بالتحقق الافتراضي

ابدأ بدون عتبات مخصصة لفهم الأداء الأساسي.
2

الضبط بناءً على المتطلبات

  • محتوى عالي الأهمية: استخدم عتبة 8-10 للدقة القصوى
  • محتوى عام: استخدم عتبة 6-7 للتحقق المتوازن
  • محتوى إبداعي: استخدم عتبة 4-5 أو التحقق الافتراضي المبني على الحكم
3

المراقبة والتكرار

تتبع نتائج التحقق واضبط العتبات بناءً على الإيجابيات/السلبيات الكاذبة.

اعتبارات الأداء

التأثير على زمن التنفيذ

  • عبء التحقق: يضيف كل حاجز حوالي 1-3 ثوانٍ لكل مهمة
  • كفاءة LLM: اختر نماذج فعالة للتقييم (مثل gpt-4o-mini)

تحسين التكلفة

  • اختيار النموذج: استخدم نماذج أصغر وفعالة لتقييم الحاجز
  • حجم السياق: اجعل السياق المرجعي موجزًا لكن شاملًا
  • التخزين المؤقت: فكّر في تخزين نتائج التحقق مؤقتًا للمحتوى المتكرر

استكشاف الأخطاء وإصلاحها

الأسباب المحتملة:
  • السياق مقيّد جدًا أو غير مرتبط بمخرجات المهمة
  • العتبة معينة عالية جدًا لنوع المحتوى
  • السياق المرجعي يحتوي على معلومات قديمة
الحلول:
  • مراجعة وتحديث السياق ليتطابق مع متطلبات المهمة
  • خفض العتبة أو استخدام التحقق الافتراضي المبني على الحكم
  • التأكد من أن السياق حالي ودقيق
الأسباب المحتملة:
  • العتبة عالية جدًا للمهام الإبداعية أو التفسيرية
  • السياق لا يغطي جميع الجوانب الصالحة للمخرجات
  • نموذج التقييم محافظ بشكل مفرط
الحلول:
  • خفض العتبة أو استخدام التحقق الافتراضي
  • توسيع السياق ليشمل محتوى مقبول أوسع
  • الاختبار مع نماذج تقييم مختلفة
الأسباب المحتملة:
  • مشكلات في الاتصال بالشبكة
  • نموذج LLM غير متاح أو محدود المعدل
  • مخرجات مهمة أو سياق غير صالح
الحلول:
  • التحقق من الاتصال بالشبكة وحالة خدمة LLM
  • تنفيذ منطق إعادة المحاولة للأعطال المؤقتة
  • التحقق من تنسيق مخرجات المهمة قبل تقييم الحاجز

هل تحتاج مساعدة؟

تواصل مع فريق الدعم للمساعدة في تهيئة حاجز الهلوسة أو استكشاف الأخطاء وإصلاحها.