الانتقال إلى المحتوى الرئيسي

VisionTool

الوصف

تُستخدم هذه الأداة لاستخراج النص من الصور. عند تمريرها إلى الوكيل، ستستخرج النص من الصورة ثم تستخدمه لتوليد استجابة أو تقرير أو أي مخرج آخر. يجب تمرير عنوان URL أو مسار الصورة إلى الوكيل.

التثبيت

ثبّت حزمة crewai_tools
pip install 'crewai[tools]'

الاستخدام

لاستخدام VisionTool، يجب تعيين مفتاح API الخاص بـ OpenAI في متغير البيئة OPENAI_API_KEY.
Code
from crewai_tools import VisionTool

vision_tool = VisionTool()

@agent
def researcher(self) -> Agent:
    '''
    This agent uses the VisionTool to extract text from images.
    '''
    return Agent(
        config=self.agents_config["researcher"],
        allow_delegation=False,
        tools=[vision_tool]
    )

المعاملات

تتطلب VisionTool المعاملات التالية:
المعاملالنوعالوصف
image_path_urlstringإلزامي. مسار ملف الصورة المراد استخراج النص منها.