FirecrawlCrawlWebsiteTool
الوصف
Firecrawl هي منصة لزحف وتحويل أي موقع إلى markdown نظيف أو بيانات منظمة.التثبيت
- احصل على مفتاح API من firecrawl.dev وعيّنه في متغيرات البيئة (
FIRECRAWL_API_KEY). - ثبّت Firecrawl SDK مع حزمة
crewai[tools]:
مثال
استخدم FirecrawlScrapeFromWebsiteTool كما يلي للسماح لوكيلك بتحميل المواقع:Code
المعاملات
api_key: اختياري. يحدد مفتاح Firecrawl API. الافتراضي هو متغير البيئةFIRECRAWL_API_KEY.url: عنوان URL الأساسي لبدء الزحف منه.page_options: اختياري.onlyMainContent: اختياري. إرجاع المحتوى الرئيسي فقط للصفحة باستثناء الرؤوس وأشرطة التنقل والتذييلات وغيرها.includeHtml: اختياري. تضمين محتوى HTML الخام للصفحة. سيُخرج مفتاح html في الاستجابة.
crawler_options: اختياري. خيارات للتحكم في سلوك الزحف.includes: اختياري. أنماط URL لتضمينها في الزحف.exclude: اختياري. أنماط URL لاستبعادها من الزحف.generateImgAltText: اختياري. توليد نص بديل للصور باستخدام LLMs (يتطلب خطة مدفوعة).returnOnlyUrls: اختياري. إذا كان true، يُرجع عناوين URL فقط كقائمة في حالة الزحف. ملاحظة: ستكون الاستجابة قائمة عناوين URL داخل البيانات، وليست قائمة مستندات.maxDepth: اختياري. الحد الأقصى لعمق الزحف. العمق 1 هو عنوان URL الأساسي، والعمق 2 يشمل عنوان URL الأساسي وأبنائه المباشرين، وهكذا.mode: اختياري. وضع الزحف المستخدم. الوضع السريع يزحف أسرع 4 مرات على المواقع بدون خريطة موقع ولكنه قد لا يكون دقيقاً ولا يجب استخدامه على المواقع التي تعتمد بشكل كبير على JavaScript.limit: اختياري. الحد الأقصى لعدد الصفحات للزحف.timeout: اختياري. المهلة بالملي ثانية لعملية الزحف.
