نظرة عامة

تتيح هذه الأدوات لوكلائك التفاعل مع الويب واستخراج البيانات من المواقع وأتمتة المهام المعتمدة على المتصفح. من الاستخراج البسيط من الويب إلى أتمتة المتصفح المعقدة، تغطي هذه الأدوات جميع احتياجات التفاعل مع الويب.

الأدوات المتاحة

أداة استخراج المواقع

أداة استخراج بيانات من الويب متعددة الأغراض لاستخراج المحتوى من أي موقع.

أداة استخراج العناصر

استهداف عناصر محددة في صفحات الويب بقدرات استخراج دقيقة.

أداة زحف Firecrawl

زحف مواقع كاملة بشكل منهجي باستخدام محرك Firecrawl القوي.

أداة استخراج Firecrawl

استخراج بيانات عالي الأداء من الويب مع قدرات Firecrawl المتقدمة.

أداة بحث Firecrawl

البحث واستخراج محتوى محدد باستخدام ميزات بحث Firecrawl.

أداة استخراج Selenium

أتمتة المتصفح والاستخراج باستخدام قدرات Selenium WebDriver.

أداة ScrapFly

استخراج احترافي من الويب مع خدمة ScrapFly المتميزة.

أداة ScrapGraph

استخراج بيانات من الويب قائم على الرسوم البيانية لعلاقات البيانات المعقدة.

أداة Spider

قدرات شاملة للزحف واستخراج البيانات من الويب.

أداة BrowserBase

أتمتة المتصفح السحابية مع بنية BrowserBase التحتية.

أداة HyperBrowser

تفاعلات متصفح سريعة مع محرك HyperBrowser المُحسّن.

أداة Stagehand

أتمتة متصفح ذكية باستخدام أوامر اللغة الطبيعية.

أداة Oxylabs للاستخراج

الوصول إلى بيانات الويب على نطاق واسع مع Oxylabs.

أدوات Bright Data

تكاملات بحث SERP و Web Unlocker و Dataset API.

حالات الاستخدام الشائعة

استخراج البيانات: استخراج معلومات المنتجات والأسعار والمراجعات
مراقبة المحتوى: تتبع التغييرات على المواقع ومصادر الأخبار
توليد العملاء المحتملين: استخراج معلومات الاتصال وبيانات الأعمال
أبحاث السوق: جمع المعلومات الاستخباراتية التنافسية وبيانات السوق
الاختبار وضمان الجودة: أتمتة اختبار المتصفح وسير عمل التحقق
وسائل التواصل الاجتماعي: استخراج المنشورات والتعليقات وتحليلات وسائل التواصل الاجتماعي

مثال سريع للبدء

from crewai_tools import ScrapeWebsiteTool, FirecrawlScrapeWebsiteTool, SeleniumScrapingTool

# Create scraping tools
simple_scraper = ScrapeWebsiteTool()
advanced_scraper = FirecrawlScrapeWebsiteTool()
browser_automation = SeleniumScrapingTool()

# Add to your agent
agent = Agent(
    role="Web Research Specialist",
    tools=[simple_scraper, advanced_scraper, browser_automation],
    goal="Extract and analyze web data efficiently"
)

أفضل ممارسات الاستخراج

احترام robots.txt: تحقق دائماً واتبع سياسات استخراج المواقع
تحديد المعدل: نفّذ تأخيرات بين الطلبات لتجنب إرهاق الخوادم
وكيل المستخدم: استخدم سلاسل وكيل مستخدم مناسبة لتعريف الروبوت الخاص بك
الامتثال القانوني: تأكد من أن أنشطة الاستخراج تتوافق مع شروط الخدمة
معالجة الأخطاء: نفّذ معالجة أخطاء قوية لمشاكل الشبكة والطلبات المحظورة
جودة البيانات: تحقق من صحة البيانات المستخرجة ونظّفها قبل المعالجة

دليل اختيار الأداة

المهام البسيطة: استخدم ScrapeWebsiteTool لاستخراج المحتوى الأساسي
المواقع كثيفة JavaScript: استخدم SeleniumScrapingTool للمحتوى الديناميكي
التوسع والأداء: استخدم FirecrawlScrapeWebsiteTool للاستخراج بكميات كبيرة
البنية التحتية السحابية: استخدم BrowserBaseLoadTool لأتمتة المتصفح القابلة للتوسع
سير العمل المعقدة: استخدم StagehandTool لتفاعلات المتصفح الذكية

أداة كتابة نص PDF

استخراج الموقع

⌘I

البدء

الأدلّة

المفاهيم الأساسية

تكامل MCP

الأدوات

Observability

التعلّم

Telemetry

نظرة عامة

الأدوات المتاحة

أداة استخراج المواقع

أداة استخراج العناصر

أداة زحف Firecrawl

أداة استخراج Firecrawl

أداة بحث Firecrawl

أداة استخراج Selenium

أداة ScrapFly

أداة ScrapGraph

أداة Spider

أداة BrowserBase

أداة HyperBrowser

أداة Stagehand

أداة Oxylabs للاستخراج

أدوات Bright Data

حالات الاستخدام الشائعة

مثال سريع للبدء

أفضل ممارسات الاستخراج

دليل اختيار الأداة

البدء

الأدلّة

المفاهيم الأساسية

تكامل MCP

الأدوات

Observability

التعلّم

Telemetry

Documentation Index

​الأدوات المتاحة

أداة استخراج المواقع

أداة استخراج العناصر

أداة زحف Firecrawl

أداة استخراج Firecrawl

أداة بحث Firecrawl

أداة استخراج Selenium

أداة ScrapFly

أداة ScrapGraph

أداة Spider

أداة BrowserBase

أداة HyperBrowser

أداة Stagehand

أداة Oxylabs للاستخراج

أدوات Bright Data

​حالات الاستخدام الشائعة

​مثال سريع للبدء

​أفضل ممارسات الاستخراج

​دليل اختيار الأداة

الأدوات المتاحة

حالات الاستخدام الشائعة

مثال سريع للبدء

أفضل ممارسات الاستخراج

دليل اختيار الأداة