الانتقال إلى المحتوى الرئيسي

التثبيت

احصل على بيانات الاعتماد بإنشاء حساب Oxylabs هنا.
pip install 'crewai[tools]' oxylabs
راجع توثيق Oxylabs للحصول على مزيد من المعلومات حول معاملات API.

OxylabsAmazonProductScraperTool

مثال

from crewai_tools import OxylabsAmazonProductScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonProductScraperTool()

result = tool.run(query="AAAAABBBBCC")

print(result)

المعاملات

  • query - رمز ASIN المكون من 10 رموز.
  • domain - توطين النطاق لـ Amazon.
  • geo_location - موقع التوصيل إلى.
  • user_agent_type - نوع الجهاز والمتصفح.
  • render - يفعّل تصيير JavaScript عند التعيين إلى html.
  • callback_url - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
  • context - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
  • parse - يُرجع بيانات مُحلّلة عند التعيين إلى true.
  • parsing_instructions - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.

مثال متقدم

from crewai_tools import OxylabsAmazonProductScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonProductScraperTool(
    config={
        "domain": "com",
        "parse": True,
        "context": [
            {
                "key": "autoselect_variant",
                "value": True
            }
        ]
    }
)

result = tool.run(query="AAAAABBBBCC")

print(result)

OxylabsAmazonSearchScraperTool

مثال

from crewai_tools import OxylabsAmazonSearchScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonSearchScraperTool()

result = tool.run(query="headsets")

print(result)

المعاملات

  • query - مصطلح بحث Amazon.
  • domain - توطين النطاق لـ Bestbuy.
  • start_page - رقم صفحة البداية.
  • pages - عدد الصفحات المراد استرجاعها.
  • geo_location - موقع التوصيل إلى.
  • user_agent_type - نوع الجهاز والمتصفح.
  • render - يفعّل تصيير JavaScript عند التعيين إلى html.
  • callback_url - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
  • context - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
  • parse - يُرجع بيانات مُحلّلة عند التعيين إلى true.
  • parsing_instructions - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.

مثال متقدم

from crewai_tools import OxylabsAmazonSearchScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsAmazonSearchScraperTool(
    config={
        "domain": 'nl',
        "start_page": 2,
        "pages": 2,
        "parse": True,
        "context": [
            {'key': 'category_id', 'value': 16391693031}
        ],
    }
)

result = tool.run(query='nirvana tshirt')

print(result)

OxylabsGoogleSearchScraperTool

مثال

from crewai_tools import OxylabsGoogleSearchScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsGoogleSearchScraperTool()

result = tool.run(query="iPhone 16")

print(result)

المعاملات

  • query - كلمة البحث المفتاحية.
  • domain - توطين النطاق لـ Google.
  • start_page - رقم صفحة البداية.
  • pages - عدد الصفحات المراد استرجاعها.
  • limit - عدد النتائج المراد استرجاعها في كل صفحة.
  • locale - قيمة رأس Accept-Language التي تغيّر لغة واجهة صفحة بحث Google.
  • geo_location - الموقع الجغرافي الذي يجب تكييف النتيجة له. استخدام هذا المعامل بشكل صحيح مهم للغاية للحصول على البيانات الصحيحة.
  • user_agent_type - نوع الجهاز والمتصفح.
  • render - يفعّل تصيير JavaScript عند التعيين إلى html.
  • callback_url - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
  • context - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
  • parse - يُرجع بيانات مُحلّلة عند التعيين إلى true.
  • parsing_instructions - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.

مثال متقدم

from crewai_tools import OxylabsGoogleSearchScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsGoogleSearchScraperTool(
    config={
        "parse": True,
        "geo_location": "Paris, France",
        "user_agent_type": "tablet",
    }
)

result = tool.run(query="iPhone 16")

print(result)

OxylabsUniversalScraperTool

مثال

from crewai_tools import OxylabsUniversalScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsUniversalScraperTool()

result = tool.run(url="https://ip.oxylabs.io")

print(result)

المعاملات

  • url - عنوان URL للموقع المراد استخراجه.
  • user_agent_type - نوع الجهاز والمتصفح.
  • geo_location - يعيّن الموقع الجغرافي للبروكسي لاسترجاع البيانات.
  • render - يفعّل تصيير JavaScript عند التعيين إلى html.
  • callback_url - عنوان URL لنقطة نهاية الاستدعاء الخاصة بك.
  • context - إعدادات وضوابط متقدمة إضافية للمتطلبات المتخصصة.
  • parse - يُرجع بيانات مُحلّلة عند التعيين إلى true، طالما يوجد مُحلّل مخصص لنوع صفحة عنوان URL المقدم.
  • parsing_instructions - حدد منطق التحليل وتحويل البيانات الخاص بك الذي سيُنفّذ على نتيجة استخراج HTML.

مثال متقدم

from crewai_tools import OxylabsUniversalScraperTool

# make sure OXYLABS_USERNAME and OXYLABS_PASSWORD variables are set
tool = OxylabsUniversalScraperTool(
    config={
        "render": "html",
        "user_agent_type": "mobile",
        "context": [
            {"key": "force_headers", "value": True},
            {"key": "force_cookies", "value": True},
            {
                "key": "headers",
                "value": {
                    "Custom-Header-Name": "custom header content",
                },
            },
            {
                "key": "cookies",
                "value": [
                    {"key": "NID", "value": "1234567890"},
                    {"key": "1P JAR", "value": "0987654321"},
                ],
            },
            {"key": "http_method", "value": "get"},
            {"key": "follow_redirects", "value": True},
            {"key": "successful_status_codes", "value": [808, 909]},
        ],
    }
)

result = tool.run(url="https://ip.oxylabs.io")

print(result)