HyperbrowserLoadTool
الوصف
تتيح أداةHyperbrowserLoadTool استخراج البيانات من الويب والزحف باستخدام Hyperbrowser، وهي منصة لتشغيل وتوسيع المتصفحات بدون واجهة. تسمح لك هذه الأداة باستخراج صفحة واحدة أو زحف موقع كامل، مع إرجاع المحتوى بتنسيق markdown أو HTML منسّق بشكل صحيح.
الميزات الرئيسية:
- قابلية توسع فورية - تشغيل مئات جلسات المتصفح في ثوانٍ دون متاعب البنية التحتية
- تكامل بسيط - يعمل بسلاسة مع الأدوات الشائعة مثل Puppeteer و Playwright
- واجهات API قوية - واجهات سهلة الاستخدام لاستخراج/زحف أي موقع
- تجاوز إجراءات مكافحة الروبوتات - وضع التخفي المدمج وحظر الإعلانات وحل CAPTCHA التلقائي والبروكسيات الدوّارة
التثبيت
لاستخدام هذه الأداة، تحتاج إلى تثبيت Hyperbrowser SDK:خطوات البدء
لاستخدامHyperbrowserLoadTool بفعالية، اتبع هذه الخطوات:
- التسجيل: توجه إلى Hyperbrowser للتسجيل وتوليد مفتاح API.
- مفتاح API: عيّن متغير البيئة
HYPERBROWSER_API_KEYأو مرّره مباشرة إلى مُنشئ الأداة. - تثبيت SDK: ثبّت Hyperbrowser SDK باستخدام الأمر أعلاه.
مثال
يوضح المثال التالي كيفية تهيئة الأداة واستخدامها لاستخراج بيانات من موقع:Code
المعاملات
تقبل أداةHyperbrowserLoadTool المعاملات التالية:
معاملات المُنشئ
- api_key: اختياري. مفتاح Hyperbrowser API الخاص بك. إذا لم يتم تقديمه، سيتم قراءته من متغير البيئة
HYPERBROWSER_API_KEY.
معاملات التشغيل
- url: مطلوب. عنوان URL للموقع المراد استخراجه أو زحفه.
- operation: اختياري. العملية المراد تنفيذها على الموقع. إما ‘scrape’ أو ‘crawl’. الافتراضي هو ‘scrape’.
- params: اختياري. معاملات إضافية لعملية الاستخراج أو الزحف.
المعاملات المدعومة
للحصول على معلومات مفصلة حول جميع المعاملات المدعومة، قم بزيارة:تنسيق الإرجاع
تُرجع الأداة المحتوى بالتنسيق التالي:- لعمليات الاستخراج: محتوى الصفحة بتنسيق markdown أو HTML.
- لعمليات الزحف: محتوى كل صفحة مفصولاً بفواصل، مع تضمين عنوان URL لكل صفحة.
الخلاصة
توفر أداةHyperbrowserLoadTool طريقة قوية لاستخراج البيانات من المواقع وزحفها، مع التعامل مع السيناريوهات المعقدة مثل إجراءات مكافحة الروبوتات و CAPTCHA وغيرها. من خلال الاستفادة من منصة Hyperbrowser، تتيح هذه الأداة للوكلاء الوصول إلى محتوى الويب واستخراجه بكفاءة.