نماذج اللغة الكبيرة (LLMs)

نظرة عامة

يتكامل CrewAI مع مزودي LLM متعددين من خلال حزم SDK الأصلية للمزودين، مما يمنحك المرونة لاختيار النموذج المناسب لحالة الاستخدام الخاصة بك. سيساعدك هذا الدليل على فهم كيفية إعداد واستخدام مزودي LLM المختلفين في مشاريع CrewAI.

ما هي نماذج اللغة الكبيرة؟

نماذج اللغة الكبيرة (LLMs) هي الذكاء الأساسي وراء وكلاء CrewAI. تمكّن الوكلاء من فهم السياق واتخاذ القرارات وتوليد استجابات شبيهة بالبشر. إليك ما تحتاج معرفته:

أساسيات LLM

نماذج اللغة الكبيرة هي أنظمة ذكاء اصطناعي مدربة على كميات هائلة من البيانات النصية. تدعم ذكاء وكلاء CrewAI، مما يمكّنهم من فهم وتوليد نصوص شبيهة بالبشر.

نافذة السياق

تحدد نافذة السياق مقدار النص الذي يمكن لـ LLM معالجته في وقت واحد. النوافذ الأكبر (مثل 128K رمز) تتيح سياقًا أكثر لكنها قد تكون أكثر تكلفة وأبطأ.

درجة الحرارة

تتحكم درجة الحرارة (0.0 إلى 1.0) في عشوائية الاستجابة. القيم المنخفضة (مثل 0.2) تنتج مخرجات أكثر تركيزًا وحتمية، بينما القيم الأعلى (مثل 0.8) تزيد الإبداع والتنوع.

اختيار المزود

يقدم كل مزود LLM (مثل OpenAI و Anthropic و Google) نماذج مختلفة بقدرات وأسعار وميزات متفاوتة. اختر بناءً على احتياجاتك من الدقة والسرعة والتكلفة.

إعداد LLM الخاص بك

هناك أماكن مختلفة في كود CrewAI حيث يمكنك تحديد النموذج المُستخدم. بمجرد تحديد النموذج، ستحتاج إلى توفير الإعداد (مثل مفتاح API) لكل مزود نموذج تستخدمه. انظر قسم أمثلة إعداد المزودين لمزودك.

1. متغيرات البيئة
2. إعداد YAML
3. كود مباشر

أبسط طريقة للبدء. عيّن النموذج في بيئتك مباشرة، من خلال ملف .env أو في كود تطبيقك. إذا استخدمت crewai create لبدء مشروعك، سيكون مُعيّنًا بالفعل.

.env

MODEL=model-id  # e.g. gpt-4o, gemini-2.0-flash, claude-3-sonnet-...

# Be sure to set your API keys here too. See the Provider
# section below.

لا تقم أبدًا بتأكيد مفاتيح API في التحكم بالإصدارات. استخدم ملفات البيئة (.env) أو إدارة أسرار نظامك.

أنشئ ملف YAML لتعريف إعدادات الوكلاء. هذه الطريقة رائعة للتحكم بالإصدارات والتعاون بين الفريق:

agents.yaml

researcher:
    role: Research Specialist
    goal: Conduct comprehensive research and analysis
    backstory: A dedicated research professional with years of experience
    verbose: true
    llm: provider/model-id  # e.g. openai/gpt-4o, google/gemini-2.0-flash, anthropic/claude...
    # (see provider configuration examples below for more)

يتيح لك إعداد YAML:

التحكم بإصدارات إعدادات الوكلاء
التبديل بسهولة بين النماذج المختلفة
مشاركة الإعدادات بين أعضاء الفريق
توثيق خيارات النماذج وأغراضها

لأقصى مرونة، أعدّ LLMs مباشرة في كود Python:

from crewai import LLM

# Basic configuration
llm = LLM(model="model-id-here")  # gpt-4o, gemini-2.0-flash, anthropic/claude...

# Advanced configuration with detailed parameters
llm = LLM(
    model="model-id-here",  # gpt-4o, gemini-2.0-flash, anthropic/claude...
    temperature=0.7,        # Higher for more creative outputs
    timeout=120,            # Seconds to wait for response
    max_tokens=4000,        # Maximum length of response
    top_p=0.9,              # Nucleus sampling parameter
    frequency_penalty=0.1 , # Reduce repetition
    presence_penalty=0.1,   # Encourage topic diversity
    response_format={"type": "json"},  # For structured outputs
    seed=42                 # For reproducible results
)

شرح المعاملات:

temperature: تتحكم في العشوائية (0.0-1.0)
timeout: أقصى وقت انتظار للاستجابة
max_tokens: تحدد طول الاستجابة
top_p: بديل لدرجة الحرارة للعينات
frequency_penalty: تقلل تكرار الكلمات
presence_penalty: تشجع موضوعات جديدة
response_format: تحدد هيكل المخرجات
seed: تضمن مخرجات متسقة

يوفر CrewAI تكاملات SDK أصلية لـ OpenAI و Anthropic و Google (Gemini API) و Azure و AWS Bedrock — لا حاجة لتثبيت إضافي بخلاف الملحقات الخاصة بالمزود (مثل uv add "crewai[openai]").جميع المزودين الآخرين مدعومون بواسطة LiteLLM. إذا كنت تخطط لاستخدام أي منهم، أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

أمثلة إعداد المزودين

يدعم CrewAI العديد من مزودي LLM، كل منهم يقدم ميزات فريدة وطرق مصادقة وقدرات نماذج. في هذا القسم، ستجد أمثلة مفصلة تساعدك في اختيار وإعداد وتحسين LLM الأنسب لاحتياجات مشروعك.

OpenAI

يوفر CrewAI تكاملًا أصليًا مع OpenAI من خلال OpenAI Python SDK.

Code

# Required
OPENAI_API_KEY=sk-...

# Optional
OPENAI_BASE_URL=<custom-base-url>

الاستخدام الأساسي:

Code

from crewai import LLM

llm = LLM(
    model="openai/gpt-4o",
    api_key="your-api-key",  # Or set OPENAI_API_KEY
    temperature=0.7,
    max_tokens=4000
)

الإعداد المتقدم:

Code

from crewai import LLM

llm = LLM(
    model="openai/gpt-4o",
    api_key="your-api-key",
    base_url="https://api.openai.com/v1",  # Optional custom endpoint
    organization="org-...",  # Optional organization ID
    project="proj_...",  # Optional project ID
    temperature=0.7,
    max_tokens=4000,
    max_completion_tokens=4000,  # For newer models
    top_p=0.9,
    frequency_penalty=0.1,
    presence_penalty=0.1,
    stop=["END"],
    seed=42,  # For reproducible outputs
    stream=True,  # Enable streaming
    timeout=60.0,  # Request timeout in seconds
    max_retries=3,  # Maximum retry attempts
    logprobs=True,  # Return log probabilities
    top_logprobs=5,  # Number of most likely tokens
    reasoning_effort="medium"  # For o1 models: low, medium, high
)

المخرجات المهيكلة:

Code

from pydantic import BaseModel
from crewai import LLM

class ResponseFormat(BaseModel):
    name: str
    age: int
    summary: str

llm = LLM(
    model="openai/gpt-4o",
)

متغيرات البيئة المدعومة:

OPENAI_API_KEY: مفتاح OpenAI API (مطلوب)
OPENAI_BASE_URL: عنوان URL مخصص لـ OpenAI API (اختياري)

الميزات:

دعم استدعاء الدوال الأصلي (باستثناء نماذج o1)
مخرجات منظمة مع JSON schema
دعم البث للاستجابات في الوقت الفعلي
تتبع استخدام الرموز
دعم تسلسلات التوقف (باستثناء نماذج o1)
احتمالات السجل لرؤى على مستوى الرموز
التحكم في جهد الاستدلال لنماذج o1

النماذج المدعومة:

النموذج	نافذة السياق	الأفضل لـ
gpt-4.1	1M tokens	أحدث نموذج بقدرات محسّنة
gpt-4.1-mini	1M tokens	إصدار فعال بسياق كبير
gpt-4.1-nano	1M tokens	متغير فائق الكفاءة
gpt-4o	128,000 tokens	محسّن للسرعة والذكاء
gpt-4o-mini	200,000 tokens	فعال من حيث التكلفة بسياق كبير
gpt-4-turbo	128,000 tokens	المحتوى الطويل، تحليل المستندات
gpt-4	8,192 tokens	مهام الدقة العالية، الاستدلال المعقد
o1	200,000 tokens	الاستدلال المتقدم، حل المشكلات المعقدة
o1-preview	128,000 tokens	معاينة قدرات الاستدلال
o1-mini	128,000 tokens	نموذج استدلال فعال
o3-mini	200,000 tokens	نموذج استدلال خفيف
o4-mini	200,000 tokens	استدلال فعال من الجيل التالي

Responses API:تقدم OpenAI واجهتي API: Chat Completions (الافتراضية) و Responses API الأحدث. تم تصميم Responses API من الأساس مع دعم أصلي متعدد الوسائط — النص والصور والصوت واستدعاءات الدوال كلها مكوّنات أساسية. توفر أداءً أفضل مع نماذج الاستدلال وتدعم ميزات إضافية مثل السلسلة التلقائية والأدوات المدمجة.

Code

from crewai import LLM

# Use the Responses API instead of Chat Completions
llm = LLM(
    model="openai/gpt-4o",
    api="responses",  # Enable Responses API
    store=True,  # Store responses for multi-turn (optional)
    auto_chain=True,  # Auto-chain for reasoning models (optional)
)

معاملات Responses API:

api: عيّن إلى "responses" لاستخدام Responses API (الافتراضي: "completions")
instructions: تعليمات على مستوى النظام (Responses API فقط)
store: ما إذا كان يجب تخزين الاستجابات للمحادثات متعددة الأدوار
previous_response_id: معرّف الاستجابة السابقة للمحادثات متعددة الأدوار
include: بيانات إضافية لتضمينها في الاستجابة (مثل ["reasoning.encrypted_content"])
builtin_tools: قائمة أدوات OpenAI المدمجة: "web_search", "file_search", "code_interpreter", "computer_use"
parse_tool_outputs: إعادة ResponsesAPIResult منظمة مع مخرجات أدوات مدمجة محللة
auto_chain: تتبع واستخدام معرّفات الاستجابة تلقائيًا للمحادثات متعددة الأدوار
auto_chain_reasoning: تتبع عناصر الاستدلال المشفرة للامتثال لـ ZDR

استخدم Responses API للمشاريع الجديدة، خاصة عند العمل مع نماذج الاستدلال (o1, o3, o4) أو عندما تحتاج دعمًا أصليًا متعدد الوسائط لـ الملفات.

ملاحظة: لاستخدام OpenAI، ثبّت التبعيات المطلوبة:

uv add "crewai[openai]"

Meta-Llama

توفر Meta Llama API الوصول إلى عائلة نماذج اللغة الكبيرة من Meta. الـ API متاحة عبر Meta Llama API. عيّن متغيرات البيئة التالية في ملف .env:

Code

# Meta Llama API Key Configuration
LLAMA_API_KEY=LLM|your_api_key_here

مثال الاستخدام في مشروع CrewAI:

Code

from crewai import LLM

# Initialize Meta Llama LLM
llm = LLM(
    model="meta_llama/Llama-4-Scout-17B-16E-Instruct-FP8",
    temperature=0.8,
    stop=["END"],
    seed=42
)

جميع النماذج المدرجة هنا https://llama.developer.meta.com/docs/models/ مدعومة.

معرّف النموذج	طول سياق الإدخال	طول سياق المخرجات	وسائط الإدخال	وسائط المخرجات
`meta_llama/Llama-4-Scout-17B-16E-Instruct-FP8`	128k	4028	نص، صورة	نص
`meta_llama/Llama-4-Maverick-17B-128E-Instruct-FP8`	128k	4028	نص، صورة	نص
`meta_llama/Llama-3.3-70B-Instruct`	128k	4028	نص	نص
`meta_llama/Llama-3.3-8B-Instruct`	128k	4028	نص	نص

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Anthropic

يوفر CrewAI تكاملًا أصليًا مع Anthropic من خلال Anthropic Python SDK.

Code

# Required
ANTHROPIC_API_KEY=sk-ant-...

الاستخدام الأساسي:

Code

from crewai import LLM

llm = LLM(
    model="anthropic/claude-3-5-sonnet-20241022",
    api_key="your-api-key",  # Or set ANTHROPIC_API_KEY
    max_tokens=4096  # Required for Anthropic
)

الإعداد المتقدم:

Code

from crewai import LLM

llm = LLM(
    model="anthropic/claude-3-5-sonnet-20241022",
    api_key="your-api-key",
    base_url="https://api.anthropic.com",  # Optional custom endpoint
    temperature=0.7,
    max_tokens=4096,  # Required parameter
    top_p=0.9,
    stop_sequences=["END", "STOP"],  # Anthropic uses stop_sequences
    stream=True,  # Enable streaming
    timeout=60.0,  # Request timeout in seconds
    max_retries=3  # Maximum retry attempts
)

التفكير الموسّع (Claude Sonnet 4 وما بعده):يدعم CrewAI ميزة التفكير الموسّع من Anthropic، التي تتيح لـ Claude التفكير في المشكلات بطريقة أكثر شبهًا بالبشر قبل الاستجابة. مفيد بشكل خاص لمهام الاستدلال والتحليل وحل المشكلات المعقدة.

Code

from crewai import LLM

# Enable extended thinking with default settings
llm = LLM(
    model="anthropic/claude-sonnet-4",
    thinking={"type": "enabled"},
    max_tokens=10000
)

# Configure thinking with budget control
llm = LLM(
    model="anthropic/claude-sonnet-4",
    thinking={
        "type": "enabled",
        "budget_tokens": 5000  # Limit thinking tokens
    },
    max_tokens=10000
)

خيارات إعداد التفكير:

type: عيّن إلى "enabled" لتفعيل وضع التفكير الموسّع
budget_tokens (اختياري): أقصى رموز للتفكير (يساعد في التحكم بالتكاليف)

النماذج التي تدعم التفكير الموسّع:

claude-sonnet-4 والنماذج الأحدث
claude-3-7-sonnet (مع قدرات التفكير الموسّع)

متى تستخدم التفكير الموسّع:

الاستدلال المعقد وحل المشكلات متعددة الخطوات
الحسابات الرياضية والبراهين
تحليل الكود وتصحيح الأخطاء
التخطيط الاستراتيجي واتخاذ القرارات
البحث والمهام التحليلية

ملاحظة: يستهلك التفكير الموسّع رموزًا إضافية لكنه يمكن أن يحسّن جودة الاستجابة بشكل كبير للمهام المعقدة.متغيرات البيئة المدعومة:

ANTHROPIC_API_KEY: مفتاح Anthropic API (مطلوب)

الميزات:

دعم استخدام الأدوات الأصلي لنماذج Claude 3+
دعم التفكير الموسّع لـ Claude Sonnet 4+
دعم البث للاستجابات في الوقت الفعلي
معالجة تلقائية لرسائل النظام
تسلسلات التوقف للتحكم في المخرجات
تتبع استخدام الرموز
محادثات استخدام أدوات متعددة الأدوار

ملاحظات مهمة:

max_tokens معامل مطلوب لجميع نماذج Anthropic
يستخدم Claude stop_sequences بدلاً من stop
يتم التعامل مع رسائل النظام بشكل منفصل عن رسائل المحادثة
يجب أن تكون الرسالة الأولى من المستخدم (يتم التعامل معها تلقائيًا)
يجب أن تتناوب الرسائل بين المستخدم والمساعد

النماذج المدعومة:

النموذج	نافذة السياق	الأفضل لـ
claude-sonnet-4	200,000 tokens	الأحدث مع قدرات التفكير الموسّع
claude-3-7-sonnet	200,000 tokens	الاستدلال المتقدم والمهام الوكيلية
claude-3-5-sonnet-20241022	200,000 tokens	أحدث Sonnet بأفضل أداء
claude-3-5-haiku	200,000 tokens	نموذج سريع وصغير للاستجابات السريعة
claude-3-opus	200,000 tokens	الأكثر قدرة للمهام المعقدة
claude-3-sonnet	200,000 tokens	توازن بين الذكاء والسرعة
claude-3-haiku	200,000 tokens	الأسرع للمهام البسيطة
claude-2.1	200,000 tokens	سياق موسّع، هلوسات أقل
claude-2	100,000 tokens	نموذج متعدد الاستخدامات
claude-instant	100,000 tokens	سريع وفعال من حيث التكلفة للمهام اليومية

ملاحظة: لاستخدام Anthropic، ثبّت التبعيات المطلوبة:

uv add "crewai[anthropic]"

Google (Gemini API)

يوفر CrewAI تكاملًا أصليًا مع Google Gemini من خلال Google Gen AI Python SDK.عيّن مفتاح API في ملف .env. إذا كنت بحاجة إلى مفتاح، تحقق من AI Studio.

.env

# Required (one of the following)
GOOGLE_API_KEY=<your-api-key>
GEMINI_API_KEY=<your-api-key>

# For Vertex AI Express mode (API key authentication)
GOOGLE_GENAI_USE_VERTEXAI=true
GOOGLE_API_KEY=<your-api-key>

# For Vertex AI with service account
GOOGLE_CLOUD_PROJECT=<your-project-id>
GOOGLE_CLOUD_LOCATION=<location>  # Defaults to us-central1

الاستخدام الأساسي:

Code

from crewai import LLM

llm = LLM(
    model="gemini/gemini-2.0-flash",
    api_key="your-api-key",  # Or set GOOGLE_API_KEY/GEMINI_API_KEY
    temperature=0.7
)

الإعداد المتقدم:

Code

from crewai import LLM

llm = LLM(
    model="gemini/gemini-2.5-flash",
    api_key="your-api-key",
    temperature=0.7,
    top_p=0.9,
    top_k=40,  # Top-k sampling parameter
    max_output_tokens=8192,
    stop_sequences=["END", "STOP"],
    stream=True,  # Enable streaming
    safety_settings={
        "HARM_CATEGORY_HARASSMENT": "BLOCK_NONE",
        "HARM_CATEGORY_HATE_SPEECH": "BLOCK_NONE"
    }
)

وضع Vertex AI Express (مصادقة بمفتاح API):يتيح لك وضع Vertex AI Express استخدام Vertex AI مع مصادقة بسيطة بمفتاح API بدلاً من بيانات اعتماد حساب الخدمة. هذه أسرع طريقة للبدء مع Vertex AI.لتفعيل وضع Express، عيّن متغيري البيئة في ملف .env:

.env

GOOGLE_GENAI_USE_VERTEXAI=true
GOOGLE_API_KEY=<your-api-key>

ثم استخدم LLM كالمعتاد:

Code

from crewai import LLM

llm = LLM(
    model="gemini/gemini-2.0-flash",
    temperature=0.7
)

للحصول على مفتاح API لوضع Express:

مستخدمو Google Cloud الجدد: احصل على مفتاح API لوضع Express
مستخدمو Google Cloud الحاليون: احصل على مفتاح Google Cloud API مرتبط بحساب خدمة

لمزيد من التفاصيل، انظر وثائق وضع Vertex AI Express.

إعداد Vertex AI (حساب خدمة):

Code

from crewai import LLM

llm = LLM(
    model="gemini/gemini-1.5-pro",
    project="your-gcp-project-id",
    location="us-central1"  # GCP region
)

متغيرات البيئة المدعومة:

GOOGLE_API_KEY أو GEMINI_API_KEY: مفتاح Google API (مطلوب لـ Gemini API ووضع Vertex AI Express)
GOOGLE_GENAI_USE_VERTEXAI: عيّن إلى true لاستخدام Vertex AI (مطلوب لوضع Express)
GOOGLE_CLOUD_PROJECT: معرّف مشروع Google Cloud (لـ Vertex AI مع حساب خدمة)
GOOGLE_CLOUD_LOCATION: موقع GCP (الافتراضي us-central1)

الميزات:

دعم استدعاء الدوال الأصلي لنماذج Gemini 1.5+ و 2.x
دعم البث للاستجابات في الوقت الفعلي
قدرات متعددة الوسائط (نص، صور، فيديو)
إعداد إعدادات الأمان
دعم لكل من Gemini API و Vertex AI
معالجة تلقائية لتعليمات النظام
تتبع استخدام الرموز

نماذج Gemini:

النموذج	نافذة السياق	الأفضل لـ
gemini-2.5-flash	1M tokens	التفكير التكيفي، كفاءة التكلفة
gemini-2.5-pro	1M tokens	التفكير والاستدلال المحسّن، الفهم متعدد الوسائط
gemini-2.0-flash	1M tokens	ميزات الجيل التالي، السرعة، التفكير
gemini-2.0-flash-thinking	32,768 tokens	الاستدلال المتقدم مع عملية التفكير
gemini-2.0-flash-lite	1M tokens	كفاءة التكلفة ووقت الاستجابة المنخفض
gemini-1.5-pro	2M tokens	الأفضل أداءً، الاستدلال المنطقي، البرمجة
gemini-1.5-flash	1M tokens	نموذج متعدد الوسائط متوازن، جيد لمعظم المهام
gemini-1.5-flash-8b	1M tokens	الأسرع والأكثر كفاءة من حيث التكلفة
gemini-1.0-pro	32,768 tokens	نموذج الجيل السابق

ملاحظة: لاستخدام Google Gemini، ثبّت التبعيات المطلوبة:

uv add "crewai[google-genai]"

القائمة الكاملة للنماذج متاحة في وثائق نماذج Gemini.

Google (Vertex AI)

احصل على بيانات الاعتماد من Google Cloud Console واحفظها في ملف JSON، ثم حمّلها بالكود التالي:

Code

import json

file_path = 'path/to/vertex_ai_service_account.json'

# Load the JSON file
with open(file_path, 'r') as file:
    vertex_credentials = json.load(file)

# Convert the credentials to a JSON string
vertex_credentials_json = json.dumps(vertex_credentials)

مثال الاستخدام في مشروع CrewAI:

Code

from crewai import LLM

llm = LLM(
    model="gemini-1.5-pro-latest", # or vertex_ai/gemini-1.5-pro-latest
    temperature=0.7,
    vertex_credentials=vertex_credentials_json
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Azure

يوفر CrewAI تكاملًا أصليًا مع Azure AI Inference و Azure OpenAI من خلال Azure AI Inference Python SDK.

Code

# Required
AZURE_API_KEY=<your-api-key>
AZURE_ENDPOINT=<your-endpoint-url>

# Optional
AZURE_API_VERSION=<api-version>  # Defaults to 2024-06-01

الاستخدام الأساسي:

Code

llm = LLM(
    model="azure/gpt-4",
    api_key="<your-api-key>",  # Or set AZURE_API_KEY
    endpoint="<your-endpoint-url>",
    api_version="2024-06-01"
)

ملاحظة: لاستخدام Azure AI Inference، ثبّت التبعيات المطلوبة:

uv add "crewai[azure-ai-inference]"

AWS Bedrock

يوفر CrewAI تكاملًا أصليًا مع AWS Bedrock من خلال boto3 SDK باستخدام Converse API.

Code

# Required
AWS_ACCESS_KEY_ID=<your-access-key>
AWS_SECRET_ACCESS_KEY=<your-secret-key>

# Optional
AWS_SESSION_TOKEN=<your-session-token>  # For temporary credentials
AWS_DEFAULT_REGION=<your-region>  # Defaults to us-east-1
AWS_REGION_NAME=<your-region>  # Alternative configuration for backwards compatibility with LiteLLM. Defaults to us-east-1

الاستخدام الأساسي:

Code

from crewai import LLM

llm = LLM(
    model="bedrock/anthropic.claude-3-5-sonnet-20241022-v2:0",
    region_name="us-east-1"
)

الإعداد المتقدم:

Code

from crewai import LLM

llm = LLM(
    model="bedrock/anthropic.claude-3-5-sonnet-20241022-v2:0",
    aws_access_key_id="your-access-key",  # Or set AWS_ACCESS_KEY_ID
    aws_secret_access_key="your-secret-key",  # Or set AWS_SECRET_ACCESS_KEY
    aws_session_token="your-session-token",  # For temporary credentials
    region_name="us-east-1",
    temperature=0.7,
    max_tokens=4096,
    top_p=0.9,
    top_k=250,  # For Claude models
    stop_sequences=["END", "STOP"],
    stream=True,  # Enable streaming
    guardrail_config={  # Optional content filtering
        "guardrailIdentifier": "your-guardrail-id",
        "guardrailVersion": "1"
    },
    additional_model_request_fields={  # Model-specific parameters
        "top_k": 250
    }
)

متغيرات البيئة المدعومة:

AWS_ACCESS_KEY_ID: مفتاح وصول AWS (مطلوب)
AWS_SECRET_ACCESS_KEY: مفتاح AWS السري (مطلوب)
AWS_SESSION_TOKEN: رمز جلسة AWS لبيانات الاعتماد المؤقتة (اختياري)
AWS_DEFAULT_REGION: منطقة AWS (الافتراضي us-east-1)
AWS_REGION_NAME: منطقة AWS (الافتراضي us-east-1). إعداد بديل للتوافق مع LiteLLM

الميزات:

دعم استدعاء الأدوات الأصلي عبر Converse API
استجابات بث وبدون بث
معالجة أخطاء شاملة مع منطق إعادة المحاولة
إعداد حواجز الحماية لتصفية المحتوى
معاملات خاصة بالنموذج عبر additional_model_request_fields
تتبع استخدام الرموز وتسجيل سبب التوقف
دعم جميع نماذج Bedrock الأساسية
معالجة تلقائية لتنسيق المحادثة

ملاحظات مهمة:

يستخدم Converse API الحديث للوصول الموحد للنماذج
معالجة تلقائية لمتطلبات المحادثة الخاصة بالنموذج
يتم التعامل مع رسائل النظام بشكل منفصل عن المحادثة
يجب أن تكون الرسالة الأولى من المستخدم (يتم التعامل معها تلقائيًا)
بعض النماذج (مثل Cohere) تتطلب أن تنتهي المحادثة برسالة المستخدم

Amazon Bedrock هو خدمة مُدارة توفر الوصول إلى نماذج أساسية متعددة من أبرز شركات الذكاء الاصطناعي عبر واجهة API موحدة.

النموذج	نافذة السياق	الأفضل لـ
Amazon Nova Pro	حتى 300k tokens	أداء عالٍ، نموذج يوازن بين الدقة والسرعة والفعالية من حيث التكلفة عبر مهام متنوعة.
Amazon Nova Micro	حتى 128k tokens	نموذج نصي فقط عالي الأداء وفعال من حيث التكلفة ومحسّن لأقل وقت استجابة.
Amazon Nova Lite	حتى 300k tokens	معالجة متعددة الوسائط بأسعار معقولة للصور والفيديو والنص مع قدرات في الوقت الفعلي.
Claude 3.7 Sonnet	حتى 128k tokens	الأفضل أداءً للاستدلال المعقد والبرمجة ووكلاء الذكاء الاصطناعي
Claude 3.5 Sonnet v2	حتى 200k tokens	نموذج متطور متخصص في هندسة البرمجيات والقدرات الوكيلية والتفاعل مع الحاسوب بتكلفة محسّنة.
Claude 3.5 Sonnet	حتى 200k tokens	نموذج عالي الأداء يقدم ذكاءً واستدلالًا فائقين عبر مهام متنوعة مع توازن مثالي بين السرعة والتكلفة.
Claude 3.5 Haiku	حتى 200k tokens	نموذج متعدد الوسائط سريع وصغير محسّن للاستجابات السريعة والتفاعلات الشبيهة بالبشر
Claude 3 Sonnet	حتى 200k tokens	نموذج متعدد الوسائط يوازن بين الذكاء والسرعة للنشر بكميات كبيرة.
Claude 3 Haiku	حتى 200k tokens	نموذج متعدد الوسائط صغير وسريع محسّن للاستجابات السريعة والتفاعلات المحادثية الطبيعية
Claude 3 Opus	حتى 200k tokens	أكثر النماذج متعددة الوسائط تقدمًا يتفوق في المهام المعقدة بالاستدلال الشبيه بالبشر والفهم السياقي الفائق.
Claude 2.1	حتى 200k tokens	إصدار محسّن بنافذة سياق موسّعة وموثوقية محسّنة وهلوسات أقل لتطبيقات النصوص الطويلة وRAG
Claude	حتى 100k tokens	نموذج متعدد الاستخدامات يتفوق في الحوار المتقدم والمحتوى الإبداعي واتباع التعليمات الدقيقة.
Claude Instant	حتى 100k tokens	نموذج سريع وفعال من حيث التكلفة للمهام اليومية مثل الحوار والتحليل والتلخيص والأسئلة والأجوبة
Llama 3.1 405B Instruct	حتى 128k tokens	نموذج LLM متقدم لتوليد البيانات الاصطناعية والتقطير والاستدلال لروبوتات المحادثة والبرمجة والمهام المتخصصة.
Llama 3.1 70B Instruct	حتى 128k tokens	يدعم المحادثات المعقدة مع فهم سياقي فائق واستدلال وتوليد نص.
Llama 3.1 8B Instruct	حتى 128k tokens	نموذج متطور مع فهم اللغة واستدلال فائق وتوليد النص.
Llama 3 70B Instruct	حتى 8k tokens	يدعم المحادثات المعقدة مع فهم سياقي فائق واستدلال وتوليد نص.
Llama 3 8B Instruct	حتى 8k tokens	نموذج LLM متطور مع فهم اللغة واستدلال فائق وتوليد النص.
Titan Text G1 - Lite	حتى 4k tokens	نموذج خفيف وفعال من حيث التكلفة محسّن لمهام اللغة الإنجليزية والضبط الدقيق مع التركيز على التلخيص وتوليد المحتوى.
Titan Text G1 - Express	حتى 8k tokens	نموذج متعدد الاستخدامات لمهام اللغة العامة والمحادثة وتطبيقات RAG مع دعم الإنجليزية وأكثر من 100 لغة.
Cohere Command	حتى 4k tokens	نموذج متخصص في اتباع أوامر المستخدم وتقديم حلول عملية للمؤسسات.
Jurassic-2 Mid	حتى 8,191 tokens	نموذج فعال من حيث التكلفة يوازن بين الجودة والسعر لمهام اللغة المتنوعة مثل الأسئلة والأجوبة والتلخيص وتوليد المحتوى.
Jurassic-2 Ultra	حتى 8,191 tokens	نموذج لتوليد النص المتقدم والفهم، يتفوق في المهام المعقدة مثل التحليل وإنشاء المحتوى.
Jamba-Instruct	حتى 256k tokens	نموذج بنافذة سياق موسّعة محسّن لتوليد النص الفعال من حيث التكلفة والتلخيص والأسئلة والأجوبة.
Mistral 7B Instruct	حتى 32k tokens	نموذج LLM يتبع التعليمات ويكمل الطلبات ويولد نصًا إبداعيًا.
Mistral 8x7B Instruct	حتى 32k tokens	نموذج LLM بمعمارية MOE يتبع التعليمات ويكمل الطلبات ويولد نصًا إبداعيًا.
DeepSeek R1	32,768 tokens	نموذج استدلال متقدم

ملاحظة: لاستخدام AWS Bedrock، ثبّت التبعيات المطلوبة:

uv add "crewai[bedrock]"

Amazon SageMaker

Code

AWS_ACCESS_KEY_ID=<your-access-key>
AWS_SECRET_ACCESS_KEY=<your-secret-key>
AWS_DEFAULT_REGION=<your-region>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="sagemaker/<my-endpoint>"
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Mistral

عيّن متغيرات البيئة التالية في ملف .env:

Code

MISTRAL_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="mistral/mistral-large-latest",
    temperature=0.7
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Nvidia NIM

عيّن متغيرات البيئة التالية في ملف .env:

Code

NVIDIA_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="nvidia_nim/meta/llama3-70b-instruct",
    temperature=0.7
)

يوفر Nvidia NIM مجموعة شاملة من النماذج لحالات الاستخدام المتنوعة، من المهام ذات الأغراض العامة إلى التطبيقات المتخصصة.

النموذج	نافذة السياق	الأفضل لـ
nvidia/mistral-nemo-minitron-8b-8k-instruct	8,192 tokens	نموذج لغة صغير متطور يقدم دقة فائقة لروبوتات المحادثة والمساعدين الافتراضيين وتوليد المحتوى.
nvidia/nemotron-4-mini-hindi-4b-instruct	4,096 tokens	نموذج لغة صغير ثنائي اللغة هندي-إنجليزي للاستدلال على الجهاز، مصمم خصيصًا للغة الهندية.
nvidia/llama-3.1-nemotron-70b-instruct	128k tokens	مخصص لتعزيز فائدة الاستجابات
nvidia/llama3-chatqa-1.5-8b	128k tokens	نموذج LLM متقدم لتوليد استجابات عالية الجودة ومدركة للسياق لروبوتات المحادثة ومحركات البحث.
nvidia/llama3-chatqa-1.5-70b	128k tokens	نموذج LLM متقدم لتوليد استجابات عالية الجودة ومدركة للسياق لروبوتات المحادثة ومحركات البحث.
nvidia/vila	128k tokens	نموذج رؤية-لغة متعدد الوسائط يفهم النص والصور والفيديو وينشئ استجابات غنية بالمعلومات
nvidia/neva-22	4,096 tokens	نموذج رؤية-لغة متعدد الوسائط يفهم النص والصور ويولد استجابات غنية بالمعلومات
nvidia/nemotron-mini-4b-instruct	8,192 tokens	مهام ذات أغراض عامة
nvidia/usdcode-llama3-70b-instruct	128k tokens	نموذج LLM متطور يجيب على استعلامات معرفة OpenUSD ويولد كود USD-Python.
nvidia/nemotron-4-340b-instruct	4,096 tokens	ينشئ بيانات اصطناعية متنوعة تحاكي خصائص بيانات العالم الحقيقي.
meta/codellama-70b	100k tokens	نموذج LLM قادر على توليد الكود من اللغة الطبيعية والعكس.
meta/llama2-70b	4,096 tokens	نموذج لغة كبير متطور قادر على توليد النص والكود استجابة للمطالبات.
meta/llama3-8b-instruct	8,192 tokens	نموذج LLM متطور مع فهم اللغة واستدلال فائق وتوليد النص.
meta/llama3-70b-instruct	8,192 tokens	يدعم المحادثات المعقدة مع فهم سياقي فائق واستدلال وتوليد نص.
meta/llama-3.1-8b-instruct	128k tokens	نموذج متطور مع فهم اللغة واستدلال فائق وتوليد النص.
meta/llama-3.1-70b-instruct	128k tokens	يدعم المحادثات المعقدة مع فهم سياقي فائق واستدلال وتوليد نص.
meta/llama-3.1-405b-instruct	128k tokens	نموذج LLM متقدم لتوليد البيانات الاصطناعية والتقطير والاستدلال لروبوتات المحادثة والبرمجة والمهام المتخصصة.
meta/llama-3.2-1b-instruct	128k tokens	نموذج لغة صغير متطور مع فهم اللغة واستدلال فائق وتوليد النص.
meta/llama-3.2-3b-instruct	128k tokens	نموذج لغة صغير متطور مع فهم اللغة واستدلال فائق وتوليد النص.
meta/llama-3.2-11b-vision-instruct	128k tokens	نموذج لغة صغير متطور مع فهم اللغة واستدلال فائق وتوليد النص.
meta/llama-3.2-90b-vision-instruct	128k tokens	نموذج لغة صغير متطور مع فهم اللغة واستدلال فائق وتوليد النص.
google/gemma-7b	8,192 tokens	نموذج متطور لتوليد النص وفهمه وتحويله وتوليد الكود.
google/gemma-2b	8,192 tokens	نموذج متطور لتوليد النص وفهمه وتحويله وتوليد الكود.
google/codegemma-7b	8,192 tokens	نموذج متطور مبني على Gemma-7B من Google متخصص في توليد الكود وإكماله.
google/codegemma-1.1-7b	8,192 tokens	نموذج برمجة متقدم لتوليد الكود وإكماله والاستدلال واتباع التعليمات.
google/recurrentgemma-2b	8,192 tokens	نموذج لغة بمعمارية تكرارية جديدة لاستدلال أسرع عند توليد تسلسلات طويلة.
google/gemma-2-9b-it	8,192 tokens	نموذج متطور لتوليد النص وفهمه وتحويله وتوليد الكود.
google/gemma-2-27b-it	8,192 tokens	نموذج متطور لتوليد النص وفهمه وتحويله وتوليد الكود.
google/gemma-2-2b-it	8,192 tokens	نموذج متطور لتوليد النص وفهمه وتحويله وتوليد الكود.
google/deplot	512 tokens	نموذج فهم لغة بصرية بلقطة واحدة يترجم صور الرسوم البيانية إلى جداول.
google/paligemma	8,192 tokens	نموذج لغة بصري بارع في استيعاب مدخلات النص والصور لإنتاج استجابات غنية بالمعلومات.
mistralai/mistral-7b-instruct-v0.2	32k tokens	نموذج LLM يتبع التعليمات ويكمل الطلبات ويولد نصًا إبداعيًا.
mistralai/mixtral-8x7b-instruct-v0.1	8,192 tokens	نموذج LLM بمعمارية MOE يتبع التعليمات ويكمل الطلبات ويولد نصًا إبداعيًا.
mistralai/mistral-large	4,096 tokens	ينشئ بيانات اصطناعية متنوعة تحاكي خصائص بيانات العالم الحقيقي.
mistralai/mixtral-8x22b-instruct-v0.1	8,192 tokens	ينشئ بيانات اصطناعية متنوعة تحاكي خصائص بيانات العالم الحقيقي.
mistralai/mistral-7b-instruct-v0.3	32k tokens	نموذج LLM يتبع التعليمات ويكمل الطلبات ويولد نصًا إبداعيًا.
nv-mistralai/mistral-nemo-12b-instruct	128k tokens	أكثر نموذج لغة تقدمًا للاستدلال والبرمجة والمهام متعددة اللغات؛ يعمل على وحدة GPU واحدة.
mistralai/mamba-codestral-7b-v0.1	256k tokens	نموذج للكتابة والتفاعل مع الكود عبر مجموعة واسعة من لغات البرمجة والمهام.
microsoft/phi-3-mini-128k-instruct	128K tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3-mini-4k-instruct	4,096 tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3-small-8k-instruct	8,192 tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3-small-128k-instruct	128K tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3-medium-4k-instruct	4,096 tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3-medium-128k-instruct	128K tokens	نموذج LLM مفتوح خفيف ومتطور مع مهارات قوية في الرياضيات والاستدلال المنطقي.
microsoft/phi-3.5-mini-instruct	128K tokens	نموذج LLM خفيف متعدد اللغات يدعم تطبيقات الذكاء الاصطناعي في البيئات المحدودة بالكمون والذاكرة والحوسبة
microsoft/phi-3.5-moe-instruct	128K tokens	نموذج LLM متقدم يعتمد على معمارية خليط الخبراء لتوليد محتوى فعال حوسبيًا
microsoft/kosmos-2	1,024 tokens	نموذج متعدد الوسائط رائد مصمم لفهم العناصر المرئية في الصور والاستدلال عليها.
microsoft/phi-3-vision-128k-instruct	128k tokens	نموذج متعدد الوسائط مفتوح متطور يتفوق في الاستدلال عالي الجودة من الصور.
microsoft/phi-3.5-vision-instruct	128k tokens	نموذج متعدد الوسائط مفتوح متطور يتفوق في الاستدلال عالي الجودة من الصور.
databricks/dbrx-instruct	12k tokens	نموذج LLM للأغراض العامة بأداء متطور في فهم اللغة والبرمجة وRAG.
snowflake/arctic	1,024 tokens	يقدم استدلالًا عالي الكفاءة لتطبيقات المؤسسات مع التركيز على توليد SQL والبرمجة.
aisingapore/sea-lion-7b-instruct	4,096 tokens	نموذج LLM لتمثيل وخدمة التنوع اللغوي والثقافي لجنوب شرق آسيا
ibm/granite-8b-code-instruct	4,096 tokens	نموذج LLM لبرمجة البرمجيات لتوليد الكود وإكماله وشرحه والتحويل متعدد الأدوار.
ibm/granite-34b-code-instruct	8,192 tokens	نموذج LLM لبرمجة البرمجيات لتوليد الكود وإكماله وشرحه والتحويل متعدد الأدوار.
ibm/granite-3.0-8b-instruct	4,096 tokens	نموذج لغة صغير متقدم يدعم RAG والتلخيص والتصنيف والكود والذكاء الاصطناعي الوكيلي
ibm/granite-3.0-3b-a800m-instruct	4,096 tokens	نموذج خليط خبراء عالي الكفاءة لـ RAG والتلخيص واستخراج الكيانات والتصنيف
mediatek/breeze-7b-instruct	4,096 tokens	ينشئ بيانات اصطناعية متنوعة تحاكي خصائص بيانات العالم الحقيقي.
upstage/solar-10.7b-instruct	4,096 tokens	يتفوق في مهام NLP، خاصة في اتباع التعليمات والاستدلال والرياضيات.
writer/palmyra-med-70b-32k	32k tokens	نموذج LLM رائد للاستجابات الدقيقة والمناسبة للسياق في المجال الطبي.
writer/palmyra-med-70b	32k tokens	نموذج LLM رائد للاستجابات الدقيقة والمناسبة للسياق في المجال الطبي.
writer/palmyra-fin-70b-32k	32k tokens	نموذج LLM متخصص في التحليل المالي وإعداد التقارير ومعالجة البيانات
01-ai/yi-large	32k tokens	نموذج قوي مدرب على الإنجليزية والصينية لمهام متنوعة بما في ذلك روبوتات المحادثة والكتابة الإبداعية.
deepseek-ai/deepseek-coder-6.7b-instruct	2k tokens	نموذج برمجة قوي يقدم قدرات متقدمة في توليد الكود وإكماله وملء الفراغات
rakuten/rakutenai-7b-instruct	1,024 tokens	نموذج LLM متطور مع فهم اللغة واستدلال فائق وتوليد النص.
rakuten/rakutenai-7b-chat	1,024 tokens	نموذج LLM متطور مع فهم اللغة واستدلال فائق وتوليد النص.
baichuan-inc/baichuan2-13b-chat	4,096 tokens	يدعم المحادثة بالصينية والإنجليزية والبرمجة والرياضيات واتباع التعليمات وحل الألغاز

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Local NVIDIA NIM Deployed using WSL2

يتيح لك NVIDIA NIM تشغيل نماذج LLM قوية محليًا على جهاز Windows باستخدام WSL2 (نظام Windows الفرعي لـ Linux). يتيح لك هذا النهج الاستفادة من وحدة GPU من NVIDIA لاستدلال ذكاء اصطناعي خاص وآمن وفعال من حيث التكلفة دون الاعتماد على الخدمات السحابية. مثالي لسيناريوهات التطوير والاختبار أو الإنتاج حيث تكون خصوصية البيانات أو القدرات غير المتصلة مطلوبة.إليك دليلًا خطوة بخطوة لإعداد نموذج NVIDIA NIM محلي:

اتبع تعليمات التثبيت من موقع NVIDIA
ثبّت النموذج المحلي. لـ Llama 3.1-8b اتبع التعليمات
أعدّ نماذج crewai المحلية:

Code

from crewai.llm import LLM

local_nvidia_nim_llm = LLM(
    model="openai/meta/llama-3.1-8b-instruct", # it's an openai-api compatible model
    base_url="http://localhost:8000/v1",
    api_key="<your_api_key|any text if you have not configured it>", # api_key is required, but you can use any text
)

# Then you can use it in your crew:

@CrewBase
class MyCrew():
    # ...

    @agent
    def researcher(self) -> Agent:
        return Agent(
            config=self.agents_config['researcher'], # type: ignore[index]
            llm=local_nvidia_nim_llm
        )

    # ...

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Groq

عيّن متغيرات البيئة التالية في ملف .env:

Code

GROQ_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="groq/llama-3.2-90b-text-preview",
    temperature=0.7
)

النموذج	نافذة السياق	الأفضل لـ
Llama 3.1 70B/8B	131,072 tokens	مهام عالية الأداء بسياق كبير
Llama 3.2 Series	8,192 tokens	مهام ذات أغراض عامة
Mixtral 8x7B	32,768 tokens	أداء متوازن وسياق جيد

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

IBM watsonx.ai

عيّن متغيرات البيئة التالية في ملف .env:

Code

# Required
WATSONX_URL=<your-url>
WATSONX_APIKEY=<your-apikey>
WATSONX_PROJECT_ID=<your-project-id>

# Optional
WATSONX_TOKEN=<your-token>
WATSONX_DEPLOYMENT_SPACE_ID=<your-space-id>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="watsonx/meta-llama/llama-3-1-70b-instruct",
    base_url="https://api.watsonx.ai/v1"
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Ollama (نماذج LLM محلية)

ثبّت Ollama: ollama.ai
شغّل نموذجًا: ollama run llama3
أعدّ:

Code

llm = LLM(
    model="ollama/llama3:70b",
    base_url="http://localhost:11434"
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Fireworks AI

عيّن متغيرات البيئة التالية في ملف .env:

Code

FIREWORKS_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="fireworks_ai/accounts/fireworks/models/llama-v3-70b-instruct",
    temperature=0.7
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Perplexity AI

عيّن متغيرات البيئة التالية في ملف .env:

Code

PERPLEXITY_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="llama-3.1-sonar-large-128k-online",
    base_url="https://api.perplexity.ai/"
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Hugging Face

عيّن متغيرات البيئة التالية في ملف .env:

Code

HF_TOKEN=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="huggingface/meta-llama/Meta-Llama-3.1-8B-Instruct"
)

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

SambaNova

عيّن متغيرات البيئة التالية في ملف .env:

Code

SAMBANOVA_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="sambanova/Meta-Llama-3.1-8B-Instruct",
    temperature=0.7
)

النموذج	نافذة السياق	الأفضل لـ
Llama 3.1 70B/8B	حتى 131,072 tokens	مهام عالية الأداء بسياق كبير
Llama 3.1 405B	8,192 tokens	أداء عالٍ وجودة مخرجات
Llama 3.2 Series	8,192 tokens	مهام عامة ومتعددة الوسائط
Llama 3.3 70B	حتى 131,072 tokens	أداء عالٍ وجودة مخرجات
Qwen2 familly	8,192 tokens	أداء عالٍ وجودة مخرجات

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Cerebras

عيّن متغيرات البيئة التالية في ملف .env:

Code

# Required
CEREBRAS_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="cerebras/llama3.1-70b",
    temperature=0.7,
    max_tokens=8192
)

ميزات Cerebras:

سرعات استدلال عالية
أسعار تنافسية
توازن جيد بين السرعة والجودة
دعم نوافذ سياق طويلة

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Open Router

عيّن متغيرات البيئة التالية في ملف .env:

Code

OPENROUTER_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="openrouter/deepseek/deepseek-r1",
    base_url="https://openrouter.ai/api/v1",
    api_key=OPENROUTER_API_KEY
)

نماذج Open Router:

openrouter/deepseek/deepseek-r1
openrouter/deepseek/deepseek-chat

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

Nebius AI Studio

عيّن متغيرات البيئة التالية في ملف .env:

Code

NEBIUS_API_KEY=<your-api-key>

مثال الاستخدام في مشروع CrewAI:

Code

llm = LLM(
    model="nebius/Qwen/Qwen3-30B-A3B"
)

ميزات Nebius AI Studio:

مجموعة كبيرة من النماذج مفتوحة المصدر
حدود معدل أعلى
أسعار تنافسية
توازن جيد بين السرعة والجودة

ملاحظة: يستخدم هذا المزود LiteLLM. أضفه كتبعية لمشروعك:

uv add 'crewai[litellm]'

بث الاستجابات

يدعم CrewAI بث الاستجابات من LLMs، مما يتيح لتطبيقك تلقي ومعالجة المخرجات في الوقت الفعلي فور توليدها.

الإعداد الأساسي
معالجة الأحداث
تتبع Agent والمهمة

فعّل البث بتعيين معامل stream إلى True عند تهيئة LLM:

from crewai import LLM

# Create an LLM with streaming enabled
llm = LLM(
    model="openai/gpt-4o",
    stream=True  # Enable streaming
)

عند تفعيل البث، يتم تسليم الاستجابات في أجزاء فور توليدها، مما يخلق تجربة مستخدم أكثر استجابة.

يُصدر CrewAI أحداثًا لكل جزء يتم تلقيه أثناء البث:

from crewai.events import (
  LLMStreamChunkEvent
)
from crewai.events import BaseEventListener

class MyCustomListener(BaseEventListener):
    def setup_listeners(self, crewai_event_bus):
        @crewai_event_bus.on(LLMStreamChunkEvent)
        def on_llm_stream_chunk(self, event: LLMStreamChunkEvent):
          # Process each chunk as it arrives
          print(f"Received chunk: {event.chunk}")

my_listener = MyCustomListener()

انقر هنا لمزيد من التفاصيل

جميع أحداث LLM في CrewAI تتضمن معلومات Agent والمهمة، مما يتيح لك تتبع وتصفية تفاعلات LLM بواسطة وكلاء أو مهام محددة:

from crewai import LLM, Agent, Task, Crew
from crewai.events import LLMStreamChunkEvent
from crewai.events import BaseEventListener

class MyCustomListener(BaseEventListener):
    def setup_listeners(self, crewai_event_bus):
        @crewai_event_bus.on(LLMStreamChunkEvent)
        def on_llm_stream_chunk(source, event):
            if researcher.id == event.agent_id:
                print("\n==============\n Got event:", event, "\n==============\n")


my_listener = MyCustomListener()

llm = LLM(model="gpt-4o-mini", temperature=0, stream=True)

researcher = Agent(
    role="About User",
    goal="You know everything about the user.",
    backstory="""You are a master at understanding people and their preferences.""",
    llm=llm,
)

search = Task(
    description="Answer the following questions about the user: {question}",
    expected_output="An answer to the question.",
    agent=researcher,
)

crew = Crew(agents=[researcher], tasks=[search])

result = crew.kickoff(
    inputs={"question": "..."}
)

هذه الميزة مفيدة بشكل خاص لـ:

تصحيح سلوكيات وكلاء محددة
تسجيل استخدام LLM حسب نوع المهمة
مراجعة أي الوكلاء يجرون أنواع استدعاءات LLM
مراقبة أداء مهام محددة

استدعاءات LLM غير المتزامنة

يدعم CrewAI استدعاءات LLM غير المتزامنة لأداء وتزامن محسّنين في سير عمل الذكاء الاصطناعي. تتيح لك الاستدعاءات غير المتزامنة تشغيل طلبات LLM متعددة بشكل متزامن دون حجب، مما يجعلها مثالية لتطبيقات الإنتاجية العالية وعمليات الوكلاء المتوازية.

الاستخدام الأساسي
مع البث

استخدم دالة acall لطلبات LLM غير المتزامنة:

import asyncio
from crewai import LLM

async def main():
    llm = LLM(model="openai/gpt-4o")

    # Single async call
    response = await llm.acall("What is the capital of France?")
    print(response)

asyncio.run(main())

تدعم دالة acall جميع المعاملات نفسها كدالة call المتزامنة، بما في ذلك الرسائل والأدوات ودوال الاسترجاع.

اجمع بين الاستدعاءات غير المتزامنة والبث للاستجابات المتزامنة في الوقت الفعلي:

import asyncio
from crewai import LLM

async def stream_async():
    llm = LLM(model="openai/gpt-4o", stream=True)

    response = await llm.acall("Write a short story about AI")

    print(response)

asyncio.run(stream_async())

استدعاءات LLM المهيكلة

يدعم CrewAI الاستجابات المهيكلة من استدعاءات LLM من خلال السماح لك بتحديد response_format باستخدام نموذج Pydantic. يمكّن هذا الإطار من تحليل المخرجات والتحقق منها تلقائيًا، مما يسهّل دمج الاستجابة في تطبيقك دون معالجة لاحقة يدوية.

Code

from crewai import LLM

class Dog(BaseModel):
    name: str
    age: int
    breed: str


llm = LLM(model="gpt-4o", response_format=Dog)

response = llm.call(
    "Analyze the following messages and return the name, age, and breed. "
    "Meet Kona! She is 3 years old and is a black german shepherd."
)
print(response)

# Output:
# Dog(name='Kona', age=3, breed='black german shepherd')

الميزات المتقدمة والتحسين

تعلّم كيفية الاستفادة القصوى من إعداد LLM:

إدارة نافذة السياق

يتضمن CrewAI ميزات إدارة سياق ذكية:

from crewai import LLM

# CrewAI automatically handles:
# 1. Token counting and tracking
# 2. Content summarization when needed
# 3. Task splitting for large contexts

llm = LLM(
    model="gpt-4",
    max_tokens=4000,  # Limit response length
)

أفضل الممارسات لإدارة السياق:

اختر نماذج بنوافذ سياق مناسبة
عالج المدخلات الطويلة مسبقًا عند الإمكان
استخدم التقسيم للمستندات الكبيرة
راقب استخدام الرموز لتحسين التكاليف

تحسين الأداء

تحسين استخدام الرموز

اختر نافذة السياق المناسبة لمهمتك:

المهام الصغيرة (حتى 4K رمز): النماذج القياسية
المهام المتوسطة (بين 4K-32K): النماذج المحسّنة
المهام الكبيرة (أكثر من 32K): نماذج السياق الكبير

# Configure model with appropriate settings
llm = LLM(
    model="openai/gpt-4-turbo-preview",
    temperature=0.7,    # Adjust based on task
    max_tokens=4096,    # Set based on output needs
    timeout=300        # Longer timeout for complex tasks
)

درجة حرارة منخفضة (0.1 إلى 0.3) للاستجابات الواقعية
درجة حرارة عالية (0.7 إلى 0.9) للمهام الإبداعية

أفضل الممارسات

راقب استخدام الرموز
نفّذ تحديد المعدل
استخدم التخزين المؤقت عند الإمكان
عيّن حدود max_tokens مناسبة

تذكّر مراقبة استخدام الرموز بانتظام وضبط إعداداتك حسب الحاجة لتحسين التكاليف والأداء.

إسقاط المعاملات الإضافية

يستخدم CrewAI داخليًا حزم SDK أصلية لاستدعاءات LLM، مما يتيح لك إسقاط معاملات إضافية غير مطلوبة لحالة الاستخدام الخاصة بك. يمكن أن يساعد هذا في تبسيط كودك وتقليل تعقيد إعداد LLM.

from crewai import LLM
import os

os.environ["OPENAI_API_KEY"] = "<api-key>"

o3_llm = LLM(
    model="o3",
    drop_params=True,
    additional_drop_params=["stop"]
)

معترضات النقل

يوفر CrewAI معترضات رسائل لعدة مزودين، مما يتيح لك الربط بدورات الطلب/الاستجابة على مستوى طبقة النقل.المزودون المدعومون:

OpenAI
Anthropic

الاستخدام الأساسي:

import httpx
from crewai import LLM
from crewai.llms.hooks import BaseInterceptor

class CustomInterceptor(BaseInterceptor[httpx.Request, httpx.Response]):
"""Custom interceptor to modify requests and responses."""

def on_outbound(self, request: httpx.Request) -> httpx.Request:
    """Print request before sending to the LLM provider."""
    print(request)
    return request

def on_inbound(self, response: httpx.Response) -> httpx.Response:
    """Process response after receiving from the LLM provider."""
    print(f"Status: {response.status_code}")
    print(f"Response time: {response.elapsed}")
    return response

# Use the interceptor with an LLM
llm = LLM(
model="openai/gpt-4o",
interceptor=CustomInterceptor()
)

ملاحظات مهمة:

يجب على كلتا الدالتين إعادة الكائن المستلم أو نوعه.
تعديل الكائنات المستلمة قد يؤدي إلى سلوك غير متوقع أو أعطال في التطبيق.
ليس كل المزودين يدعمون المعترضات — تحقق من قائمة المزودين المدعومين أعلاه

تعمل المعترضات على مستوى طبقة النقل. مفيدة بشكل خاص لـ:

تحويل الرسائل وتصفيتها
تصحيح تفاعلات API

المشاكل الشائعة والحلول

المصادقة
أسماء النماذج
طول السياق

يمكن حل معظم مشاكل المصادقة بالتحقق من تنسيق مفتاح API وأسماء متغيرات البيئة.

# OpenAI
OPENAI_API_KEY=sk-...

# Anthropic
ANTHROPIC_API_KEY=sk-ant-...

ضمّن دائمًا بادئة المزود في أسماء النماذج

# Correct
llm = LLM(model="openai/gpt-4")

# Incorrect
llm = LLM(model="gpt-4")

استخدم نماذج سياق أكبر للمهام الواسعة

# Large context model
llm = LLM(model="openai/gpt-4o")  # 128K tokens

البدء

الأدلّة

المفاهيم الأساسية

تكامل MCP

الأدوات

Observability

التعلّم

Telemetry

نماذج اللغة الكبيرة (LLMs)

نظرة عامة

ما هي نماذج اللغة الكبيرة؟

أساسيات LLM

نافذة السياق

درجة الحرارة

اختيار المزود

إعداد LLM الخاص بك

أمثلة إعداد المزودين

بث الاستجابات

استدعاءات LLM غير المتزامنة

استدعاءات LLM المهيكلة

الميزات المتقدمة والتحسين

المشاكل الشائعة والحلول

البدء

الأدلّة

المفاهيم الأساسية

تكامل MCP

الأدوات

Observability

التعلّم

Telemetry

Documentation Index

​نظرة عامة

​ما هي نماذج اللغة الكبيرة؟

أساسيات LLM

نافذة السياق

درجة الحرارة

اختيار المزود

​إعداد LLM الخاص بك

​أمثلة إعداد المزودين

​بث الاستجابات

​استدعاءات LLM غير المتزامنة

​استدعاءات LLM المهيكلة

​الميزات المتقدمة والتحسين

​المشاكل الشائعة والحلول

نظرة عامة

ما هي نماذج اللغة الكبيرة؟

إعداد LLM الخاص بك

أمثلة إعداد المزودين

بث الاستجابات

استدعاءات LLM غير المتزامنة

استدعاءات LLM المهيكلة

الميزات المتقدمة والتحسين

المشاكل الشائعة والحلول