Visão Geral
O CrewAI suporta entradas de arquivos multimodais nativos, permitindo que você passe imagens, PDFs, áudio, vídeo e arquivos de texto diretamente para seus agentes. Os arquivos são formatados automaticamente para os requisitos da API de cada provedor LLM.O suporte a arquivos requer o pacote opcional
crewai-files. Instale com:A API de processamento de arquivos está atualmente em acesso antecipado.
Tipos de Arquivo
O CrewAI suporta cinco tipos de arquivo específicos mais uma classe genéricaFile que detecta automaticamente o tipo:
| Tipo | Classe | Casos de Uso |
|---|---|---|
| Imagem | ImageFile | Fotos, capturas de tela, diagramas, gráficos |
PDFFile | Documentos, relatórios, artigos | |
| Áudio | AudioFile | Gravações de voz, podcasts, reuniões |
| Vídeo | VideoFile | Gravações de tela, apresentações |
| Texto | TextFile | Arquivos de código, logs, arquivos de dados |
| Genérico | File | Detecta automaticamente o tipo do conteúdo |
Fontes de Arquivo
O parâmetrosource aceita múltiplos tipos de entrada e detecta automaticamente o handler apropriado:
De Caminho
De URL
De Bytes
Usando Arquivos
Arquivos podem ser passados em múltiplos níveis, com níveis mais específicos tendo precedência.Com Crews
Passe arquivos ao iniciar uma crew:Com Tasks
Anexe arquivos a tasks específicas:Com Flows
Passe arquivos para flows, que automaticamente herdam para crews:Com Agentes Standalone
Passe arquivos diretamente no kickoff do agente:Precedência de Arquivos
Quando arquivos são passados em múltiplos níveis, níveis mais específicos sobrescrevem os mais amplos:"chart", a versão da Task é usada.
Suporte por Provedor
Diferentes provedores suportam diferentes tipos de arquivo. O CrewAI formata automaticamente os arquivos para a API de cada provedor.| Provedor | Imagem | Áudio | Vídeo | Texto | |
|---|---|---|---|---|---|
| OpenAI (API completions) | ✓ | ||||
| OpenAI (API responses) | ✓ | ✓ | ✓ | ||
| Anthropic (claude-3.x) | ✓ | ✓ | |||
| Google Gemini (gemini-1.5, 2.0, 2.5) | ✓ | ✓ | ✓ | ✓ | ✓ |
| AWS Bedrock (claude-3) | ✓ | ✓ | |||
| Azure OpenAI (gpt-4o) | ✓ | ✓ |
Os modelos Google Gemini suportam todos os tipos de arquivo incluindo vídeo (até 1 hora, 2GB). Use Gemini quando precisar processar conteúdo de vídeo.
Se você passar um tipo de arquivo que o provedor não suporta (ex: vídeo para OpenAI), você receberá um
UnsupportedFileTypeError. Escolha seu provedor baseado nos tipos de arquivo que você precisa processar.Como os Arquivos São Enviados
O CrewAI escolhe automaticamente o método ideal para enviar arquivos para cada provedor:| Método | Descrição | Usado Quando |
|---|---|---|
| Base64 Inline | Arquivo embutido diretamente na requisição | Arquivos pequenos (< 5MB tipicamente) |
| API de Upload de Arquivo | Arquivo enviado separadamente, referenciado por ID | Arquivos grandes que excedem o limite |
| Referência por URL | URL direta passada para o modelo | Fonte do arquivo já é uma URL |
Métodos de Transmissão por Provedor
| Provedor | Base64 Inline | API de Upload | Referências URL |
|---|---|---|---|
| OpenAI | ✓ | ✓ (> 5 MB) | ✓ |
| Anthropic | ✓ | ✓ (> 5 MB) | ✓ |
| Google Gemini | ✓ | ✓ (> 20 MB) | ✓ |
| AWS Bedrock | ✓ | ✓ (S3 URIs) | |
| Azure OpenAI | ✓ | ✓ |
Você não precisa gerenciar isso. O CrewAI usa automaticamente o método mais eficiente baseado no tamanho do arquivo e nas capacidades do provedor. Provedores sem APIs de upload de arquivo usam base64 inline para todos os arquivos.
Modos de Tratamento de Arquivo
Controle como os arquivos são processados quando excedem os limites do provedor:Restrições por Provedor
Cada provedor tem limites específicos para tamanhos e dimensões de arquivo:OpenAI
- Imagens: Máx 20 MB, até 10 imagens por requisição
- PDFs: Máx 32 MB, até 100 páginas
- Áudio: Máx 25 MB, até 25 minutos
Anthropic
- Imagens: Máx 5 MB, máx 8000x8000 pixels, até 100 imagens
- PDFs: Máx 32 MB, até 100 páginas
Google Gemini
- Imagens: Máx 100 MB
- PDFs: Máx 50 MB
- Áudio: Máx 100 MB, até 9,5 horas
- Vídeo: Máx 2 GB, até 1 hora
AWS Bedrock
- Imagens: Máx 4,5 MB, máx 8000x8000 pixels
- PDFs: Máx 3,75 MB, até 100 páginas
