O VisionTool
foi projetado para extrair texto de imagens.
VisionTool
Esta ferramenta é utilizada para extrair texto de imagens. Quando passada para o agente, ela extrai o texto da imagem e depois o utiliza para gerar uma resposta, relatório ou qualquer outra saída. A URL ou o CAMINHO da imagem deve ser passado para o Agente.
Instale o pacote crewai_tools
Para usar o VisionTool, a chave da API da OpenAI deve ser definida na variável de ambiente OPENAI_API_KEY
.
O VisionTool requer os seguintes argumentos:
Argumento | Tipo | Descrição |
---|---|---|
image_path_url | string | Obrigatório. O caminho para o arquivo de imagem do qual o texto será extraído. |