VisionTool

Descrição

Esta ferramenta é utilizada para extrair texto de imagens. Quando passada para o agente, ela extrai o texto da imagem e depois o utiliza para gerar uma resposta, relatório ou qualquer outra saída. A URL ou o CAMINHO da imagem deve ser passado para o Agente.

Instalação

Instale o pacote crewai_tools

pip install 'crewai[tools]'

Uso

Para usar o VisionTool, a chave da API da OpenAI deve ser definida na variável de ambiente OPENAI_API_KEY.

Code
from crewai_tools import VisionTool

vision_tool = VisionTool()

@agent
def researcher(self) -> Agent:
    '''
    This agent uses the VisionTool to extract text from images.
    '''
    return Agent(
        config=self.agents_config["researcher"],
        allow_delegation=False,
        tools=[vision_tool]
    )

Argumentos

O VisionTool requer os seguintes argumentos:

ArgumentoTipoDescrição
image_path_urlstringObrigatório. O caminho para o arquivo de imagem do qual o texto será extraído.