Integração Opik
Saiba como usar o Comet Opik para depurar, avaliar e monitorar suas aplicações CrewAI com rastreamento abrangente, avaliações automatizadas e dashboards prontos para produção.
Visão Geral do Opik
Com o Comet Opik, depure, avalie e monitore suas aplicações LLM, sistemas RAG e fluxos de trabalho agentic com rastreamento detalhado, avaliações automatizadas e dashboards prontos para produção.
Dashboard do Agente Opik
O Opik oferece suporte abrangente para cada etapa do desenvolvimento da sua aplicação CrewAI:
- Registrar Traces e Spans: Acompanhe automaticamente chamadas LLM e lógica da aplicação para depurar e analisar sistemas em desenvolvimento e em produção. Anote manualmente ou programaticamente, visualize e compare respostas entre projetos.
- Avalie a Performance da sua Aplicação LLM: Avalie contra um conjunto de testes personalizado e execute métricas de avaliação nativas ou defina suas próprias métricas via SDK ou UI.
- Teste no Pipeline CI/CD: Estabeleça bases de performance confiáveis com os testes unitários LLM do Opik, baseados em PyTest. Execute avaliações online para monitoramento contínuo em produção.
- Monitore & Analise Dados de Produção: Entenda a performance dos seus modelos em dados inéditos em produção e gere conjuntos de dados para novas iterações de desenvolvimento.
Configuração
A Comet oferece uma versão hospedada da plataforma Opik, ou você pode rodar a plataforma localmente.
Para usar a versão hospedada, basta criar uma conta gratuita na Comet e obter sua chave de API.
Para rodar a plataforma Opik localmente, veja nosso guia de instalação para mais informações.
Neste guia, utilizaremos o exemplo de início rápido da CrewAI.
Instale os pacotes necessários
Configure o Opik
Prepare o ambiente
Primeiro, configuramos nossas chaves de API do provedor LLM como variáveis de ambiente:
Usando a CrewAI
O primeiro passo é criar nosso projeto. Vamos utilizar um exemplo da documentação do CrewAI:
Agora podemos importar o tracker do Opik e executar nossa crew:
Após rodar sua aplicação CrewAI, acesse o app Opik para visualizar:
- Traces LLM, spans e seus metadados
- Interações dos agentes e fluxo de execução das tarefas
- Métricas de performance, como latência e uso de tokens
- Métricas de avaliação (nativas ou personalizadas)