Patronus AI의 종합 평가 플랫폼을 사용하여 CrewAI 에이전트의 성능과 LLM 출력 및 에이전트 행동을 모니터링하고 평가합니다.
PatronusEvalTool
의 사용 방법을 보여줍니다:
PatronusPredefinedCriteriaEvalTool
의 사용 방법을 보여줍니다:
PatronusLocalEvaluatorTool
의 사용 방법을 보여줍니다:
PatronusEvalTool
은(는) 초기화 시에 어떠한 매개변수도 필요로 하지 않습니다. Patronus API에서 사용 가능한 평가자와 기준을 자동으로 가져옵니다.
PatronusPredefinedCriteriaEvalTool
은(는) 초기화 시 다음과 같은 파라미터를 받습니다:
[{"evaluator": "judge", "criteria": "contains-code"}]
.PatronusLocalEvaluatorTool
은(는) 초기화 시 다음과 같은 파라미터를 허용합니다:
PatronusEvalTool
및 PatronusPredefinedCriteriaEvalTool
을 호출할 때는 다음과 같은 매개변수가 필요합니다:
PatronusLocalEvaluatorTool
의 경우에도 동일한 매개변수가 필요하지만, 평가자와 정답은 초기화 시에 지정합니다.