Tavily API를 사용하여 웹 페이지에서 구조화된 콘텐츠를 추출합니다
TavilyExtractorTool
은 CrewAI 에이전트가 Tavily API를 사용하여 웹 페이지에서 구조화된 콘텐츠를 추출할 수 있도록 합니다. 이 도구는 단일 URL 또는 URL 목록을 처리할 수 있으며, 추출 깊이를 제어하고 이미지를 포함하는 등의 옵션을 제공합니다.
TavilyExtractorTool
을 사용하려면 tavily-python
라이브러리를 설치해야 합니다:
TavilyExtractorTool
을 초기화하고 사용하는 방법입니다:
TavilyExtractorTool
은 다음과 같은 인자를 받습니다:
urls
(Union[List[str], str]): 필수. 데이터를 추출할 단일 URL 문자열 또는 URL 문자열의 리스트.include_images
(Optional[bool]): 추출 결과에 이미지를 포함할지 여부. 기본값은 False
입니다.extract_depth
(Literal[“basic”, “advanced”]): 추출의 깊이. 더 빠르고 표면적인 추출에는 "basic"
을, 더 포괄적인 추출에는 "advanced"
를 사용합니다. 기본값은 "basic"
입니다.timeout
(int): 추출 요청이 완료될 때까지 대기하는 최대 시간(초)입니다. 기본값은 60
입니다.extract_depth
에 따라 달라집니다.
일반적인 응답 요소는 다음과 같습니다:
include_images=True
인 경우)