ScrapeElementFromWebsiteTool
Descrição
AScrapeElementFromWebsiteTool
foi projetada para extrair elementos específicos de websites utilizando seletores CSS. Esta ferramenta permite que agentes CrewAI capturem conteúdos direcionados de páginas web, tornando-se útil para tarefas de extração de dados em que apenas partes específicas de uma página são necessárias.
Instalação
Para utilizar esta ferramenta, você precisa instalar as dependências necessárias:Passos para Começar
Para usar aScrapeElementFromWebsiteTool
de maneira eficaz, siga estes passos:
- Instale as Dependências: Instale os pacotes necessários com o comando acima.
- Identifique os Seletores CSS: Determine os seletores CSS dos elementos que deseja extrair do site.
- Inicialize a Ferramenta: Crie uma instância da ferramenta com os parâmetros necessários.
Exemplo
O exemplo abaixo demonstra como usar aScrapeElementFromWebsiteTool
para extrair elementos específicos de um website:
Code
Code
Parâmetros
AScrapeElementFromWebsiteTool
aceita os seguintes parâmetros durante a inicialização:
- website_url: Opcional. A URL do website a ser extraído. Se fornecido na inicialização, o agente não precisará especificá-lo ao utilizar a ferramenta.
- css_element: Opcional. O seletor CSS para os elementos a serem extraídos. Se fornecido na inicialização, o agente não precisará especificá-lo ao utilizar a ferramenta.
- cookies: Opcional. Um dicionário contendo cookies a serem enviados com a requisição. Isso pode ser útil para sites que requerem autenticação.
Uso
Ao utilizar aScrapeElementFromWebsiteTool
com um agente, o agente precisará fornecer os seguintes parâmetros (a menos que já tenham sido especificados na inicialização):
- website_url: A URL do website a ser extraído.
- css_element: O seletor CSS dos elementos a serem extraídos.
Code
Detalhes de Implementação
AScrapeElementFromWebsiteTool
utiliza a biblioteca requests
para buscar a página web e BeautifulSoup
para analisar o HTML e extrair os elementos especificados:
Code
Conclusão
AScrapeElementFromWebsiteTool
oferece uma maneira poderosa de extrair elementos específicos de websites utilizando seletores CSS. Ao possibilitar que agentes direcionem apenas o conteúdo que necessitam, ela torna as tarefas de web scraping mais eficientes e objetivas. Esta ferramenta é particularmente útil para extração de dados, monitoramento de conteúdos e tarefas de pesquisa em que informações específicas precisam ser extraídas de páginas web.