Over 10 years we help companies reach their financial and branding goals. Engitech is a values-driven technology agency dedicated.

Gallery

Contacts

411 University St, Seattle, USA

engitech@oceanthemes.net

+1 -800-456-478-23

N8n workflows

Workflow n8n

Agente de IA basado en visión para scraping web con Google Sheets, ScrapingBee y Gemini

Complejidad: Intermedio

Este workflow automatiza el proceso de scraping web utilizando un agente de IA basado en visión. Primero, se obtiene una lista de URLs desde una hoja de cálculo de Google Sheets. Para cada URL, se utiliza ScrapingBee para obtener el HTML y una captura de pantalla de la página. A continuación, un agente de IA (basado en el modelo Google Gemini) procesa el HTML y la imagen para extraer información estructurada. El agente utiliza herramientas de scraping basadas en HTML para refinar la extracción. Finalmente, los datos extraídos, junto con la captura de pantalla, se añaden a la hoja de cálculo de Google Sheets. El flujo es el siguiente: Se inicia manualmente el workflow. Se lee una lista de URLs de Google Sheets. Por cada URL, ScrapingBee extrae el HTML y una captura de pantalla. El modelo Google Gemini, junto con herramientas de parsing de HTML, procesa esta información. Los resultados se estructuran y se añaden a la hoja de cálculo.

  • Automatización completa del proceso de scraping web.
  • Integración de múltiples servicios: Google Sheets, ScrapingBee y Google Gemini.
  • Uso de un agente de IA para una extracción de datos más robusta y precisa.
  • Manejo de imágenes para mejorar la comprensión contextual del agente de IA.
  • Almacenamiento de los datos extraídos y las capturas de pantalla en Google Sheets.

Descargar Workflow n8n: