Este workflow automatiza el proceso de scraping web utilizando un agente de IA basado en visión. Primero, se obtiene una lista de URLs desde una hoja de cálculo de Google Sheets. Para cada URL, se utiliza ScrapingBee para obtener el HTML y una captura de pantalla de la página. A continuación, un agente de IA (basado en el modelo Google Gemini) procesa el HTML y la imagen para extraer información estructurada. El agente utiliza herramientas de scraping basadas en HTML para refinar la extracción. Finalmente, los datos extraídos, junto con la captura de pantalla, se añaden a la hoja de cálculo de Google Sheets. El flujo es el siguiente: Se inicia manualmente el workflow. Se lee una lista de URLs de Google Sheets. Por cada URL, ScrapingBee extrae el HTML y una captura de pantalla. El modelo Google Gemini, junto con herramientas de parsing de HTML, procesa esta información. Los resultados se estructuran y se añaden a la hoja de cálculo.
- Automatización completa del proceso de scraping web.
- Integración de múltiples servicios: Google Sheets, ScrapingBee y Google Gemini.
- Uso de un agente de IA para una extracción de datos más robusta y precisa.
- Manejo de imágenes para mejorar la comprensión contextual del agente de IA.
- Almacenamiento de los datos extraídos y las capturas de pantalla en Google Sheets.






