Tabla de Contenidos
Un repositorio de GitHub que analiza fichas de Google Maps
Existe una herramienta de código abierto capaz de recorrer Google Maps y extraer información de negocios de forma automatizada. Los datos que puede recopilar incluyen:
• Nombre del negocio
• Dirección
• Teléfono
• Página web
• Valoración media
• Número de reseñas
• Categoría del negocio
• Horarios
• Servicios disponibles
El funcionamiento es bastante directo: le indicas una búsqueda del tipo “Restaurantes italianos en Madrid”, y el script lanza Google Maps, recorre los resultados, accede a cada ficha y vuelca toda la información en un archivo CSV.
¿Y para qué tiene sentido usarlo? Principalmente para entender cómo funciona la automatización de navegadores con Python y Playwright, y para aprender a extraer datos públicos de una web, procesarlos y convertirlos en algo estructurado y aprovechable.
Ahora bien, conviene tener los pies en el suelo. Google Maps tiene unos términos de uso bastante claros y restrictivos, así que si tu intención es utilizar estos datos en un proyecto serio, comercial o a gran escala, lo más sensato es recurrir a alternativas oficiales como la Google Places API.
La lectura que hago de este repositorio no es la de “la herramienta definitiva para conseguir leads”. Es un proyecto interesante para aprender cómo se construye un proceso de extracción de datos con Python, y el stack no puede ser más sencillo: Python + Playwright + Pandas. Abre el navegador, busca, hace scroll, entra en cada resultado y exporta.
Una buena pieza para aprender, pero también una reflexión importante: que algo sea técnicamente posible no implica que sea siempre recomendable llevarlo a producción.
Puedes ver el repositorio aquí: Repositorio en GitHub.
Scraping de Google Maps con Python, Playwright y Pandas: análisis técnico del repositorio
Resumen técnico
El repositorio automatiza la extracción de datos estructurados desde Google Maps usando Python, Playwright como motor de automatización de navegador y Pandas para el procesamiento y exportación. Extrae hasta 9 campos por ficha: nombre, dirección, teléfono, web, valoración media, número de reseñas, categoría, horarios y servicios. El flujo opera abriendo un navegador real, ejecutando búsquedas por consulta libre tipo “Restaurantes italianos en Madrid”, haciendo scroll dinámico sobre los resultados, accediendo a cada ficha individual y volcando los datos en un archivo CSV estructurado y procesable.
Análisis de implicaciones
Técnicamente, el stack demuestra que Playwright supera a soluciones clásicas como Selenium en estabilidad para scraping de SPAs con renderizado dinámico. El problema real no es técnico: Google Maps bloquea activamente el scraping automatizado mediante detección de bots, CAPTCHAs y rate limiting. Para proyectos en producción, el uso sin la Google Places API viola los términos de servicio y expone la IP a bloqueos permanentes. Este repositorio es válido como entorno de aprendizaje, no como solución de datos escalable.
Aplicación práctica
En contexto de ecommerce, este enfoque es útil para análisis competitivo local a pequeña escala o para construir datasets de prueba durante el desarrollo. Un caso concreto: mapear competidores directos en una ciudad concreta, extrayendo valoraciones y número de reseñas para benchmarking. Para implementación real, lo correcto es usar la Google Places API con autenticación, que ofrece hasta $200 de crédito mensual gratuito y devuelve los mismos campos en JSON estructurado sin riesgo de bloqueo ni violación de términos.
Contexto del sector
El scraping de datos de negocio local está en tensión directa con las políticas de las grandes plataformas. Google ha endurecido su detección desde 2023 con mecanismos antibot más agresivos. La alternativa oficial, Google Places API, cubre los mismos casos de uso con mayor fiabilidad y cumplimiento legal. Herramientas como Apify o Outscraper ofrecen soluciones intermedias gestionadas para quienes necesitan volumen sin infraestructura propia.
