Un repositorio de GitHub que analiza fichas de Google Maps

Un repositorio de GitHub que analiza fichas de Google Maps

Existe una herramienta de código abierto capaz de recorrer Google Maps y extraer información de negocios de forma automatizada. Los datos que puede recopilar incluyen:

Nombre del negocio
Dirección
Teléfono
Página web
Valoración media
Número de reseñas
Categoría del negocio
Horarios
Servicios disponibles

El funcionamiento es bastante directo: le indicas una búsqueda del tipo “Restaurantes italianos en Madrid”, y el script lanza Google Maps, recorre los resultados, accede a cada ficha y vuelca toda la información en un archivo CSV.

¿Y para qué tiene sentido usarlo? Principalmente para entender cómo funciona la automatización de navegadores con Python y Playwright, y para aprender a extraer datos públicos de una web, procesarlos y convertirlos en algo estructurado y aprovechable.

Ahora bien, conviene tener los pies en el suelo. Google Maps tiene unos términos de uso bastante claros y restrictivos, así que si tu intención es utilizar estos datos en un proyecto serio, comercial o a gran escala, lo más sensato es recurrir a alternativas oficiales como la Google Places API.

La lectura que hago de este repositorio no es la de “la herramienta definitiva para conseguir leads”. Es un proyecto interesante para aprender cómo se construye un proceso de extracción de datos con Python, y el stack no puede ser más sencillo: Python + Playwright + Pandas. Abre el navegador, busca, hace scroll, entra en cada resultado y exporta.

Una buena pieza para aprender, pero también una reflexión importante: que algo sea técnicamente posible no implica que sea siempre recomendable llevarlo a producción.

Puedes ver el repositorio aquí: Repositorio en GitHub.


Scraping de Google Maps con Python, Playwright y Pandas: análisis técnico del repositorio

Resumen técnico

El repositorio automatiza la extracción de datos estructurados desde Google Maps usando Python, Playwright como motor de automatización de navegador y Pandas para el procesamiento y exportación. Extrae hasta 9 campos por ficha: nombre, dirección, teléfono, web, valoración media, número de reseñas, categoría, horarios y servicios. El flujo opera abriendo un navegador real, ejecutando búsquedas por consulta libre tipo “Restaurantes italianos en Madrid”, haciendo scroll dinámico sobre los resultados, accediendo a cada ficha individual y volcando los datos en un archivo CSV estructurado y procesable.

Análisis de implicaciones

Técnicamente, el stack demuestra que Playwright supera a soluciones clásicas como Selenium en estabilidad para scraping de SPAs con renderizado dinámico. El problema real no es técnico: Google Maps bloquea activamente el scraping automatizado mediante detección de bots, CAPTCHAs y rate limiting. Para proyectos en producción, el uso sin la Google Places API viola los términos de servicio y expone la IP a bloqueos permanentes. Este repositorio es válido como entorno de aprendizaje, no como solución de datos escalable.

Aplicación práctica

En contexto de ecommerce, este enfoque es útil para análisis competitivo local a pequeña escala o para construir datasets de prueba durante el desarrollo. Un caso concreto: mapear competidores directos en una ciudad concreta, extrayendo valoraciones y número de reseñas para benchmarking. Para implementación real, lo correcto es usar la Google Places API con autenticación, que ofrece hasta $200 de crédito mensual gratuito y devuelve los mismos campos en JSON estructurado sin riesgo de bloqueo ni violación de términos.

Contexto del sector

El scraping de datos de negocio local está en tensión directa con las políticas de las grandes plataformas. Google ha endurecido su detección desde 2023 con mecanismos antibot más agresivos. La alternativa oficial, Google Places API, cubre los mismos casos de uso con mayor fiabilidad y cumplimiento legal. Herramientas como Apify o Outscraper ofrecen soluciones intermedias gestionadas para quienes necesitan volumen sin infraestructura propia.

Artículo relacionado

Miguel C.

Ver publicación original

Deja un comentario

Información básica sobre protección de datos Ver más

  • Responsable: Lorenzo Lardillier Sanchez.
  • Finalidad:  Moderar los comentarios.
  • Legitimación:  Por consentimiento del interesado.
  • Destinatarios y encargados de tratamiento:  No se ceden o comunican datos a terceros para prestar este servicio. El Titular ha contratado los servicios de alojamiento web a htpps://www.unelink.es que actúa como encargado de tratamiento.
  • Derechos: Acceder, rectificar y suprimir los datos.
  • Información Adicional: Puede consultar la información detallada en la Política de Privacidad.

Esta web utiliza cookies propias y de terceros para su correcto funcionamiento y para fines analíticos y para mostrarte publicidad relacionada con sus preferencias en base a un perfil elaborado a partir de tus hábitos de navegación. Contiene enlaces a sitios web de terceros con políticas de privacidad ajenas que podrás aceptar o no cuando accedas a ellos. Al hacer clic en el botón Aceptar, acepta el uso de estas tecnologías y el procesamiento de tus datos para estos propósitos. Ver Política de cookies
Privacidad