Cargando la bóveda…
Cargando la bóveda…
Librería open-source con MCP integrado para extraer info pública de Google Maps, directorios y sites públicos. Claude la usa con prompts simples para armar listas de leads sin pagar agencias. Cuándo conviene, cuándo es legalmente borderline.
Necesitás una lista de dentistas de tu ciudad con teléfono y dirección para hacer outreach B2B. Las opciones:
El patrón con Scrapling: una librería open-source con MCP integrado que Claude controla por vos. Le pedís en español, te arma la lista.
Sobre antes de seguir: scrapear info pública NO es ilegal en sí, pero hay matices legales según país, sitio y uso. Lee la sección "El warning legal" antes de empezar.
Una librería Python open-source para extraer info de sites web sin que te bloqueen. Se camufla como navegador real (no como bot). Tiene MCP server integrado → Claude la puede invocar directo.
Capacidades:
pip install scrapling.claude/settings.json:
{
"mcpServers": {
"scrapling": {
"command": "scrapling-mcp",
"env": {
"SCRAPLING_RATE_LIMIT": "human"
}
}
}
}Listo. En la próxima sesión de Claude, podés invocarlo.
> Necesito una lista de gimnasios en Buenos Aires capital.
Por cada uno:
- Nombre
- Dirección
- Teléfono
- URL del sitio web (si tiene)
- Rating de Google
- Cantidad de reseñas
Usá Scrapling sobre Google Maps. Filtrá los que tengan rating >4 y
más de 10 reseñas (señales de operación real).
Output: CSV en /tmp/gimnasios-baires.csvClaude invoca Scrapling, hace el scraping con tu config, te devuelve el archivo.
> Cada lunes, sacame los productos del sitio del competidor X:
- Producto
- Precio actual
- Precio anterior (si está visible)
- Stock declarado
- URL del producto
Comparame contra el output de la semana pasada (está en
/tmp/competencia/{fecha}.csv) y mostrame los cambios:
- Productos nuevos
- Productos descontinuados
- Cambios de precio (>5%)Agendado como hook o slash command que corre semanalmente.
Tenés un CSV con 200 empresas pero solo el nombre. Querés enriquecerlo:
> Tomá /tmp/empresas-input.csv (tiene solo el nombre de la empresa).
Para cada una, buscá públicamente y agregá:
- URL del sitio
- Industria
- Tamaño aproximado (employees range)
- Ciudad principal
- LinkedIn URL si la encontrás
Si no encontrás algún campo, dejá en blanco. NO inventes.
Output a /tmp/empresas-enriched.csvMucho más barato que servicios de enriquecimiento pagos.
No solo Google Maps. Scrapling también te sirve para extraer info de:
Cualquier site con info pública estructurada.
Scraping puede ser legal, ilegal o "depende" según múltiples factores:
robots.txtSi scrapeás 100k páginas en una hora, el site te bloquea y posiblemente toma acción legal. Siempre con rate limit humano (1-2 req/seg max).
Tener emails scrapeados no te da derecho a mandarles cold outreach masivo. En muchos países eso viola anti-spam. Tu IP/dominio termina blacklisted.
LinkedIn, Facebook, Instagram tienen prohibición explícita de scraping en sus Términos. Detectan y bannean cuentas. Algunos juicios famosos (LinkedIn vs HiQ) muestran que el tema es complejo legalmente.
Para data de redes: usá las APIs oficiales aunque sean limitadas o caras.
Scraping no es 100% confiable. La data viene con typos, formatos inconsistentes, valores faltantes. Siempre validá antes de mandar outreach — un email mal scrapeado mandado a la persona equivocada arruina la marca.
Pipeline completo sin pagar a 5 servicios distintos.
Útil para retail, SaaS, agencias.
✅ Necesitás listas de leads de info pública (Maps, directorios) ✅ Monitoreo recurrente de competidores ✅ Enriquecimiento de bases de datos propias ✅ Investigación competitiva ✅ Aceptás la responsabilidad legal y ética del scraping
❌ Necesitás emails verificados y compliant para cold (mejor usá Apollo/Lemlist) ❌ Data crítica donde necesitás 100% confiabilidad (mejor APIs oficiales) ❌ Datos personales sensibles ❌ No querés lidiar con el debugging cuando los sites cambian su HTML
Algo que la mayoría subestima: los sites cambian su HTML. Lo que hoy funciona, en 3 meses puede romperse porque el site rediseñó.
Tu pipeline necesita:
Si la lista es de uso único (la juntás y nunca más), barato. Si es continuo, el costo de mantenimiento puede ser significativo. Calculá esto antes de armar el pipeline.