Cargando la bóveda…
Cargando la bóveda…
Vercel Labs liberó Agent Browser: un navegador para Claude que reduce 10× el costo de tokens al navegar. En vez de mandar screenshots, numera cada botón y link y le manda solo eso. Setup en 1 prompt y 5 casos prácticos para arrancar.
Antes, para que Claude "navegue internet" tenías 2 opciones malas:
Resultado: cualquier flow de 10+ clicks quemaba el plan de $20 en una sesión.
En vez de mandar la página renderizada, Agent Browser enumera los elementos interactivos y le pasa solo la lista:
Antes:
[Screenshot 1080×800 de tu landing] → ~3000 tokens
Después:
[1] Logo (link, va a /)
[2] Botón "Sign in"
[3] Input email (vacío)
[4] Input password (vacío)
[5] Botón "Login"
[6] Link "Forgot password"
→ ~300 tokens10× menos tokens por interacción.
Es como si en lugar de describirte el restaurant entero (paredes, mesas, decoración), te pasara la carta con los números. Vos pedís "el plato 3" y listo.
Para tareas donde Claude interactúa (clicks, formularios, navegación), eso es todo lo que necesita saber.
> Instalame Agent Browser de Vercel Labs siguiendo el README oficial
del repo. Después validame que funciona abriendo google.com y
listándome los elementos interactivos visibles.Claude:
Si responde, instalado.
> Andá a [URL de blog post]. Si el contenido está visible, leelo
completo y resumime en 3 puntos.Mucho más barato que un screenshot. Agent Browser parsea el HTML, te tira el texto.
> Andá a https://miapp.com/landing. Listame:
- Todos los CTAs visibles
- Cuál es el primer CTA (above the fold)
- Cuántos botones hay en total
- Si el formulario de email funciona (click vacío, ¿muestra error?)
Después audita la UX: ¿qué mejorarías?Combinás "ojos de Claude" con análisis. Mucho más barato que screenshots iterativos.
> Andá a [URL de blog post con galería]. Identificá las imágenes
principales del post (no thumbnails laterales). Para cada una:
- URL original
- Alt text
- Tamaño aprox
Bajame las URLs a un .txt.Útil para investigación, research, archivo.
> Andá a [form de inscripción de cliente]. Llenalo con:
- Email: [...]
- Nombre: [...]
- Empresa: [...]
- [otros campos]
Antes de submit, mostrame todo lo cargado. NO submit hasta que confirme.Automatización de tareas repetitivas (subir productos, completar formularios, etc.).
> En staging.miapp.com:
1. Andá al producto X
2. Agregalo al carrito
3. Ir a checkout
4. Email: test@test.com
5. Tarjeta de test: 4242 4242 4242 4242
6. Confirmar
Reportame:
- Cuántos pasos
- Si algún paso falló
- Tiempo aproximado totalQA real, sin escribir Playwright a mano.
Regla: para flows interactivos en sites públicos, Agent Browser es el más eficiente. Para sites con login, Browser Harness. Para extracción pura, Scrapling.
Para curiosos:
El truco eficiencia es que nunca manda el HTML completo al modelo. Solo manda:
Eso son ~300 tokens vs 3000 de un screenshot.
Agent Browser detecta los elementos visibles al momento. Si el site carga contenido en scroll o tiene lazy loading, puede no ver lo de abajo.
Mitigación: pedirle explícitamente "scroll down y re-evaluá la página".
Aunque Agent Browser usa Chrome real, patrones repetitivos te bloquean (CAPTCHAs, rate limits). Para sites con anti-bot:
Agent Browser detecta cosas funcionales (botón existe, link funciona). No detecta:
Es complemento del QA humano, no reemplazo.
Si tu flow depende de carrera contra otro proceso (race condition test, performance benchmark), Agent Browser tiene latencia que afecta el timing.
✅ Auditar / probar sites públicos (tu landing, competidores, etc.) ✅ Automatización de tareas repetitivas (formularios, uploads) ✅ Tareas exploratorias en internet ✅ Combinar con Claude para análisis post-navegación
❌ Sites con login complejo → Browser Harness ❌ Solo extracción de data → Scrapling ❌ Producción crítica con SLA → herramienta dedicada como Playwright manual
Antes con screenshots:
1 sesión de 30 minutos navegando = ~30 acciones × 3000 tokens = 90k tokens
Costo: ~$2-4 según modelo
Tu plan de $20: 5-10 sesiones por mesDespués con Agent Browser:
1 sesión de 30 minutos = ~30 acciones × 300 tokens = 9k tokens
Costo: ~$0.20-0.40
Tu plan de $20: 50-100 sesiones por mes10× más capacidad del mismo plan. Para quien navegaba seguido, es el cambio del año.