Cargando la bóveda…
Cargando la bóveda…
Correcciones que disparan re-lectura, chats largos que no rotás, preguntas en mensajes separados, funciones extra siempre activas y usar Claude en horas pico. Cada error explicado con su fix concreto. Con estos 5 cambios, tu plan rinde el doble.
Tu plan de Claude es como una cubeta de agua. Cada mensaje que mandás es echar un vaso.
Pero hay un detalle clave: cada vez que escribís, Claude tiene que leer toda la conversación desde el principio. Cuanto más larga la conversación, más agua se gasta por mensaje.
Los 5 errores que siguen son dejar la llave abierta sin darte cuenta. Cada uno tiene su fix.
Claude responde algo que no te gustó. Mandás otro mensaje diciendo "así no" o "hacelo diferente". Claude tiene que releer TODA la conversación desde el inicio para entender qué cambiar.
Le pedís a alguien que te lea un libro de 200 páginas. En la página 180 le decís "cambiá una palabra en la página 5". Esa persona tiene que volver a leer las 200 páginas desde el inicio solo para cambiar esa palabra.
No mandes mensaje nuevo. En lugar:
Claude lee la conversación una sola vez en lugar de dos.
En conversaciones largas con 3-5 correcciones: 30-50% de tokens ahorrados.
Llevás 20, 30, 50 mensajes en el mismo chat. Cada mensaje nuevo, Claude relee los 50 anteriores. Tu cuota se va en releer lo que ya dijo.
Como ir al súper y cargar TODAS las bolsas de TODAS las veces que fuiste. Cada visita nueva cargás las bolsas viejas + las nuevas. Al rato no podés ni caminar.
1. Cuando lleves +20 mensajes, pedile a Claude:
"Dame resumen estructurado de todo lo que hicimos hasta ahora"
2. Copiá ese resumen
3. Abrí chat NUEVO
4. Pegá el resumen como primer mensaje y seguí trabajandoConversación de 50 mensajes vs reset a 1 mensaje contextualizado: 70-85% de tokens en cada mensaje siguiente.
En CLAUDE.md de tu proyecto:
Cuando la conversación pase los 25 mensajes, ofrecé
proactivamente generar un resumen estructurado para que
pueda hacer reset en chat nuevo.Vos: "¿Cuál es la mejor librería para X?"
[esperás respuesta]
Vos: "¿Cómo la instalo?"
[esperás respuesta]
Vos: "¿Hay ejemplos?"
[esperás respuesta]3 mensajes = Claude cargó la conversación 3 veces.
Es como llamar a tu amigo 3 veces para hacerle 3 preguntas en lugar de UNA llamada con todo junto. Cada llamada cuesta.
Juntá todas tus preguntas en UN solo mensaje:
Vos: "Sobre librerías para X:
1. ¿Cuál es la mejor?
2. ¿Cómo se instala?
3. ¿Tenés ejemplo de uso básico?"Claude lee la conversación una vez y te contesta todo.
3 preguntas separadas vs 1 conjunta: ~50-60% del costo de las 3 separadas.
Tenés encendidas:
Si no las usás en cada mensaje, igual cuentan. Claude tiene que verificar capacidades, evaluar si las necesita, etc. Eso son tokens.
Dejás TODAS las luces de tu casa encendidas mientras estás solo en una habitación. Baño, cocina, patio, cuarto de visitas — todas prendidas. Recibo de luz carísimo.
Settings de Claude → revisá conexiones activas:
Apagá todo lo que no uses regularmente. Encendelo manualmente cuando lo necesites.
15-25% en uso casual. Para usuarios con muchas conexiones activas: hasta 40%.
Desde marzo 2026, Claude tiene rate limiting variable según hora. Las horas pico son:
Misma pregunta en hora pico puede:
Ir al súper un domingo a mediodía. Filas enormes, todo tarda, los precios suben. Si vas temprano entre semana comprás lo mismo más rápido y barato.
Para tareas pesadas (sesiones largas con Claude Code, batches, generación grande):
Hacelo temprano (antes de 7am hora México) o tarde (después de 1pm).
Para chats puntuales rápidos, horas pico está bien.
15-25% en duración del plan flat. Para usuarios de horario diurno fijo: cambiar 2h a horarios off-peak ya da el ahorro completo.
Si aplicás los 5 simultáneamente:
El plan te dura ~2x más. Sin pagar más, sin cambiar de plan.
Tu prompt es ~1% del costo. Lo caro es la conversación acumulada que Claude relee. Prompts cortos no cambian el quemar de cuenta. Los 5 errores sí.
Velocidad no = ahorro. Si mandás 30 mensajes en 1 hora vs 30 en 4 horas, mismo costo. Lo que cuenta es la estructura de conversación.
Haiku ahorra dinero pero pierde calidad en tareas complejas. Resultado: necesitás re-prompt, rebound a Sonnet/Opus, y terminás gastando más. Usá el modelo correcto para cada tarea — ver cambia de modelo.
Genial, pero si lo pegás en un chat de 50 mensajes ya saturado, el ahorro es marginal. Primero arreglá la conversación, después afiná prompts.
Token Efficient corta el output verboso de Claude. Los 5 errores cortan input innecesario. Los dos combinados: ahorro máximo.
5 repos no quemar cuenta son skills/tools que automatizan estos comportamientos. Capa avanzada sobre los hábitos básicos.
Cambia de modelo según tarea: tareas mecánicas en Haiku, razonamiento en Opus. Optimización por dimensión distinta.
Si usás Claude 2-3 veces por semana para queries puntuales, no te preocupes — tu cuota sobra.
Estos fixes son para uso intensivo (>20h/mes con Claude Code o >50 mensajes/día en chat).