Cargando la bóveda…
Cargando la bóveda…
Herramienta open source de Microsoft (100k+ ★) que convierte PDF, Word, Excel, PowerPoint, imágenes, audios, videos de YouTube a Markdown limpio. Claude lo lee rapidísimo gastando casi nada vs leer el archivo directo. Instalación: pegale un prompt a Claude Code, lo hace solo.
Cuando le das un PDF, Word o Excel a Claude directo, tiene que leer el archivo entero. Eso gasta muchísimo de tu cuenta sin que te des cuenta.
Por ejemplo:
MarkItDown es traductor open source de Microsoft. Convierte cualquier archivo a Markdown limpio que Claude lee rapidísimo y gastando casi nada.
Repo: microsoft/markitdown. 100k+ estrellas. Open source.
Cubre prácticamente cualquier formato común.
Para un PDF típico de 30 páginas:
Ahorro: ~75% en input tokens. Para uso intensivo, transforma tu cuota.
Bonus: Claude entiende mejor porque el formato es nativo (Markdown vs PDF parseado).
No necesitás saber programar. Copy-paste:
Instalá la herramienta MarkItDown de Microsoft desde
https://github.com/microsoft/markitdown en mi computadora.
Después usala cada vez que te pida convertir un archivo (PDF,
Word, Excel, PowerPoint, imagen, audio o video) a Markdown
antes de leerlo.
Avisame cuando termines de instalarla.Claude:
github.com/microsoft/markitdownVos no tecleás nada técnico. Solo aceptás permisos para correr comandos (solo es la instalación).
Funciona en Claude Code, Codex, Cursor, Claude Cowork — cualquier agente compatible.
Después de instalado, en lugar de arrastrarle el archivo, le decís: "usá MarkItDown para convertir este archivo".
Claude lo traduce primero a texto limpio y después lo lee. Ese paso extra te ahorra muchos tokens.
> Usá MarkItDown para convertir /Users/yo/Desktop/contrato.pdf
a Markdown.
Después leelo y resumímelo en español sencillo con los
puntos más importantes.> Convertí /Users/yo/Desktop/reporte.xlsx con MarkItDown y
decime las 5 cosas más importantes que ves en la tabla,
en palabras simples.> Usá MarkItDown con este link de YouTube
https://www.youtube.com/watch?v=XXXX
Sacá la transcripción y hacéme resumen en bullets cortos.> Convertí /docs/propuesta.docx a Markdown con MarkItDown.
Guardalo como /docs/propuesta.md.
Mantené tablas y formato.> Acá hay grabación /audio/meeting-2026-05-28.mp3.
Usá MarkItDown para transcribir.
Después dame:
1. Resumen ejecutivo
2. Decisiones tomadas
3. Action items con responsables y deadlines> Acá hay screenshot /screenshots/whiteboard.png con notas
manuscritas de una reunión.
Usá MarkItDown para extraer el texto (OCR).
Después estructurame en formato de outline.> Tengo carpeta /contracts/2026/ con 50 PDFs.
Para cada uno:
1. MarkItDown a Markdown
2. Extraé: nombre cliente, fecha firma, monto, vencimiento
3. Generá CSV consolidado /contracts/summary.csv> Convertí /papers/transformer-paper.pdf con MarkItDown.
Resumime:
- Problema que ataca
- Solución propuesta
- Resultados clave
- Limitaciones reconocidas
Lenguaje claro, asumí que sé ML básico.> /reports/Q1-2026.pdf (50 páginas) → MarkItDown.
Extraé:
- Top 5 KPIs con números
- Cambios vs Q4-2025
- Decisiones estratégicas mencionadas> Estos 5 videos de YouTube son tutoriales sobre [tema]:
- [URL 1]
- [URL 2]
...
Para cada uno: transcribí con MarkItDown.
Después sintetizá los puntos comunes a través de los 5.> Acá hay 20 PDFs en /research/.
Convertilos todos con MarkItDown.
Después creá knowledge base en /research/notes/:
- Una nota por paper
- Wikilinks entre conceptos relacionados
- Sumario general en /research/summary.mdCombinable con Obsidian.
Si decís solo "leé este PDF", Claude lo lee directo (gastando todo). Decile explícitamente "usá MarkItDown".
Workaround: agregalo a CLAUDE.md:
## Regla de archivos
Siempre que se mencione un archivo PDF, Word, Excel, PowerPoint,
imagen, audio o video, USAR MarkItDown para convertir a Markdown
ANTES de procesar.Para un PDF de 1 página, el overhead de MarkItDown puede no compensar. Usalo para archivos medianos a grandes.
OCR es bueno pero no perfecto. Para texto crítico (legal, médico), validá manualmente.
Para audio de 3+ horas, divide primero en chunks. MarkItDown puede tardar y consumir mucho.
Si el PDF es escaneado con calidad mala, MarkItDown extrae texto roto. Para esos: pre-procesar con OCR mejor (Tesseract, Adobe).
Sweet spot de MarkItDown: traducción universal con calidad consistente.
5 skills oficina gratis incluye PDF skill. Para PDFs específicamente, PDF skill es más profundo. MarkItDown es más rápido y universal.
Combinálos:
> Convertí PDFs en /research/ con MarkItDown.
> Guardá los .md en mi vault de Obsidian /research/.
> Conectá con wikilinks a conceptos existentes.Obsidian usa Markdown nativo. MarkItDown alimenta tu vault.
NotebookLM acepta varios formatos. MarkItDown estandariza todo a .md para mantener tu corpus consistente.
> Cada lunes:
1. Buscá nuevos PDFs en /Dropbox/Reports/
2. Convertí con MarkItDown
3. Guardá en /knowledge-base/
4. Mandame email con resúmenes