pdf2md-ai
v1.0.2
Published
AI-powered PDF to Markdown converter that preserves complete context: images, tables, and code blocks. Uses Gemini and LlamaParse. MCP server for Claude Desktop, Cursor, and Windsurf.
Maintainers
Readme
PDF to Markdown MCP Server
Servidor MCP (Model Context Protocol) que permite a asistentes de IA como Claude, Cursor y otros convertir archivos PDF a Markdown preservando el contexto completo de imágenes, tablas y código. Usa tecnología de IA avanzada con Gemini y LlamaParse para garantizar que ningún detalle visual o estructural se pierda en la conversión.
🌟 Características
- Conversión inteligente con preservación de contexto: No solo convierte texto, sino que extrae y describe imágenes, mantiene la estructura de tablas complejas, y preserva bloques de código con su formato original
- Imágenes contextualizadas: Cada imagen del PDF se analiza con IA y se describe en detalle, manteniendo su contexto en el documento
- Tablas complejas: Preserva la estructura exacta de tablas, incluyendo celdas combinadas y formato
- Código fuente: Mantiene bloques de código con su sintaxis y formato original
- Fácil integración: Compatible con Claude Desktop, Cursor, Windsurf y cualquier cliente MCP
- Sistema de créditos: Control de uso transparente
- API SaaS: Tu infraestructura en la nube, sin instalación local compleja
📦 Instalación
Opción 1: Uso directo con npx (Recomendado)
No necesitas instalar nada. Simplemente configura tu cliente MCP:
{
"mcpServers": {
"pdf-converter": {
"command": "npx",
"args": ["-y", "@manuesp/pdf-to-markdown-mcp"],
"env": {
"PDF_TO_MARKDOWN_API_KEY": "tu_api_key_aqui"
}
}
}
}Opción 2: Instalación global
npm install -g @manuesp/pdf-to-markdown-mcp🔧 Configuración
Claude Desktop
Localiza tu archivo de configuración:
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json
- macOS:
Añade el servidor MCP:
{
"mcpServers": {
"pdf-converter": {
"command": "npx",
"args": ["-y", "@manuesp/pdf-to-markdown-mcp"],
"env": {
"PDF_TO_MARKDOWN_API_KEY": "pk_live_tu_clave_aqui"
}
}
}
}- Reinicia Claude Desktop
Cursor / Windsurf
Similar a Claude Desktop, configura en el archivo de configuración correspondiente del IDE.
🔑 Obtener API Key
- Regístrate en tu-sitio-saas.com
- Ve a tu dashboard de usuario
- Copia tu API Key
- Pégala en la configuración de tu cliente MCP
💡 Uso
Una vez configurado, simplemente interactúa con tu asistente de IA:
Ejemplos de comandos:
- "Convierte este PDF a Markdown: C:\Documentos\contrato.pdf"
- "Lee este informe y resume los puntos clave: ~/Downloads/informe-anual.pdf"
- "Extrae las tablas de este documento: /ruta/al/archivo.pdf"
- "Convierte este PDF y guarda el resultado en un archivo"
El servidor procesará el PDF y devolverá el contenido en Markdown junto con estadísticas del proceso.
📊 Respuesta del Servidor
Cuando conviertes un PDF recibirás:
- Contenido en Markdown: El texto completo extraído y formateado
- Estadísticas: Páginas procesadas, créditos usados
- Metadata: Información del documento
Ejemplo de respuesta:
✅ Conversión Completada Exitosamente
📊 Estadísticas del Documento:
- Archivo: contrato.pdf
- Tamaño: 2.34 MB
- Páginas procesadas: 15
- Créditos usados: 15
- Créditos restantes: 485
---
## Contenido en Markdown:
[El contenido del PDF en formato Markdown...]🛠️ Desarrollo Local
Si quieres modificar o contribuir al servidor:
# Clonar el repositorio
git clone https://github.com/tu-usuario/pdf-to-markdown-mcp.git
cd pdf-to-markdown-mcp
# Instalar dependencias
npm install
# Compilar TypeScript
npm run build
# Probar localmente
PDF_TO_MARKDOWN_API_KEY=tu_key npm start🔒 Seguridad
- API Key: Nunca compartas tu API Key públicamente
- Variables de entorno: La clave se configura como variable de entorno, no en código
- HTTPS: Todas las comunicaciones con la API usan cifrado TLS
- Sin almacenamiento: Los PDFs no se guardan permanentemente en el servidor
📝 Requisitos del Sistema
- Node.js: >= 18.0.0
- NPM: >= 8.0.0
- Sistema operativo: Windows, macOS, Linux
🐛 Solución de Problemas
Error: "PDF_TO_MARKDOWN_API_KEY no configurada"
Asegúrate de haber añadido la API Key en la configuración del cliente MCP.
Error: "Archivo no encontrado"
Verifica que la ruta al PDF sea absoluta y correcta. Usa rutas completas como:
- Windows:
C:\\Users\\usuario\\documento.pdf - macOS/Linux:
/home/usuario/documento.pdf
Error: "Créditos insuficientes"
Tu cuenta ha agotado los créditos. Recarga en el dashboard de la plataforma.
Timeout
Si el PDF es muy grande (>50MB), puede tardar varios minutos. Espera o divide el documento.
📄 Licencia
MIT License - Libre para uso comercial y personal
🤝 Soporte
- Email: [email protected]
- Documentación: API Docs
- Issues: GitHub Issues
🚀 Roadmap
- [ ] Soporte para batch processing (múltiples PDFs)
- [ ] Opciones de configuración (idioma, formato de salida)
- [ ] Cache local para documentos ya procesados
- [ ] Webhooks para procesamiento asíncrono
- [ ] Soporte para imágenes embebidas
📚 Documentación Adicional
- INSTALLATION.md - Guía detallada de instalación
- QUICKSTART.md - Prueba rápida local antes de publicar
- TESTING.md - Guía completa de testing
- PUBLISHING.md - Cómo publicar en NPM y MCP Registry
- CHANGELOG.md - Historial de cambios
🏗️ Estructura del Proyecto
pdf-to-markdown-mcp/
├── src/
│ └── index.ts # Código fuente del servidor MCP
├── dist/ # Código compilado (generado)
├── package.json # Configuración del paquete NPM
├── tsconfig.json # Configuración de TypeScript
├── README.md # Este archivo
├── INSTALLATION.md # Guía de instalación
├── QUICKSTART.md # Inicio rápido
├── TESTING.md # Guía de testing
├── PUBLISHING.md # Guía de publicación
├── CHANGELOG.md # Historial de versiones
├── LICENSE # Licencia MIT
└── claude_desktop_config.example.json # Ejemplo de configuraciónHecho con ❤️ para la comunidad MCP
