Skip to content

pdf-oxide CLI — el kit PDF más rápido desde terminal

pdf-oxide es una herramienta de línea de comandos para procesamiento PDF rápido y local. Usa el mismo núcleo Rust que la biblioteca — sin nube, sin dependencias de sistema. Trae 23 comandos: desde text y markdown hasta compress, encrypt y watermark.

Instalación rápida (recomendada)

Un solo comando detecta automáticamente tu sistema operativo y arquitectura:

Linux / macOS

curl -fsSL oxide.fyi/install.sh | sh

Windows (PowerShell)

irm oxide.fyi/install.ps1 | iex

Otras opciones de instalación

Homebrew (macOS / Linux)

brew install yfedoseev/tap/pdf-oxide

Cargo

cargo install pdf_oxide_cli

cargo-binstall (binario precompilado)

cargo binstall pdf_oxide_cli

Binarios precompilados

Descárgalos desde GitHub Releases y agrégalos a tu PATH.

Inicio rápido

# Extraer texto
pdf-oxide text document.pdf

# Convertir a Markdown
pdf-oxide markdown document.pdf -o output.md

# Convertir a HTML
pdf-oxide html document.pdf -o output.html

# Mostrar datos del PDF (páginas, metadatos, cifrado)
pdf-oxide info document.pdf

# Buscar texto (soporta regex)
pdf-oxide search document.pdf "pattern"

Comandos

Comando Descripción Flags principales
text Extrae texto plano --format plain|words|lines, --area x,y,w,h
paths Extrae trazos vectoriales --format json|rects|lines, --area x,y,w,h
markdown Convierte a Markdown
html Convierte a HTML
info Muestra metadatos y cantidad de páginas
search Busca texto (regex) -i (ignora mayúsculas), --pages
images Extrae imágenes --area x,y,w,h, --pages
render Renderiza páginas a PNG/JPEG --dpi N, --format png|jpeg, --quality N
merge Combina varios PDFs (requiere 2+ archivos)
split Divide en páginas individuales
create Crea un PDF desde Markdown, HTML o texto --from markdown|html|text
compress Comprime y optimiza
encrypt Cifra con contraseña (previsto en v0.4.0 — placeholder por ahora)
decrypt Descifra un PDF protegido --password PW
rotate Rota páginas --degrees 90|180|270|-90
delete Elimina páginas --pages
reorder Reordena páginas --order "3,1,2,5,4"
metadata Lee, edita o elimina metadatos --title, --author, --subject, --keywords, --strip
watermark Agrega marca de agua de texto --opacity 0.3, --rotation 45, --font-size 48, --color R,G,B
bookmarks Lista el índice del documento
flatten Aplana anotaciones o formularios --forms, --annotations
crop Recorta los márgenes de la página --margins L,R,T,B
forms Lista, rellena o exporta campos de formulario --fill "k=v,…", --export fdf|xfdf, --area x,y,w,h

Son 23 comandos en total. Ejecuta pdf-oxide <comando> --help para ver la documentación completa de los flags de cada uno.

Opciones globales

-o, --output <PATH>        Archivo de salida (por defecto stdout para salidas de texto)
-p, --pages <RANGE>        Rango de páginas: "1-5", "1,3,7", "1-3,7,10-12"
    --password <PW>        Contraseña para PDFs cifrados
-v, --verbose              Muestra información de tiempos
-q, --quiet                Oculta la salida no esencial
-j, --json                 Salida en formato JSON
    --no-banner            Omite el banner del REPL

Ejemplos

Extraer las páginas 1–5 como Markdown:

pdf-oxide markdown report.pdf --pages 1-5 -o report.md

Combinar tres PDFs:

pdf-oxide merge cover.pdf body.pdf appendix.pdf -o combined.pdf

Agregar una marca de agua:

pdf-oxide watermark contract.pdf "DRAFT" --opacity 0.2 --font-size 72

Rellenar campos de formulario:

pdf-oxide forms application.pdf --fill "name=Jane Doe,date=2026-02-28" -o filled.pdf

Búsqueda con regex sin distinguir mayúsculas:

pdf-oxide search paper.pdf "neural.?network" -i

Renderizar la página 1 como PNG a 300 DPI:

pdf-oxide render report.pdf --dpi 300 --format png --pages 1 -o page1.png

Extraer los trazos vectoriales de un esquema en JSON:

pdf-oxide paths schematic.pdf --format json -o paths.json

REPL interactiva

Ejecuta pdf-oxide sin argumentos para entrar en modo interactivo:

$ pdf-oxide
pdf-oxide> text /path/to/doc.pdf
(aparece el texto extraído)
pdf-oxide> info /path/to/doc.pdf
(aparecen los metadatos)