Skip to content

pdf-oxide CLI — o kit PDF mais rápido no terminal

pdf-oxide é uma ferramenta de linha de comando para processamento local e rápido de PDF. Usa o mesmo núcleo Rust que alimenta a biblioteca — sem nuvem, sem dependências de sistema. Traz 23 comandos: de text e markdown a compress, encrypt e watermark.

Instalação rápida (recomendada)

Um único comando detecta automaticamente o seu sistema operacional e a arquitetura:

Linux / macOS

curl -fsSL oxide.fyi/install.sh | sh

Windows (PowerShell)

irm oxide.fyi/install.ps1 | iex

Outras formas de instalar

Homebrew (macOS / Linux)

brew install yfedoseev/tap/pdf-oxide

Cargo

cargo install pdf_oxide_cli

cargo-binstall (binário pré-compilado)

cargo binstall pdf_oxide_cli

Binários pré-compilados

Baixe em GitHub Releases e coloque o arquivo em um diretório do seu PATH.

Início rápido

# Extrair texto
pdf-oxide text document.pdf

# Converter para Markdown
pdf-oxide markdown document.pdf -o output.md

# Converter para HTML
pdf-oxide html document.pdf -o output.html

# Mostrar informações do PDF (páginas, metadados, criptografia)
pdf-oxide info document.pdf

# Buscar texto (aceita regex)
pdf-oxide search document.pdf "pattern"

Comandos

Comando Descrição Flags principais
text Extrai texto simples --format plain|words|lines, --area x,y,w,h
paths Extrai traçados vetoriais --format json|rects|lines, --area x,y,w,h
markdown Converte para Markdown
html Converte para HTML
info Mostra metadados e quantidade de páginas
search Busca texto (regex) -i (ignora maiúsculas), --pages
images Extrai imagens --area x,y,w,h, --pages
render Renderiza páginas em PNG/JPEG --dpi N, --format png|jpeg, --quality N
merge Mescla vários PDFs (exige 2+ arquivos)
split Divide em páginas individuais
create Cria PDF a partir de Markdown, HTML ou texto --from markdown|html|text
compress Comprime e otimiza
encrypt Criptografa com senha (previsto para v0.4.0 — placeholder por enquanto)
decrypt Descriptografa um PDF protegido --password PW
rotate Gira páginas --degrees 90|180|270|-90
delete Remove páginas --pages
reorder Reordena páginas --order "3,1,2,5,4"
metadata Lê, edita ou remove metadados --title, --author, --subject, --keywords, --strip
watermark Adiciona marca d’água de texto --opacity 0.3, --rotation 45, --font-size 48, --color R,G,B
bookmarks Lista o sumário do documento
flatten Aplana anotações ou formulários --forms, --annotations
crop Corta as margens da página --margins L,R,T,B
forms Lista, preenche ou exporta campos de formulário --fill "k=v,…", --export fdf|xfdf, --area x,y,w,h

São 23 comandos no total. Use pdf-oxide <comando> --help para ver toda a documentação de flags de qualquer um deles.

Opções globais

-o, --output <PATH>        Arquivo de saída (padrão é stdout para saídas de texto)
-p, --pages <RANGE>        Intervalo de páginas: "1-5", "1,3,7", "1-3,7,10-12"
    --password <PW>        Senha para PDFs criptografados
-v, --verbose              Mostra informações de tempo
-q, --quiet                Oculta a saída não essencial
-j, --json                 Saída em JSON
    --no-banner            Pula o banner do REPL

Exemplos

Extrair as páginas 1–5 como Markdown:

pdf-oxide markdown report.pdf --pages 1-5 -o report.md

Mesclar três PDFs:

pdf-oxide merge cover.pdf body.pdf appendix.pdf -o combined.pdf

Adicionar marca d’água:

pdf-oxide watermark contract.pdf "DRAFT" --opacity 0.2 --font-size 72

Preencher campos de formulário:

pdf-oxide forms application.pdf --fill "name=Jane Doe,date=2026-02-28" -o filled.pdf

Buscar com regex sem diferenciar maiúsculas:

pdf-oxide search paper.pdf "neural.?network" -i

Renderizar a página 1 como PNG a 300 DPI:

pdf-oxide render report.pdf --dpi 300 --format png --pages 1 -o page1.png

Extrair os traçados vetoriais de um esquema como JSON:

pdf-oxide paths schematic.pdf --format json -o paths.json

REPL interativo

Execute pdf-oxide sem argumentos para entrar no modo interativo:

$ pdf-oxide
pdf-oxide> text /path/to/doc.pdf
(o texto extraído aparece)
pdf-oxide> info /path/to/doc.pdf
(os metadados aparecem)