Skip to content

PDF Oxide MCP Server — PDF-Extraktion für KI-Assistenten

pdf-oxide-mcp ist ein Model Context Protocol-Server, mit dem KI-Assistenten Inhalte aus PDFs auslesen können. Er läuft vollständig lokal — keine Datei verlässt Ihren Rechner.

crgx installieren (einmalig)

crgx ist ein npx-ähnlicher Runner für Rust-Binaries: Er lädt pdf_oxide_mcp beim ersten Aufruf automatisch herunter. Eine manuelle MCP-Installation entfällt damit.

Linux / macOS

curl -fsSL crgx.dev/install.sh | sh

Windows (PowerShell)

irm crgx.dev/install.ps1 | iex

Konfiguration

Nach der Installation von crgx fügen Sie die folgende Konfiguration in Ihr KI-Werkzeug ein. Mehr ist nicht nötig — crgx kümmert sich selbstständig um das Herunterladen und Aktualisieren von pdf_oxide_mcp.

Claude Desktop

Ergänzen Sie ~/.config/claude/claude_desktop_config.json (Linux) bzw. ~/Library/Application Support/Claude/claude_desktop_config.json (macOS):

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Claude Code

Tragen Sie die Konfiguration in der projekteigenen .claude/settings.json ein:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Cursor

Fügen Sie die Konfiguration in den MCP-Einstellungen von Cursor hinzu:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Alternative Installation

Wenn Sie crgx nicht einsetzen möchten, lässt sich pdf_oxide_mcp auch direkt installieren:

Homebrew (macOS / Linux)

brew install yfedoseev/tap/pdf-oxide    # enthält pdf-oxide-mcp

Cargo

cargo install pdf_oxide_mcp

Anschließend verweisen Sie in der Konfiguration direkt auf den Binary-Pfad:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "pdf-oxide-mcp"
    }
  }
}

Verfügbare Tools

extract

Liest Text, Markdown oder HTML aus einer PDF-Datei aus.

Parameter Typ Pflicht Beschreibung
file_path string Ja Pfad zur PDF-Datei
output_path string Ja Zielpfad für den extrahierten Inhalt
format string Nein "text" (Standard), "markdown" oder "html"
pages string Nein Seitenbereich, z. B. "1-3,7,10-12"
password string Nein Passwort für verschlüsselte PDFs
images boolean Nein Bilder als separate Dateien neben der Ausgabe speichern
embed_images boolean Nein Bilder als Base64 in Markdown/HTML einbetten (Standard: true)

Funktionsweise

Der MCP-Server kommuniziert über stdio mit JSON-RPC 2.0. Sobald ein KI-Assistent eine PDF lesen möchte, sendet er einen tools/call-Request und erhält den extrahierten Inhalt zurück.

Die gesamte Verarbeitung läuft lokal mit derselben Rust-Extraktions-Engine wie Bibliothek und CLI — es werden keine Daten an externe Dienste übertragen.

Prompts, die Sie dem Assistenten geben können

Sobald der MCP-Server eingebunden ist, ruft der Assistent extract selbstständig auf. Bewährte Prompts:

  • „Extrahiere report.pdf als Markdown nach report.md."
  • „Exportiere die Seiten 4–8 aus contract.pdf als HTML mit eingebetteten Bildern und speichere sie in contract.html."
  • bank-statement.pdf ist passwortgeschützt (Passwort: hunter2) — extrahiere nur die Transaktionstabelle als Text."

Im Hintergrund setzt der Assistent einen JSON-RPC-Aufruf wie diesen ab:

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "extract",
    "arguments": {
      "file_path": "/path/report.pdf",
      "output_path": "/path/report.md",
      "format": "markdown",
      "pages": "4-8",
      "images": true,
      "embed_images": true
    }
  }
}

Der Server schreibt das Ergebnis nach output_path und gibt eine kurze Bestätigung zurück — der Assistent kann die Datei anschließend in seinen Kontext laden.