PDF Oxide MCP Server — PDF-Extraktion für KI-Assistenten
pdf-oxide-mcp ist ein Model Context Protocol-Server, mit dem KI-Assistenten Inhalte aus PDFs auslesen können. Er läuft vollständig lokal — keine Datei verlässt Ihren Rechner.
crgx installieren (einmalig)
crgx ist ein npx-ähnlicher Runner für Rust-Binaries: Er lädt pdf_oxide_mcp beim ersten Aufruf automatisch herunter. Eine manuelle MCP-Installation entfällt damit.
Linux / macOS
curl -fsSL crgx.dev/install.sh | sh
Windows (PowerShell)
irm crgx.dev/install.ps1 | iex
Konfiguration
Nach der Installation von crgx fügen Sie die folgende Konfiguration in Ihr KI-Werkzeug ein. Mehr ist nicht nötig — crgx kümmert sich selbstständig um das Herunterladen und Aktualisieren von pdf_oxide_mcp.
Claude Desktop
Ergänzen Sie ~/.config/claude/claude_desktop_config.json (Linux) bzw. ~/Library/Application Support/Claude/claude_desktop_config.json (macOS):
{
"mcpServers": {
"pdf-oxide": {
"command": "crgx",
"args": ["pdf_oxide_mcp@latest"]
}
}
}
Claude Code
Tragen Sie die Konfiguration in der projekteigenen .claude/settings.json ein:
{
"mcpServers": {
"pdf-oxide": {
"command": "crgx",
"args": ["pdf_oxide_mcp@latest"]
}
}
}
Cursor
Fügen Sie die Konfiguration in den MCP-Einstellungen von Cursor hinzu:
{
"mcpServers": {
"pdf-oxide": {
"command": "crgx",
"args": ["pdf_oxide_mcp@latest"]
}
}
}
Alternative Installation
Wenn Sie crgx nicht einsetzen möchten, lässt sich pdf_oxide_mcp auch direkt installieren:
Homebrew (macOS / Linux)
brew install yfedoseev/tap/pdf-oxide # enthält pdf-oxide-mcp
Cargo
cargo install pdf_oxide_mcp
Anschließend verweisen Sie in der Konfiguration direkt auf den Binary-Pfad:
{
"mcpServers": {
"pdf-oxide": {
"command": "pdf-oxide-mcp"
}
}
}
Verfügbare Tools
extract
Liest Text, Markdown oder HTML aus einer PDF-Datei aus.
| Parameter | Typ | Pflicht | Beschreibung |
|---|---|---|---|
file_path |
string | Ja | Pfad zur PDF-Datei |
output_path |
string | Ja | Zielpfad für den extrahierten Inhalt |
format |
string | Nein | "text" (Standard), "markdown" oder "html" |
pages |
string | Nein | Seitenbereich, z. B. "1-3,7,10-12" |
password |
string | Nein | Passwort für verschlüsselte PDFs |
images |
boolean | Nein | Bilder als separate Dateien neben der Ausgabe speichern |
embed_images |
boolean | Nein | Bilder als Base64 in Markdown/HTML einbetten (Standard: true) |
Funktionsweise
Der MCP-Server kommuniziert über stdio mit JSON-RPC 2.0. Sobald ein KI-Assistent eine PDF lesen möchte, sendet er einen tools/call-Request und erhält den extrahierten Inhalt zurück.
Die gesamte Verarbeitung läuft lokal mit derselben Rust-Extraktions-Engine wie Bibliothek und CLI — es werden keine Daten an externe Dienste übertragen.
Prompts, die Sie dem Assistenten geben können
Sobald der MCP-Server eingebunden ist, ruft der Assistent extract selbstständig auf. Bewährte Prompts:
- „Extrahiere
report.pdfals Markdown nachreport.md." - „Exportiere die Seiten 4–8 aus
contract.pdfals HTML mit eingebetteten Bildern und speichere sie incontract.html." - „
bank-statement.pdfist passwortgeschützt (Passwort:hunter2) — extrahiere nur die Transaktionstabelle als Text."
Im Hintergrund setzt der Assistent einen JSON-RPC-Aufruf wie diesen ab:
{
"jsonrpc": "2.0",
"id": 1,
"method": "tools/call",
"params": {
"name": "extract",
"arguments": {
"file_path": "/path/report.pdf",
"output_path": "/path/report.md",
"format": "markdown",
"pages": "4-8",
"images": true,
"embed_images": true
}
}
}
Der Server schreibt das Ergebnis nach output_path und gibt eine kurze Bestätigung zurück — der Assistent kann die Datei anschließend in seinen Kontext laden.