Skip to content

PDF Oxide MCP-сервер — видобування PDF для AI-асистентів

pdf-oxide-mcp — сервер Model Context Protocol, що дозволяє AI-асистентам діставати вміст із PDF. Усе працює локально — файли не залишають ваш комп’ютер.

Установіть crgx (одноразово)

crgx — npx-подібний запускач для бінарників на Rust: під час першого запуску він сам завантажить pdf_oxide_mcp. MCP уручну встановлювати не треба.

Linux / macOS

curl -fsSL crgx.dev/install.sh | sh

Windows (PowerShell)

irm crgx.dev/install.ps1 | iex

Налаштування

Після встановлення crgx додайте наведений нижче фрагмент у конфігурацію вашого AI-інструмента. Більше нічого не потрібно — crgx сам подбає про завантаження та оновлення pdf_oxide_mcp.

Claude Desktop

Додайте до ~/.config/claude/claude_desktop_config.json (Linux) або ~/Library/Application Support/Claude/claude_desktop_config.json (macOS):

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Claude Code

Додайте до .claude/settings.json вашого проєкту:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Cursor

Додайте до налаштувань MCP у Cursor:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "crgx",
      "args": ["pdf_oxide_mcp@latest"]
    }
  }
}

Інші способи встановити

Якщо не хочете користуватися crgx, pdf_oxide_mcp можна встановити напряму:

Homebrew (macOS / Linux)

brew install yfedoseev/tap/pdf-oxide    # містить pdf-oxide-mcp

Cargo

cargo install pdf_oxide_mcp

Потім вкажіть у конфігурації шлях до бінарника:

{
  "mcpServers": {
    "pdf-oxide": {
      "command": "pdf-oxide-mcp"
    }
  }
}

Доступні інструменти

extract

Видобуває текст, Markdown або HTML із PDF-файлу.

Параметр Тип Обов’язковий Опис
file_path string Так Шлях до PDF-файлу
output_path string Так Шлях для запису видобутого вмісту
format string Ні "text" (за замовчуванням), "markdown" чи "html"
pages string Ні Діапазон сторінок, напр. "1-3,7,10-12"
password string Ні Пароль для зашифрованих PDF
images boolean Ні Зберігає зображення окремими файлами поруч із виводом
embed_images boolean Ні Вбудовує зображення як base64 у markdown/html (за замовчуванням: true)

Як це працює

MCP-сервер спілкується через stdio за протоколом JSON-RPC 2.0. Коли AI-асистенту потрібно прочитати PDF, він надсилає запит tools/call і отримує у відповідь видобутий вміст.

Уся обробка відбувається локально тим самим Rust-рушієм видобування, що його використовують бібліотека та CLI — жодні дані не передаються до зовнішніх сервісів.

Промпти, які можна давати асистентові

Коли MCP-сервер підключено, асистент сам викликає extract. Приклади промптів, що добре спрацьовують:

  • «Витягни Markdown із report.pdf у файл report.md
  • «Збережи сторінки 4–8 із contract.pdf як HTML із вбудованими зображеннями у contract.html
  • «bank-statement.pdf захищений паролем (pw: hunter2) — видобудь лише таблицю транзакцій у вигляді тексту.»

Під капотом асистент надсилає JSON-RPC-виклик приблизно такого вигляду:

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "extract",
    "arguments": {
      "file_path": "/path/report.pdf",
      "output_path": "/path/report.md",
      "format": "markdown",
      "pages": "4-8",
      "images": true,
      "embed_images": true
    }
  }
}

Сервер записує результат у output_path і повертає коротке підтвердження — асистент далі зчитує цей файл і забирає його в свій контекст.