PDF: Parse (text extraction)

action_pdf_parse · action · File & Documenti · Disponibile · v1.0.0

Descrizione

Estrae il testo da un PDF. Prima prova con pdf-parse (gratis, veloce); se il risultato è di bassa qualità (PDF scannerizzato, OCR malfatto), fa fallback a Claude Sonnet vision (richiede una API key Anthropic in Settings → AI Providers).

⚙️ Parametri di configurazione

Campi mostrati nell’editor quando si configura il nodo. Generati direttamente dal NodeDefconfigFields.

CampoTipoRequiredDefaultDescrizione
path
File PDF su disco (opzionale)
file-pickerno
es. ordine.pdf o {{input.attachment.path}}
Path nel sandbox del tenant. Se vuoto, l'engine cerca i bytes in "Base64" qui sotto. Uno dei due è obbligatorio.
base64
Base64 dei bytes PDF (opzionale)
expressionno
{{$node.ImapTrigger.json.attachments[0].base64}}
Stringa base64 del PDF (es. allegato email). Massimo 32 MB. Si usa quando il PDF arriva via webhook/email senza essere salvato su disco.
mode
Strategia estrazione
enum
autopdf-parse-onlyllm-only
noautoauto = prova pdf-parse, fa fallback LLM-vision se la qualità è bassa (raccomandato). pdf-parse-only = solo libreria gratis, niente API LLM (costo zero, ma fallisce su PDF scannerizzati). llm-only = salta pdf-parse e va diretto su Claude Sonnet (massima qualità, max costo per call).

⬆️ Output del nodo

Campi disponibili nei nodi successivi via $node.<alias>.json.<field>:

  • text
  • confidence
  • mode
  • pages
  • sizeBytes
  • usedLlmFallback
  • llmModel
  • cheapAttempt

💡 Esempio configurazione

Snippet JSON del nodo come compare nel workflow. I valori sono derivati daidefaultValue e dai parametri required.

{
  "id": "node-action_pdf_parse-1",
  "defId": "action_pdf_parse",
  "label": "PDF: Parse (text extraction)",
  "config": {
    "mode": "auto"
  }
}

Pronto a usare PDF: Parse (text extraction)?

Disponibile da subito in tutti i piani FlowForge. Provalo gratis senza carta di credito.

Inizia gratisSfoglia tutti i nodi