OCR (Tesseract)

integration_ocr · action · Integrazioni SaaS · Disponibile · v1.0.0

Descrizione

Estrae testo da immagini e PDF scansionati usando Tesseract.js (pure JS, no native binary, no API key). Lingue: italiano + inglese di default, configurabile. Output con bounding boxes, confidence score per blocco, threshold filter.

⚙️ Parametri di configurazione

Campi mostrati nell’editor quando si configura il nodo. Generati direttamente dal NodeDefconfigFields.

CampoTipoRequiredDefaultDescrizione
action
Azione
enum
extract_text
siextract_text
source
Tipo sorgente
enum
file_pathbase64
sifile_path = path nel volume workspace. base64 = contenuto inline.
content
Path o base64
string (multiline)si
languages
Lingue (separate da virgola)
stringnoita,engCodici Tesseract: ita, eng, fra, deu, spa, ...
confidenceThreshold
Soglia confidence (0-100)
numberno30Filtra blocchi sotto questa soglia.

⬆️ Output del nodo

Campi disponibili nei nodi successivi via $node.<alias>.json.<field>:

  • text
  • confidence
  • blocks

💡 Esempio configurazione

Snippet JSON del nodo come compare nel workflow. I valori sono derivati daidefaultValue e dai parametri required.

{
  "id": "node-integration_ocr-1",
  "defId": "integration_ocr",
  "label": "OCR (Tesseract)",
  "config": {
    "action": "extract_text",
    "source": "file_path",
    "content": "<content>",
    "languages": "ita,eng",
    "confidenceThreshold": 30
  }
}

🔒 Note di sicurezza

OCR locale (no cloud upload). Dati restano sul container tenant, mai inviati a terze parti. Per qualità superiore in arrivo opzione Google Vision OCR (cloud).

Pronto a usare OCR (Tesseract)?

Disponibile da subito in tutti i piani FlowForge. Provalo gratis senza carta di credito.

Inizia gratisSfoglia tutti i nodi