OCR (Tesseract)

integration_ocr · action · Integrazioni SaaS · Disponibile · v1.0.0

Descrizione

Estrae testo da immagini e PDF scansionati usando Tesseract.js (pure JS, no native binary, no API key). Lingue: italiano + inglese di default, configurabile. Output con bounding boxes, confidence score per blocco, threshold filter.

⚙️ Parametri di configurazione

Campi mostrati nell’editor quando si configura il nodo. Generati direttamente dal NodeDefconfigFields.

Campo	Tipo	Required	Default	Descrizione
`action` Azione	`enum` `extract_text`	si	`extract_text`	—
`source` Tipo sorgente	`enum` `file_pathbase64`	si	—	file_path = path nel volume workspace. base64 = contenuto inline.
`content` Path o base64	`string (multiline)`	si	—	—
`languages` Lingue (separate da virgola)	`string`	no	`ita,eng`	Codici Tesseract: ita, eng, fra, deu, spa, ...
`confidenceThreshold` Soglia confidence (0-100)	`number`	no	`30`	Filtra blocchi sotto questa soglia.

⬆️ Output del nodo

Campi disponibili nei nodi successivi via $node.<alias>.json.<field>:

text
confidence
blocks

💡 Esempio configurazione

Snippet JSON del nodo come compare nel workflow. I valori sono derivati daidefaultValue e dai parametri required.

{
  "id": "node-integration_ocr-1",
  "defId": "integration_ocr",
  "label": "OCR (Tesseract)",
  "config": {
    "action": "extract_text",
    "source": "file_path",
    "content": "<content>",
    "languages": "ita,eng",
    "confidenceThreshold": 30
  }
}

🔒 Note di sicurezza

OCR locale (no cloud upload). Dati restano sul container tenant, mai inviati a terze parti. Per qualità superiore in arrivo opzione Google Vision OCR (cloud).

🔗 Nodi correlati nella stessa categoria

Pronto a usare OCR (Tesseract)?

Disponibile da subito in tutti i piani FlowForge. Provalo gratis senza carta di credito.

Inizia gratis Sfoglia tutti i nodi