Descrizione
Estrae testo da immagini e PDF scansionati usando Tesseract.js (pure JS, no native binary, no API key). Lingue: italiano + inglese di default, configurabile. Output con bounding boxes, confidence score per blocco, threshold filter.
integration_ocr · action · Integrazioni SaaS · Disponibile · v1.0.0
Estrae testo da immagini e PDF scansionati usando Tesseract.js (pure JS, no native binary, no API key). Lingue: italiano + inglese di default, configurabile. Output con bounding boxes, confidence score per blocco, threshold filter.
Campi mostrati nell’editor quando si configura il nodo. Generati direttamente dal NodeDefconfigFields.
| Campo | Tipo | Required | Default | Descrizione |
|---|---|---|---|---|
actionAzione | enumextract_text | si | extract_text | — |
sourceTipo sorgente | enumfile_pathbase64 | si | — | file_path = path nel volume workspace. base64 = contenuto inline. |
contentPath o base64 | string (multiline) | si | — | — |
languagesLingue (separate da virgola) | string | no | ita,eng | Codici Tesseract: ita, eng, fra, deu, spa, ... |
confidenceThresholdSoglia confidence (0-100) | number | no | 30 | Filtra blocchi sotto questa soglia. |
Campi disponibili nei nodi successivi via $node.<alias>.json.<field>:
textconfidenceblocksSnippet JSON del nodo come compare nel workflow. I valori sono derivati daidefaultValue e dai parametri required.
{
"id": "node-integration_ocr-1",
"defId": "integration_ocr",
"label": "OCR (Tesseract)",
"config": {
"action": "extract_text",
"source": "file_path",
"content": "<content>",
"languages": "ita,eng",
"confidenceThreshold": 30
}
}OCR locale (no cloud upload). Dati restano sul container tenant, mai inviati a terze parti. Per qualità superiore in arrivo opzione Google Vision OCR (cloud).
Disponibile da subito in tutti i piani FlowForge. Provalo gratis senza carta di credito.
Inizia gratisSfoglia tutti i nodi