stripQuotedReply Rimuovi reply quotata | boolean | no | true | Rileva "On 2026-01-15, X wrote:" (EN), "Il giorno X ha scritto:" (IT), "---- Forwarded message ----", "Da: …" (Outlook), oppure 4+ righe ">" consecutive. Taglia tutto da quel punto in poi. |
stripSignatures Rimuovi firma | boolean | no | true | Rileva delimitatore RFC-3676 "-- " (dash dash space), "Inviato da iPhone/Android/Samsung/...", "Sent from my iPhone", oppure euristica "ultimo paragrafo con Tel:/P.IVA:/email:". |
stripDisclaimers Rimuovi disclaimer legali | boolean | no | true | "This email is confidential…", "Le informazioni contenute…", "Per proteggere l'ambiente non stampare…", "Informativa privacy GDPR…", "Ai sensi del Reg…". Match per paragrafo, non per body intero. |
stripTrackingUrls Rimuovi tracking dagli URL | boolean | no | false | Sostituisce gli URL con parametri utm_*, gclid, fbclid, mc_eid, mc_cid con la sola "https://<host>/". Utile contro marketing emails. Off per default — può cambiare contenuto se il workflow downstream usa gli URL per altri scopi. |
collapseBlankLines Collassa righe vuote (≥3 → 1) | boolean | no | true | Dopo lo strip rimuovere spazi consecutivi rende i token più densi. |
maxBodyLength Lunghezza massima body (caratteri) | number | no | 8192 | Hard cap per evitare LLM context overflow. Range 64–64000. Eccedenza tagliata + "…" alla fine. |
inputBodyField Campo input con il body | string | no | body | Nome del campo dall'input record che porta il body raw. Default "body". Cambia se l'upstream usa "text", "content", "html". |