Sitemap Crawler

action_sitemap_crawler · action · Utility · Disponibile · v1.0.0

Descrizione

Scarica e parsa sitemap.xml di un sito → ritorna lista URL. Supporta sitemap-index ricorsivo (1 sitemap che linka altri sitemap), filtri regex include/exclude, filtro lastmod minimo (per "solo URL aggiornati dopo X"). Use case: audit SEO proprio sito (quante pagine indicizzate?), detection nuove pagine (compare lastrun → diff), sync URL su crawler interno, bulk price-check pagine prodotto. Default max 1000 URL ritornati, max recursion depth 3 livelli sitemap index.

⚙️ Parametri di configurazione

Campi mostrati nell’editor quando si configura il nodo. Generati direttamente dal NodeDefconfigFields.

CampoTipoRequiredDefaultDescrizione
url
URL sitemap.xml
stringsi
https://miosito.com/sitemap.xml
URL del sitemap. Funziona sia con urlset diretto sia con sitemap-index (recursion auto).
includeRegex
Include regex (filtro URL)
stringno
/blog/|/news/
Solo URL che matchano questa regex (case-insensitive). Lascia vuoto = tutte.
excludeRegex
Exclude regex (filtro URL)
stringno
/admin/|\.pdf$
Escludi URL che matchano questa regex.
lastmodSinceIso
Solo lastmod >= (ISO)
stringno
2026-05-01
Filtra URL con lastmod >= questa data. URL senza lastmod vengono SCARTATI quando filtro attivo.
maxRecurseDepth
Max recursion depth
numberno3Quanti livelli di sitemap-index seguire. Default 3 (sufficiente per 99% siti).
limit
Max URL ritornati
numberno1000Limite output. Default 1000, max 50000.
userAgent
User-Agent
stringnoFlowForge/1.0 (+https://flowforge.automazionezeli.com)

⬆️ Output del nodo

Campi disponibili nei nodi successivi via $node.<alias>.json.<field>:

  • totalUrlsInSitemap
  • filteredCount
  • urls
  • includeRegex
  • excludeRegex
  • lastmodSinceIso

💡 Esempio configurazione

Snippet JSON del nodo come compare nel workflow. I valori sono derivati daidefaultValue e dai parametri required.

{
  "id": "node-action_sitemap_crawler-1",
  "defId": "action_sitemap_crawler",
  "label": "Sitemap Crawler",
  "config": {
    "url": "https://miosito.com/sitemap.xml",
    "maxRecurseDepth": 3,
    "limit": 1000,
    "userAgent": "FlowForge/1.0 (+https://flowforge.automazionezeli.com)"
  }
}

🔗 Nodi correlati nella stessa categoria

Pronto a usare Sitemap Crawler?

Disponibile da subito in tutti i piani FlowForge. Provalo gratis senza carta di credito.

Inizia gratisSfoglia tutti i nodi