Le sitemap sono strumenti fondamentali per aiutare sia gli utenti sia i motori di ricerca a navigare e comprendere la struttura di un sito web. Esistono due tipi principali: le sitemap HTML, pensate per la navigazione umana, e le sitemap XML, progettate specificamente per i crawler dei motori di ricerca. In questa guida vedremo come creare, configurare e ottimizzare entrambi i tipi per massimizzare l’indicizzazione e la visibilità del tuo sito.
Cosa Sono le Sitemap e Perché Sono Importanti
Una sitemap è essenzialmente una mappa del sito — un elenco organizzato di tutte le pagine che compongono un sito web. Per i motori di ricerca, la sitemap XML funziona come una guida che indica quali pagine esistono, quando sono state aggiornate e quanto sono importanti. Per gli utenti, la sitemap HTML offre una panoramica navigabile dell’intera struttura del sito.
Le sitemap sono particolarmente importanti in diversi scenari: siti di grandi dimensioni con centinaia o migliaia di pagine, siti con pagine isolate (non facilmente raggiungibili tramite link interni), siti nuovi con pochi backlink esterni, siti che utilizzano contenuti multimediali (video, immagini) e siti con contenuti aggiornati frequentemente come blog e portali di notizie.
Google stesso afferma che, sebbene il crawler possa scoprire le pagine seguendo i link interni, la sitemap XML migliora l’efficienza del crawling e garantisce che nessuna pagina importante venga trascurata. Per comprendere meglio come la struttura HTML influisce sulla visibilità nei motori di ricerca, potete consultare la nostra guida su HTML e SEO.
Sitemap HTML: Struttura e Implementazione
La sitemap HTML è una pagina web tradizionale che elenca tutti i contenuti del sito in modo organizzato e gerarchico. Si tratta di una pagina accessibile agli utenti, tipicamente raggiungibile dal footer del sito, che fornisce una visione d’insieme della struttura dei contenuti.
Una sitemap HTML ben strutturata utilizza elenchi annidati per riflettere la gerarchia del sito:
<h1>Mappa del Sito</h1>
<h2>Pagine Principali</h2>
<ul>
<li><a href="/chi-siamo">Chi Siamo</a></li>
<li><a href="/servizi">Servizi</a>
<ul>
<li><a href="/servizi/web-design">Web Design</a></li>
<li><a href="/servizi/seo">SEO</a></li>
</ul>
</li>
<li><a href="/contatti">Contatti</a></li>
</ul>
<h2>Blog</h2>
<ul>
<li><a href="/blog/articolo-1">Titolo Articolo 1</a></li>
<li><a href="/blog/articolo-2">Titolo Articolo 2</a></li>
</ul>
I vantaggi della sitemap HTML includono il miglioramento della navigazione interna per gli utenti, la distribuzione del “link juice” a tutte le pagine del sito e l’offerta di un punto di accesso alternativo ai contenuti. Dal punto di vista SEO, ogni link nella sitemap HTML è un link interno che i crawler possono seguire, migliorando l’architettura dei link del sito.
Sitemap XML: Struttura e Protocollo
La sitemap XML segue il protocollo sitemap definito su sitemaps.org e utilizza un formato strutturato che i motori di ricerca possono analizzare automaticamente. La struttura base prevede un elemento radice <urlset> contenente uno o più elementi <url>:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.esempio.it/</loc>
<lastmod>2025-09-10</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://www.esempio.it/servizi/</loc>
<lastmod>2025-08-15</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>
I tag disponibili per ogni URL sono: <loc> (obbligatorio, l’URL completo della pagina), <lastmod> (data dell’ultima modifica in formato ISO 8601), <changefreq> (frequenza prevista di aggiornamento: always, hourly, daily, weekly, monthly, yearly, never) e <priority> (un valore da 0.0 a 1.0 che indica l’importanza relativa della pagina all’interno del sito).
È importante sapere che Google ha dichiarato di ignorare i tag changefreq e priority, considerandoli poco affidabili. Il tag <lastmod> viene invece utilizzato attivamente, a condizione che rifletta la data reale dell’ultima modifica significativa del contenuto. Aggiornare il lastmod senza modificare il contenuto è controproducente.
Sitemap Index e Gestione di Siti Grandi
Una singola sitemap XML ha un limite di 50.000 URL e un peso massimo di 50 MB (non compressa). Per siti più grandi, si utilizza una sitemap index che referenzia multiple sitemap individuali:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://www.esempio.it/sitemap-pagine.xml</loc>
<lastmod>2025-09-10</lastmod>
</sitemap>
<sitemap>
<loc>https://www.esempio.it/sitemap-blog.xml</loc>
<lastmod>2025-09-08</lastmod>
</sitemap>
<sitemap>
<loc>https://www.esempio.it/sitemap-prodotti.xml</loc>
<lastmod>2025-09-09</lastmod>
</sitemap>
</sitemapindex>
Una buona pratica è suddividere le sitemap per tipo di contenuto (pagine, articoli, prodotti, categorie) per facilitare il monitoraggio dell’indicizzazione in Google Search Console. Ogni sitemap individuale può essere monitorata separatamente, permettendo di identificare rapidamente problemi specifici.
Robots.txt, Search Console e Best Practice
Il file robots.txt deve contenere un riferimento alla sitemap XML, in modo che i crawler possano trovarla automaticamente. La direttiva va inserita alla fine del file:
User-agent: *
Disallow: /admin/
Disallow: /tmp/
Sitemap: https://www.esempio.it/sitemap.xml
Oltre al riferimento nel robots.txt, è consigliabile inviare la sitemap a Google Search Console manualmente. Nella sezione “Sitemap” della Search Console, inserite l’URL completo della sitemap e inviatela. La Search Console mostrerà il numero di URL inviati, quelli indicizzati e eventuali errori. Questo strumento è invaluabile per monitorare la salute dell’indicizzazione del sito.
Le best practice per le sitemap includono: inserire solo URL canonici (non URL con parametri o duplicati), mantenere aggiornato il lastmod, non includere URL bloccati dal robots.txt o con tag noindex, verificare che tutti gli URL restituiscano uno status 200, e rigenerare la sitemap automaticamente quando i contenuti cambiano. Per i siti WordPress, plugin come Yoast SEO o SEOPress generano e aggiornano la sitemap automaticamente, eliminando la necessità di gestione manuale.
Infine, oltre alla sitemap standard, esistono sitemap specializzate per immagini e video che utilizzano namespace aggiuntivi per fornire ai motori di ricerca informazioni specifiche su questi tipi di contenuti multimediali, migliorandone la visibilità nella ricerca per immagini e video di Google.
Hai bisogno di aiuto con la configurazione della sitemap del tuo sito? G Tech Group offre servizi di sviluppo web professionale e consulenza tecnica. Contattaci a su*****@********up.it o via WhatsApp al 0465 84 62 45.