Sitemap XML e SEO: tutto quello che devi sapere
Sitemap XML: il codice segreto per un’indicizzazione di successo
SEO
Ci scusiamo per eventuali errori nel testo. Questa è una traduzione automatica. Se trovate inesattezze,scriveteci , saremo grati. articolo originale in inglese.

Sitemap XML: il codice segreto per un’indicizzazione di successo

Un saluto a tutti i professionisti e gli appassionati di SEO! Oggi parleremo di uno strumento importante, la sitemap XML, che, se utilizzata correttamente, può migliorare notevolmente il posizionamento sui motori di ricerca. Questo significa che non possiamo ignorarlo. Quindi, cominciamo!

Sitemap XML: il codice segreto per un'indicizzazione di successo

 

Le sitemap sono uno strumento semplice per i webmaster che aiuta i motori di ricerca a comprendere meglio la struttura e l’importanza delle pagine di un sito web. La base di una sitemap è un file XML che elenca gli URL, insieme a dati aggiuntivi come la data dell’ultimo aggiornamento, la frequenza delle modifiche e il livello di priorità rispetto alle altre pagine del sito. Queste informazioni aiutano i motori di ricerca a scansionare efficacemente tutte le pagine del sito e a fornire un’indicizzazione intelligente. Le sitemap XML non sono destinate all’uomo, ma esclusivamente ai robot dei motori di ricerca.

 

Storia della creazione
Agli albori di Internet, i motori di ricerca indicizzavano i siti web esclusivamente attraverso robot che attraversavano tutte le pagine tramite link. Il numero sempre crescente di siti web su Internet rendeva la ricerca di nuove pagine per i motori di ricerca un compito molto impegnativo in termini di risorse, con la possibilità che alcune pagine importanti non venissero scoperte dal bot. A questo punto è nata l’idea che i webmaster potessero informare i motori di ricerca in un formato leggibile dalla macchina sull’elenco delle pagine del loro sito. Nasce così il progetto Sitemaps.

Il 2 giugno 2005, il direttore tecnico di Google, Shiva Shivakumar, ha annunciato in un post sul blog:

“Stiamo conducendo un esperimento chiamato Google Sitemaps, che fallirà o supererà i nostri sogni più sfrenati e renderà Internet migliore sia per i webmaster che per gli utenti”. Si tratta di una versione beta di un “ecosistema” che può aiutare i webmaster ad affrontare due compiti attuali: informare Google su tutte le nuove pagine web o gli aggiornamenti e aumentare la copertura delle pagine web nell’indice di Google”.

Sitemap XML: il codice segreto per un'indicizzazione di successo

 

Il 16 novembre 2006 Google, Yahoo! e Microsoft hanno annunciato il loro supporto congiunto per Sitemaps 0.90. Come sottolineato da Tim Mayer, Senior Director of Product Management di Yahoo Search:

“Il lancio di Sitemaps è importante perché consente ai siti web di utilizzare un modo unificato e semplice per fornire contenuti e metadati ai motori di ricerca”.

“Le Sitemaps aiutano i webmaster a visualizzare i contenuti che in genere sono difficili da scoprire per gli scanner, offrendo agli utenti un’esperienza di ricerca più completa”.

Sitemap XML: il codice segreto per un'indicizzazione di successo

Questa versione di Sitemaps è ancora attuale.

L’11 aprile 2007, Ask.com, Google, Microsoft Live Search e Yahoo! hanno annunciato il supporto per l’individuazione automatica dei file Sitemap tramite il file robots.txt.

Il 13 maggio 2023, Bing ha annunciato la rimozione della possibilità di inviare anonimamente una Sitemap tramite una richiesta HTTP. Il 26 giugno 2023 anche Google ha cancellato questa funzione. In entrambi i casi, è stato dichiarato che gli spammer avevano abusato di questa funzione.

 

In quali casi è necessario un file Sitemap?
Secondo la documentazione ufficiale di Google, una Sitemap è necessaria in tre casi:

● Se si dispone di un sito web di grandi dimensioni (più di 500 pagine);
Se il sito web è nuovo e/o ha problemi di linking interno e/o di massa di link;
Se il sito è presente in Google News o contiene molti contenuti multimediali.

Tuttavia, la pratica dimostra che non ci sono garanzie che un robot trovi tutte le pagine di un sito web senza un file Sitemap. Inoltre, la presenza di un file Sitemap rende più facile per il robot ottenere informazioni sulle modifiche apportate al sito web. Pertanto, consigliamo di aggiungere una mappa XML per qualsiasi sito web: non farà male in nessun caso.

 

Struttura della Sitemap
Il file Sitemap deve essere creato con la codifica UTF-8. Al posto dei caratteri &, ‘, “, >, <, vanno utilizzate le loro maschere. L’ordine degli URL nel file Sitemap non ha importanza per i motori di ricerca.

La Sitemap può contenere tag XML:

● urlset;
● url;
● loc;
● lastmod;
● changefreq;
● priorità.

Analizziamoli in dettaglio.

Sitemap XML: il codice segreto per un'indicizzazione di successo

Tag richiesti:
● urlset definisce lo spazio dei nomi (standard di protocollo).
url è il tag genitore di ogni voce.
loc è un tag figlio di url e contiene l’URL completo della pagina (compreso il prefisso del protocollo). Specifica la pagina corrente che sarà descritta dai tag opzionali. Il contenuto di questo tag non deve superare i 2048 caratteri.

 

Tag opzionali:
● lastmod è un tag figlio di url e contiene la data dell’ultima modifica della pagina corrente nel formato W3C Datetime. La data è spesso usata nel formato abbreviato YYYY-MM-DD.
changefreq è un tag figlio di url e descrive la frequenza prevista delle modifiche alla pagina corrente. Può assumere i seguenti valori:

-sempre;
-ogni ora;
-giornalmente; -settimanalmente
-settimanale;
-mensile;
-annuale;
-mai.

Il tag priority è un tag figlio del tag url e descrive la priorità relativa della pagina corrente sul sito web, che va da 0 a 1. La priorità è impostata in relazione alle altre pagine dello stesso sito. La priorità predefinita di una pagina è 0,5.

 

Esempio di sitemap:
<<br />
<?xml version=”1.0″ encoding=”UTF-8″?><br />
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″><br />
<url><br />
<loc>https://www.example.com/</loc><br />
<lastmod>2023-10-04</lastmod><br />
<changefreq>settimanale</changefreq>
<priorità>1</priorità>
</url><br />
<url><br />
<loc>https://www.example.com/page.html</loc><br />
<lastmod>2023-10-04</lastmod><br />
<changefreq>settimanale</changefreq>
<priorità>0,8</priorità>
</url><br />
</urlset><br />

File indice della Sitemap
Esistono due limitazioni per i file sitemap. Ogni file deve:

1. Contenere non più di 50.000 URL.
2. avere una dimensione non superiore a 52.428.800 byte.

Se la sitemap supera questi limiti, è necessario creare più file sitemap. Ogni file deve essere citato nel file di indice. I file sitemap dell’indice inoltre
non possono contenere link a più di 50.000 file sitemap e la loro dimensione non deve superare i 52.428.800 byte.

In Google Search Console c’è una limitazione: non si possono fornire più di 500 file indice Sitemap per ciascuno dei siti web.

 

Il file indice Sitemap può contenere i seguenti tag XML:
● sitemapindex;
● sitemap;
● loc;
lastmod.

*Il tag sitemapindex è il genitore dell’intero albero XML.
*Il tag sitemap è il genitore di ogni voce.
*Il tag loc è un tag figlio di sitemap e contiene l’URL completo della pagina (compreso il prefisso del protocollo). Il file indice della Sitemap non può contenere più di 50.000 tag loc.
*Il tag lastmod è opzionale ed è un tag figlio di sitemap. Contiene la data dell’ultima modifica del file Sitemap corrispondente nel formato W3C Datetime. La data è più spesso usata nel formato abbreviato YYYY-MM-DD.

 

Esempio di file indice
<<br />
<?xml version=”1.0″ encoding=”UTF-8″?><br />
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″><br />
<sitemap><br />
<loc>https://www.example.com/sitemap1.xml</loc><br />
<lastmod>2023-10-04</lastmod><br />
</sitemap><br />
<sitemap><br />
<loc>https://www.example.com/sitemap2.xml</loc><br />
<lastmod>2023-10-04</lastmod><br />
</sitemap><br />
</sitemapindex><br />

Estensione del protocollo Sitemaps
Esiste la possibilità di estendere il protocollo Sitemaps con uno spazio dei nomi personalizzato, specificandolo nell’elemento principale.

 

Come informare i motori di ricerca della posizione della sitemap
Esistono tre modi per informare i motori di ricerca sulla posizione del file della sitemap:

1. Attraverso il pannello degli strumenti per i webmaster,
2. Attraverso il file robots.txt,
3. Utilizzando una richiesta HTTP (questo metodo non è consigliato).

L’invio del file Sitemap attraverso il pannello degli strumenti per i webmaster di Google è possibile solo se si dispone dei diritti di proprietà della risorsa.
si possiedono i diritti di proprietà della risorsa. Per aggiungere il file, è necessario aprire la pagina del rapporto
pagina del rapporto Sitemap, selezionare la risorsa e aggiungere l’URL del file Sitemap. Si consiglia di verificare prima se Google ha accesso al file Sitemap.

Ecco il video di recensione di Google:
“Sitemaps in Search Console – Formazione su Google Search Console”.

Sitemap XML: il codice segreto per un'indicizzazione di successo

Inviate il file Sitemap attraverso il pannello degli strumenti per i webmaster di Bing.
Si noti che è possibile inviare una Sitemap solo per un sito selezionato dall’elenco dei siti verificati.

Per inviare il file Sitemap a Baidu, utilizzate gli Strumenti per i webmaster di Baidu Ziyuan. Solo i siti web di alta qualità che rispettano la legislazione cinese, hanno almeno una pagina in cinese semplificato e hanno superato la verifica possono inviare una Sitemap a Baidu.

Yahoo e Duckduckgo utilizzano il sistema interno di Bing per recuperare le sitemap e scoprire gli URL.

 

Per informare i motori di ricerca sulla posizione della sitemap, è necessario aggiungere la seguente direttiva al file robots.txt:

Sitemap: https://www.example.com/sitemap.xml
Qui, al posto di www.example.com, si aggiunge il dominio del sito e al posto di sitemap.xml, la posizione della mappa del sito.

Il metodo di aggiungere una sitemap tramite una richiesta HTTP è obsoleto. Ha cessato di essere efficace in Bing dal 13 maggio 2023 e in Google dal 26 giugno 2023. Il motivo principale della cancellazione di questo metodo di aggiunta delle informazioni della sitemap è lo spam. La creazione di uno script che inviasse automaticamente la sitemap tramite il protocollo http ogni giorno (o dopo ogni modifica) sembrava una buona idea. Per Google, la stringa inviata era come questa:

http://www.google.com/ping?sitemap=https://www.example.com/sitemap.xml
Con l’aumento del numero di siti web, il carico sui server dei motori di ricerca è cresciuto sensibilmente e si è deciso di abbandonare questa forma di informazione sulla posizione della sitemap.

 

Sitemap e Google
Sitemap XML: il codice segreto per un'indicizzazione di successo

In Google, gli elementi changefreq e priority specificati nel file Sitemap non vengono presi in considerazione durante l’indicizzazione del sito. L’elemento changefreq, che indica la frequenza di modifica del contenuto di una pagina, non è rilevante se è presente un elemento lastmod che indica la data dell’ultima modifica della pagina. L’elemento priority, che presuppone la determinazione della priorità della pagina, è soggettivo e non riflette accuratamente la reale importanza della pagina rispetto alle altre pagine del sito.

È importante ricordare che Googlebot tiene conto dell’attributo lastmod durante la scansione delle pagine, ma se si imposta un valore errato, non verrà preso in considerazione in futuro. Il numero di file Sitemap non ha alcun ruolo nell’indicizzazione: da parte di Google, tutti i file Sitemap vengono uniti e gli URL provenienti da essi vengono elaborati insieme, indipendentemente dal numero di file forniti.

 

Google supporta quattro modi per fornire informazioni aggiuntive nel file Sitemap:
1. Espandere gli URL per includere i file grafici,
2. Espansione degli URL per includere file video,
3. Includere informazioni su lingue diverse o versioni localizzate delle pagine utilizzando l’attributo hreflang.
4. Per i siti di notizie, è possibile utilizzare un tipo speciale di Sitemap per fornire informazioni sugli ultimi aggiornamenti.

 

Sitemap e Bing
Sitemap XML: il codice segreto per un'indicizzazione di successo

 

Il responsabile del programma di generazione dell’indice di Bing, Fabrice Canel, afferma che:
“Una delle strategie chiave per l’ottimizzazione dei siti web per i motori di ricerca (SEO) consiste nel disporre di sitemap di alta qualità che aiutino i motori di ricerca a scoprire e ad accedere a tutti i contenuti rilevanti ospitati sul sito. Le sitemap offrono ai proprietari dei siti web un modo davvero semplice per condividere con ogni motore di ricerca le informazioni sui contenuti presenti sul sito, piuttosto che affidarsi esclusivamente agli algoritmi di scansione (cioè scanner, robot) per trovarli.”

Sitemap XML: il codice segreto per un'indicizzazione di successo

Raccomanda di evitare un numero eccessivo di file sitemap XML sul sito. Idealmente, suggerisce di utilizzare un solo file sitemap di indice che elenchi tutti i file sitemap rilevanti e i file sitemap di indice.

Per ridurre al minimo il numero di link duplicati e non funzionanti nelle sitemap, Bing consiglia di creare sitemap almeno una volta al giorno.

Per i siti molto grandi con milioni e miliardi di URL, la dimensione totale dei file XML delle sitemap può raggiungere oltre 100 gigabyte. In questi casi, Bing consiglia di creare due serie di sitemap e di alternarle quotidianamente.

 

Sitemap e Baidu
Sitemap XML: il codice segreto per un'indicizzazione di successo

Baidu richiede quanto segue per le sitemap:

● Non deve superare i 10 MB;&nbsp
Non deve contenere caratteri cinesi;&nbsp
Deve trovarsi nella cartella principale del sito web.

 

Come creare una sitemap XML?
Google offre un elenco leggermente obsoleto di generatori di file Sitemap di terze parti che i webmaster possono utilizzare o creare un proprio strumento basato su di essi. Attualmente non tutti i link sono attivi, ma molti funzionano ancora.

 

Ecco alcuni servizi popolari per la creazione di sitemap XML:
Sitemap Writer Pro è un programma che offre sette tipi di sitemap (sitemap standard, Google Immagini, Google News, Google Video, Google Code Search, Google Geo, Google Mobile). Include un crawler integrato per la generazione di sitemap e un gestore FTP per il caricamento della sitemap sul sito web.

Il generatore di sitemap XML comprende un generatore gratuito (fino a 500 pagine), un generatore professionale e uno script per server scritto in PHP.

My Sitemap Generator è un generatore di sitemap gratuito che analizza il sito web e crea una sitemap XML.

 

Plugin CMS che creano sitemap:
Drupal
Modulo XML Sitemap: crea una sitemap. Include diversi sottomoduli che possono aggiungere collegamenti alla sitemap per i contenuti, le voci di menu e i profili degli utenti.

WordPress
Google (XML) Sitemaps Generator – crea automaticamente una sitemap XML. Genera anche una sitemap HTML.

Generatore di Sitemap XML
IKSWEB XML Sitemap Generator – un plugin leggero e compatto che crea una sitemap XML.

Plugin Google XML News Sitemap
Il plugin Google News è un software open-source che consente agli editori di aggiornare i file Sitemap per Google News. Oltre alle consuete funzionalità, consente agli editori di descrivere i tipi di contenuti pubblicati e di specificare i livelli di accesso per i singoli articoli.

Joomla
L’elenco attuale dei plugin che creano una mappa del sito in formato XML per Joomla è riportato sul sito web del CMS.

 

Altri formati di mappa del sito:
Oltre alla mappa del sito in formato XML, esistono altri formati meno comuni di mappe del sito destinate ai motori di ricerca.

RSS, mRSS e Atom 1.0
Per un blog con un feed RSS o Atom, è possibile utilizzare l’URL di questo feed come fonte per creare un file Sitemap. Quasi tutte le piattaforme di blogging offrono la possibilità di creare un feed. Google supporta i feed RSS 2.0 e Atom 1.0, nonché i feed mRSS (media RSS).

File Sitemap di testo
In un file Sitemap di testo è possibile aggiungere solo URL, ciascuno su una riga separata. L’estensione del file deve essere .txt (ad esempio, sitemap.txt).

 

Conclusione
In conclusione, una Sitemap XML è uno strumento essenziale nell’arsenale di un webmaster o del proprietario di un sito web. Si tratta di un file strutturato che aiuta i motori di ricerca a scansionare e indicizzare in modo più efficace i contenuti del sito. In questo articolo abbiamo discusso gli aspetti chiave delle sitemap XML e il loro importante ruolo nell’ottimizzazione della visibilità di ricerca.

Una sitemap XML consente di controllare quali pagine del sito sono disponibili per l’indicizzazione e fornisce informazioni aggiuntive su ciascuna pagina, come la data dell’ultimo aggiornamento e la priorità. Questo aiuta i motori di ricerca a determinare con maggiore precisione quali pagine indicizzare e con quale frequenza rivisitarle.

L’utilizzo delle sitemap XML è un elemento chiave di una strategia SEO di successo. Contribuisce a migliorare l’indicizzazione del sito, aumentandone la visibilità nei risultati di ricerca.

È importante ricordare che una sitemap XML è uno strumento che richiede un aggiornamento e una manutenzione costanti per rimanere attuale ed efficace. L’aggiornamento regolare della sitemap consente ai bot di tenere traccia delle modifiche apportate al sito e di informare i motori di ricerca di tali cambiamenti.

 

Cari amici! Grazie per aver letto e per averci dedicato del tempo!
Speriamo che l’articolo sia stato interessante e, soprattutto, utile!

Sitemap XML: il codice segreto per un'indicizzazione di successo

 

Capire il markup semantico: Nozioni di base e impatto sulla SEO

Capire il markup semantico: Nozioni di base e impatto sulla SEO

Salve a tutti! In questo articolo parleremo del markup semantico e del perché...

Come promuovere attraverso le query chiave “…vicino a me”

Come promuovere attraverso le query chiave “…vicino a me”

Un saluto a tutti! Oggi parleremo di come promuovere attraverso le query di...

Guida ai dati fondamentali del web

Guida ai dati fondamentali del web

Salve appassionati di SEO! Oggi vi proponiamo una guida su Core Web Vitals....