La sitemap.xml è importante ?

Prima di descirvere gli errori più comuni delle sitemap.xml , probabilmente devi chiarire la differenza tra mappa del sito ( chiamata anche sitemap ma genericamente) è sitemap.xml .

La mappa del sito è una normale pagina Web o un File PDF dove viene creata manualmente una vera e propria mappa del sito con i link a tutte le pagine di quest’ultimo (o alle sezioni principali per siti Web di grandi dimensioni), utile per facilitare sia la navigazione degli utenti umani o anche utilizzata per spiegare i termini (keywords utilizzati per costruire la base, cioè la struttura del sito web).

La Sitemap XML, invece, è un file che raccoglie tutti gli URL di un sito Internet che il proprietario di quest’ultimo vuole sottoporre ai motori di ricerca per la scansione e, di conseguenza, per l’indicizzazione di tali contenuti. 

Capito ? Ci tengo a precisare che la struttura del sito , deve essere studiata precedentemente, analizzata in ogni aspetto e in ogni keywords da associare.

Una struttura fatta a CASO non ti porterà benefici.

Le sitemap XML sono uno strumento importante (e trascurato) che il tuo sito web può utilizzare per indirizzare i motori di ricerca a tutte le pagine più importanti del tuo sito web.

Invece di eseguire la scansione pagina per pagina del tuo sito web, le sitemap.xml offrono ai motori di ricerca un modo efficiente per trovare, eseguire la scansione e indicizzare tutte le pagine del tuo sito web.

Sono un fattore SEO davvero importante e spesso è la prima cosa che guardiamo quando valutiamo la posizione SEO di un sito web. 

Dopo aver inviato una sitemap.xml ai motori di ricerca tramite Google Search Console e Bing Webmaster Tools, molti proprietari di siti scoprono che i motori di ricerca trovano problemi nei loro siti web, problemi seo, problemi nei codici, problemi in posizionamento, ecc…

Ci tengo a precisare però che la sitemap.xml non risolve problemi di codice o problemi di posizionamento, questi problemi, si possono risolvere solo lavorando con l’ottimizzazione seo e una valida strategia SEO da seguire.

Oltre ad avere una struttura VALIDA di un sito web, per struttura del sito, intendo una struttura costruita ad hoc, studiata in base ad ogni keywords per ogni pagina e inerente poi alle pagine secondarie ecc…

Gli errori che puoi trovare nelle sitemap.xml inviate

È importante fare tutto il possibile per eliminare gli errori delle sitemap, poiché ai motori di ricerca non piace fare affidamento su sitemap che presentano problemi. 

Di seguito sono riportati alcuni degli errori più comuni associati alle sitemap.xml e come puoi risolverli.

Errore di scansione URL SITEMAP XML

Questo è probabilmente il problema della sitemap più comune che incontrerai in Google Search Console.

Questo messaggio di errore indica che la tua Sitemap ha una pagina elencata con un errore di scansione noto, ma lo stato dell’errore non è specificato.

Potrebbe anche non essere scansito affatto l’url del file sitemap.xml

Come Risolvere l’Errore di scansione URL SITEMAP XML

Se il problema riguarda solo pochi url , cioè alcune pagine devi un po’ investigare, e il modo migliore per farlo è caricare la pagina nel tuo browser. 

Il problema alla radice potrebbe essere uno dei tanti problemi, come:

  • La pagina si carica troppo lentamente e la connessione è scaduta
  • Troppi reindirizzamenti: i motori di ricerca seguiranno solo pochi reindirizzamenti. Se questo è il caso della tua pagina, dovrai reimpostare i reindirizzamenti 301 del tuo sito
  • Il tuo sito sta impedendo ai motori di ricerca di accedere ai contenuti Javascript o CSS (non HTML)
  • La pagina ha una pagina di stato 4xx diversa da una 404, ad esempio una pagina 403 “Proibita” o una pagina 410 “Andata”

Se la pagina viene caricata correttamente, potresti provare a inviare una richiesta a Google per recuperare e visualizzare la pagina e vedere come il bot di Google esegue la scansione e visualizza i tuoi contenuti.

Come Risolvere l’Errore di scansione URL FILE SITEMAP XML

Se invece l’errore è genericamente rivolto all’URL del file sitemap.xml, controlla l’utilizzo del protocollo Sitemap standard in tutti i formati e non prevedendo (al momento) l’attributo <priority> nelle Sitemap.

I formati accettati sono quello XML, il più diffuso, e poi ancora .txt (file testuale, valido solo se la mappa contiene URL di pagine web e non altre risorse), feed RSS 2.0, mRSS e Atom 1.0, ma Google supporta anche la sintassi espansa delle Sitemap per determinati contenuti multimediali.

Controlla anche come inserisci l’url nella search console di google, alle volte se crei il file sitemap con un plugin potresti avere l’esigenza di inserire l’url nel seguente modo:

Inserire URL relativi, non uniformi o incompleti rappresenta un grave errore, perché genera link non validi.

In termini pratici, questo significa che bisogna includere il protocollo, ma anche (se richiesto dal server web) la barra finale: l’indirizzo https://www.esempio.it/ rappresenta dunque un URL valido per una Sitemap, mentre www.esempio.ithttps://example.com/ (senza usare il www) o ./mypage.html non lo sono.

Errore 404 in alcune pagine inviate o errori 404 soft

Ci sono pagine nella sitempa.xml che restituiscono un messaggio di errore 404 “File non trovato”. 

Queste pagine dovrebbero essere rimosse dalla tua sitemp.xml e potresti voler creare reindirizzamenti 301 a una pagina live sul tuo sito web.

Tieni presente che Google potrebbe elencare una manciata di pagine nella tua sitempa con problemi di scansione, ma potrebbe non elencare tutte le pagine con errori 404.

Come risolvere gli errori 404 e 404 soft

Se si tratta di pagine utili – non duplicate né bloccate – potrebbe esserci un problema di qualità, come i famosi contenuti sottili, o uno status code non corretto, in particolare per le pagine scansionate ma attualmente non indicizzate (Google ha scelto di non inserire per ora la pagina nell’Indice) e per le pagine rilevate, ma non indicizzate (Google ha provato a fare una scansione, ma il sito era sovraccarico), e quindi è il caso di intervenire con opportune ottimizzazioni onsite.

Puoi anche effettuare dei reindirizzamenti 301, se sono molte le pagine, ti conviene fare un redirect 301 nel file htaccess, poichè non tutti i redirect vengono indicizzati nel file sitemap da gooogle search console.

Errore Data non Valida

Si puoi anche avere un errore data non valida, specialmente se hai creato manualmente un file sitemap.xml.

Se la tua mappa del sito elenca le date dell’ultima modifica, devono essere elencate nel formato di data W3C corretto (il formato dell’ora è facoltativo).

Le date devono essere elencate come AAAA-MM-GG – non AAAA/MM/GG, GG/MM/AAAA o qualsiasi altro formato.

Sitemap bloccata dal file robots txt

Il file robots.txt del tuo sito indica ai motori di ricerca quali pagine non devono essere sottoposte a scansione. 

Questo aiuta a ridurre la larghezza di banda e impedisce ai motori di ricerca di indicizzare le pagine che non vuoi che indicizzino, come una pagina di accesso o se hai un E-commerce quelle coni dati dei tuoi clienti.

Puoi visualizzare il file robots.txt del tuo sito visitando www.yoursite.com/robots.txt:

il comando Disallow: indica ai bot di non eseguire la scansione di un determinato percorso URL.

Se elenchi una pagina come:

yourwebsite.com/services/pet-sitting nella tua sitemap, ma il tuo file robots.txt blocca tutte le pagine di servizio “Disallow: /services/*”, allora questo è un problema.

Assicurati di non bloccare le pagine in tale file.

Ricordati sempre di inserire all’interno del tuo file robots.txt la seguente voce:

Sitemap: http://tuoindirizzo/sitemap.xml

URL NOINDEX inviati dalla Sitemap 

I proprietari di siti web possono impedire ai motori di ricerca di indicizzare una pagina utilizzando un tag noindex, in genere come meta tag, ma può anche essere eseguito come intestazione di risposta HTTP. 

Ancora una volta, questo viene spesso utilizzato su pagine che il proprietario di un sito Web non desidera che i motori di ricerca indicizzino, come una pagina di accesso o una pagina di termini e servizi.

Ciò pone un problema quando le pagine con un tag noindex sono elencate in una sitemap. Esamina queste pagine e rimuovi il tag noindex o rimuovi queste pagine dalla sitemap.xml per evitare errori banali nella search console di google.

Sitemap Troppo grandi – Limite di url superati

Google attualmente limita il numero di URL in una sitemap.xml a 50.000 URL. 

Puoi inviare più di una sitemap.xml ai motori di ricerca e questo è meglio farlo creando un file di indice della sitemap.xml, che elenca tutti i file delle altre sitemap.

Indipendentemente da ciò, se il tuo sito web è molto grande, è una buona idea dividere la tua sitemap, poiché alcuni studi hanno dimostrato che Google indicizza una percentuale maggiore di URL se sono elencati in sitemap più piccole.

Esempio:

  • Indice generico con pagine principali – Sitemap.xml
  • Pagine secondarie – Sitemap_index1.xml e cosi via
  • Immagini – Sitemap_Image.xml
  • Video – Sitemap_video.xml

Sitemap Vuote o con nomi sbagliati

Controlla sempre il file sitemap creato, assicurati che sia valido e contenga gli url del tuo sito web è davvero da principianti, salvare un file vuoto che non contiene alcun URL e inviarlo alla Search Console.

Peggio ancora salvare un file che abbiamo detto centinaia di volte si chiama sitemap.xml e va inserito nella root del tuo sito, quindi l’url è www.nomesito.it/sitemap.xml chiamarlo diversamente.

Errori di codifiche e caratteri non supportati nella sitemap.xml

Una imprecisione simile, ma più specifica, riguarda il metodo di codifica dei caratteri usati per generare i file Sitemap:

Lo standard richiesto è la codifica UTF-8, che in genere si può applicate quando si salva il file, e la Guida di Google spiega che “tutti i valori dei dati (inclusi gli URL) devono utilizzare codici di escape” per alcuni caratteri critici (come si vede nell’immagine in pagina).

In dettaglio, una mappa può contenere soltanto caratteri ASCII, mentre non sono supportati caratteri ASCII maiuscoli né particolari codici di controllo e caratteri speciali (ad esempio, asterisco * e parentesi graffe {}).

Se si usano questi caratteri nell’URL della Sitemap si genera un errore al momento di aggiungere la Sitemap.

Di seguito è riportata una Sitemap XML basilare che include il percorso di un singolo URL.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://www.example.com/foo.html</loc>
    <lastmod>2018-06-04</lastmod>
  </url>
</urlset>

In generale come risolvere errori della sitemap in search console google

Google Search Console non specifica cosa sta causando esattamente il problema, quindi dovrai utilizzare altri strumenti per capire quali problemi devono essere risolti. 

Se lo strumento rileva dei problemi, sarai in grado di ottenere tutte le informazioni necessarie su ogni errore facendo clic sul numero di pagine.

In questo modo ogni errore avrà una psiegazione e saprai quale pagina presenta tale errore e come questa pagina è collegata ad altre pagine del sito web .

Valuta anche lo stato del file sitempa.xml quando risulta essere Riuscito , perchè ciò non significa che hai finito con la sitemap o con il tuo sito web. 

Fai clic sull’icona di copertura dell’indice accanto al numero di URL rilevati per accedere al rispettivo rapporto.

Una volta che inizi a indagare, potresti notare che non tutte le pagine che hai inviato sono state indicizzate. 

NOTA: La Sitemap non garantisce che le pagine web siano indicizzate e incluse nei motori di ricerca al 100%, né influenza il posizionamento nei risultati di ricerca.

Per tutto questo, occorre un sito ben strutturaro, ben ottimizzato, senza errori di codice, senza errori di scrittura per gli umani , senza errori in lettura da parte di search console e specialmente una strategia SEO per il POSIZIONAMENTO.

 

Contattami Per sviluppare il tuo E-commerce con Una Pianificazione Seo Adeguata al progetto o Per qualsiasi dubbio i consigli non si pagano!

Trattamento Privacy

1 + 5 =