Awwwards

Come rendere scansionabile un sito web, per posizionarlo su Google

I presenti accorgimenti hanno come obiettivo di mettere Google nelle condizioni di poter individuare e valutare i contenuti che offriamo, e proporli poi nei risultati di ricerca.

In questo articolo ti mostrerò come rendere il tuo sito indicizzabile dal motore di ricerca.

(Articolo scritto da Filippo Jatta di JFactor).

L’obiettivo è quello di mettere Google nelle condizioni di poter individuare e valutare i contenuti che offriamo, e comparire nei risultati di ricerca.

Non seguire queste indicazioni può compromettere i risultati delle strategie SEO di posizionamento su Google.

Prima di tutto una doverosa precisazione: indicizzazione e posizionamento sono concetti certamente legati l’una all’altro, ma anche differenti.

L’indicizzazione di un sito web riguarda il crawler di Google, che può accedere al nostro sito, valutarlo e inserirlo nel proprio database.

Il posizionamento su Google invece riguarda non solo il fatto che il sito deve essere indicizzabile, ma che deve anche raggiungere la prima pagina per determinate parole chiave, inerenti al nostro business.

Per tal motivo l’opera di posizionamento su Google deve assolutamente comprendere i passaggi che ora andrò a mostrarti, al fine di rendere il sito anzitutto indicizzabile.

Il posizionamento vero e proprio non si limita alle operazioni che troverai di seguito, ma includerà anche altre fasi, come la ricerca di volumi apprezzabili di parole chiave, l’ottimizzazione on site e on page, e la link building.

Bene, detto questo iniziamo individuando 4 elementi chiave per una corretta indicizzazione:

  • struttura chiara
  • sitemap
  • no index, disallow, canonical
  • redirect 301 e 410 gone

Una chiara struttura per sfruttare al meglio il crawl budget

sitemap

Google assegna ad ogni sito web, a seconda della sua qualità e autorevolezza, un budget di risorse per la scansione.

Questo vuol dire che un suo spider, detto Googlebot, passa a leggere periodicamente il nostro sito web per verificare cosa offriamo, e ne valuta contenuti e argomenti.

Il tuo obiettivo è quello di sfruttare al meglio questa opportunità, facendo in modo che Googlebot scansioni e controlli con facilità tutte le pagine importanti del tuo sito web, e comprenda a quale pubblico ti stai rivolgendo.

Per far questo, è necessario creare una struttura ordinata tra le pagine del tuo sito web.

Ma, qualunque tipo di sito tu abbia, ricorda che dovresti dare visibilità e rilevanza alle pagine più importanti. Ad esempio, all’interno dei menu di navigazione,

Individua pertanto i contenuti più importanti del tuo blog. Inserisci nel menu di navigazione principale tali contenuti. Poi, crea una struttura di link interni che, con ordine e logica, porti da questi alle pagine più specifiche.

Esempio: mettiamo che hai un e-commerce di borse in pelle.

Nel menu di navigazione puoi decidere di inserire i link alle pagine di categoria principali, in modo tale che Google le scansioni per prime.

Tali categorie possono essere “borse donna” e “borse uomo”, ad esempio.

Da queste categorie puoi inserire link interni verso le sottocategorie, come “borse spalla donna”, “borse clutcher donna” e così via.

Da queste sottocategorie puoi infine linkare i singoli prodotti.

Con una struttura del genere Google scansionerà quei contenuti che per te rappresentano la fonte di guadagno, quelli su cui punti maggiormente per le vendite.

Tale indicazione vale anche per i blog: io stesso, sul mio blog, parlo di posizionamento su Google.

In particolare la pagina che parla di posizionamento su Google, che trovi sul mio sito, è linkata direttamente dal menu principale.

Non è un caso: questo contenuto è per me importante, e per questo è stato inserito in una posizione importante del sito web.

Da tale pagina ho inserito link interni verso pagine secondarie ma che rivestono comunque importanza strategica nel mio blog.

Evita, dunque, di infarcire i menu con pagine inutili e metti in evidenza quelle più importanti.

La sitemap, per mostrare a Google i tuoi contenuti da indicizzare

search console

La sitemap è un file xml che presenta un elenco di pagine web presenti nel tuo sito.

Tale elenco è importante, perché viene utilizzato da Google per venire a conoscenza delle pagine web da scansionare.

Se usi CMS come WordPress e Prestashop puoi creare facilmente la tua sitemap tramite plugin.

Una volta che la sitemap è stata creata è importante inserirla all’interno della Search Console di Google.

In tal modo potrai essere praticamente certo che Google veda tutti i contenuti presenti.

C’è da dire, d’altra parte, che Google rileva del pagine del tuo sito anche “navigandolo”, e seguendo i link interni che vi trova.

Questo vuol dire che, se la struttura del sito è fatta davvero bene (vedi il punto precedente di quest’articolo), la sitemap potrebbe addirittura non essere necessaria.

Tuttavia consiglio ugualmente di crearla, dato che basta davvero un attimo e puoi usarla anche per nascondere dei contenuti che non vuoi rendere pubblici, come le risorse multimediali, e assegnare priorità diverse alle pagine.

No index, disallow, canonical

redirect 301

In base alle peculiarità del sito web è possibile che sia necessario creare delle pagine che non vogliamo vengano indicizzate.

Questo può avvenire per diversi motivi: magari perché tali pagine hanno contenuti protetti da password (e quindi risulterebbero praticamente vuote per il motore di ricerca), magari perché presentano contenuti duplicati o comunque molto simili ad altre pagine presenti in rete.

In tali situazioni possiamo usare due semplici comandi: no index (non indicizzare) e il canonical (questo contenuto è una copia presa da un’altra fonte).

Il no index: Google non indicizza la pagina web

Quando abbiamo pagine web protette da password, oppure che presentano contenuti che non vogliamo far indicizzare sul motore di ricerca, possiamo usare il comando no index.

Tale comando dice a Google “ok Google, guarda pure la mia pagina, ma non inserirla nel tuo database, cioè… non mostrarla nelle ricerche!“.

Il disallow: Google, tu non puoi passare!

Riprendendo una celebre frase del mago del Signore degli Anelli ho spiegato, in questo titolo, la funzione del disallow: tale comando serve a negare a Google l’accesso a una determinata risorsa o pagina web.

Mentre con il no index Google può vedere la pagina (e poi non la mette nell’indice), con il disallow Google non ha proprio accesso alla pagina in questione.

Il comando disallow è ottimo da usare per salvare il famoso crawl budget di cui ho parlato a inizio articolo.

Canonical: Google, lo so che questa pagina ha un contenuto simile, però…

Il canonical è un altro metodo per indirizzare Google a scansionare le pagine più importanti di un sito web.

Facciamo un esempio: hai un e-commerce di elettrodomestici.

Hai 100 lavatrici in catalogo, e sono ordinabili per prezzo, marca, valutazione ecc.

Quando un visitatore ordina il catalogo secondo un diverso parametro viene generata una nuova pagina web.

Tale pagina web presenta sempre gli stessi modelli di lavatrici, ovviamente. Ma li presenta ordinati secondo un parametro diverso (per prezzo, oppure per marca e così via).
Tutte le pagine così generate hanno quindi contenuto simile tra loro (in fondo i modelli son sempre quelli), ma presentati in ordine diverso.

Per tal motivo all’interno di ognuna di queste pagine inseriremo l’indicazione “canonical”, che spiega a Google che, ad esempio, la pagina delle lavatrici ordinate per marca ha come riferimento (pagina appunto canonical) la pagina delle lavatrici ordinate per prezzo.

In questo modo si dà al motore di ricerca una pagina riferimento, e Google capirà che è normale che ci siano tante pagine simili. E capirà anche che quella di riferimento è una sola.

Usare bene no index, disallow e canonical porta a indirizzare al meglio la scansione di Google, evitando che venga speso male il crawl budget.

Il posizionamento del sito web ne gioverà.

I redirect 301

Può capitare che in un sito web una determinata pagina sparisca.

Magari perché la cancelliamo, o perché semplicemente ne dobbiamo cambiare la URL.

In questa situazione google continuerà comunque a visitare la pagina non più esistente, e la rileverà come 404: errore di pagina non trovata.

Gli errori 404 sono normali in un sito web, ma se derivano da link interni non più funzionanti vanno certamente risolti.

Per risolverli possiamo prima di tutto sistemare i link interni (eliminandoli o sostituendoli con le nuove URL delle pagine), e poi possiamo applicare dei redirect 301.

Un redirect 301 è un reindirizzamento definitivo, che in pratica avvisa Google che la vecchia pagina non esiste più, ed è stata sostituita con un’altra.

Tale comando permette non solo di risolvere gli errori di pagine non trovate, ma anche di conservare la link juice e la forza che queste pagine non più esistenti avevano.

In alternativa può accadere che le vecchie pagine non abbiano cambiato URL, ma siano proprio sparite, cancellate.

In tal caso non si fa un reindirizzamento verso una nuova pagina, ma si usa il comando 410 gone, per dire a Google che la vecchia pagina non è più disponibile.

Anche questi due comandi permettono a Google di scansionare meglio il nostro sito, evitando di perdere tempo verso risorse ormai inesistenti.

Nessun commento. Vuoi essere il primo?

Rispondi

%d blogger hanno fatto clic su Mi Piace per questo: