Se c’è un elemento che mette in costante ansia i proprietari di siti è lo spauracchio dei contenuti duplicati.
Basta un semplice comunicato stampa per cadere nella trappola e ritrovarsi a dover gestire questo problema.
Questo perché i contenuti duplicati possono causare problemi di SEO e dato che il 25-30% del Web è contenuto duplicato, è importante conoscere di cosa si tratta, come evitare e come poter affrontare la questione.

Iniziamo però dalle basi e cerchiamo di capire insieme cosa si indica per contenuto duplicato.

Cos’è un contenuto duplicato e perché crea problemi per la SEO

Il contenuto duplicato è un testo che viene copiato (intero o in grandi parti) e che appare sul Web su un singolo sito o su più domini.
Ad esempio, se dovessi ripubblicare questo articolo in questo blog stai creando un contenuto duplicato. Allo stesso modo se questo articolo viene pubblicato in un altro blog (e quindi con un’altra url) crei un contenuto duplicato.

Google afferma che la maggior parte dei contenuti duplicati non è di origine ingannevole, ma allora perché sono dannosi per la SEO? Ci sono tre motivi da approfondire:

  • URL indesiderati nei risultati di ricerca
  • Sprecare crawl budget
  • Contenuti copiati che superano la fonte originale

URL indesiderati

Immagina che la stessa pagina sia disponibile su tre URL diversi:

  • domain.com/page/
  • domain.com/page/?utm_content=buffer & utm_medium = social
  • domain.com/category/page/

Il primo dovrebbe essere visualizzato nei risultati di ricerca, ma Google potrebbe sbagliare e proporre gli altri due.
Poiché le persone potrebbero essere meno propense a fare clic su un URL così complesso, potresti ottenere meno traffico organico.

Crawl budget

Google trova nuovi contenuti sul tuo sito web tramite la scansione, il che significa che segue i link dalle pagine esistenti alle nuove pagine.
Di tanto in tanto viene eseguita nuovamente la scansione delle pagine di cui è già a conoscenza per vedere se qualcosa è cambiato. Avere contenuti duplicati serve solo ad aumentare il lavoro e sprecare crawl budget.

Questo può influire sulla velocità e sulla frequenza con cui scansionano le tue pagine nuove o aggiornate. Di conseguenza potrebbe causare ritardi nell’indicizzazione di nuove pagine e nella re-indicizzazione delle pagine aggiornate.

Contenuti copiati che superano la fonte originale

Occasionalmente, puoi consentire a un altro sito web di ripubblicare i tuoi contenuti.
Altre volte, i siti potrebbero prelevare i tuoi contenuti e ripubblicarli senza autorizzazione.
Entrambi questi scenari portano a duplicare il contenuto su più domini, ma di solito non causano problemi. È solo quando il contenuto prelevato o ripubblicato inizia a superare l’originale sul tuo sito che sorgono problemi. La buona notizia è che questo è un evento raro, ma può succedere.

Google penalizza i contenuti duplicati?

Google ha dichiarato in più occasioni di non avere una penalità per i contenuti duplicati.
In realtà questo avviene solo quando non è il risultato di una manipolazione intenzionale dei risultati di ricerca o di pratiche di spam.
Infatti il colosso ha precisato la questione con queste parole:

“Nei rari casi in cui Google percepisce che potrebbero essere mostrati contenuti duplicati con l’intento di manipolare la posizione e ingannare i nostri utenti, apporteremo anche gli opportuni aggiustamenti all’indicizzazione e al posizionamento dei siti coinvolti.
Di conseguenza, il posizionamento del sito potrebbe risentirne o il sito potrebbe essere completamente rimosso dall’indice di Google, nel qual caso non verrà più visualizzato nei risultati di ricerca”.

Cosa fare quando si hanno contenuti duplicati

La maggior parte dei CMS ti consente di organizzare i tuoi contenuti utilizzando tag e categorie. Spesso quando gli utenti eseguono ricerche basate su tag o categorie, vengono visualizzati gli stessi risultati. Di conseguenza, i robot dei motori di ricerca potrebbero pensare che entrambi gli URL offrano lo stesso contenuto come ad esempio:

http://www.yoursite.com/categoria-random

http://www.yoursite.com/tag-random

Questo problema è più grave nei siti di e-commerce dove un singolo prodotto può essere raggiunto utilizzando più filtri (risultando così in diversi possibili parametri URL).

Per evitare questo problema, Google consiglia di aggiungere un tag canonico all’URL preferito dei tuoi contenuti.
Quando un bot del motore di ricerca accede a una pagina e vede il tag canonico, ottiene il collegamento alla risorsa originale. Inoltre, tutti i collegamenti a qualsiasi pagina duplicata vengono conteggiati come collegamenti alla pagina di origine originale. Quindi, non perdi alcun valore SEO da quei link.

I tag canonici possono essere implementati in diversi modi:

  • impostare la versione preferita: www e non www
  • puntare manualmente al collegamento canonico per tutte le pagine
  • impostare reindirizzamenti 301
  • meta tag Noindex
  • utilizzare il tag hreflang per gestire i siti localizzati
  • usa l’hashtag invece del punto interrogativo quando usi i parametri UTM
  • fai attenzione alla diffusione dei contenuti