I contenuti dublicati sono un problema per la SEO. Questo è un dato di fatto. Ce lo dicono i motori di ricerca che non distinguono correttamente le copie dall’originale. Come fare allora per risolvere questo annoso problema? Come permettere a Google (e ai suoi “fratelli”) di individuare esattamente il contenuto originale e distinguerlo dalle altre copie?
Il problema di fondo è che gli algoritmi di Google non prevedono vere penalizzazioni per i contenuti duplicati. Questo significa che se il contenuto originale non viene correttamente identificato rischia paradossalmente di posizionarsi più indietro nella SERP rispetto alle sue copie. Quale soluzione adottare allora?
Contenuti duplicati intenzionalmente
Prendiamo ad esempio il caso di contenuti dublicati intenzionalmente. La cosa peggiore che possiate fare ovviamente è linkare il contenuto originale alle diverse copie. La cosa migliore invece è identificare il contenuto originale con un “canonical URL” che andrete a posizione nell’header delle pagine che contengono le copie.
Il motore di ricerca lo riconoscerà come “redirect”. Nel caso in cui non abbiate accesso agli header delle copie potete posizionare un link “normale” all’inizio o alla fine del contenuto duplicato.
Contenuti duplicati da terzi
Ma cosa succede nel caso di contenuti duplicati da terzi? Logicamente la tecnica del canonical URL non può essere applicata. Un esempio classico è quello degli RSS feed che di fatto creano copie involontarie dei vostri testi originale. In questo caso, la soluzione migliore è quella di posizionare dei backlink alla versione originale all’interno dell’RSS feed, sebbene gli scraper professionali solitamente li rimuovono.
Ma vale le pena tentare. Nel caso di contenuti duplicati e non autorizzati, che potete scovare con una semplice ricerca su Google oppure utilizzando Copyscape, l’unica cosa da fare è contattare il proprietario del sito per chiderne la rimozione.
Quando non c’è intenzione…
I contenuti possono essere duplicati in modo non intenzionale all’interno dello stesso sito. Come? Ad esempio i CMS offrono la possibilità di accedere allo stesso contenuto attraverso URL differenti. Questo di fatto crea automaticamente diverse copie identiche.
È possibile gestire questa criticità attraverso un buon settaggio del CMS oppure utilizzando il valore “noindex” nei metatag delle pagine da non indicizzare, o ancora attraverso il file robots.txt.
Stessa cosa succede per quei siti raggiungibili con o senza www, oppure in HTTP e HTTPS. In questi casi è sufficiente realizzare dei redirect per risolvere il problema.
Vi segnaliamo infine Siteliner, un ottimo strumento per trovare contenuti duplicati all’interno dello stesso dominio. Molto utile. Provatelo.