I contenuti duplicati sono una vera e propria piaga per il tuo sito web e, sopratutto, per le tue campagne di web marketing: l’impatto può essere estremamente negativo in termini di esperienza utente (ed in particolare di brand reputation), ma anche e sopratutto in ambito SEO. Vediamo perchè e come accorgersi di un problema spesso nascosto…

Cerchiamo intanto di capire quali problemi possa provocare la presenza di contenuti duplicati sul tuo sito web: sebbene non debba essere sottovalutata la reazione negativa dell’utente che riconosce un testo scopiazzato o già letto su altre pagine, l’impatto è principalmente in termini prettamente SEO. Laddove Google rilevi un contenuto copiato può intraprendere azioni correttive nei suoi algoritmi, che in ordine di gravità possono andare dalla semplice de-indicizzazione della pagina che contiene il testo duplicato, alla penalizzazione algoritmica dell’intero sito web.

Contenuti rubati

Una tipologia piuttosto frequente di contenuti duplicati sono quelli “rubati”: fondamentalmente, frasi, paragrafi o intere pagine prese da un’altra pagina web senza alcuna autorizzazione. Google non sempre è in grado di distinguere l’originale dal copiato, ed è questo il problema principale, perchè ti obbliga anche a verificare periodicamente che non siano i tuoi testi ad essere stati “rubati”. Consiglio: utilizza strumenti come Awario, che ti permetta di verificare se particolari porzioni di testo indicizzate dal tuo sito non siano presenti anche su altre risorse da te non autorizzate. Se ciò accade, contatta il webmaster e chiedine la rimozione, solitamente questa semplice azione risolve il problema.

Contenuti replicati

In questo caso, hai autorizzato la copia del tuo contenuto, o ne sei comunque a conoscenza e l’approvi. Ma attenzione: se non segnali a Google la cosa, la situazione rientra esattamente nel caso precedentemente descritto… e si porta quindi dietro gli stessi problemi. Quando un contenuto viene replicato in maniera lecita, va segnalato mediante attributo “canonical” al motore di ricerca, devi quindi accertarti che tale accorgimento venga adottato.

Contenuti duplicati sul sito

Leggendo le precedenti due casistiche, avrai sicuramente pensato “nulla di nuovo”… Forse, ma hai mai pensato di cercare i contenuti duplicati all’interno del tuo sito? Già, perchè questo è un problema il cui impatto in termini di indicizzazione e posizionamento organico può essere determinante. Il motivo è legato al cosidetto “crawling budget”: esso identifica, per farla semplice, il numero di pagine che Google indicizzerà in una determinata unità di tempo. Ipotizziamo, a titolo di esempio, che il crawling budget dedicato al tuo sito sia pari a 100 in 1 minuto: significa che Google indicizzerà 100 pagine del tuo sito in quel minuto, prima di passare ad un altro sito. Ora, se il tuo sito è composto da 10,20,50 o 99 pagine, tutto bene: ma se, per qualsiasi motivo, il numero di URL (attenzione: 1 URL=1 pagina!) sale a 200,500 o 1.000… allora hai un problema. Sopratutto se magari il 50% di esse non contiene un contenuto importante per l’utente, ma rientra in uno dei casi che ora andiamo ad elencare.

  1. Pagine http raggiungibili/pagine senza www: problema prettamente tecnico, ma moooolto frequente… Si verifica quando hai diversi link esterni (o interni) che puntano su URL non http (presenti anche prima del cambio di protocollo) o non www: in questi casi la soluzione è abbastanza semplice, in quanto è sufficiente impostare su ogni pagina dei redirect 301
  2. URL generati dinamicamente: problema comune a moltissimi e-commerce. Si verifica quasi sempre a causa dei filtri applicati sui prodotti, che possono generare pagine dinamiche tutte uguali tra di loro (o in gran parte) che vanno a sottrarre molto crawling budget. In questi casi, è fondamentale impostare le corrette direttive nel file robots.txt affinchè il bot di Google ignori determinati parametri all’interno dell’URL della pagina
  3. Pagine molto simili tra di loro: anche in questo caso sotto la lente d’ingrandimento vanno gli shop online, in quanto spesso articoli differenti condividono le stesse descrizioni. Oppure quei siti che ancora adottano vecchie tecniche SEO di duplicazione di contenuti su pagine con titoli diversificati per rispondere alle diverse keyword di ricerca (es. stesso testo per le pagine “web agency monza” e “web agency lecco”)
  4. Pagine ottimizzate per la stampa pdf: se il tuo sito offre questa funzionalità, è probabile che generi un URL che sarà indicizzato da Google. Con evidente dispendio di crawling budget

Come avrai capito, non devi curarti solo degli altri, ma guardare anche “in casa tua”, perchè disperdere il crawling budget su troppo URL rischia di compromettere seriamente l’indicizzazione, e quindi il posizionamento, di pagine vitali per il suo sito web.