La stragrande maggioranza dei siti che analizzo soffre del problema dei contenuti duplicati. Al di là degli aspetti morali e legali, importantissimi ma che richiedono una trattazione separata, in questo articolo voglio parlarti solo degli aspetti legati al motore di ricerca e a quelli di marketing connessi alla percezione del pubblico.
Google, alcuni anni fa, ha iniziato una dura lotta contro i contenuti duplicati. Con “contenuto duplicato” s’intende un testo intero, o una porzione di esso, che si può leggere su più pagine o più siti. Di recente si è iniziato a parlare anche di contenuti di pessima qualità, definizione molto ampia che le fonti ufficiali non hanno mai identificato in maniera netta, se non in alcune risposte rilasciate in alcune interviste.
Oggi vedremo proprio alcune di queste risposte, per evitare l’ira funesta di Google.
Contenuti duplicati
Distinguiamo innanzitutto due categorie di contenuti duplicati:
- Contenuti duplicati interni.
- Contenuti duplicati esterni.
Contenuti duplicati interni
Una prima categoria di contenuti duplicati interni riguarda i testi disponibili da più URL, generati da un “problema tecnico” legato ai CMS. Si tratta di testi che, all’interno dello stesso sito, sono raggiungibili digitando nella barra dell’indirizzo del browser percorsi diversi. Per esempio, un testo potrebbe essere disponibile agli indirizzi miosito.it/pagina1 ma anche all’indirizzo miosito.it/categoriax/pagina1 miosito.it/index.php?id=2342
Sono casi davvero molto frequenti, soprattutto quando si usano dei CMS (WordPress, Joomla, Drupal, ecc. ecc). La corretta gestione di questa forma di contenuti duplicati deve essere curata dal sistemista solo su indicazioni del SEO. Esistono, infatti, diverse modalità specifiche per diverse tipologie di casi.
Un’altra categoria di contenuti duplicati interni non riguarda una problematica tecnica, quanto piuttosto una scelta consapevole. Questa scelta, di solito, la prende chi ignora le informazioni sul funzionamento dei motori di ricerca e sugli aspetti SEO, in particolar modo sulle penalizzazioni di Google e sull’ottimizzazione per i motori di ricerca.
Approfondiremo tra poco questo aspetto SEO.
Contenuti duplicati esterni
Sono gli stessi contenuti presenti sul proprio sito disponibili però anche su altri.
Questo può avvenire sia perché i propri testi vengono copiati da altri senza autorizzazione, sia per scelte o accordi errati fatti in modo inconsapevole, come ad esempio l’iscrizione ad alcune categorie di aggregatori o l’invio dello stesso testo a più siti.
Google e il riconoscimento della paternità
Google non è in grado di attribuire la corretta paternità di un testo al suo autore originario. Come anticipato sopra, la presenza di un link al sito “madre”, non serve a far capire al motore di ricerca chi sia stato il primo sito a pubblicare un testo. C’è da aggiungere un’altra cosuccia: a oggi, nemmeno il rel=”author” viene associato da Google all’autore che per primo ha scritto testo.
Qual è la conseguenza (assurda) di ciò? Semplice: Google potrebbe decidere di mostrare nei risultati il testo pubblicato su un sito che ha copiato e non su quello che, effettivamente, ne è l’autore.
Questa scelta di Google, ovvero quale sito mostrare nei risultati, è valutata più che altro in base al valore che il motore di ricerca attribuisce al sito (trust del sito), un valore che è una combinazione di anzianità del sito, backlinks, citazioni, traffico.
Da questo nasce il problema che siti molto piccoli, o giovani, possono essere penalizzati se i loro testi vengono copiati da grossi portali o aggregatori. Triste, ma vero.
Come trovare contenuti duplicati
Il primo modo per trovare contenuti duplicati è semplice: usare Google. Copia una porzione di testo di un tuo articolo, possibilmente al fondo della pagina, e incollalo nella casella di ricerca di Google tra doppie virgolette. Per una ricerca più approfondita, puoi usare alcuni tools disponibili online come Copyscape, Plagium, Turnitin o PlagScan.
Oltre i contenuti copiati: copywriter, non copiare e non rimaneggiare i testi
Se una penalizzazione per contenuti duplicati è abbastanza facile da individuare (esclusione delle proprie pagine dalle SERP, posizionamento arretrato rispetto ad altri siti che ci hanno copiato), molto meno facile è individuare un problema di ranking di un sito legato a contenuti rimaneggiati, ovvero una categoria di contenuti che Google considera di pessima qualità.
Contenuti rimaneggiati per il pubblico
Quando si parla di SEO partiamo sempre dal pubblico.
Immagina di leggere una notizia che riguarda una tua passione, un tuo hobby o il tuo lavoro. Può essere una notizia sul nuovo smartphone Sony Xperia Z, sulla presentazione del nuovo Office 2013, oppure sugli ultimi test dell’Alfa Romeo 4C. Sei avido di informazioni perché l’argomento ti interessa molto. Leggi il primo articolo, poi il secondo, il terzo e poi ti accorgi che tutti gli altri alla fine dicono le stesse cose, rimaneggiando la medesima notizia.
Cosa fai, continui a leggere articoli simili che non ti danno ulteriori informazioni oppure smetti di aprire siti?
Ovviamente il tuo tempo è limitato, quindi non andrai a leggere gli altri siti che ti propongono la stessa notizia a meno che non lo facciano in un modo o in una forma diversa o aggiungendo dettagli inediti.
Sembra una banalità, ma molti progetti editoriali, anche sostenuti da grossi gruppi, nascono con questo errore di fondo. Il pubblico vuole informazioni originali ed esclusive, altrimenti non ti segue.
Contenuti rimaneggiati per Google
Per quanto strano possa essere, nella comunità SEO non si parla del problema dei contenuti rimaneggiati. Anzi, tantissimi SEO ne ignorano l’esistenza, pensando che sia il classico “pippone mentale” di quei professionisti che si vogliono complicare la vita.
Quindi, per confermare quanto ho scritto finora (e per dimostrare che non mi piace complicarmi la vita), voglio mostrarti le dichiarazioni di alcuni personaggi di primo piano in Google.
Matt Cutts
Non si può non iniziare da lui, il primo vescovo di Google, Matt Cutts, capo del team antispam di Mountain View.
Ecco cosa risponde in un’intervista rilasciata il 7 giugno 2011 al SMX Advanced.
John Mueller
John Mueller è un ingegnere di spicco in Google, molto attivo nei forum di supporto e su Google Plus. Ecco la sua risposta, del 26 novembre 2012, alla domanda di un utente circa la qualità dei contenuti.
Andre Weyher
Andre Weyher è un ex dipendente di Google che ha lavorato nel Search Quality Team di Google. Anche lui, in un’intervista del 16 ottobre 2012, parla della qualità dei contenuti per Google.
I contenuti duplicati: una scelta editoriale
I contenuti duplicati e quelli rimaneggiati sono un serio problema, prima di tutto dal punto di vista del modo con cui ci si rapporta al pubblico: vogliamo dare ai nostri lettori contenuti originali o una minestra riscaldata? Sono ancora in molti, purtroppo, a credere nel vecchio sistema editoriale dove bastava prendere una notizia alle 5 del mattino, rimaneggiarla un po’ e pubblicarla con la speranza poi che i lettori cliccassero sui banner pubblicitari o sugli Ads.
Ma non è tutto: i contenuti duplicati sono anche un problema SEO da non sottovalutare, sia dal punto di vista tecnico della struttura del sito, sia dal punto di vista della qualità dei testi. Ancora una volta, non siamo noi a decidere se un contenuto è di qualità o no, ma l’ecosistema formato dal nostro pubblico e dal suo atteggiamento, dal motore di ricerca e dai nostri concorrenti.
Certo, adesso non possiamo più ignorare il fatto che per Google anche i contenuti rimaneggiati possono portare a una diminuzione del ranking di un sito o, nel peggiore dei casi, farlo considerare di pessima qualità. Tuttavia, esistono tanti casi dove le informazioni o le notizie sono per forza di cose sempre le stesse.
Un assaggio di esercitazione pre-Yummy Writing
Lasciami chiudere con uno degli esercizi che faremo insieme in aula a Yummy Writing, il nostro corso per copywriter: cosa faresti per rendere una notizia iper inflazionata, originale e appetibile per l’esigente palato di lettori e Google?