Come gestire i contenuti copiati e duplicati del tuo sito

Innanzitutto occorre distinguere i due tipi di problemi: copiati e duplicati:

  1. i contenuti copiati vengono eseguiti da un sito esterno che, arrivando sul tuo sito, copia l’intera o una buona parta del testo di una pagina e lo incolla su quella del suo sito.
  2. i duplicati sono i testi che sono presenti sul tuo sito su due o più pagine completamente identiche.

Perché sono considerati errori dai motori di ricerca?

Perché possono creare confusione negli algoritmi e nelle loro intelligenze artificiali i quali preferiscono trovare all’interno dei siti, contenuti univoci e originali. Addirittura vanno un po’ in confusione quando ci sono due articoli simili che concorrono per la prima posizione in prima pagina nello stesso sito. Questo problema, invece, si chiama “cannibalizzazione”. Non viene considerato un errore grave come possono essere, invece, i contenuti duplicati o copiati, ma anche lì bisognerebbe fare un po’ di pulizia di testi.

In sostanza, più contenuti originali e unici per argomento si hanno, meglio è. Ovviamente, non farti prendere dal panico se stai riportando un articolo della Costituzione o un passo della Bibbia citandolo chiaramente. Il motore di ricerca sa benissimo che sono contenuti con un testo“non modificabile” i quali non possono subire variazioni. Quello che importa è il contesto in cui vengono inseriti. Deve essere unico e originale.

Se si apportano piccole modifiche al testi, riesco ad aggirare i motori di ricerca?

Fino a qualche tempo fa, sì. Era possibile che gli algoritmi avessero difficoltà nel riconoscere un testo, sostanzialmente copiato, ma modificato. Ora, con i vari aggiornamenti dell’algoritmo che si sono succeduti negli anni, e, soprattutto, grazie alla presenza dal 2019 dell’intelligenza artificiale che ha portato alla rivoluzione di BERT e MUM (i due aggiornamenti dell’algoritmo che si basano sul linguaggio naturale), i contenuti copiati ma modificati non hanno vita facile. Se prima era per alcuni una prassi consolidata che portava, in alcuni casi, qualche tipo di vantaggio, ora non più.

I contenuti copiati, si possono posizionare meglio dell’originale nei risultati di ricerca?

Sì, in alcuni casi si è addirittura assistito ad un superamento di posizioni rispetto all’originale. Può avvenire se, però, questo sito ha, in generale, delle informazioni aggiuntive ed è ritenuto da Google, comunque, un buon sito. Se, invece, è un sito spam che non fa altro che pubblicare articoli copiati e non ha un contenuto originale suo, dubito fortemente che possa accadere la situazione di superamento dell’originale. Potrebbe succedere in 2 situazioni, a mio parere:

  1. Tutti e due i siti, sono siti più volte penalizzati da Google per vari motivi e non offrono un’esperienza utente adeguata e danno scarse o inadeguate risposte alle intenzioni di ricerca degli utenti
  2. Le parole chiavi e gli argomenti ricercati dagli utenti rientrano in SERP e settori per niente competitivi. Quindi, parlo di volumi di ricerca che si avvicinano allo 0.

Hai bisogno di una consulenza SEO urgente?



    I siti che copiano vengono puniti dai motori di ricerca?

    Tendenzialmente se un sito ha ottimi contenuti, nuovi, aggiornati, autorevoli, di qualità, esaustivi e all’improvviso comincia a pubblicare articoli palesemente presi da altri siti, è molto probabile che Google cominci a scaraventare le parole chiavi per cui è posizionato, nelle altre pagine di ricerca (dalla seconda in poi). Altro conto è, magari, se si copia un solo articolo. Lì si incorre in una penalizzazione che riguarda, appunto, quella singola pagina, che, probabilmente non vedrà mai la luce in cima alla SERP di Google. Ma se un sito nasce solo per riportare i testi di altri siti sul proprio, direi “Ma dove vuoi che vada?!”.

    Perché gli altri copiano i miei contenuti?

    Beh probabilmente perché hai scritto un ottimi articolo e sei ben posizionato per qualche parola chiave ottima. Qualcuno che non conosce il funzionamento dei motori di ricerca, potrebbe capitare sul tuo sito e cliccare su “Seleziona tutto” e poi “Copia e incolla”. Oppure c’è uno scraper, ovvero una software progettato ad arte per estrapolare i testi di altri siti e inserirli nel proprio. Per tentare di evitarlo, è buona norma, ad esempio, sul sito:

    • fare uso di captcha,
    • bloccare di IP sospetti,
    • utilizzare sempre il protocollo HTTPS,
    • avere un buon plugin anti-spam (ad esempio su WordPress il plugin Akismet può rivelarsi talvolta insufficiente),
    • avere un’area riservata per contenuti “premium” da accesso con password.

    Come risolvere il problema di contenuti copiati?

    Ovviamente, la cosa migliore e più immediata, è quella di contattare l’admin del sito in questione chiedendo di rimuovere le pagine copiate entro tot giorni, intimando, altrimenti, di intervenire, successivamente, per vie legali. Se l’admin non risponde o non intende rimuoverli, puoi utilizzare uno strumento di Google per la loro rimozione oppure utilizzare un altro strumento, sempre di Google, se qualcuno ha violato un tuo copyright.

    Stai tranquillo, perché anche se dovesse arrivare a te una denuncia o segnalazione di Google, ma tu sei sicuro che la tua pagina è l’originale e non la copia, allora lo è anche Google, perché vede benissimo la data in cui sono state indicizzate le pagina. Da lì non si scappa. Non possono fregarti. È uno dei tanto vantaggi del digitale.

    Invece, a cosa è dovuto l’errore dei contenuti duplicati interni?

    Dipende da alcuni fattori, molte volte interni al sito. Se si tratta di WordPress o altri CMS si dovrebbe indagare su quali errori può portare il codice del tema oppure scovare il plugin che genera questo errore. Alcuni di essi, se mal configurati, possono creare delle URL con vari parametri (quindi con simboli strani come %&) che duplicano la pagina originale.

    È opportuno scegliere sempre dei temi e plugin di qualità e controllare sia gli aggiornamenti che le recensioni degli utenti, che siano sotto forma di voto (stellette) o con commenti testuali. Se, invece, siamo in presenza di un sito sviluppato in qualche linguaggio particolare, anche lì c’è da indagare se, in un framework specifico, ci sia qualche errore javascript che, autonomamente, crea dei contenuti doppiati sul sito. Importantissimo, inoltre, controllare se esistano “copie” dello stesso sito.

    Per esempio può accadere che un sito abbia due versioni: una http e un’altra https. Così come può avere sia il www che il non-www. In questo caso sarebbe opportuno fare un redirect di massa tramite l’htaccess, se si utilizza il web server Apache o il file di configurazione se siamo in Nginx.

    Contenuti duplicati negli e-commerce

    È molto frequente trovare nei siti e-commerce pagine duplicate che non fanno capire bene ai motori di ricerca quale sia la pagina più importante rispetto alle duplicate. Ad esempio, nelle pagine dei prodotti, se cambia l’URL quando un utente attiva i filtri (cambiando il brand, il colore, le dimensioni o le altre features di quel prodotto) bisognerebbe comunicare a Google la pagina del prodotto “senza filtri” con il tag=canonical, comunicandogli che quella è la pagina madre e le altre sono le “figlie”.

    Consiglio spassionato: mi è capitato di vedere più di una volta grossi e-commerce dove in pagine diverse c’era lo stesso prodotto, ma cambiava solo il colore o la dimensione o la marca. Se il prodotto è lo stesso, tieni tutto su una stessa pagina e dai la possibilità agli utenti di spuntare le caselle dei vari filtri colore, dimensioni, brand ecc…

    Come scovare i contenuti duplicati o copiati?

    Esistono vari tool online, come Siteliner o Copyscape che inserendo il link del tuo sito, ti restituiscono sia se hai contenuti duplicati all’interno di esso, sia se sono stati plagiati e messi su altri siti. Oppure basta selezionare una porzione di testo su cui hai dei dubbi che possa essere stato sbattuto su siti terzi, copiarla e incollarla nella barra di ricerca del motore di ricerca con le virgolette.

    Hai avuto o hai problemi con i contenuti duplicati o copiati? Scrivimelo in un commento ⤵️

    Lascia un commento