Guida completa dei Contenuti duplicati di un sito web

Contenuti duplicati

Il contenuto duplicato è uno dei problemi più diffusi nel SEO e, stranamente, uno dei meno presenti.

Spesso parliamo di come ottimizzare una pagina per i motori di ricerca, come ottenere collegamenti, ma difficilmente menzioniamo i fastidiosi contenuti duplicati.

Il punto è che, se il tuo sito è inondato di pagine ripetute, è difficile per i motori di ricerca darle il valore che merita. Quindi è fondamentale minimizzare il problema.

In questo post spiego tutto quello che devi sapere su i contenuti duplicati:

Che cosa è, dove trovarlo e come sbarazzarsi di loro.

Qual è il contenuto duplicato

Il contenuto duplicato è qualsiasi testo ripetuto in più di un URL, interno o esterno. Questo è ciò che accade quando il tuo sito genera più copie della stessa pagina o quando uno spammer copia uno dei tuoi articoli.

Può sembrare che il contenuto duplicato non sia un fattore importante, ma la verità è che rappresentano un problema serio. Qualsiasi utente di Google spera di trovare risultati diversi, non lo stesso contenuto più e più volte. Per questo motivo filtra le copie di uno contenuto in modo che sia univoco, è quando non lo è lo penalizza.

Naturalmente, il processo di filtraggio che il motore di ricerca fa non è trasparente. Non dovete sapere che le tue pagine sono state contrassegnate come duplicati , e puoi anche pensare che tutte le tue pagine siano uniche e attirino visitatori quando la realtà è molto diversa. Ma se il tuo sito genera contenuti duplicati, stai perdendo la possibilità di comparire nei risultati di ricerca.

Conseguenze del contenuto duplicato

Ora che sai perché è così importante evitare la duplicazione dei contenuti, dovresti conoscere i problemi che possono causare nel tuo sito. Alcuni dei più importanti sono:

Pagine non corretta – Avere diverse pagine per lo stesso contenuto significa lasciare al motore di ricerca la scelta della pagina corretta. Questa non è una buona idea in quanto è possibile scegliere una versione diversa da quella che si desidera.
Peggiore visibilità – In conseguenza di quanto citato sopra, il motore di ricerca potrebbe finire per mostrare una copia sbagliata della pagina, e quindi posizionarla in malo modo rispetto alla versione di pagina corretta.
Indice meno corretto – L’ indicizzazione delle tue pagine può essere influenzata perché lo spider trascorre il suo tempo a monitorare le pagine duplicate. Se il contenuto duplicato è una parte significativa del sito, il motore di ricerca visiterà le pagine importanti meno frequentemente.
link Wasted – Pagine duplicati possono ricevere link e diluire la forza dei tuoi contenuti, perché tutti quei link potrebbero (e dovrebbero) unire le forze in una singola pagina.
Collasso della visibilità – il motore di ricerca può decidere che il tuo contenuto proviene da un altro dominio e esclude le tue pagine dai risultati, fidati succede.

Google penalizza i contenuti duplicati?

Google rifiuta i contenuti duplicati, ma non penalizza. Quello che fa è filtrarlo in modo che non appaia nei suoi risultati, che è abbastanza pesante come punizione.

Tuttavia, i siti che copiano e / o riscrivono il contenuto degli altri in modo sistematico vengono penalizzati . Il famoso algoritmo Panda è stato progettato per quella missione .

Cause di contenuti duplicati

Quando la gente pensa ai contenuti duplicati, la prima cosa che viene in mente è l’immagine di uno spammatore che atterra sul tuo sito, copiando alcuni articoli e incollandoli in un altro dominio. Succede raramente questo. La più grande fonte di contenuti duplicati è di solito il web stesso, non importa quanto sia ottimizzato.

Come vedrai ora, ci sono molti motivi per cui potresti essere inondato di contenuti duplicati senza percepirlo:

Dominio non canonico – Il tuo sito può operare con il dominio (sub) che inizia con “www”. E con il dominio che non reca questo prefisso. La buona versione è canonica e non impostandola correttamente rende il tuo sito ripetuto in entrambe le varianti.
Pagine sicure – Simile al dominio canonico, se il tuo sito utilizza la crittografia SSL, (quella che inizia con HTTPS ).
ID sessione – Molti siti gestiscono le sessioni utente inserendo un codice alla fine dell’URL di ciascuna pagina. Questi parametri, diversi per ogni sessione utente, possono far credere al motore di ricerca di essere pagine separate, anche se in realtà sono le stesse.
Contenuti dinamici – Siti che assegnano parametri agli URL per controllare il contenuto visualizzato all’utente. Come con gli ID di sessione , i motori di ricerca possono interpretare queste pagine come copie.
File – Un problema tipico per i blog è che lo stesso contenuto viene visualizzato in diverse pagine, ad esempio in categorie e file di tag.
Pagina – Ogni pagina Web che utilizza può avere questo problema, soprattutto se le pagine condividono lo stesso titolo e la descrizione.
Versione mobile – la versione per smartphone se viene generata su un URL separata (ad esempio, un sottodominio o sottodirectory) e non configurato correttamente, il browser potrebbe avere difficoltà a sapere che si tratta di una versione parallela.

Quando il duplicato proviene dall’esterno

In questo caso, i motivi più comuni sono:

Syndication – Consiste nell’invio dei tuoi contenuti ad altri siti per attirare traffico, come ad esempio RSS. Il problema può verificarsi quando pubblicano una copia completa del tuo contenuto anziché uno snippet.
Posizione – per indicare diversi paesi, è possibile che lo stesso contenuto (o quasi) sia utilizzato in più domini contemporaneamente, ad esempio .org e .com .
CDN – L’utilizzo di una rete di distribuzione dei contenuti di un CDN comporta la replica di parte del contenuto web (principalmente file statici) ai server della rete. Questo può essere un problema se non vengono adottate azioni appropriate.
Scraping – Scapers utilizza il software robot per copiare le pagine e pubblicarle in un altro dominio.
Plagio – In modo puntuale, qualcuno può copiare un testo dal tuo sito e pubblicarlo nel suo. A volte avviene intenzionalmente, a volte no, di solito chi copia un’intero contenuto da un altro sito non conosce le regole dei motori di ricerca.

Come rilevare un contenuto duplicato

Google identifica i contenuti duplicati quando incontra titoli , descrizioni , intestazioni e sezioni identiche o molto simili. Quindi per controllare il contenuto duplicato è necessario iniziare da qui:

Ecco i metodi più efficaci:

Strumenti per i webmaster di Google – Se sei registrato per gli strumenti webmaster di Google Search Console, questo è sicuramente il miglior punto di partenza. Vai all’applicazione di ricerca > Miglioramenti HTML e prestate attenzione a duplicare i titoli di titolo e i metadati. La relazione indica il numero di repliche esistenti e le pagine che sono state trovate in modo da poterli correggere.
Comando del sito – È un metodo molto efficace ma richiede un sacco di lavoro. Consiste nella ricerca all’interno del tuo sito per certe parole o frasi chiave, ad esempio i prodotti nel caso di un negozio online ( sito: example.com “questo è un prodotto del negozio” ). Nel risultato è possibile vederlo se sono presenti pagine con titoli e descrizioni duplicate. Questo metodo consente inoltre di sapere se alcune pagine sono state spostate nell’indice secondario quando visualizzi un messaggio nell’ultima pagina dei risultati (“ripeti la ricerca e includi i risultati che sono stati omessi”). Questo è un sintomo di contenuti duplicati.
Screaming Frog – Questo potente strumento ti permette di tracciare, tra l’altro, il tuo sito per contenuti duplicati. Le schede che ti interessano sono URI , Titoli di pagina , Meta Description e H1 , utilizzando il filtro Duplicato .
Google Analytics – È inoltre possibile trovare pagine duplicate in Google Analytics utilizzando il rapporto Comportamento> Contenuti sito> Pagine di destinazione . La chiave è cercare URL sospette e pagine che ricevono traffico meno organico di quanto non dovrebbero.
strumenti di analisi web – Ci sono strumenti che possono identificare contenuti duplicati, ed anche collegamenti interrotti, pagine non indicizzate e altri problemi difficili da rilevare ad occhio nudo, come ad esempio Siteliner , SEMRush

Rilevare contenuto duplicato da altri siti

Se le copie sono al di fuori del tuo sito web, puoi controllare il contenuto duplicato utilizzando i seguenti strumenti:

CopyScape , sia nella versione gratuita che in quella premium
Duplichecker
Plagiarisma
Plagium

Come sbarazzarsi dei contenuti duplicati

È chiaro che i motori di ricerca non amano i contenuti duplicati perché portano ad una scarsa esperienza utente. Quindi, se hai duplicato contenuto nel tuo sito, dovresti fare tutto il possibile per eliminarlo.

Ecco le opzioni principali per affrontare il problema:

Usa Rel Canonical – L’etichetta “rel = canonical” è stata concepita proprio per affrontare questo inconveniente, quindi è la soluzione migliore. Consiste in una riga di codice all’interno della sezione <head> della pagina che indica al motore di ricerca quale versione è quella buona (canonica). Può anche essere incluso nell’intestazione HTTP della pagina.
Crea reindirizzamenti 301 – Consigliati quando non è possibile utilizzare il tag canonico quando si sposta un contenuto da una pagina all’altra o quando si imposta il dominio canonico. I reindirizzamenti 301 sono comandi inclusi nel file .htaccess in Apache.
Impedire l’accesso ai robot – Per impedire ai motori di ricerca di trovare pagine duplicate, è possibile utilizzare il tag meta robots o il file robots.txt .
Gestire parametri URL – Nel caso in cui il contenuto duplicato è causata da parametri, si può dire che cosa Google ignorare utilizzando lo strumento di monitoraggio> parametri URL in Strumenti per i Webmaster .
Utilizza Schema.org – Il motore di ricerca può utilizzare i dati strutturati per risolvere la confusione tra le pagine duplicate.
Unire pagine o riscrivere il contenuto – L’uno e l’altro sono soluzioni sensibili quando diverse pagine del tuo sito mostrano contenuti molto simili o uguali.

Plagio Spudorato

Se il tuo contenuto è stato copiato da una terza persona , hai le seguenti opzioni:

Chiedi di cancellarlo – Invia un messaggio via e-mail o modulo di contatto per richiedere gentilmente la cancellazione. Se non c’è modo di comunicare, utilizzare l’email WHOIS , che può essere ottenuta tramite lo strumento Whois.net . Inoltre chiedete loro, se non sono disposti a sbarazzarsi del contenuto, almeno metteranno un collegamento alla pagina che li hanno copiati. Questo aiuterà il motore di ricerca a identificare l’originale.
Richiesta di rimozione a Google – Se la comunicazione non funziona, puoi chiedere al motore di ricerca di cancellare la pagina dai risultati. A tal fine, essa invia una richiesta basata sul DMCA (Digital Copyright Act ).

Suggerimenti generali per la prevenzione del contenuto duplicato

Non utilizzare mai lo stesso titolo / descrizione in più di una pagina
Il testo di ogni pagina deve essere univoco per tutto il sito e per l’intero web
Includere solo la versione canonica della pagina nelle tue Sitemap
Quando si copia un appunto da un altro sito, includere sempre un collegamento all’originale
Quando si copia una intera pagina, chiedere prima l’autorizzazione; include un collegamento all’originale, e negare l’accesso del motore di ricerca alla pagina utilizzando i robot (puoi anche utilizzare il relay canonico tra i domini)

Consiglio una buona guida per la SEO :The Art of SEO: Mastering Search Engine Optimization

Avete trovato contenuto duplicato del vostro sito ?

SEO MAGAZINE

Post suggeriti