Furto dei contenuti web
Creare un blog, sul tuo sito che pubblica articoli o gestisce un portale di notizie, puoi correre il rischio che un giorno qualcuno rubi il tuo contenuto e lo usi a tua insaputa.
Succede costantemente: I ladri copiano i contenuti per pubblicarli per come sono nel loro sito, o li riscrivono camuffandoli un po e far credere che siano scritti da pugno.
Peggio ancora, la copia può essere indicizzata dai motori di ricerca. Quindi il ladro non solo è premiato con il tuo lavoro, ma può dimezzare il tuo traffico.
Di norma questo non dovrebbe succedere, i motori di ricerca riescono ad individuare quale delle due è la copie è qual’è l’originale, . Altre volte invece, il motore di ricerca presume che la fonte originale sia il sito più autorevole tra i due, per la serie: il ricco sottomette il povero. Ebbene si.
Come proteggeti?
Beh, non puoi cambiare il funzionamento di Google, ma prevenire i suoi errori. In questo post spiego come ottenere credito per i tuoi contenuti, e come individuare il furto, bloccarlo e gestirlo. Basta seguire i passaggi che sto per elencare.
Indice di riferimento
- 1 Furto dei contenuti web
- 2 1. Ritarda l’inserimento del feed
- 3 2. Rinomina la sitemap
- 4 3. Aggiungere un collegamento alla sorgente
- 5 4. Invia la pagina al motore di ricerca
- 6 5. Crea avvisi su Google
- 7 6. Utilizzare Copyscape Premium
- 8 7. Bloccare i ladri plagiatori
- 9 8. Usa CloudFlare
- 10 9. Gestisce la situazione
1. Ritarda l’inserimento del feed
Anche se il feed RSS è uno strumento favoloso per distribuire i tuoi contenuti, ma è anche la fonte da cui gli scraper bevono. lo scaping è un software robot che estrae informazioni dal tuo feed per pubblicarlo su altri siti.
Di solito non avrai problemi se la tua pagina è indicizzata prima del truffatore. Ma se per qualche motivo la copia del truffatore è stata indicizzata prima della tua, le tue possibilità di classificazione saranno scarse perché sono contenuti duplicati .
Un modo per evitare questo è ritardare l’inserimento del feed. Ad esempio, 10 minuti di ritardo. In questo modo è possibile dare tempo al motore di ricerca di indicizzare i contenuti prima di poterli dare al feed RSS.
L’implementazione del ritardo nel feed è semplice. Se si utilizza WordPress basta inserire il codice riportato di seguito nel file functions.php . La quantità di tempo è determinata dalla variabile & wait :
/wp-content/themes/[nome del vostro Tema]/functions.php
function retrasar_feed($where) {
global $wpdb;
if ( is_feed() ) {
$now = gmdate(‘Y-m-d H:i:s’);
$wait = ’10’;
$device = ‘MINUTI’;
$where .= ” AND TIMESTAMPDIFF($device, $wpdb->posts.post_date_gmt, ‘$now’) > $wait “;
}
return $where;
}
add_filter(‘posts_where’, ‘retrasar_feed’);
Se preferisci non toccare il codice sul tuo sito, puoi utilizzare un plugin come RSS Manager .
2. Rinomina la sitemap
Un modo per estrarre contenuti dal tuo sito è quello di utilizzare la mappa del sito come punto di partenza e seguire i collegamenti. Poiché lo scopo di una Sitemap è di indicare tutte le pagine indicizzabili sul sito, è uno dei metodi più semplici per accedere al contenuto che interessa.
Fortunatamente c’è un modo per impedire a qualcuno di trovare la tua Sitemap, ed è facile, come cambiare il suo nome. così non saprà come cercarla, non è necessario che la sitemap venga chiamata sitemap, ma puoi darle il nome che desideri.
Una volta rinominata a tuo gradimento, evita di richiamarla nel file robots.txt , perchè qualcuno potrebbe vederla. Invece puoi inserire il percorso sitemap nel tool Google search console con gli Strumenti per i webmaster.
3. Aggiungere un collegamento alla sorgente
Una buona idea (oltre a una pratica SEO consigliata) è quella di inserire nei i tuoi contenuti i collegamenti interni. Quindi, anche se non impedisci di copiare i tuoi contenuti, almeno puoi ottenere (forse) un minimo di traffico per il tuo sito, ma non è detto che sia traffico pulito
Tuttavia, c’è qualcosa di più importante nel mettere i collegamenti alle pagine interne e includere un collegamento alla pagina originale. La ragione è semplice: Google considera questo segnale come un indicatore affidabile della sorgente del contenuto.
È possibile aggiungere il collegamento in due modi:
- Nel feed RSS – Poiché i truffatori spesso rubano il contenuto dal feed, puoi ottenere un credito aggiungendo un link alla fine dell’articolo nel feed. Yoast include questa funzionalità nel plugin di WordPress SEO , ma se utilizzi un altro plugin SEO, nessun problema, puoi usare il plug-in di RSS footer .
- Quando si copia e incolla – Tynt inserisce automaticamente un collegamento quando qualcuno copia e incolla il testo dal tuo sito, che può incoraggiare l’utente a citare la fonte. Inoltre, fornisce statistiche interessanti sul numero di copie fatte, sui link vinti e sul traffico generato.
Un altro vantaggio di includere un collegamento di ritorno, se il copiatore truffatore ha attivo l’avviso dei feed rss, riceverai un trackback ogni volta che il contenuto viene pubblicato. Basta avere l’abitudine di controllare i trackback che ti arrivano.
4. Invia la pagina al motore di ricerca
Se stai lanciando un sito nuovo, Google richiede molto tempo per indicizzare ogni pagina. Spiegherò un metodo per velocizzare il processo.
Basta procedere come segue:
- Vai a Google Strumenti per i Webmaster
- Vai al menu Esplora come Google
- Inserisci l’URI del post e fai clic su Invia
- Infine, inviare la pagina all’indice
Di solito richiede meno di un giorno per indicizzare il contenuto,
5. Crea avvisi su Google
Una volta che hai pubblicato il tuo articolo o pagina, puoi rilevare le copie rubate usando Google Alerts . Ogni volta che il motore di ricerca trova una copia, ti invierà un’email.
A tale scopo, configurare il servizio come segue:
- Richiesta – Inserisci il titolo del post in virgolette. Se vuoi essere più sicuro, puoi creare alcune varianti per i frammenti del post. Anche in virgolette.
- Tipo di risultato – Ti interessa coprirli tutti.
- Frequenza – quando si verifica, per poter agire al più presto possibile.
- Quantità – Tutti i risultati.
Purtroppo, il servizio di avviso di Google è limitato ai primi 20 risultati per il web e ai primi 10 per le notizie. Quindi, se il contenuto copiato non è ben posizionato, avrai anche bisogno del seguente metodo.
6. Utilizzare Copyscape Premium
Un altro modo per rilevare le copie del tuo contenuto è tramite CopyScape. La versione gratuita ti permette di inserire un URL del tuo sito per trovare duplicati in tutto il web.
Il problema è che quando si dispone di un sito con centinaia o migliaia di pagine la versione free non è efficace. La versione a pagamento è in grado di analizzare l’intero sito in un solo clic.
Tra le altre funzioni, CopyScape Premium consente:
- Controlla l’intero sito – Ricerca batch o copie fino a 10.000 pagine del tuo sito in un’unica operazione.
- Confronta il contenuto – Quando viene trovata una copia, hai la possibilità di vedere le parole di confronto, evidenziando le parti uguali di testo.
- Gestisci casi di plagiarism – Puoi anche tenere traccia dei casi di plagio.
- Escludere alcune pagine – Se pubblici lo stesso contenuto in più pagine nel tuo sito o se hai il permesso di riutilizzare il contenuto, puoi filtrare i risultati in modo che non venga preso in considerazione.
Quando hai un elenco di siti che copiano i tuoi contenuti, è meglio agire.
7. Bloccare i ladri plagiatori
Se i ladri utilizzano il tuo feed RSS per copiare i tuoi contenuti. potrai scoprire il loro indirizzo IP , puoi impedire l’accesso al tuo server.
A tale scopo, inserire il codice riportato in seguito nel file .htaccess:
Esempio, ogni volta che un visitatore cerca di accedere al server da IP 192.0.2.1/44, sarà bloccato.
Ora, ci sono un paio di situazioni in cui questo metodo non funziona. Il primo è quando si utilizza un servizio come Feedburner , in quanto gli scrapers accedono ad un altro server. Il secondo è quando i plagiatori operano da un IP diverso al dominio in cui pubblicano il contenuto. Quindi non è infallibile.
8. Usa CloudFlare
La tecnologia CloudFlare serve non solo per accelerare i tempi di caricamento del tuo sito, ma anche per proteggerlo. Funziona come proxy inverso , ponendosi nel mezzo tra i visitatori e il tuo hosting, come un intermediario e garantisce un ulteriore livello di sicurezza.
Ogni volta che qualcuno accede ad una pagina dal tuo sito, CloudFlare esegue un’analisi basata su più caratteristiche, come l’indirizzo IP del visitatore, le risorse richieste, il carico del server, la frequenza delle richieste, ecc. Se il visitatore risulta “losco” (ad esempio un hacker o uno spammer), lo blocca prima che possa accedere al server.
Per utilizzare CloudFlare non è necessario apportare modifiche sul sito. Infatti, è possibile mantenere lo stesso provider di hosting. Tutto quello che devi fare è configurare il DNS del tuo dominio per puntare ai tuoi server.
9. Gestisce la situazione
Se hai seguito i consigli che ti ho dato finora, i tuoi contenuti saranno molto più sicuri di prima. Tuttavia, c’è una domanda in sospeso: cosa fai con il contenuto già rubato?
Beh, puoi fare un paio di cose:
- Contattalo – Questo dovrebbe essere sempre il primo passo . Se non vuole eliminare il contenuto, provate ad ottenere almeno un collegamento all’articolo originale. Ciò faciliterà sia Google che gli utenti di identificare l’autore effettivo del contenuto.
- Richiesta di rimozione del risultato – Quando la comunicazione non funziona, un’altra opzione è chiedere a Google di eliminare il contenuto dai risultati . Se scoprirai che il contenuto copiato ti sorpassa in serp, puoi inviare un report di contenuti copiati . Quest’ultima non eliminerà il risultato, ma aiuterà il motore di ricerca a migliorare l’individuazione delle copie.
C’è una terza opzione, non fare niente. Se le pagine con contenuto copiato non superano il tuo nel motore di ricerca, forse non si desidera intraprendere alcuna azione. Tutto dipende dal fatto che accetti l’utilizzo dei tuoi contenuti.
D’altra parte, è bene pensare che se qualcuno ruba i tuoi contenuti è perché sono apprezzati. Ovviamente non è il modo migliore per ricevere un compiacimento, ma almeno è un segno che stai lavorando bene, non pensi? o forse no?
Quali altri metodi usate per combattere il plagio o il furto di contenuti?
Preferite tacere o vi diverte vestire i panni del detective?