La penalizzazione per contenuti duplicati è un mito (lo dice Google)
Non esiste un interruttore segreto di Google che ti banna per aver pubblicato lo stesso articolo in due posti. Il rischio reale è più silenzioso, ed è la ragione per cui questo tema conta.
Se gestisci un piccolo sito di notizie, un blog di nicchia o una redazione di una sola persona, hai quasi certamente sentito l'avvertimento: ripubblica lo stesso articolo su un altro sito e Google ti colpirà con una penalizzazione per contenuti duplicati. È uno dei miti più resistenti del SEO, e tiene i piccoli editori lontani da una tattica di crescita legittima e vecchia di decenni per pura paura. Risolviamola dunque con le parole di Google stesso. Nella sua SEO Starter Guide ufficiale, Google affronta direttamente la presunta penalizzazione: se lo stesso contenuto è accessibile sotto più URL, "va bene, non preoccuparti. È inefficiente, ma non è qualcosa che causerà un'azione manuale".[1] Copiare i contenuti altrui per ingannare è un'altra storia, ma la sindacazione normale, in cui accetti che un partner ripubblichi il tuo lavoro, è esplicitamente non malevola.
La voce di Wikipedia sui contenuti duplicati mette la sindacazione nello stesso gruppo, definendola "una forma popolare di contenuto duplicato" ed elencandola tra i casi non malevoli contro cui Google non agisce.[11] Quindi, se non c'è penalizzazione, perché esiste questo articolo? Perché il rischio reale è più sottile e molto più frequente di un ban. Quando la stessa storia vive su più siti, Google non punisce nessuno. Sceglie semplicemente una versione da mostrare nella ricerca e filtra il resto in silenzio. Il pericolo per un piccolo editore non è una penalizzazione. È che il sito partner, più grande e più autorevole, venga scelto come la versione che si posiziona, così che tu fai il lavoro e loro raccolgono il traffico della tua stessa storia.
La frase che riformula l'intero tema
Quella distinzione cambia tutto nel modo in cui affronti un accordo di sindacazione. Invece di chiederti "verrò penalizzato?", che ha una risposta rassicurante e netta di no, dovresti chiederti "Google mostrerà ancora la mia versione quando qualcuno cerca questa storia?". È una domanda su cui puoi davvero influire, e il resto di questa guida riguarda le mosse concrete, perlopiù non tecniche, che inclinano la risposta a tuo favore.
Cos'è davvero la sindacazione, e perché i piccoli editori la usano
Una strategia di portata legittima, non una scorciatoia. Ed è più comune di quanto la maggior parte creda.
La sindacazione di contenuti è ripubblicare lo stesso pezzo, un articolo, un video, un'infografica, su uno o più siti di terzi oltre al tuo o al suo posto. L'obiettivo è la portata: mettere la tua storia davanti al pubblico più ampio di un partner. La sindacazione di notizie è la stessa idea applicata al giornalismo, in cui una redazione concede in licenza o condivide i suoi articoli perché testate partner, un'agenzia di stampa, una grande testata nazionale o un aggregatore come un grande portale, li ripubblichino, spesso parola per parola. È così che un piccolo scoop locale può finire su un sito nazionale, e un'analisi di nicchia può raggiungere lettori che non avrebbero mai trovato il tuo dominio da soli.
Vale la pena tracciare una linea chiara fin dall'inizio. La sindacazione la accetti tu. Controlli i termini, i tempi e l'attribuzione. Lo scraping è furto. Qualcuno copia il tuo contenuto senza permesso, e anche se non sempre puoi fermarlo, Google di solito è bravo a identificare l'originale autentico. Questo articolo riguarda interamente il primo tipo, quello deliberato e contrattuale, perché è lì che poche decisioni intelligenti proteggono il tuo posizionamento e poche disattente lo cedono in silenzio.
Se la sindacazione ti sembra una tattica marginale, i dati dicono il contrario. È un canale comune, soprattutto nel marketing tra aziende. Secondo cifre raccolte da Madison Logic, il 65 per cento dei marketer B2B usa la sindacazione di contenuti come tattica centrale di lead generation, e una larga maggioranza si appoggia ad almeno un fornitore di sindacazione.[12] Anche gli acquirenti vi fanno affidamento: una quota considerevole degli acquirenti B2B usa whitepaper e contenuti sindacati per orientare le decisioni. La conclusione per un piccolo editore è rassicurante. Non stai aggirando le regole sindacando. Stai usando un canale che il resto del mercato tratta già come prassi standard.
La sindacazione è comune, non una tattica marginale
Le cifre di adozione e di fiducia dell'acquirente mostrano che la domanda è come sindacare, non se farlo[12]
Fonti: sondaggio SalesBox via Madison Logic (ott 2024) per la cifra del 65 per cento come tattica centrale; sondaggi di fornitori e di comportamento degli acquirenti per le restanti barre. Lo schema è coerente tra gli studi: la sindacazione è un canale di distribuzione normale e molto usato, non una scorciatoia da zona grigia.
Cosa succede davvero: canonicalizzazione, non punizione
Quando lo stesso articolo esiste in più posti, Google deduplica. Capire quel processo è la chiave per controllare il risultato.
Ecco cosa fa davvero Google quando trova il tuo articolo su tre siti diversi. Non ricorre a una penalizzazione. Esegue un processo chiamato canonicalizzazione, che è solo deduplicazione con un nome più elegante. Google scansiona tutte le versioni, ne sceglie una come canonical (la versione che considera definitiva e mostra nella ricerca), consolida verso di essa i segnali di posizionamento come i link, e filtra le altre copie dai risultati.[2] Dal punto di vista di Google questo è ordinato ed efficiente. Non vuole mostrare all'utente cinque pagine identiche, quindi mostra quella che giudica migliore e nasconde il resto.
Il problema, ed è la frase più importante di tutto questo articolo, è sepolto nella documentazione di Google stesso: Google può scegliere una pagina canonical diversa dalla tua. Come dicono i documenti, indicare una preferenza di canonical "è un suggerimento, non una regola".[2] Traduzione per un piccolo editore: se sindachi a un partner molto più grande e autorevole, Google può decidere che la sua copia è la migliore da mostrare, e il tuo originale finisce sepolto sotto. Non è una penalizzazione. È la deduplicazione che funziona esattamente come progettata, solo non a tuo favore.
I problemi reali che i duplicati causano
- Si posiziona la versione sbagliata. Il partner supera l'originatore sulla storia dell'originatore stesso.
- I segnali si dividono. Link e autorità possono disperdersi tra le versioni invece di consolidarsi sulla tua.
- L'indicizzazione si confonde. Google può indicizzare la copia e saltare del tutto l'originale, soprattutto se ha trovato la copia per prima.
È qui che lo svantaggio del piccolo editore diventa concreto. L'autorità conta nella canonicalizzazione, e per definizione il tuo partner di sindacazione di solito ne ha più di te, che è proprio il motivo per cui hai voluto sindacare con lui. Non gestito, quello stesso divario di autorità è esattamente ciò che fa vincere alla sua copia il sorteggio della canonical. La buona notizia è che qui non sei alla mercé del giudizio di Google. Ci sono segnali espliciti che puoi inviare, e un ordine di operazioni chiaro, che rendono la tua versione l'originale ovvio. Quello è il manuale di sindacazione sicura.
Il manuale di sindacazione sicura con noindex prima
Cinque mosse, in ordine, che tengono Google ad accreditarti come la fonte. La maggior parte sono accordi, non codice.
Proteggere il tuo posizionamento durante la sindacazione ha meno a che fare con la magia tecnica e più con la sequenza e le scartoffie. Azzecca l'ordine ed esigi i tag giusti, e mantieni sia la portata sia il posizionamento. Ecco il manuale, dall'assicurazione più economica alla garanzia più forte.
Le cinque tutele, in ordine
1. Pubblica l'originale sul tuo sito per primo, e lascia che Google lo indicizzi prima che la copia vada online. Questa è l'assicurazione più economica e potente che hai. Il contenuto nuovo può impiegare da poche ore a poche settimane per essere indicizzato, quindi inserisci un margine di tempo in ogni accordo di sindacazione. Pubblica, poi verifica che la pagina sia davvero nell'indice di Google con lo strumento Controllo URL di Search Console o una rapida ricerca site:, e solo allora lascia pubblicare il partner. Quando Google vede la tua versione per prima, inizi il processo di canonicalizzazione già nel ruolo di fonte.
2. Fai aggiungere al partner un tag noindex alla copia ripubblicata. Questa è la raccomandazione principale di Google per la sindacazione di notizie, e lo è da quando l'azienda ha rivisto le sue linee guida sulla canonicalizzazione a maggio 2023. Il partner aggiunge una sola riga, <meta name="robots" content="noindex, follow">, che tiene la sua copia del tutto fuori dall'indice di Google. La copia serve ancora i lettori del partner, passa ancora un link di ritorno a te, ma non può mai competere con il tuo originale nella ricerca perché Google non la indicizza mai. Il valore follow conta: lascia fluire il valore del link di nuovo verso la tua pagina.
3. Se il partner non vuole o non può mettere il noindex, ripiega su una canonical tra domini. Qui il partner aggiunge un tag rel=canonical sulla sua copia che punta al tuo URL originale. Dice a Google che la tua versione è la fonte e che i segnali devono consolidarsi su di te. È davvero utile, ma comprendi il suo limite: una canonical è un suggerimento che Google può ignorare, e alcuni sistemi di gestione dei contenuti rimuovono o riscrivono il tag senza dirlo a nessuno. Trattala come l'opzione medaglia d'argento, e verifica sempre che il partner l'abbia davvero applicata.
4. Esigi sempre un link di ritorno chiaro e scansionabile all'originale. Una riga visibile come "Pubblicato originariamente su IlTuoSito", idealmente vicino all'inizio dell'articolo e che punta al tuo URL esatto, aiuta lettori e motori di ricerca ad attribuire la fonte. È il segnale di attribuzione più semplice che esista, e dovrebbe essere non negoziabile in ogni accordo, indipendentemente dal tag che il partner usa.
5. Metti tutto per iscritto. Un accordo di partner di sindacazione dovrebbe specificare chi è l'editore originale, che il partner metterà la copia in noindex (o, in mancanza, canonical), l'obbligo di link e attribuzione, e il calendario di pubblicazione che garantisce che tu vada online e venga indicizzato per primo. I tag si dimenticano e il personale cambia. Un accordo scritto è ciò che sopravvive a entrambi.
Non combinare noindex e una canonical sulla stessa pagina
noindex e un rel=canonical sulla stessa pagina è imprevedibile, perché una pagina a cui si dice di non essere indicizzata potrebbe non essere mai scansionata abbastanza spesso perché Google veda la canonical.[9] Scegli un segnale. Per notizie e contenuti competitivi, scegli noindex. I due tag tirano in direzioni diverse, e usarli entrambi non fa che intorbidire il messaggio che cerchi di inviare.
Canonical vs noindex vs riscrittura: il quadro decisionale
Tre approcci legittimi, tre risultati diversi. Scegli in base a cosa devi proteggere e quanto entrambi i siti devono posizionarsi.
Non c'è un solo modo giusto di sindacare. C'è un modo giusto per il tuo obiettivo. I tre approcci legittimi differiscono soprattutto in una domanda: hai bisogno che il tuo sito sia l'unica versione a posizionarsi, o ti va bene che appaiano entrambi? Ecco come si confrontano.
| Approccio | Come funziona | Meglio quando | Rischio principale | Visione attuale di Google |
|---|---|---|---|---|
| rel=canonical tra domini | Il partner aggiunge un tag canonical sulla copia che punta al tuo URL originale, dicendo a Google che la tua versione è la fonte. | Il partner può modificare i tag dell'head ma non mette il noindex, e ti va bene che la copia si posizioni ancora se Google la preferisce. | È solo un suggerimento che Google può ignorare, i CMS dei partner a volte lo rimuovono, e il partner può comunque finire per posizionarsi al tuo posto. | Consentito, ma non è più la raccomandazione principale per la sindacazione di notizie. |
| noindex sulla copia | Il partner aggiunge un meta tag robots (noindex, follow) così che la copia ripubblicata resti del tutto fuori dall'indice di Google. | Devi garantire che il tuo originale sia l'unica versione a posizionarsi, soprattutto per notizie e query competitive. | La copia perde ogni visibilità nella ricerca, che è lo scopo, e serve la collaborazione del partner. Non aggiungere anche una canonical. | L'approccio attualmente raccomandato da Google per la sindacazione di notizie, da maggio 2023. |
| Riscrivere con un taglio proprio | Il partner pubblica una versione davvero diversa, o pubblicate entrambi pezzi distinti, così che non esista alcun duplicato letterale. | Vuoi che entrambi i siti si posizionino, il contenuto è sempreverde o di marketing, e il testo identico non è richiesto da contratto. | Costa tempo e denaro, non è vera sindacazione, e riscritture pigre possono scivolare nell'abuso di contenuti su larga scala. | Incoraggiato. Google chiede agli editori di creare contenuti originali, non di limitarsi a riscaldarli. |
Il motivo per cui Google e i SEO esperti ora propendono per noindex invece di una canonical per le notizie è l'affidabilità. Un tag noindex è una direttiva: Google deve rispettarla. Una canonical è un suggerimento: Google può valutarla rispetto a tutto il resto e scegliere comunque il partner. Per un articolo di marketing occasionale dove saresti felice di veder posizionare una qualsiasi delle versioni, quella flessibilità va bene. Per una notizia competitiva dove essere la fonte visibile è tutto lo scopo, vuoi la direttiva, non il suggerimento.
- È cruciale mantenere il tuo sito come versione che si posiziona? (Notizie, query competitive, tutto ciò dove essere la fonte conta.) Chiedi al partner di mettere la copia in noindex, ed esigi un link di ritorno. È la protezione più forte.
- Il partner può aggiungere tag nell'head ma non il noindex? Usa una canonical tra domini che punta al tuo originale, più il link di ritorno. È più debole, quindi verifica che l'abbia davvero implementata.
- Vuoi che entrambi i siti si posizionino e hai il budget? Fai pubblicare al partner una versione davvero riscritta con un'introduzione, un taglio o dati aggiunti unici, così che non ci sia duplicato da deduplicare.
- In ogni caso: pubblica il tuo originale per primo, conferma che sia indicizzato, esigi un link di ritorno visibile e metti i termini nell'accordo. Questi quattro non cambiano mai.
Cosa è cambiato dal 2024 al 2026, e perché ha alzato la posta
Google ha passato due anni a spingere gli editori verso il noindex sulla copia, mentre in silenzio rendeva un tipo di sindacazione molto più rischioso di prima.
Il consiglio sopra non è statico. Google ha passato gli ultimi anni ad affinare sia le sue raccomandazioni sia la sua applicazione, e due fili contano per chiunque sindachi nel 2026. Il primo è una spinta costante e coerente verso il noindex come tutela preferita. Il secondo è un nuovo insieme di policy anti-spam che ha cambiato quale lato della sindacazione è pericoloso. La cronologia qui sotto segue il filo della raccomandazione.
Le regole di sindacazione di Google, 2023 a 2025
La linea di tendenza è coerente: Google continua a orientare gli editori verso il noindex sulla copia[4][5][7][9]
Google aggiorna le linee guida per raccomandare che i partner di sindacazione aggiungano un tag noindex alla copia ripubblicata quando l'editore originale non vuole competere con il partner nella Ricerca.
Google rilascia un core update insieme a nuove policy anti-spam (abuso di contenuti su larga scala, abuso di domini scaduti, abuso di reputazione del sito), con l'obiettivo dichiarato di ridurre i contenuti poco utili di circa il 40 per cento.
Google inizia ad applicare la sua policy sull'abuso di reputazione del sito (spesso chiamata Parasite SEO), dapprima con azioni manuali contro pagine ospitate con poca o nessuna supervisione editoriale propria.
I rappresentanti di Google ripetono pubblicamente che gli editori originali dovrebbero chiedere ai partner di aggiungere un tag noindex alle copie sindacate, preferibile al solo affidarsi a canonical tra domini.
John Mueller chiarisce che mescolare un tag noindex e un rel=canonical sulla stessa pagina è imprevedibile, perché una pagina in noindex potrebbe non essere mai scansionata per vedere la canonical. Scegline uno.
Glenn Gabe di GSQI segue circa 3.000 articoli di notizie sindacati e conclude che mettere in noindex la copia sindacata è la via chiara per proteggere l'editore originale.
Il secondo filo è il core update di marzo 2024, che Google ha rilasciato insieme a grandi modifiche delle policy anti-spam la stessa settimana, con l'obiettivo dichiarato di ridurre i contenuti poco utili e di bassa qualità di circa il 40 per cento.[8] Due di quelle nuove policy toccano direttamente la sindacazione. L'abuso di contenuti su larga scala prende di mira i contenuti generati in massa principalmente per manipolare il posizionamento invece di aiutare gli utenti.[4] Ed è cruciale: è agnostico al metodo, non importa se il contenuto è scritto da un umano, generato dall'IA o copiato e sindacato, ciò che lo innesca è il volume più l'intento manipolatorio. Spargere lo stesso articolo, o sottili riscritture IA, su decine di siti di bassa qualità è esattamente lo schema che questa policy è stata creata per intercettare.
Il cambiamento più sorprendente è l'abuso di reputazione del sito, ampiamente soprannominato Parasite SEO. Google lo definisce come pagine di terzi pubblicate "con poca o nessuna supervisione o coinvolgimento proprio, dove lo scopo è manipolare il posizionamento sfruttando i segnali del sito ospitante".[7] È stato annunciato il 5 marzo 2024 e l'applicazione è iniziata il 7 maggio 2024.[7] L'esempio stesso di Google cita un sito di notizie che ospita coupon di terzi con poca o nessuna supervisione.[8] Il caso ammonitore più clamoroso è stato l'episodio di Sports Illustrated, in cui un marchio un tempo affidabile ha pubblicato recensioni di prodotti generate dall'IA fornite da terzi sotto falsi nomi di autore, con un controllo editoriale minimo.
La direzione del rischio si è invertita
C'è un filo che attraversa tutto questo e tocca specificamente i contenuti di IA. La posizione di Google è coerente: il contenuto di IA non è penalizzato per essere di IA. È penalizzato quando è prodotto in massa per manipolare il posizionamento senza aggiungere valore, che è di nuovo la policy sull'abuso di contenuti su larga scala. Un piccolo editore che usa l'IA per aiutare a ricercare e redigere articoli originali e davvero utili è su un terreno solido. Un editore che auto-genera cinquanta copie quasi identiche della stessa notizia di agenzia e le spruzza su una rete di siti scadenti non lo è. La linea è il valore e l'intento, non lo strumento.
Gli errori che CAUSANO davvero problemi
Nessuna penalizzazione non significa nessun rischio. Queste sono le mosse disattente che costano davvero il posizionamento ai piccoli editori.
Se non c'è penalizzazione, cosa va davvero storto? Quasi sempre, uno di una manciata di errori evitabili. Nessuno invoca una punizione segreta di Google. Ciascuno semplicemente cede la tua canonical, il tuo valore di link o la tua reputazione editoriale a qualcun altro. Ecco i quattro che intrappolano più spesso i piccoli editori.
Lasciare la copia online prima che il tuo originale sia indicizzato
Se il partner pubblica per primo, Google può trattare la sua copia come la fonte. Pubblica prima sul tuo sito e conferma l'indicizzazione prima che qualsiasi partner vada online.
Ripubblicazione letterale senza canonical, senza noindex, senza link
Senza nessuna delle tre tutele, la copia sindacata può essere trattata come l'originale e assorbire il vantaggio di posizionamento. È il modo classico di perdere la tua stessa storia.
Fidarsi di una canonical e non verificarla mai
Una canonical tra domini è un suggerimento, non un ordine. I CMS dei partner la rimuovono, e Google può comunque scegliere il partner. Preferisci il noindex, e verifica ciò che il partner ha davvero pubblicato.
Sindacazione di massa su decine di siti di bassa qualità
Spargere lo stesso articolo, o versioni riscritte con IA, su molti siti scadenti rientra in pieno nell'abuso di contenuti su larga scala dopo l'update di marzo 2024. Sindaca a pochi buoni partner.
Altri due meritano una breve menzione perché sono trappole tecniche. Primo, non affidarti a robots.txt per "bloccare" un duplicato. Google avverte che robots.txt non è uno strumento di canonicalizzazione: un URL che blocchi lì può comunque essere indicizzato senza il suo contenuto, il che peggiora il problema invece di risolverlo.[3] Secondo, non ospitare contenuti di terzi non verificati sul tuo dominio di fiducia su larga scala, la trappola dell'abuso di reputazione del sito vista sopra. Entrambi sono facili da evitare una volta che sai che esistono, ed entrambi hanno molte più probabilità di costarti caro di qualsiasi mitica penalizzazione per contenuti duplicati.
L'altro modo di sindacare in sicurezza: pubblica una versione che sia davvero tua
Fai un passo indietro e tutto il tema si semplifica. Non c'è penalizzazione per contenuti duplicati quando si sindacano notizie, e non c'è mai stata. Il rischio reale è che Google mostri la copia del tuo partner invece della tua, e su quel risultato hai controllo diretto. Pubblica per primo e conferma di essere indicizzato. Chiedi ai partner di mettere la copia in noindex, o almeno una canonical, ed esigi sempre un link di ritorno. Sindaca deliberatamente a pochi buoni partner invece di spruzzare il tuo lavoro su una rete di siti scadenti. E dai a tutto ciò che ospiti sul tuo dominio la stessa cura editoriale del tuo giornalismo. Fai queste cose, e la sindacazione fa esattamente ciò che deve fare: fa crescere la tua portata senza costarti il posizionamento che ti sei guadagnato.
Letture correlate
- Il mito dei contenuti duplicati: cosa penalizza davvero Google: la base del perché la deduplicazione non è una punizione.
- Contenuti tradotti e SEO: perché anche tradurre non è duplicare.
- llms.txt e crawler di IA: come controllare cosa fanno i bot con il tuo contenuto.