Hvad er Duplicate Content? Den ultimative forklaring

Hvad er duplicate content?

I et SEO perspektiv, da filtrerer søgemaskiner gerne det fra, hvad de ser som kopieret indhold (duplicate content), ting der er nøjagtig det samme. Søgemaskinerne ønsker aldrig at vise dig et sæt resultater, hvor søgeresultat to, tre, fire og fem alle er fra den nøjagtig samme artikel, eller de væsentligt ligner hinanden og gentages med de samme billeder indlejret i dem.

Det kunne være, at indholdet er blevet licenseret mellem forskellige parter – Nyhedsmedier gør dette meget, og her kan samme artikel nogle gange dukke op i søgeresultater (mere om dette længere ned i artiklen). Det kunne være, at nogen har plagieret og faktisk stjålet en artikel. Det kunne også bare være, at nogen har udsendt den samme artikel flere forskellige steder på nettet. Under alle omstændigheder, så prøver søgemaskinerne ofte at filtrere denne type indhold ud af søgeresultaterne.

Hvor unikt skal indholdet være?

Fra et SEO perspektiv er det derfor meget vigtigt at forstå, “Hvad betyder det egentlig? Hvad menes der med kopieret indhold (duplicate content), og hvor unik skal indholdet være?”

Når vi taler om, og henviser til det unikke materiale på en side, da er det indholdet, altså brødteksten vi taler om, og ikke navigations faner, annoncer, footer, sidebars, osv. Måske står der et lille stykke i sidebars om dig selv eller firmaet, som er det samme på alle sider – Dette skal du ikke bekymre dig om, så længe dit brødtekst indhold er unikt.

Hvis du har det samme indhold to steder på dit websted, f.eks. kan det være en artikel fra din Blog, som også findes i en oversigt andetsteds, da ignorerer søgemaskinerne ofte dette – det kan også være i tilfældet af en trykt version (pdf-fil), én mobilvenlig version af samme artikel (tekst), men er du i tvivl -og vil du være sikker, så kan det være klogt at bruge en rel=canonical, som viser hvilken side søgemaskinerne skal indeksere af disse. Hvis du har det samme indhold på Dansk og den samme artikel på Engelsk, da skal man bruge en Hreflang Tag.

Du må gerne låne bidder af tekst

Her blive mange ofte forvirret, når jeg siger at du gerne må låne bidder fra andre, uden at det betegnes som kopireret indhold (duplicate content), så længe du tilføjer det en unik værdi.

Lad mig forklare, du skriver måske en artikel og vil gerne citerere nogle linjer og tekst fra Wikipedia og sætte det ind i artiklen, eller du citere en Blogger og omfatter et par sætninger som de siger, eller du tager et stykke fra en avisartikel osv.” Det er ikke disse gentagelser af indhold, som ses som duplicate content, så længe du skriver en artikel der giver det citerede ”nyt liv” og unik værdi.

Men pas på

Jamen, du tænker måske; ”hvis jeg nu tager noget tekst eller en hel artikel, et andet sted på nettet og ændrer alle ord, så har jeg vel en unik artikel”? Ja du har teknisk set lavet unikt indhold, men artiklen mangler unik værdi. Unik værdi er en meget anderledes ting, du skal kunne tilføje noget, eller vise noget omkring emnet som ingen andre har gjort før, dette er unik værdi, og det er ofte dette der virkelig kræver mange timers arbejde.

Der findes også mange folk på SEO området, der fejlagtigt tror, at der er en magisk grænse ved at ændre 60% af ordene eller 50% af ordene i en kopieret tekst, så skaber de unikt indhold i forhold til en artikel eller tekst der allerede findes på nettet, denne imaginære indbildning er helt forkert, og der er ikke noget om den. Der findes ikke en sådan grænse, søgemaskinernes algoritmer er meget mere avanceret og sofistikeret end en procentdel af hvad der er duplikeret og det der ikke er. Søgemaskinerne bruger en bred vifte af input.

Samme artikel, flere steder?

Du kan i nogle tilfælde godt se samme dublet af den samme artikel i søgeresultaterne, selvom de er ens – Dette skyldes ofte, at disse er dem, der er blevet kommenteret mest, delt mest på de sociale medier og hvor Google og søgemaskinerne har set en brugeradfærd, der tilføjer artiklerne unik værdi, selvom indholdet er nøjagtigt det samme. Dette sker ofte ved nogle nyhedsmedier, hvor indholdet er licenseret ud til flere parter eller artiklen bliver delt på privates egen blogge. Nogle gange vil Google liste flere af samme artikel, andre gange ikke, det handler forudsat om den unikke værdi af artiklen, set ud fra en meget avanceret algoritme.

Hvis du er bange for at dele én artikel, som du har fået lov til at udgive på dit site, så vær ikke bange, du vil ikke blive straffet for dette. Det du skal gøre synligt, for dine læsere og for Google er at vise hvor artiklen stammer fra, – Dette er almindelig praksis, altså kildegengivelse – Men det vil dog ikke være sikkert at den bliver indekseret specielt godt i forhold til originalen.

Det der kan gøre forskellen på en delt artikel, og give den samme artikel mere værdi ét sted, end flere andre, kan derfor skyldes artiklens branding, indgående links, kommentarer, delinger. Ydermere er det heller ikke lige meget hvor artiklen placeres, da domænets autoritet, der hvor artiklen ligger kan spille en stor rolle.

En sidste ting jeg vil nævne er, at hvis der på din hjemmeside findes en del gentagelser af samme indhold, en del kopieret indhold (dette kan f.eks. sagtens være produktbeskrivelser, som kommer fra leverandøren), da kan disse godt skade hele din side, da Google jo ikke vil se noget som unik indhold – så vær forsigtig med at gøre det på den ”nemme” måde, men tænk og kreer noget unikt og noget der giver lidt mere værdi end andre steder. Matt Cutts, der er chef for Google Search og Spam Team, siger faktisk i en udtalelse fra 2013, at man ikke skal være specielt bekymret vedr. duplicate content, da søgemaskinerne selv kan finde ud af om det er den ene, eller den anden version af en ”duplicate” tekst, der vil blive rangeret højest. Det værste der vil ske, er bare at dine sider ikke bliver specielt godt indekseret, da de ikke ser indholdet som unikt (dette er straffen ved duplicate content).

Så hvis du har eller sidder med en tekst, som du ved er en kopi af lignende tekst fra andre sider på nettet, måske har du købt noget licenseret materiale, som forefindes andre steder, men som du finder beskrivende og nyttig for dine kunder, da kan du f.eks. bruge ”Disallow meta noindex”, eller du kan gøre det inde i Google Search Console (tidligere Google Webmastertools), og forbyde gennemgang og indeksering af disse sider, men som Matt Cutts siger, da er det måske ikke engang nødvendigt.

Håber denne gennemgang af ”Duplicate Content” var nyttig, og du nu vil gå ud og skabe noget unikt indhold, med unik og værdifuld værdi. læs mere om SEO på blog.seo-sem.dk.

2 kommentarer til “Hvad er Duplicate Content?”

[…] Steen M. Nielsen, “Hvad er duplicate content”. […]

[…] 19. Duplicate Content: Identisk eller duplikeret indhold på samme sted (endda lidt ændret) kan have en negativ indflydelse på en hjemmesides placeringer. Læs mere om duplicate content. […]