Duplicate Content analyse – Find DC let med dette tool

Duplicate Content analyse – Find DC let med dette tool

SEMaward nomineret 2014wizzi - kåret til et af de bedste blogindlægI dette indlæg viser jeg dig, hvordan du let og enkelt kan analysere dit website for Duplicate Content. Med værktøjet Siteliner får du gratis mulighed for at analysere 250 af dine sider og finde ud af om du er i farezonen for at blive straffet af Google. Jeg gennemgår i indlægget værktøjet på mit eget website, så du kan se hvordan det virker.

Først kigger jeg på hvad Duplicate Content er og herefter hvorfor det er så vigtigt at undgå. Når vi har det på plads kan jeg vise dig, hvordan toolet virker og hvordan du kan eksportere det til Excel og få overblik over dit website. Herudover viser jeg dig en metode til at finde Duplicate Content på Google. Til sidst guider jeg dig videre til andre kilder information om Duplicate Content. God fornøjelse J

Hvad er Duplicate Content?

Først er det på sin plads at få defineret, hvad Duplicate Content (eller duplikeret indhold) er. Min definition er som følger:

Duplicate Content er indhold som fremgår flere steder enten på dit website eller på eksterne websites. Indhold er Duplicate Content når hele afsnit eller blokke af indholdet på en url-adresse er ens med indhold på en anden url-adresse.

Klassiske eksempler på Duplicate Content er produkter med forskellige farver. Her vil produktet typisk have en side per farve og kan mange shopejere desværre ikke se værdien i at gøre indholdet unikt. Et andet klassisk eksempel på Duplicate Content er hvis kategorisider, hvor man kan sortere. Her fremstår kategoritekster som Duplicate Content, hvis Google indekserer hver af sorteringerne. Det kan være at man har en visning sorteret efter pris, mærke etc. hvor kategoriteksten er den samme uanset sortering. Hvis Google indekserer disse sorteringer, vil de fremstå som Duplicate Content, da indholdet er det samme på dem på de respektive url adresser.

Hvorfor bruge tid på Duplicate Content?

Herefter er det nok på sin plads at specificere, hvorfor det er så vigtigt for din SEO at undgå Duplicate Content. Jeg har selv været med til at fjerne Duplicate Content og oplevet, hvordan placeringer på et website fra dag til dag kan stige med 10 i gennemsnit på tværs af de trackede søgeord. Duplicate Content er skadeligt for dit website rent SEO-mæssigt. Herunder har jeg forsøgt at samle en række grunde til hvorfor dette er tilfældet:

  • Unikt indhold: Google ønsker kun at vise søgere ét stykke indhold én gang. De vil vise unikt indhold og unikke resultater. Når indhold er kopieret på tværs af et website (både internt og eksternt) har Google svært ved at bestemme originalen.
  • Straf: Har dit website meget Duplicate Content kan det fremstå som spam for Google. Det er en af de områder som Panda opdateringerne handler om. Du kan altså med tilstrækkelige mængder DC (ofte forårsaget af tekniske SEO udfordringer med dit website) ende med at blive straffet på placeringerne fordi Google tror, at du spammer internettet.
  • Autoritetsfordeling: Når du har det samme indhold på flere sider, så vil den side med højst autoritet rangere i Google, mens andre vil blive skubbet langt om bag i indekset. De duplikerede siders autoritet er dermed til ingen verdens nytte, da siden aldrig vil rangere. Dermed misser du noget autoritet på de vigtige sider, hvis du har Duplicate Content.
  • Rangeringsproblemer: Når dit website har Duplicate Content, vil Google være i tvivl om, hvilken side der skal rangere. Selvom det oftest vil være den side med højst autoritet, så kan du komme ud for at tilfældige og svage sider rangerer. Dette gør at du mister din konkurrencedygtighed på autoritet, trust og historik, hvis en ny og mindre prominent side pludselig fremstår som originalen.

Find Duplicate Content med Siteliner

Her kommer blogindlæggets gode tip. Du kan med det gratis tool Siteliner finde intern Duplicate Content på dit website. Den gratis version skanner 250 sider på et valgfrit domæne. Hvis du har et stort website vil det derfor ikke være nok blot at køre det igennem Siteliner. Men du kan få en indikation af på hvilke typer af sider, du har Duplicate Content. http://www.siteliner.com/ userinterface ser således ud:

Siteliner DC finder

Det var Lars Nørgaard Graversen fra mit team i GroupM, der viste mig toolet, som vi bruger i hver eneste SEO analyse vi udarbejder.

Det er muligt at eksportere til Excel for i mine øjne bedre overblik:

Duplicate Content analyse

Når du har eksporteret analysen af Duplicate Content ser det således ud i excel:

 

Excel duplicate content analyse

 

 

Din DC analyse kommer til at se således ud, hvis du opdeler og farvelægger:

 

Kategorier duplicate content

Der er en række metrikker i Siteliner, som jeg lige vil give mit take på. Dem jeg har markeret med fed er de absolut vigtigste i forhold til Duplicate Content analysen:

  • Page Power: Den interne autoritet til hver side målt på interne links
  • Size: Størrelsen på siden
  • Words: Antallet af ord på siden
  • Matching words: Antallet af matchene/duplikerede ord
  • Match percentage: Hvor stor en andel af de totale ord, som er matchene/duplikerede med andre sider. I procenttallet er der fratrukket menuer og elementer, der går på tværs af websitet.
  • Match Pages: Antallet af sider, som indholdet matcher med. Altså hvor mange sider på websitet det matchene indhold kan findes på.
  • Match Words (With Common): Antallet af matchene ord inklusiv menustruktur, footer, sidemenu etc. som går igen på flere sider.
  • Match percentage (With common): Den total match andel med alt indhold
  • Match pages (with common). Hvor mange sider indholdet matcher med inklusiv menuer og statiske elementer.

Jeg har som du kan se herover analyseret mit website nikolajmogensen.dk for Duplicate Content og kan konstatere, at det i høj grad er min kategorisider, som indeholder mest duplikeret indhold.

Det er det fordi jeg har alle indlæg listet i mange kategorier og fordi jeg ikke får skrevet unikke beskrivelser af blogindlæggene til excerpt. Det betyder at indholdet i den korte opremsning af blogindlæggene er det samme, som på selve blogindlæggenes sider.Ligeledes ligger en del af blogindlæggene i flere kategorier og dermed opstår der Duplicate Content.

Løsningen er at jeg skal arbejde med at skrive endnu mere unikt og godt kategoriindhold og/eller begynde at gøre excerpts unikke for indlæggene. Dette har jeg dog ikke rigtig nogen intention om, hvorfor min tilgang vil være at øge andelen af unikt kategoriindhold og så beholde en lille smule DC. Ud over det så fungerer mit website som det skal, når det kommer til Duplicate Content. Så her r alt godt. Du bør selv tjekke dit website og sikre dig, at du ikke bliver ramt af nogle af problemerne med Duplicate Content.

Find Duplicate Content med Google

En anden måde at finde Duplicate Content er igennem Google. Her kan du markere stykker af indhold på dit website og simpelthen Google det. På den måde kan du se om indholdet bliver indekseret andre steder. Herunder har jeg eksempelvis markeret indhold og tekst fra forsiden, som jeg vil teste for om det skulle være duplikeret til andre steder:

Brug google til at finde duplicate content

Det prøver jeg så at kopiere ind i Google. Hvis der findes Duplicate Content vil dette fremstå af de forskellige resultater, der er i Google. Herunder har jeg forsøgt at søge efter indholdet.

Duplicate content i google

Da der kun er ét resultat viser det, at jeg ikke har Duplicate Content på indholdet fra min forside. Havde analysen fra Siteliner vist, at jeg havde massiv Duplicate Content kunne jeg finde frem til hvilke sider ved at lave ovenstående manøvre i Google.

Sådan undgår du Duplicate Content

Nu har du så fundet ud af, at dit website har en masse DC, som vi jo ved er skadeligt for din SEO. Derfor skal du nu have det fjernet for ikke at forvirre Google eller blive straffet af Google.

Hvordan du gør det er generelt ikke noget jeg vil beskæftige mig med her. Hvis du finder Duplicate Content og ikke ved hvordan du skal undgå det, vil jeg anbefale dig at søge professionel hjælp Alt efter hvilken årsag der er på dit website til det kopierede tekst skal du gøre nogle forskellige ting.

Ofte kan Duplicate Content løses ved at bruge 301 redirects, canonical, robots.txt filen, noindex tag etc. Hvis du har decideret kopieret tekst kan Duplicate Content løses ved simpelthen at skrive ny og mere unik tekst.

Andet læsestof omkring Duplicate Content

Duplicate Content er et kendt problem og derfor findes der også rimelig meget materiale om det, som jeg kan anbefale dig at kigge nærmere på:

VN:F [1.9.22_1171]
Rating: 4.3/5 (7 votes cast)
Duplicate Content analyse – Find DC let med dette tool, 4.3 out of 5 based on 7 ratings
Spred god karma og del
Share on Facebook1Share on Google+30Share on LinkedIn11Tweet about this on TwitterEmail this to someone

7 svar

  • Hej Nikolaj.
    Jeg følger interesseret med på din blog. Den er saglig og anvendelig for alle os, der ikke er “SEO-nørder”. Tak for det.

    Jeg har imidlertid et spørgsmål til DC i forhold til oversættelse af indhold. Lad mig give et eksempel.

    En virksomhed servicerer 4 geografiske markeder og har valgt at servicere dem via lokale domæner (.se, .fi etc.).

    Indhold produceres på dansk og oversættes typisk til lokalsprog, hvorefter indholdet udgives publiceres på alle domæner.

    Er det DC? Kan Google detekte den type “DC”? Og kan det evt. løses med canonical?

    • Hej Jens

      jamen tak for det – det varmer at høre.

      I forhold til dit spørgsmål. hvis indholdet er tilgængeligt for Google på alle TLD (eksempelvis .se og .dk), så det svenske indhold både kan findes på .dk og .se , så er der tale om DC. Det er der dog kun i tilfælde af at det ikke er afhjulpet igennem robots.txt filen, ved hjælp af canonical eller igennem noindex. Duplicate Content forårsaget af sprog er en helt almindelig kilde. Det er super frusterende at mange webbureauer og udviklere ikke har sat sig ind i problematikken og får den løst fra starten af.

      Hvis du vil finde ud af om du har et problem med Duplicate Content, så prøv at Google noget af indholdet, som vist i indlægget. Hvis der kommer mere end 1 resultat op, som viser det samme indhold markeret med fed, så har du DC.

      Håber det hjalp

  • Rigtig god intro til Dublicate Content – og fedt med en seriøs SEO-blogger, der også deler referencerne til sin research 🙂

    Siteliner virker umiddelbart meget fint, især da værktøjet viser fordelingerne grafisk.

    Der findes også analyseværktøjer, som ud over DC viser en masse andre vigtige parametre – som Siteliner umiddelbart ikke rapporterer. Det er f.eks. manglende metatekster, for korte/lange/dublikerede descriptions, alt-tekster på billeder, headings, upper/lower case URL’er osv.

    Jeg bruger ofte det gratis program (med det mundrette navn) ‘Screaming Frog SEO Spider’ (http://www.screamingfrog.co.uk/seo-spider/). Jeg synes i hvert fald, det er værd at overveje, da det giver en masse indsigt, jeg umiddelbart ikke finder i Siteliner 🙂

    Tak for altid god videndeling 🙂

    • Hej Severin

      Tak for kommentaren – det varmer!

      Screaming Frog er super godt. Det tester bare ikke selve indholdet, men kun titler, meta og overskrifter. Samtidigt giver det ikke en match score.

      Så derfor vil jeg da anbefale, at man bruger begge værktøjer og evt kobler dataet sammen i sin analyse.

      • Enig 🙂

  • Hej Nikolaj,
    Hvis du ikke allerede har fundet ud af det, kan du importere arket til Google drev. Så opdeles det automatisk og du kan spare lidt tid:-)

  • Hej Nikolaj

    Først og fremmest rigtig fin blog du har fået sat sammen, med en masse velskrevet og letforståelige artikler.

    Jeg har et spørgsmål til din mening ang DC på e-handels hjemmesider. Det er utrolig svært at undgå når man har mange produkt beskrivelser som ligner hinanden meget.

    I min case har jeg praktisk info på mit produkt, som vil gå igen på alle produkter. Min produkt beskrivelse er unik på hvert produkt. Men praktisk info vil altså være den samme. I mit tilfælde op til 80 gange på mit site.

    Hvad er din holdning til hvordan Google/søgemaskiner opfatter dette?

    Ville du evt samle alt praktisk info på en særskilt side og linke til den i stedet? (Hvis det er muligt).

    Ser frem til at høre dit svar og endnu en gang tak for en fantastisk blog.

    Vh
    Anders Jensen

Skriv en kommentar

Venligst indtast navn Please enter an valid email address. Skriv venligst en besked

Gratis bog om søgeordsanalyse

Få den gratis +50 siders bog der gennemgår søgeordsanalysen fra formål til udførsel og til brug. Du tilmelder dig samtidigt nyhedsbrevetSøgeordsanalyse bog