Google Pandaen er Tam, Uden Tænder og Ganske Harmløs

Posted Posted af i Guest post, SEO     Comments 31 kommentarer
jun
9

Google elsker tyndt indhold. Google elsker autogenereret indhold. Her kommer modsvaret til det tilsyneladende farlige dyr, de kalder ”Google Panda”. Har updaten overhovedet en effekt?

Mens mange danske online folk går og venter på, at Panda opdateringen fra Google bliver rullet ud i Danmark, er det blevet tid til en status på, hvordan udrulningen har påvirket websites i USA og England, hvor opdatering snart har været ude i 3 måneder.

Hvad betyder Panda opdateringen?
Efter lang og hård kritik af søgeresultaterne har Google måtte sande, at det er på tide at opdatere deres indeks så ligegyldige websites, kopier, og andet tyndt indhold, ikke længere vil dominere hver SERP, som bare ”lugter” lidt af penge.

Hvis du ikke er helt med, så lav en søgning efter; ”a-kasser”, ”bredbånd”, ”mobil bredbånd” mfl.

Googles intentioner været at ramme content farms, altså sider der scraper eller autogenererer og gengiver allerede eksisterende indhold, med det eneste henblik at tjene penge på Adsense, Affiliate, infolinks og så videre.

Googles Panda opdatering har været live i 3-4 måneder og mange større Content Farms, som f.eks. Ehow, og tilsvarrende artikeldatabaser er blevet hårdt ramt. Men hvad med alle de små content farms som i virkeligheden fylder mest i hver SERP?

Case Study viser en tam panda
Følgende er Case Study fra den virkelige verden, hvor Pandaen tilsyneladende viser sig at være totalt tam. Efter at have læst alt for mange artikler om Pandaer, affiliates der har mistet en direktørløn, og alt muligt andet PR-spin, syntes jeg det var på tide, at poste en case med data og 100% indsigt.

Data i denne Case Study er 100% valid og kan til en hver tid fremvises.

For at teste hvorledes Panda ville påvirke content farms oprettede undertegnede en scraper blog i nichen Iphone Unlocking, jailbreaking, hacking osv.

Systemet blev sat til at scrape blandt andet, Yahoo Answers, Ehow og Flickr alt sammen krydret med kommentarer ”lånt” fra YouTube.

Resultatet blev dette pragtfulde website: unlock-iphonesoftware.com

• Antal indekserede sider i Google: 1030 (alle poster/indlæg er scraped eller autogenererede)
• Backlinks YSE: 2
• Domænealder: november 2010
• System: WordPress Blog
• Scraper-plugin: WP-robot autoposter plugin

Ovenstående burde matche præcist de kriterier som Google går efter, når de langer ud efter ”Thin content” eller non-unique scraped content. Elementer – som netop er blevet udråbt til kernen – i Googles Panda update.

Google elsker autogenereret indhold
For ikke at give Google et kæmpe forspring valgte jeg ikke, at installere Google Analytics eller Google Webmaster Tool. Google burde jo kunne tjekke websites ved egen indeksering. Udviklingen i trafik ser således ud i AW-stats, som er min hosts serverstatistik.

Efter en lidt sløv start begynder websitet at blive indekseret og i marts måned rammer trafikken ~20.000 unikke besøg (iflg. AW-stats, GA tal kommer senere). Men alligevel er det rimelig pænt trafik for et website, der ikke er mere end 3 måneder gammelt.

Men det store spørgsmål er: hvorfor sender Google 20.000 besøg om måneden til et website som ifølge Google selv ikke har nogen plads i deres søgemaskine?

OK. Google har ikke spottet at websitet er 100% autogenereret, så jeg forsøger herefter, at fange Googles opmærksomhed, ved at plastre websitet til med annoncer. Det burde være en klar indikator på at websitet kun er sat i verden af én grund.

For at blive klogere og få endnu en datakilde implementerer jeg Google Analytics, hvilket betyder, at Google får alt det data, som de kunne ønske sig.

Google elsker stadig autogenereret indhold
Trafikken på websitet bliver ved med at stige, selvom annoncerne dominerer websitet totalt:
4 Adsense bloks på forsiden, Infolinks, affiliate banners, Amazon Widgets, Chitika, osv. Men trafikken stiger stadig.

Gennem hele april stiger trafikken dag for dag. (Den 11. april skifter jeg DNS, og sitet ryger offline i 24 timer, derfor er der et let drop).

Først omkring den 4. maj begynder trafikken at falde en smule. Det skyldes, at nyhedsværdien her falder, og samtidig er jeg ved at ”løbe tør” for artikler at scrape. Omkring 1000 poster er blevet publiceret indtil da.

Hvis jeg havde tid/lyst ville jeg uden tvivl kunne holde liv i websitet ved at skrive en smule unikt content, og begynde at link builde til sitet. Det har dog aldrig været hensigten her.

Det er helt tydeligt, at websitet ikke er blevet straffet eller på nogen måde ramt af Googles nye hårde linje over for content farms. Dermed heller ikke af Google Panda Updaten. Trafiksammensætningen i Google Analytics giver en fint billede heraf:

Næsten alle besøg kommer fra organiske søgninger og det er tydeligt, at det er long tail søgninger eftersom hvert 8. søgeord er unikt.

Pandaen har ingen tænder!
Personligt virker det hele en smule nedslående. Man kan stadig fylde SERPs op med ligegyldigt content som out-ranker og out-performer websites, der har et originalt budskab og fortjener organisk trafik.

Man kan jo håbe på, at den danske udrulning af Google Panda bliver mere effektiv. Det er dog nok tvivlsomt.

Konklusion: Pandaen virker umiddelbart som det tammeste dyr i skoven.
Konklusionen er, at det absolut er muligt at lave denne type websites, som ikke kræver noget særligt arbejde, og nemt kan trække 30.000 til 40.000 unikke, højrelevante long tail besøg om måneden.

Det har taget længere tid, at skrive dette indlæg end det har taget at udvikle websitet. Derfor er prioriteterne fra Googles side tilsyneladende endnu ikke helt tilpassede.

Der er i forbindelse med udviklingen af websitet på ingen måde brugt snyd eller metoder, som Google ikke accepterer: eks. Cloacking, Doorways eller andet.

Jeg vil opfordre andre til at dele deres meninger, oplevelser eller stille spørgsmål til Casen og Google Panda updaten nedenfor. Alt data til denne case er tilgængeligt for interesserede.

Indlægget her er skrevet af Jonas Aagreen – Seo Analyst hos Omnicom Media Group – og tidligere gæsteskribent her. Det er også ham, der ligger data til denne Case Study.

31 Kommentarer til “Google Pandaen er Tam, Uden Tænder og Ganske Harmløs”

  • Hej Jonas,

    Super fed case og fine referencer til diverse PR-spin :)

    En ting jeg dog synes det er vigtigt at huske på er, at Google viser det indhold som de finder er mest relevant (uanset hvordan det er fremkommet). I og med at dit site får langt den største del af trafikken på long tail (og jeg gætter på “meget” long tail), tror du så ikke at det skyldes at der umiddelbart ikke findes bedre derude?

    Google skal jo vise noget og hvis alternativet er værre end det du kan byde på, så er resultatet vel stadig ok? Google kan jo ikke skrive nyt indhold hvis det eksisterende er for dårligt :)

    Men super fedt eksempel!

    /Mikael

  • Goddag Jones,

    Super interessant case!

    Det er godt nok tankevaekkende at den spammy, reklameklistret og scrapet hjemmeside, kan faa saa mange besoeg, efter den (u)farlige panda… Foej! Jeg faar det virkeligt daarligt at at se paa den side!

    Jeg tror umiddelbart at det er et spoergsmaal om tid, foer hele sitet ryger – hva siger du? 2-3 maaneder?
    Maaske er Pandaen bare ikke saa hurtig..

    Faelles for alle de scrappede sider er også at deres bouncerate laegger paa 75%+, hvilket ogsaa boer “flagge” siden som tvivlsom @ Google.

  • @Mikael Google må sgu have mere relevante resultater, uafhaengig af long-tail keyword-relevans, end denne :)

  • @Frederik, skal jeg ikke kunne sige. Kender ikke søgeordene. Jeg ved godt at Google taler om at de kan vurderer layout baseret på bruger-adfærd, men må indrømme at jeg ikke helt tror på det. Så layoutet tror jeg vi skal se bort fra.

    Alternativt må det jo være noget andet der lader denne side slippe igennem. Pandaen har ramt hårdt mange steder, så der kan ikke være tvivl om dens eksistens.

    Så hvis det ikke er antallet af reklamer og det ikke er det at man scraper indhold, hvad skulle det så være der lader denne side slippe?

  • Tak for et rigtigt godt indlæg!

    Jeg kan se på et af billederne at avr time on site er ca. 50 sekunder. Hvad er bounce raten?

  • Super god case. Utroligt at den kan overleve. Men efter at du har offentliggjort denne case, så er siden er pontetial handjob kandidat :)

  • Hej
    God gennemgang og rigtig fin case.

    Der er stadig er meget ”skrammel” i rigtig mange SERPs, men en del er altså også ”luset ud” eller ”hårdt ramt” alt efter hvilke briller man ser det med.

    Jeg kørte en test med et lignende site, som opbyggede 15.000 sider og et næsten tilsvarende antal indgående links over 2-3 måneder. Alt var DC og det kom op på ca. 2.000 daglige besøgende inden det sagde PLONK og sitet (meget berettiget) landede i det supplerende index, men det var faktisk før Panda.

    De sites der har gået til eller over grænsen, har hele tiden levet et farligt liv, men det overrasker mig da at dette site slipper så let igennem. Man skulle vel tro at med så meget DC, var den et oplagt offer for Pandaen, men det kommer nok. Pandaen er jo en langsom æder, som kun en gang imellem virkelig viser tænder.

  • Hej Jonas,

    Super godt indlæg og fedt med data, der kan bakke tingene op! Fakta og ikke gisninger og Ulven kommer profetier.

    Som vi talte om i går og som jeg har udtalt til bl.a. Comon, så har den Panda fået sparket tænderne ind og revet kløerne ud. Jeg giver ikke fem flade øre for alt det piveri der p.t. omgiver Google.

    Lav nogle gode sites og hold din sti.. grå – så skulle den Panda være tilbage i regnskoven.

    OG HUSK nu at Google har udtalt flere gange at Panda KUN er rullet ud i USA, så alle dem med dansksprogede sites og teorier om at Panda har ramt dem, skulle finde noget andet at gå op i ;)

  • Fedt med en faktisk case.
    Det er værd at bemærke, at Google selv mener, at de er på vej med en anti-scraper justering til bambustyggeren:
    Citeret fra: http://searchtempo.com/smx-advanced-liveblog-%E2%80%98you-a%E2%80%99-keynote-with-google%E2%80%99s-matt-cutts-2/

    “DS: Talking about Panda, says that he’s getting a ton of emails from people who say that scraper sites are now outranking them after Panda.

    MC: A guy on my team working on that issue. A change has been approved that should help with that issue. We’re continuing to iterate on Panda. The algorithm change originated in search quality, not the web spam team.”

  • @Michael Rieck
    Umiddelbart findes der andet indhold derude, i hvert fald det som er blevet scraped. Men når man tager lidt indhold hist og lidt her, så skaber man semi-unikt indhold. Det kan dog undre at Google ikke er i stand til at se at samlet er indholdet bidder af indhold, de allerede har eksisteret.

    @Fredrik
    Svært at sige hvad der sker om 2-3 måneder, men jeg tror ikke at websitet ryger ud i den forstand, det vil falde i trafik, men mere som et resultat af at der ikke bliver postet mere indhold.

    @Andreas Saugstrup
    Bounce rate er voldsom høj ligger for alle trafikkilder på 82,18%

    @Kim Jørgensen
    Helt sikkert, men det er også ok, det er ment som en test, og metode til at samle data til dette indlæg.

    @Klaus Hall
    Min teori er at Panda opdateringen slet ikke er automatisk endnu. Google har valgt store US websites ud manuelt, og derefter sluppet den automatiske algoritme løs, for at samle data og herefter tilrette igen.
    Men den skal nok blive automatisk.

    @Rasmus Sørensen
    100% enig, ingen tegn i DK endnu.

  • @Klaus, i mine sites tilfælde vil jeg mene at Pandaen har ramt helt skævt. De var på ingen måde på grænsen og have udelukkende unikt indhold.

    @Jonas, forstår ikke helt hvad du skriver til Klaus. Mener du at den både er automatisk OG manuel (hvis den automatiske ikke fanger dem i første omgang)?

  • @Michael Rieck
    Jeg tænker at Google har udvalgt nogen store Amerikanske website, som f.eks. Ehow, men de er valgt manuelt. Herefter har de isoleret set testet algoritmen, som automatisk funktion, vurderet hvad den fandt, og holdt det hele op imod deres ønskede resultat.

  • @Jonas, er det så ikke lidt underligt, at eHow først blev ramt ved anden runde af Panda? Den har jo nærmest været synonym med “content farm” hele vejen igennem. (Hvilket jeg i øvrigt ikke synes er helt berettiget).

    Vi kan selvfølgelig kun gætte, men jeg er altså meget i tvivl om hvor meget (hvis noget) der er sket manuelt.

  • @rasmus:
    Lidt hård konklusion på én test – Jeg har i rigtig mange år lavet sider som denne og de holder ikke i længden – Du skal blive ved med at oprette sites, hvis du vil bevare indtjeningen. Stopper du bliver du spist (dette mønster var der også før pandaen)

    @Jonas:
    Gider du uddybe denne:
    “Min teori er at Panda opdateringen slet ikke er automatisk endnu. Google har valgt store US websites ud manuelt, og derefter sluppet den automatiske algoritme løs, for at samle data og herefter tilrette igen.
    Men den skal nok blive automatisk.”

  • @Mikael Rieck
    Jo måske, men det er også kun en teori, fakta er blot at der ikke har været “blodbad” blandt mindre websites, i hverken US, UK.

  • Hvis du har sat siden op for at teste Pandaen, så forstår jeg ikke hvorfor du har brugt et plugin der skal få dine tekster til at se anonyme ud (i klide koden). Sådan et plugin bruges netop for at snyde Google for en tid.

  • @Jonas Aagreen
    Nu er det jo ikke kun de sites som bliver fremstillet på de store SEO blogs der er ramt – der er en ret stor hær af mindre sites som også er ramt. men jeg ved selvfølgelig ikke hvad der skal til før du synes det er et blodbad

  • @Jonas, enig med Riisager. Jeg kender til rigtig mange små sites der er blevet ramt, så det er ikke “fakta”. :)

  • Hej Jonas,

    Sådan som jeg forstår dit indlæg, mener du at Panda bør have en omgående effekt på sites. Hvorfor skulle Panda, som algo-ændring agere så meget anderledes end resten af algoritmen? Og som jeg forstår dine kommentarer mener du at panda til stadig er håndteret udelukkende manuelt, algoen er slet ikke rullet ud endnu.

    I så tilfælde må Google virkeligt have oprustet deres mandskab, for de har haft travlt. Formålet med din case må dermed også være at se hvor lang tid der går, før en Google medarbejder reagerer på dit site?

    Jeg kunne også bruge en masse lyssky teknikker som Google slår hårdt ned på og som algoritmen tager højde for, i begrænset tid, det kan være alt fra en dag til år. Hvis dette ikke var tilfældet, så var der ikke længere noget der hed blackhat.

    Nu det har taget dig så kort tid at sætte sitet op, syntes jeg det kunne være interessant om du lige brugte 5 minutter mere af din tid og så om du kunne holde den kørende i et halvt år til og så lavede en opfølgning.

    Ydermere undrer det mig at du så fast tror på at den IKKE er rullet ud i Danmark, nu hvor du konkluderer at den er så tam. Hvis den er så tam på det engelsksprogede marked, hvorfor skulle den så være mere stringent på et sprog som dansk?

    @Rasmus Sørensen

    Du har arbejdet med SEO i ti år og vælger at stole blindt på hvad Google udtaler, det undrer mig. Google er en virksomhed, en virksomhed der vil tjene penge ligesom så mange andre – Google udtaler hvad der tjener Google bedst, ligesom en hver anden virksomhed, det kaldes PR :)

  • @Henrik – jeg forstår ikke rigtig hvad du mener med at jeg vælger blindt at stole på Google’s udtalelser?

    Hvis du mener deres udmelding om at Panda endnu ikke er rullet ud i f.eks. Europa, vælger jeg at tage dette som et udtryk for at de har sværere ved at håndtere f.eks. dansk end engelsk.

    Min pointe er netop, at man ikke skal stole på rygter, gisninger og udmeldelser fra ulven i hønsegården, men gøre sine egne erfaringer og benytte af folk, som man stoler på.

    Mine erfaringer er, at vi ikke har kunne se en effekt overhovedet af de påståede tiltag i.f.t. Panda og Danmark og at Panda dermed ikke er så farlig, som det antydes mange steder – eller at den ikke er rullet ud i Danmark endnu.

    Top 10 har jo 10 sites at vise og Google er føjtende ligeglade med om det er mit eller dit site, der ligger i top 10 – bare det relevant. Spørg manden på gaden i f.eks. USA om han har bemærket blodbadet? Det tror jeg ikke :)
    Google er netop verdensmeter i PR og har historisk været lidt øøhh.. økonomiske med sandheden om hvordan deres søgemaskine i virkeligheden rangerer sites :)

  • Tak for de mange kommentarer – og et super indlæg af Jonas.

    Ifølge Hr. Cutts på SMX kommer der inden så længe en ny opdatering til Google Panda – Panda 2.2.
    The next update will target a common webmaster complaint related to the original Panda/Farmer update: sites that scrape and re-publish content and are out-ranking the original source of the content.

    Derfor:
    Vi har med garanti ikke set det sidst til Google Panda – og opdatering 2.2 tager tilsyneladende højde for sites som det beskrevet i indlægget. Jeg tror dog også mest på data – og denne case er ikke en enkeltstående case. Der er mange tilsvarende.

    Jeg mener ikke Panda er kommet til ikke-engelsktalende lande – og dermed heller ikke til det meste af Europa.

    “I don’t know when we’ll launch fully internationally, not just in English.” Matt Cutts på SMX.

    Den kommer givetvis – men der går lang tid før Google får ryddet bare nogenlunde op.

  • @Rasmus – OK – Jamen så taler vi samme sprog.

    Det var denne udtalelse der tilsyneladende førte mig på vildspor: OG HUSK nu at Google har udtalt flere gange at Panda KUN er rullet ud i USA.

  • Spændende test. Jeg vil gerne bakke op om Henrik Bondtoftes forslag. Det kunne være super interessant at lade testen køre og høre om hvornår siden bliver “opdaget”. Det kan jo være den bliver opdaget i takt med nye Panda udrulninger.

  • @Morten G.
    Hvilken plug-in tænker du på her ?

  • @Henrik
    Ikke en omgående effekt, hvis du mener at så snart content er indekseret, men med Panda, så tænker jeg at Google burde have automatiseret det så meget at de ikke indekserer “thin content”. I “gamle” dage snakkede man om “Google Sandbox”, hvor et nyt website skulle vurderes af G. inden det blev fuldt indekseret og vægtet.

    Efter min mening ville det give mening hvis Google havde en pre-vurdering, inden de indekserede et helt website. Så ville de i første omgang undgå at få indekserer så meget junk.

    @alle Tak for alle kommentarer, jeg håber i syntes det var en interessant case, og jeg har som sagt mere data, hvis nogen skulle være interesseret. Jeg har desvære ikke mulighed eller tid for at arbejde videre med websitet.
    Det bliver rigtigt spændende at se hvad der kommer til at ske i fremtiden.

    MVH
    Jonas

  • Interessant at høre nærmere om, tak for linket Rosenstand :-)

    Jeg tror ikke at man kan konkludere ud fra 1 kvalitativt forsøg, og slet ikke over så kort tid.
    Uden at skulle lege den store ekspert, vil jeg påstå at et sådant forsøg kræver et langt større grundlag for at kunne fastlå konklusionen.

    Når det så er sagt, så er jeg imponeret over arbejdet, det er super fedt at dele eksemplet med os andre!

  • Hej – Jeg bringer lige denne tråd frem igen. Er Pandaen stadig tam og uden tænder? ;-)

  • Hmm. Ja, jeg gad også godt høre hvad folk oplever derude. :-)

  • Hej Henrik
    Tak for interessen i oplægget, og undskyld det sene svar.
    I forhold til Panda, så er intet ændret ved websitet, det lever stadig og modtager god trafik. Jeg kan dog ikke give ny data, da websitet har fået en ny ejer, og jeg har derfor ikke længere adgang til trafik data.
    Jeg snakker dog stadig med den nye ejer, og han er vældig tilfreds med trafikken.

    Det er absolut min overbevisning at Pandaen ikke automatisk straffer scraped content. Det er stadig muligt at lave websites som er 100% scraped, og stadig generer god trafik, så lang tid man mixer “kilder” godt op, og bruger et par små tricks.

    Derfor er konklusionen at Googles Panda endnu ikke er voksen, men stadig teenager ;-)

    med venlig hilsen
    Jonas

  • Interessant læsning! :) synes også jeg læste en artikel på searchengineland at googles nye opdatering ville slå mere ned på hjemmeside med for mange dårlige link.

Kommenter post