Ranking-Faktoren
03.09.2015, 13:12 Uhr
Duplicate Content erkennen und vermeiden
Inhalt, der an verschiedenen Stellen auftaucht, wird von Google nicht gern gesehen - einige Tipps wie sich Duplicate Content erkennen und vermeiden lässt.
(Quelle: shutterstock.com/blan-k)
von Stephan Sigloch
Unter vielen SEO-Experten gilt Duplicate Content als Schreckgespenst, denn Google straft aufgeblähte oder kopierte Inhalte im Ranking ab. Von Duplicate Content (= doppelter Inhalt), Near Duplicate Content oder abgekürzt "DC" wird gesprochen, wenn verschiedene Seiten einer Website oder eines Shops gleiche oder sehr ähnliche Texte und Elemente enthalten.
Wie stark Duplicate Content tatsächlich das SEO-Ranking beeinträchtigt, ist umstritten. Klar ist jedoch: DC kann dem Google-Crawler das richtige Indexieren der eigenen Seite erschweren - und das gilt es zu vermeiden.
Doppelte Inhalte können auch bei normalen Corporate Websites auftreten, stellen jedoch bei Online-Shops in höherem Masse ein Problem dar. Folgende Unterscheidungen werden vorgenommen:
- Interner Duplicate Content - identische oder ähnliche Inhalt können innerhalb einer einzelnen Domain aufgerufen werden.
- Externer Duplicate Content - identische oder ähnliche Inhalte sind auf verschiedenen Domains zu finden.
- Externer Duplicate Content - identische oder ähnliche Inhalte sind auf verschiedenen Domains zu finden.
Meist wird dieses Thema im Rahmen von Suchmaschinenoptimierung (SEO) betrachtet, da Duplicate Content häufig eine direkte (negative) Auswirkung auf das Ranking der Seite hat.
Weshalb kann Duplicate Content schädlich sein?
Suchmaschinen - allen voran Google - bevorzugen einzigartigen und qualitativ hochwertigen Content. An erster Stelle steht hier der User mit seiner Erwartung, die bestmöglichen, passenden Suchergebnisse zu seiner Anfrage zu erhalten. Um diesem Anspruch gerecht zu werden, analysiert, bewertet und indexiert Google tagtäglich Millionen von Webseiten.
Wenn es nun mehrere Seiten mit demselben oder einem beinahe identischen Inhalt gibt, dann kann nicht mehr ermittelt werden, welche dieser Seiten die höchste Relevanz besitzt - die Seiten müssen sich somit die Relevanz teilen und verlieren im Ranking der Suchtreffer an Bedeutung. Je mehr Seiten von Duplicate Content betroffen sind, desto schlechter wird meist das Ranking. Duplizierungen, die notwendig sind (etwa sich wiederholende rechtliche Angaben), wirken sich jedoch nicht negativ aus.
Man sollte im Idealfall der Erste sein, der Content publiziert, denn der Veröffentlichungshistorie kommt ein wichtiger Stellenwert zu: Suchmaschinen analysieren, wer als Erster einen Content publiziert hat oder eben, wo er auf der eigenen Plattform publiziert wurde.
Für jede Webseite ist festgelegt, wie viel Zeit die Suchmaschine dort verbringen wird, um einzelne Unterseiten in den Index aufzunehmen. Dies ist das sogenannte Crawl Budget. Ist nun aber auf bestimmten Unterseiten eines Webauftritts häufig Duplicate Content zu finden, kann es passieren, dass Google einen grossen Teil der anberaumten Zeit damit verbringt, diese doppelten Seiten zu überprüfen.
Das Crawl Budget kann also aufgebraucht sein, obwohl die Suchmaschine einige wichtige Seiten noch gar nicht besucht hat. So kann es passieren, dass einzelne Seiten nicht mit in den Index aufgenommen werden. Durch Duplicate Content werden also möglicherweise wichtige Ranking-Potenziale verschenkt, da die Seiten in Konkurrenz zueinander stehen und sich somit gegenseitig schwächen.