Duplicate Content

Was ist Duplicate Content?

Duplicate Content, oft einfach mit DC abgekürzt, bezeichnet das Vorkommen von zwei oder mehr identischen Inhalten auf der gleichen oder verschiedenen Webseiten, weswegen zwischen internem und externem DC unterschieden wird:

  • Interner DC: identische Inhalte unter der gleichen Domain (Beispiel: mehrere URLs rufen den gleichen Inhalt einer Seite ab)
  • Externer DC: identische Inhalte unter mehreren Domains (Beispiel: mehrere Domains sollen auf die gleiche Hauptseite verweisen, es wurde aber keine saubere 301-Weiterleitung gesetzt)

Hinweis: Es handelt sich nicht um identische Inhalte, wenn diese in mehreren Sprachen vorliegen oder wenn Passagen sauber über blockquote- und cite-Tags als Zitat gekennzeichnet werden.

Die Problematik

Aus Sicht von Suchmaschinen wie Google stellen doppelte Inhalte einen ein Problem dar, da Google garnicht oder nur schwer die Originalquelle ausmachen kann. Das wirkt sich natürlich negativ auf ein Ranking aus. Langfristig (wenn auch nicht immer) kann DC zu einer Abstrafung durch Google führen, Schwierigkeiten bei der Indexierung verursachen und für starke Schwankungen in den Rankings sorgen, da aus Sicht der Suchmaschinen nicht klar ist, welche von den Seiten mit gleichem Inhalt am relevantesten ist. Es dürfte sich bei DC um einen der häufigsten Gründe für Abstrafungen durch Google und Probleme bei der Platzierung handeln.

Darüber hinaus versuchen Google und Co. aber auch selbstständig zu erkennen, welche Webseite bzw. welche Inhalte die relevantesten sind und löst so das DC Problem ein Stück weit selbst. Verlassen sollten sich Webmaster darauf jedoch nie.

Tipps zum Umgang mit und zur Vermeidung von Dupliacte Content

Im folgenden präsentieren wir einige Tipps und Techniken, um DC bei den eigenen Projekten zu vermeiden:

  1. Ist ein Inhalt unter mehreren Domains verfügbar, sollte immer eine 301-Weiterleitung auf eine gemeinsame Hauptseite erfolgen
  2. Viele kostenlose (und kostenpflichte) SEO-Tools, wie beispielsweise SISTRIX Optimizer können eine Webseite auf DC untersuchen
  3. Mit dem Canoncial Tag lässt sich angeben, welche Version einer Webseite die Originalversion ist (wenn man mehrere ähnliche Seiten benötigt, etwa eine separate Druckversion).
  4. Bei der Paginierung (Einteilung von Texten mit Kopf- bzw. Fußzeilen, Seitennummern und ähnlichem) sollten die Tags rel=“next“ und rel=“prev“ genutzt werden, um DC zu vermeiden und die Beziehung zwischen Hauptseite und Paginationsseiten für Suchmaschinen kenntlich zu machen