Warum Duplicate Content dein Ranking beeinträchtigt

Viele Website-Betreiber haben schon von diesem ominösen „Duplicate Content“ gehört und dass er ganz schlecht sei, was SEO angeht. Aber was sind „doppelte Inhalte“ eigentlich genau, wie entstehen sie und vor allem: wie kann man sie vermeiden? Denn eines ist klar, für das Ranking deiner Website ist Duplicate Content tatsächlich ein Problem.

1. Was versteht man unter Duplicate Content?

Unter Duplicate Content versteht man Inhalte/Texte, die auf einer Website mehrmals unverändert oder sehr ähnlich erscheinen. Außerdem kann es verschiedene URLs auf einer Website geben, die genau den gleichen Inhalt haben. Hier spricht man von internem Duplicate Content bzw. im Fall von sehr ähnlichen Inhalten von „near duplicate content“.

Von externem Duplicate Content spricht man, wenn gleicher Text auf unterschiedlichen Websites zu finden ist. Dies ist beispielsweise der Fall, wenn Beiträge auf mehreren Plattformen erscheinen.

Für ein gutes Ranking bei Google ist die Qualität und Einzigartigkeit der Texte entscheidend, also Inhalte, die relevant für den Nutzer sind und in dieser Form nirgendwo anders vorkommen.

2. Welche Arten von Duplicate Content gibt es?

2.1. Verschiedene Versionen einer URL

Verschiedene Versionen einer URL sind für Google klassischer Duplicate Content. In der Praxis kommt das je nach Webprojekt gar nicht so selten vor, z.B.

  • Groß- und Kleinschreibung:
    meine-seite.de/seite1 und meine-seite.de/Seite1
  • Verschiedene Versionen der Startseite:
    meine-seite.de und meine-seite.de/index.php
  • Mit „Trailing Slash“ am Ende oder nicht:
    meine-seite.de/seite1 und meine-seite.de/seite1/
  • Verschiedene Protokolle:
    https://www.meine-seite.de und https://meine-seite.de
  • Unterschiedliche URLs mit gleichem Inhalt und nur wenigen Änderungen am Inhalt, z.B. bei Events:
    meine-seite.de/event-xy-2020-06 und meine-seite.de/event-xy-2020-09

2.2. URL-Parameter und Session-IDs durch Filter

Filter bei Shopsystemen produzieren häufige viele URLs mit gleichem Inhalt, z.B. durch Variationen von Farben und Größen:

  • meine-seite.de/artikel-xy-675859/variationID=6758591 und meine-seite.de/artikel-xy-675859/variationID=6758592

Das kann unterbunden werden, indem man Google mitteilt, welche Seite den Originalartikel enthält. Dazu wird der sog. „Canonical Tag“ verwendet, der auf die ursprüngliche Seite verweist. Bei Shopsystemen ist das meist integriert, aber es kann auch bei Nicht-Ecommerce-Websites vorkommen, dass hier viele zusätzliche URLs entstehen.

2.3. Boilerplate-Content

Als Boilerplate-Text (Abbinder) bezeichnet man einen gleichbleiben Textblock meist am Ende eines Texts. Dieser sollte vermieden werden, v.a. wenn er länger ist als der Haupttext der Website.

2.4. Druckversionen

Wird auf einer Seite die Möglichkeit gegeben die Seite auszudrucken, entsteht möglicherweise eine weitere URL, die außer den Bildern und der Sidebar, genau den gleichen Inhalt hat wie das Original, was ebenfalls Duplicate Content ist.

2.5. Externer Duplicate Content

Shops übernehmen oft die Herstellertexte, was ein Problem ist, da diese vielfach im Netz zu finden sind. Natürlich ist klar, dass ein Shop mit Tausenden Produkten nicht alle Texte selbst formulieren kann, zumindest nicht gleich am Anfang. Aber bei einem kleineren Shop, der gegen große Anbieter konkurrieren muss, können sich gute Produkttexte positiv auf das Ranking auswirken, ganz abgesehen davon, dass sie natürlich meist viel ansprechender für die Konsumenten sind.

Wenn Pressemitteilungen oder Fachartikel auf verschiedenen Plattformen veröffentlicht werden, ist das ebenfalls ein Fall von Duplicate Content. Soll deine eigene Seite aber ranken, empfiehlt es sich den Artikel zuerst auf deiner eigenen Website zu veröffentlichen und erst ein paar Tage später auf den weiteren Plattformen. Wichtig ist, dass Google deine Webseite zuerst erfasst. Diesen Vorgang kannst du beschleunigen, indem du in der Google Search Console, die URL-Prüfung verwendest:

Mit der URL-Prüfung in der Google Search Console die Indexierung beschleunigen

Mit der URL-Prüfung in der Google Search Console kann die Indexierung einer URL beschleunigt werden.

 

Hier im Blog findest du noch mehr Tipps zur Google Search Console!

3. Welche doppelten Inhalte sind kein Problem?

3.1. Gleiche Inhalte im Footer und in der Sidebar

Dass es auf jeder Seite einen Footer und eine Sidebar mit jeweils gleichem Inhalt gibt, ist eine ganz normale Sache und auch Google kommt damit gut klar. Wichtig zu wissen ist vielleicht in dem Zusammenhang auch, dass Links, die sich im Footer und in der Sidebar befinden nicht als so relevant gesehen werden wie Links im Hauptteil einer Seite.

3.2. Übersetzte Inhalte

Wenn es auf der Website z. B. deutsche und englische Seiten mit übersetzten Inhalten gibt, ist das natürlich kein doppelter Inhalt, da es sich hier um unterschiedliche Sprachen handelt. Allerdings sollte man darauf achten, dass das hreflang-Attribut verwendet wird, bei dem Sprachen im HTML-Code spezifiziert werden. Für WordPress gibt es dazu diverse Plugins, die dieses Attribut automatisch einfügen.

4. Beeinträchtigt Duplicate Content das Ranking?

Wenn es zu viele doppelte Inhalte auf einer Website gibt, dann kann dies das Ranking negativ beeinflussen. Wenn viele Seiten den gleichen Inhalt enthalten, findet Google keine positiven Signale, wie beispielsweise die Qualität, den Mehrwert für den Nutzer oder Einzigartigkeit der Inhalte. Die doppelten Inhalte können verhindern, dass Google zügig neue und wertvolle Inhalte findet.

Ein weiteres Problem sind kopierte Inhalte, die eins zu eins auf anderen Websites erscheinen. Wenn dein Text auch auf anderen Websites veröffentlicht wird, wird es deine Seite sehr schwer haben in den Google Suchergebnissen aufzutauchen. Denn Google möchte einfach den Nutzern passend zu ihrer Suchanfrage die beste Seite anzeigen, die einen echten Mehrwert bietet und den Nutzer zufriedenstellt. Und das ist dann eben unter Umständen nicht deine eigene Seite, sondern die einer anderen Website. Also rechne erst gar nicht damit, dass deine Seite gut rankt, wenn dein eigener Content auf anderen Seiten erscheint. Das gleiche gilt natürlich auch, wenn du den Content anderer Websites auf deiner eigenen veröffentlichst.

5. Führt Duplicate Content zu einer Abstrafung der Website?

Google behauptet, dass es KEINE Abstrafung für doppelte Inhalte gibt, weil doppelte Inhalte einfach Teil des Internets sind. Allerdings können sie wie oben erwähnt das Ranking negativ beeinflussen.
Gary Illyes von Google sagte 2017 dazu auf Twitter:

“DYK Google doesn’t have a duplicate content penalty, but having many URLs serving the same content burns crawl budget and may dilute signals”

Gary IILyes, Google, 2017

 

Tweet zu Duplicate Content und die Auswirkungen auf Twitter

Google straft doppelten Content nicht ab, aber viele URLs mit dem gleichen Content verbrennen das Crawl-Budget und verwässern möglicherweise die Signale. (DYK = Did you know)

 

Google würde nur eine Website nur dann abstrafen, wenn es die Absicht des Website-Betreibers ist die Suchmaschine zu manipulieren. Das ist aber häufig nicht der Fall und der Duplicate Content entsteht eher aus Unwissenheit.

6. Was ist mit Duplicate Content auf Blogseiten?

Blogsysteme wie WordPress generieren auf Kategorie- und Schlagwort/Tag-Seiten Teasertexte/Anreissertexte. Jede Kategorie und jeder Tag bildet einzelne URLs. Wenn also ein Artikel mehreren Kategorien und mehreren Tags zugeordnet wird, entstehen möglicherweise viele URLs auf denen der Teasertext steht. So kommt der Text mehrfach auf der Website vor. Damit hat Google kein Problem, das ist kein Duplicate Content.

Das Problem ist hier, das möglicherweise unter jeder URL nur ein einziger Artikel steht. Eine solche Seite würde Google dann als wenig relevant beurteilen und als „Thin Content“ bezeichnen, also als dünnen Inhalt, der dem Nutzer keinen Mehrwert bietet.

Wenn es zu viele solcher Seiten auf einer Website gibt, weil es X Kategorien und Tags gibt, wird die Website möglicherweise nicht gut gerankt. Deshalb werden z.B. in WordPress Tag-Seiten meistens vom Index ausgeschlossen. In WordPress geht das mit Hilfe von SEO-Plugins wie dem von Yoast. Siehe auch hierzu den Artikel über WordPress SEO mit Yoast.

7. Ist Textspinning sinnvoll?

Wenn du gleiche Inhalte hast, die auf mehreren Websites erscheinen sollen, ist das sog. Spinning von Texten, also das leichte Anpassen von Originalartikeln keine Lösung. Denn das meist automatisierte Verändern von Texten durch Ersetzen von winzigen Textpassagen, Füllwörtern oder Verwendung von Synonymen, sind für Google trotzdem doppelter Inhalt und die entsprechende Seite wird nicht gut in den Suchergebnissen erscheinen. Google bezeichnet diese Vorgehensweise sogar als kontraproduktiv.

8. Wie prüft man, ob Duplicate Content vorhanden ist?

In der Google Search Console findet man eine Übersicht über Seiten, die sich im Index befinden. Mit Hilfe einer XML-Sitemap kannst du Google genau mitteilen, welche Seiten im Index landen sollen und welche nicht. So sparst du Crawling-Budget und Google kann die wichtigen Seiten besser herausfinden.

Mit einem Tool wie Copyscape lässt sich feststellen, ob Duplicate Content auf der Website vorhanden ist.

9. Was sollte man beachten, um Duplicate Content zu vermeiden?

Die beste Option, um ein gutes Ranking zu erreichen, ist es natürlich doppelte Inhalte zu vermeiden und einzigartige Texte speziell für die eigene Website zu schreiben. Google möchte informative und qualitativ hochwertige Inhalte sehen und belohnt diese mit einem besseren Ranking. Der Qualitätsstandard, den Google hier ansetzt, hat sich in den letzten Jahren ständig erhöht.

Einige Maßnahmen, die du ergreifen kannst, um doppelte oder dünne Inhalte zu vermeiden, sind beispielsweise:

  • Kategorien und Tag-Seiten vom Index ausschließen, v.a. wenn du sehr viele davon hast, aber zu jeder Kategorie und jedem Tag gar nicht so viele Artikel vorhanden sind
  • Seiten, die keinen Mehrwert enthalten auf <noindex> setzen oder in der robots.txt ausschließen (bitte nicht beide Methoden anwenden, sondern nur eine auswählen)
  • Bei Produktseiten mit mehreren Variationen darauf achten, dass der Canonical-Tag auf die Originalseite gesetzt wurde
  • Darauf achten, dass das Content Management-System nicht mehrere Versionen einer URL ausgibt
  • Druckversionen der Website entweder ganz vermeiden oder ebenfalls auf noindex setzen bzw. in der robots.txt ausschließen (oder erst gar keine Druckversion anbieten ?).
  • Sehr ähnliche Inhalte auf der Website vermeiden und konsolidieren

Fazit

Was SEO angeht, ist Duplicate Content ein Problem, auch wenn es keine Abstrafung der Website gibt. Aber es fehlt Google an positiven Signalen, wenn es wenig einzigartigen Content gibt, der für die Konsumenten einen Mehrwert haben könnte. Aufgrund des Fehlens dieser Signale hat deine Website nicht so viele Chancen gut zu ranken. Auch kopierte Inhalte in jeglicher Form sind für eine nachhaltige SEO-Strategie keine Option. Es ist wichtig, den Duplicate oder Near Duplicate Content loszuwerden oder zumindest zu reduzieren.