Warum Duplicate Content dein Ranking beeinträchtigt
Viele Website-Betreiber haben schon von diesem ominösen „Duplicate Content“ gehört und dass er ganz schlecht sei, was SEO angeht. Aber was sind „doppelte Inhalte“ eigentlich genau, wie entstehen sie und vor allem: wie kann man sie vermeiden? Denn eines ist klar, für das Ranking deiner Website ist Duplicate Content tatsächlich ein Problem.
1. Was versteht man unter Duplicate Content?
Unter Duplicate Content versteht man Inhalte/Texte, die auf einer Website mehrmals unverändert oder sehr ähnlich erscheinen. Außerdem kann es verschiedene URLs auf einer Website geben, die genau den gleichen Inhalt haben. Hier spricht man von internem Duplicate Content bzw. im Fall von sehr ähnlichen Inhalten von „near duplicate content“.
Von externem Duplicate Content spricht man, wenn gleicher Text auf unterschiedlichen Websites zu finden ist. Dies ist beispielsweise der Fall, wenn Beiträge auf mehreren Plattformen erscheinen.
Für ein gutes Ranking bei Google ist die Qualität und Einzigartigkeit der Texte entscheidend, also Inhalte, die relevant für den Nutzer sind und in dieser Form nirgendwo anders vorkommen.
2. Welche Arten von Duplicate Content gibt es?
2.1. Verschiedene Versionen einer URL
Verschiedene Versionen einer URL sind für Google klassischer Duplicate Content. In der Praxis kommt das je nach Webprojekt gar nicht so selten vor, z.B.
- Groß- und Kleinschreibung:
meine-seite.de/seite1 und meine-seite.de/Seite1 - Verschiedene Versionen der Startseite:
meine-seite.de und meine-seite.de/index.php - Mit „Trailing Slash“ am Ende oder nicht:
meine-seite.de/seite1 und meine-seite.de/seite1/ - Verschiedene Protokolle:
https://www.meine-seite.de und https://meine-seite.de - Unterschiedliche URLs mit gleichem Inhalt und nur wenigen Änderungen am Inhalt, z.B. bei Events:
meine-seite.de/event-xy-2020-06 und meine-seite.de/event-xy-2020-09
2.2. URL-Parameter und Session-IDs durch Filter
Filter bei Shopsystemen produzieren häufige viele URLs mit gleichem Inhalt, z.B. durch Variationen von Farben und Größen:
- meine-seite.de/artikel-xy-675859/variationID=6758591 und meine-seite.de/artikel-xy-675859/variationID=6758592
Das kann unterbunden werden, indem man Google mitteilt, welche Seite den Originalartikel enthält. Dazu wird der sog. „Canonical Tag“ verwendet, der auf die ursprüngliche Seite verweist. Bei Shopsystemen ist das meist integriert, aber es kann auch bei Nicht-Ecommerce-Websites vorkommen, dass hier viele zusätzliche URLs entstehen.
2.3. Boilerplate-Content
Als Boilerplate-Text (Abbinder) bezeichnet man einen gleichbleiben Textblock meist am Ende eines Texts. Dieser sollte vermieden werden, v.a. wenn er länger ist als der Haupttext der Website.
2.4. Druckversionen
Wird auf einer Seite die Möglichkeit gegeben die Seite auszudrucken, entsteht möglicherweise eine weitere URL, die außer den Bildern und der Sidebar, genau den gleichen Inhalt hat wie das Original, was ebenfalls Duplicate Content ist.
2.5. Externer Duplicate Content
Shops übernehmen oft die Herstellertexte, was ein Problem ist, da diese vielfach im Netz zu finden sind. Natürlich ist klar, dass ein Shop mit Tausenden Produkten nicht alle Texte selbst formulieren kann, zumindest nicht gleich am Anfang. Aber bei einem kleineren Shop, der gegen große Anbieter konkurrieren muss, können sich gute Produkttexte positiv auf das Ranking auswirken, ganz abgesehen davon, dass sie natürlich meist viel ansprechender für die Konsumenten sind.
Wenn Pressemitteilungen oder Fachartikel auf verschiedenen Plattformen veröffentlicht werden, ist das ebenfalls ein Fall von Duplicate Content. Soll deine eigene Seite aber ranken, empfiehlt es sich den Artikel zuerst auf deiner eigenen Website zu veröffentlichen und erst ein paar Tage später auf den weiteren Plattformen. Wichtig ist, dass Google deine Webseite zuerst erfasst. Diesen Vorgang kannst du beschleunigen, indem du in der Google Search Console, die URL-Prüfung verwendest:
Hier im Blog findest du noch mehr Tipps zur Google Search Console!
3. Welche doppelten Inhalte sind kein Problem?
Dass es auf jeder Seite einen Footer und eine Sidebar mit jeweils gleichem Inhalt gibt, ist eine ganz normale Sache und auch Google kommt damit gut klar. Wichtig zu wissen ist vielleicht in dem Zusammenhang auch, dass Links, die sich im Footer und in der Sidebar befinden nicht als so relevant gesehen werden wie Links im Hauptteil einer Seite.
3.2. Übersetzte Inhalte
Wenn es auf der Website z. B. deutsche und englische Seiten mit übersetzten Inhalten gibt, ist das natürlich kein doppelter Inhalt, da es sich hier um unterschiedliche Sprachen handelt. Allerdings sollte man darauf achten, dass das hreflang-Attribut verwendet wird, bei dem Sprachen im HTML-Code spezifiziert werden. Für WordPress gibt es dazu diverse Plugins, die dieses Attribut automatisch einfügen.
4. Beeinträchtigt Duplicate Content das Ranking?
Wenn es zu viele doppelte Inhalte auf einer Website gibt, dann kann dies das Ranking negativ beeinflussen. Wenn viele Seiten den gleichen Inhalt enthalten, findet Google keine positiven Signale, wie beispielsweise die Qualität, den Mehrwert für den Nutzer oder Einzigartigkeit der Inhalte. Die doppelten Inhalte können verhindern, dass Google zügig neue und wertvolle Inhalte findet.
Ein weiteres Problem sind kopierte Inhalte, die eins zu eins auf anderen Websites erscheinen. Wenn dein Text auch auf anderen Websites veröffentlicht wird, wird es deine Seite sehr schwer haben in den Google Suchergebnissen aufzutauchen. Denn Google möchte einfach den Nutzern passend zu ihrer Suchanfrage die beste Seite anzeigen, die einen echten Mehrwert bietet und den Nutzer zufriedenstellt. Und das ist dann eben unter Umständen nicht deine eigene Seite, sondern die einer anderen Website. Also rechne erst gar nicht damit, dass deine Seite gut rankt, wenn dein eigener Content auf anderen Seiten erscheint. Das gleiche gilt natürlich auch, wenn du den Content anderer Websites auf deiner eigenen veröffentlichst.
5. Führt Duplicate Content zu einer Abstrafung der Website?
Google behauptet, dass es KEINE Abstrafung für doppelte Inhalte gibt, weil doppelte Inhalte einfach Teil des Internets sind. Allerdings können sie wie oben erwähnt das Ranking negativ beeinflussen.
Gary Illyes von Google sagte 2017 dazu auf Twitter:
“DYK Google doesn’t have a duplicate content penalty, but having many URLs serving the same content burns crawl budget and may dilute signals”
Gary IILyes, Google, 2017
Google würde nur eine Website nur dann abstrafen, wenn es die Absicht des Website-Betreibers ist die Suchmaschine zu manipulieren. Das ist aber häufig nicht der Fall und der Duplicate Content entsteht eher aus Unwissenheit.
6. Was ist mit Duplicate Content auf Blogseiten?
Blogsysteme wie WordPress generieren auf Kategorie- und Schlagwort/Tag-Seiten Teasertexte/Anreissertexte. Jede Kategorie und jeder Tag bildet einzelne URLs. Wenn also ein Artikel mehreren Kategorien und mehreren Tags zugeordnet wird, entstehen möglicherweise viele URLs auf denen der Teasertext steht. So kommt der Text mehrfach auf der Website vor. Damit hat Google kein Problem, das ist kein Duplicate Content.
Das Problem ist hier, das möglicherweise unter jeder URL nur ein einziger Artikel steht. Eine solche Seite würde Google dann als wenig relevant beurteilen und als „Thin Content“ bezeichnen, also als dünnen Inhalt, der dem Nutzer keinen Mehrwert bietet.
Wenn es zu viele solcher Seiten auf einer Website gibt, weil es X Kategorien und Tags gibt, wird die Website möglicherweise nicht gut gerankt. Deshalb werden z.B. in WordPress Tag-Seiten meistens vom Index ausgeschlossen. In WordPress geht das mit Hilfe von SEO-Plugins wie dem von Yoast. Siehe auch hierzu den Artikel über WordPress SEO mit Yoast.
7. Ist Textspinning sinnvoll?
Wenn du gleiche Inhalte hast, die auf mehreren Websites erscheinen sollen, ist das sog. Spinning von Texten, also das leichte Anpassen von Originalartikeln keine Lösung. Denn das meist automatisierte Verändern von Texten durch Ersetzen von winzigen Textpassagen, Füllwörtern oder Verwendung von Synonymen, sind für Google trotzdem doppelter Inhalt und die entsprechende Seite wird nicht gut in den Suchergebnissen erscheinen. Google bezeichnet diese Vorgehensweise sogar als kontraproduktiv.
8. Wie prüft man, ob Duplicate Content vorhanden ist?
In der Google Search Console findet man eine Übersicht über Seiten, die sich im Index befinden. Mit Hilfe einer XML-Sitemap kannst du Google genau mitteilen, welche Seiten im Index landen sollen und welche nicht. So sparst du Crawling-Budget und Google kann die wichtigen Seiten besser herausfinden.
Mit einem Tool wie Copyscape lässt sich feststellen, ob Duplicate Content auf der Website vorhanden ist.
9. Was sollte man beachten, um Duplicate Content zu vermeiden?
Die beste Option, um ein gutes Ranking zu erreichen, ist es natürlich doppelte Inhalte zu vermeiden und einzigartige Texte speziell für die eigene Website zu schreiben. Google möchte informative und qualitativ hochwertige Inhalte sehen und belohnt diese mit einem besseren Ranking. Der Qualitätsstandard, den Google hier ansetzt, hat sich in den letzten Jahren ständig erhöht.
Einige Maßnahmen, die du ergreifen kannst, um doppelte oder dünne Inhalte zu vermeiden, sind beispielsweise:
- Kategorien und Tag-Seiten vom Index ausschließen, v.a. wenn du sehr viele davon hast, aber zu jeder Kategorie und jedem Tag gar nicht so viele Artikel vorhanden sind
- Seiten, die keinen Mehrwert enthalten auf <noindex> setzen oder in der robots.txt ausschließen (bitte nicht beide Methoden anwenden, sondern nur eine auswählen)
- Bei Produktseiten mit mehreren Variationen darauf achten, dass der Canonical-Tag auf die Originalseite gesetzt wurde
- Darauf achten, dass das Content Management-System nicht mehrere Versionen einer URL ausgibt
- Druckversionen der Website entweder ganz vermeiden oder ebenfalls auf noindex setzen bzw. in der robots.txt ausschließen (oder erst gar keine Druckversion anbieten ?).
- Sehr ähnliche Inhalte auf der Website vermeiden und konsolidieren
Fazit
Was SEO angeht, ist Duplicate Content ein Problem, auch wenn es keine Abstrafung der Website gibt. Aber es fehlt Google an positiven Signalen, wenn es wenig einzigartigen Content gibt, der für die Konsumenten einen Mehrwert haben könnte. Aufgrund des Fehlens dieser Signale hat deine Website nicht so viele Chancen gut zu ranken. Auch kopierte Inhalte in jeglicher Form sind für eine nachhaltige SEO-Strategie keine Option. Es ist wichtig, den Duplicate oder Near Duplicate Content loszuwerden oder zumindest zu reduzieren.
Liebe Cathrin,
danke für den guten Text, den ich via Google gefunden habe. 🙂
Nun habe ich eine Frage: Wie sieht es aus, wenn ich auf der Website einen Text in mehreren Navigationspunkten 1:1 übernehme und nur ein Wort austausche?
Sagen wir mal (um ein fiktives Beispiel zu nehmen) „Zähne putzen Männer“ und „Zähne putzen Frauen“. Der Text ist derselbe, nur einmal geht es um „Männer“, das andere Mal um „Frauen“. Ausgetauscht wird nur ein Wort, auf das auch optimiert wird.
Würde das als interner Duplicate Content gewertet und abgestraft werden?
Mit Dank und herzlichen Grüßen
Huberta
Liebe Huberta,
zunächst einmal straft Google Duplicate Content nicht wirklich ab, sondern sie suchen sich dann die Seite aus, die am besten zum Search Intent passt. Wenn man es von Nutzerseite aus betrachtet, muss man überlegen, ob man entweder für jede Suchanfrage einen eigenen Text hat oder einen ganzheitlichen Text. Um Dein Beispiel zu nehmen „Zähne putzen Männer“ hat einen wirklich unterschiedlichen Text als der für Frauen. Dann sind die zwei Seiten auch gerechtfertigt. Nachdem Seiten für viele Suchanfragen ranken können, würde ich sehr überlegen, ob ich wirklich mehrere Seiten benötige oder ob nicht alles in einen Text kann.
Der Verweis, also der Link in den Navigationspunkten, ist eine „logische Struktur“ für den Nutzer. Die Crawler gehen aber nach der internen Verlinkung von der Startseite aus. Du könntest also einen Text rein theoretisch in verschiedenen Menüpunkten aufhängen. Wenn der Text aus bestimmten Gründen tatsächlich mehrmals vorkommen musst, kannst Du mit dem „canonical tag“ Google sagen, dass dieser eine Text das Original ist. Aber eben immer überlegen, was bedient die Suchabsicht am besten.
Ich hoffe das hilft jetzt erst mal.
Viele Grüße,
Cathrin