Duplicate Content: Wirklich so schlimm für’s SEO wie alle sagen?
von Timo Schnalzger| 01.10.2021 | SEO WIKI
Wenn bekannte Politiker zu häufig die Copy & Paste-Funktion benutzen, nennt man das Doktorarbeit, wenn Du das auf Deiner Website tust, nennt man es Duplicate Content. Davon hast Du vielleicht schon einmal gehört. Doch was versteht man unter Duplicate Content genau? Ist er wirklich immer schlecht? Wie entsteht Duplicate Content und wie helfen Duplicate Content Checker ihn zu finden? Antworten darauf und auf viele weitere Fragen findest Du in diesem Artikel. Außerdem stellen wir Dir zwei kostenlose Duplicate Content Finder vor und erklären ihre Besonderheiten.
Was ist Duplicate Content?
Unter Duplicate Content, kurz DC genannt, versteht man exakt identische oder sehr ähnliche Inhalte auf zwei oder mehr Websites. Dabei können Seiten derselben Domain betroffen sein, es kann sich aber auch um verschiedene Domains handeln. Duplicate Content ist vor allem deshalb bekannt, weil er in dem Ruf steht, absolut verheerend für das Google-Ranking der betreffenden Seiten zu sein. Das ist so aber nicht richtig.
Bestraft Google die Verwendung von Duplicate Content?
Nein, oder zumindest nicht direkt. Die auch heute noch weit verbreitete Annahme, Google werte jeden Duplicate Content als Spam, der nur dazu diene, die Suchmaschine zu manipulieren und möglichst weit oben zu ranken und strafe ihn gnadenlos ab, ist falsch. Auch bei Google weiß man, dass sich Duplicate Content nicht immer vermeiden lässt, manchmal sogar notwendig ist und hat entsprechend reagiert. Google selbst sagt dazu, Duplicate Content werde nicht mehr aktiv bestraft, außer „in den seltenen Fällen, in denen wir annehmen müssen, dass duplizierte Inhalte das Ranking manipulieren oder unsere Nutzer täuschen sollen“. Nur dann nehme man „entsprechenden Korrekturen an Index und Ranking der betreffenden Websites vor. Infolgedessen werden diese Websites unter Umständen in den Suchergebnissen niedriger eingestuft oder sogar aus dem Google-Index entfernt und damit nicht mehr in den Suchergebnissen angezeigt.“
Google straft DC heute also keineswegs mehr automatisch ab. Dennoch ergeben sich aus Duplicate Content Probleme, die sich negativ auf Dein Ranking auswirken können.
Jetzt mit Online Marketing durchstarten
Nutze Online Marketing um Deine Zielgruppen zu erreichen und mit Deinem Unternehmen zu wachsen.
Warum ist Duplicate Content ein Problem?
Google ist bestrebt, seinen Usern möglichst schnell das gewünschte Suchergebnis zu präsentieren. Dabei hat Google das Problem, dass die Suchmaschine die Suchintention seiner Nutzer nicht genau kennen kann. Wenn Du beispielsweise nach „Pizza“ suchst, weiß Google nicht, ob Du eine Pizza bestellen, selber backen oder Dich über den Erfinder informieren möchtest. Google versucht dieses Problem zu lösen, indem möglichst unterschiedliche Ergebnisse gerankt werden. In unserem Beispiel Lieferservices, Rezepte und Wiki-Artikel. Google ist also immer bestrebt, seinen Usern möglichst unterschiedliche Inhalte anzuzeigen, damit jeder Nutzer möglichst schnell genau das findet, was für ihn relevant ist. Ähnliche oder gleiche Inhalte helfen dabei nicht weiter und werden dementsprechend nicht gerankt.
Unique Content
Unique Content bezeichnet Inhalte, die es nur einmal gibt, also quasi das Gegenteil doppelter Inhalte. Unique Content ist für Google das, was für den Goldwäscher das Nugget ist. Ein einmaliger Inhalt ist besonders wertvoll, da er ein Suchergebnis darstellt, welches sich von allen andern unterscheidet und somit vielleicht genau der Suchintention eines Users entspricht. Darum ist Google bemüht, möglichst viele einzigartige Inhalte zu indexieren. Ähnlich wie ein großes Kaufhaus, das viele Waren vorhält, damit alle Kunden fündig werden.
Damit hast Du eigentlich schon den besten Tipp, um doppelte Inhalte zu vermeiden. Kopiere nicht einfach Texte von einer URL auf die andere, sondern erschaffe für jede Seite neuen, einzigartigen Content, der Deinen Usern echten Mehrwert bietet. So werden Deine Seiten auch für Google einzigartig und wertvoll. Doch leider ist es nicht immer so einfach, manchmal lässt sich Duplicate Content nicht vermeiden. Dabei gibt es verschieden Arten von DC.
Welche Arten von Duplicate Content gibt es?
Duplicate Content kann auf verschiedene Arten entstehen. Je nach Ursache unterscheidet man inhaltlichen und technischen Duplicate Content. Inhaltlicher DC meint schlichtweg den gleichen Text an verschiedenen Orten, wohingegen technischer DC etwas komplizierter ist. Mehr dazu später. Häufig gebraucht man auch ist die Unterscheidung zwischen internem und externem Duplicate Content. Bei ersterem handelt es sich um doppelte Inhalte auf einer Website, bei letzterem ist der DC website-übergreifend.
Interner Duplicate Content
Wenn interner Duplicate Content entsteht, hat das meist technische Ursachen, weswegen sich doppelte Inhalte auch durch noch so fleißiges Texten nicht vermeiden lassen. Das Gute daran ist jedoch, dass sie die Probleme die technischer DC verursacht auch technisch recht einfach lösen lassen.
Unterschiedliche Artikel mit der selben Beschreibung
Dieses Problem betrifft vor allem Onlineshops. Häufig werden dort Artikel angeboten, die sich nur in Nuancen voneinander unterscheiden. Ein gutes Beispiel ist ein Kleidungsstück, von dem es nicht nur mehrere Größen, sondern auch mehrere Farben gibt. In diesem Fall lässt sich Duplicate Content nicht vermeiden. Ganz im Gegenteil: Es wäre für Deine Kunden sogar äußerst verwirrend, wenn Du beim selben T-Shirt für jede Größe eine andere Produktbeschreibung hättest.
Zum Glück gibt es für dieses Problem eine einfache Lösung. Du fasst einfach alle Seiten zu den unterschiedlichen Produktvarianten als Kindartikel unter einem Vaterartikel zusammen. Wenn Du sehr viele Produkte anbietest, reicht diese Methode allerdings nicht aus. In so einem Fall ist es klüger, wenn Du die Kindartikel zusätzlich mit Canonical URLs kennzeichnest. Mit Canonical Tags reduzierst Du die Zahl der Seiten, die Google bei einer entsprechenden Suchanfrage indexiert. Damit machst Du es für den Suchenden übersichtlicher und stellst sicher, dass der Vaterartikel als erstes Suchergebnis für Deine Seite rankt.
// Du willst Dein Wissen vertiefen?
Blog
Alles rund ums Online Marketing.
SEO WIKI
Unser Online Marketing Glossar.
Podcast
Online Marketing Podcast
Deine Website gibt es in verschiedenen Sprachen
Inhaltlich identische Texte in verschiedenen Sprachen werden von Google nicht als Duplicate Content betrachtet. Ein Problem kann es jedoch geben, wenn Deine verschiedene Sprachversionen Deiner Website auf einem Suchmaschinenmarkt rankten, das bedeutet, dass Deine Website für ein bestimmtes Keyword bei Google Deutschland sowohl mit ihrer deutschsprachigen als auch mit ihrer französischen Version rankt.
Auch dieses Problem lässt sich zum Glück recht einfach lösen. Durch das Link-Attribut „hreflang“ machst Du Google klar, dass es sich um verschiedene Sprachversionen des selben Inhalts handelt und für Sprecher welcher Sprache welche Seite gedacht ist. Zur Erstellung dieser Attribute kannst Du spezielle Generatoren nutzen. Alternativ kannst Du auch darüber nachdenken, ob Du Deine fremdsprachigen Inhalte nicht lieber auf einer separaten Domain präsentierst, die in dem entsprechenden Land registriert ist. Das verbessert in der Regel auch Dein Ranking bei einer Suchanfrage aus dem jeweiligen Land.
Hau Dir was auf die Ohren!
Lerne wie Du digitale Stratgien für Dich und Dein Unternehmen erfolgreich einsetzt. Hole Dir jede Menge Input für Deine Projekte im Online Marketing.
Du hast mehrere Domains
Mehrere Domains können also durchaus vorteilhaft sein, etwa wenn User zu falschen Schreibweisen Deiner Domain tendieren. Mit mehreren Domains bleibst Du für sie dennoch erreichbar. Doch sie bergen auch Tücken. Das gilt vor allem dann, wenn Du keine 301 Weiterleitung eingerichtet hast, die auf die richtige Domain verweist. Das zu unterlassen erzeugt nämlich wieder Duplicate Content.
Alles wichtige über die Bedeutung der 301-Weiterleitung und wie Du sie nutzt, erfährst Du in unserem Wiki-Artikel.
Mehrere Versionen in unterschiedlichen Dateiformaten
Du bietest Deinen Kunden die Informationen von Deiner Website auch zum Download als PDF an. Das ist gut, denn es ist ein echter Mehrwert für Deine User. Datenblätter, Checklisten, Rezepte und Co. als PDFs sind ein klassisches Beispiel für guten und nützlich Duplicate Content. Doch sie sind eben auch doppelte Inhalte. Außerdem weiß Google nicht, welche Seite zuerst gerankt werden soll und wählt im schlimmsten Fall eine andere aus als die, die Du möchtest.
Auch hier erweist sich der Canonical-Tag als hilfreiches Instrument, um DC zu kennzeichnen und auf die richtige Version zu verweisen. Zusätzlich kannst Du mit dem Tag noindex gleich dafür sorgen, dass Deine PDFs erst gar nicht in den Suchergebnissen auftauchen. So ist sichergestellt, dass User bei Dir immer auf der richtigen Seite landen.
Externer Duplicate Content
Dieser entsteht, wenn eine Website Inhalte einer andern Seite kopiert. Dabei ist es völlig irrelevant, ob es sich um ein illegales Plagiat handelt, ob Du Inhalte aus einer gemeinfreien Quelle wie zum Beispiel der Wikipedia übernimmst oder ob Du Produktbeschreibungen von der Seite eines Herstellers, mit dessen ausdrücklicher Erlaubnis, für Deinen Shop kopierst. Google wertet die Inhalte in allen Fällen als DC. Du wirst dafür zwar nicht abgestraft, doch wirst Du in der Regel hinter der Originalseite ranken, da Alter der URL und Autorität wichtige Rankingfaktoren sind.
Die Vermeidung von externem DC auf Deiner Website ist einfach: Schreib nicht ab. Wenn Du eine Produktbeschreibung von einem Deiner Lieferanten erhältst, schreib sie in eigenen Worten um; mach Zitate aus der Wikipedia oder anderen Quellen als solche kenntlich. Wenn Du hingegen feststellst, dass jemand von Dir abgeschrieben hat, wird es schwieriger. Dann bleibt oft nur noch der Rechtsweg.
Wie kann ich Duplicate Content erkennen?
Okay, jetzt weißt Du schon viel über Duplicate Content und was Du gegen ihn tun kannst. Doch wie findest Du überhaupt heraus, dass sich auf Deiner Website Duplicate Content befindet? Zum Glück gibt es dafür sehr nützliche Tools, die Duplicate Content Checker.
Duplicate Content Checker
Ein Duplicate Content Checker, auch Duplikate Content Finder genannt, ist ein Programm, dass Websites auf doppelte Inhalte überprüfen kann. Was genau ein Duplicate Content Checker macht, ist jedoch von Programm zu Programm unterschiedlich. Der größte Unterschied liegt darin, wo bzw. nach welcher Art von Duplicate Content das jeweilige Programm sucht. Es gibt sowohl Duplicate Content Finder für internen als auch für externen Duplicate Content.
Duplicate Content Checker für Deine Website
Möchtest Du Deine Website auf doppelte Inhalte untersuchen lassen, so hast Du die Wahl zwischen einer Vielzahl von Apps. Am bekanntesten ist vielleicht der kostenlose Siteliner (früher unter dem Namen Copyscape erreichbar). Das Tool funktioniert denkbar einfach: Es checkt die ihm gegebene URL auf Duplicate Content und zeigt Dir diesen gegeben Falls an. Das geht in der kostenlosen Version mit bis zu 250 Seiten pro Monat, der kostenpflichtige Siteliner Premium checkt bis zu 25.000 Sites.
Duplicate Content Checker für externen Duplicate Content
Diese Programme versuchen nicht, doppelte Inhalte auf Deiner eigenen Website zu finden, sondern sie suchen danach auf andern Domains. Man könnte auch sagen, sie dienen der Suche nach Plagiaten. Das ist vor allem dann interessant, wenn Du den Verdacht hast, das andere Seiten mit Texten, die sie von Dir kopiert haben könnten, besser ranken als Du selbst. Natürlich ist kein Content Checker in der Lage, alle URLs der Welt zu crawlen. Daher beschränken sich die meisten Programme auf die Seiten die bei Google indexiert werden.
Mit Articlechecker.com steht auch zu diesem Zweck eine kostenlose Anwendung zur Verfügung (die aber auch in der Lage ist, internen DC aufzuspüren). Sie kann Textbausteine oder ganze Artikel auf anderen Seiten aufspüren. Allerdings hat das Programm in Tests gewisse Schwächen gezeigt. Articlechecker.com war dabei nicht immer in der Lage, die plagiierten Artikel zuverlässig zu erkennen.
Zusammenfassung: Duplicate Content
Duplicate Content ist bei weitem kein so bedeutender Parameter für das Ranking einer Website im Index der Suchmaschinen, wie die meisten Menschen denken. Google ist sich der Sinnhaftigkeit, die Duplicate Content in vielen Fällen hat, bewusst und möchte ihn darum nicht pauschal abstrafen. Problematisch ist vielmehr, dass doppelte Inhalt Google verwirren, da die Suchmaschine nicht erkennen kann, welcher Inhalt als Original die beste Indexierung verdient. Diese Probleme lassen sich jedoch meist mit einfachen technischen Mitteln umgehen. Für alle anderen Fälle ist die Erschaffung einzigartigen Contents noch immer der beste Schutz vor doppelten Inhalten.
Timo Schnalzger
SEO//Content Marketing
Timo war schon in der Schule begeistert von der Literatur. Auf der Suche nach einem Studiengang geriet er an die Germanistik. Dort entdeckte er seine Liebe zum detaillierten Arbeiten an und mit Texten. Erste Gehversuche mit kreativem Schreiben unternahm er in seiner Zeit als Mitglied der studentischen Fachschaft. Jetzt kombiniert er alle diese Interessen und Fähigkeiten bei H&W.
Hier findest Du weitere Inhalte