Der große Duplicate Content Check: Teil 1

Duplicate Content ist nach wie vor einer der häufigsten und schädlichsten SEO-Fehler, den Website-Betreiber unbewusst verursachen können. Denn: Duplicate Content ist ein wichtiger Faktor für domainweite Abstrafungen im Zuge von Panda-Updates des Google-Algorithmus‘ und sorgt regelmäßig für fallende Rankings von Websites.
Dass dieser Fehler nach wie vor auf über einem Viertel der Seiten im Netz geschieht (s. Video), liegt mitunter auch daran, dass die jeweiligen Betreiber nur ungenügend über dieses Phänomen wissen. Wir möchten einen Beitrag dazu leisten, Licht ins Dunkel zu bringen, und Ihnen mit diesem dreiteiligen Artikel die wichtigsten Fakten zum Duplicate Content und praktische Maßnahmen zur Behandlung näher bringen.

Duplicate Content – Definition

Als Duplicate Content werden auf Deutsch doppelte textliche Inhaltebezeichnet. Diese ergeben sich, sobald auf mindestens zwei verschiedenen URLs identische Textabschnitte auftreten. Wessen viele sich nicht bewusst sind: Auch wenn die beiden Seitenpfade sich nur minimal unterscheiden, z.B. durch den Zusatz von „/“ oder bei URLs mit http und https, handelt es sich um zwei unterschiedliche Adressen.

Die Abgrenzung zu internem und externem Duplicate Content darf in dieser Definition nicht fehlen: Ersterer tritt innerhalb einer Website auf, z.B. wenn im Footer oder der Seitenleiste ein Beschreibungstext erscheint und dieser für jede URL gleichlautend ist. Externe doppelte Inhalte treten auf, wenn ein Textabschnitt exakt oder größtenteils identisch auf einer anderen Website wiederzufinden ist. Ein Beispiel: Wer etwa eine Website zum britischen Königshaus aufbaut und die Inhalte von Wikipedia übernimmt, hat externen Duplicate Content geschaffen.

Buckingham Palace: So könnte das Keyvisual der Beispiel-Website aussehen.
Buckinghampalace als Beispiel

Was doppelte Inhalte anrichten können

Abgesehen davon, dass die meisten doppelten Inhalte für die User wenig Wert haben, und Inhalte in den meisten Fällen urheberrechtlich geschützt sind, stellen sie eine Problematik im Bereich der Suchmaschinenoptimierung dar. Es sind im Endeffekt also vor allem die Rankings einer Website, die unter identischen Inhalten leiden, indem sie herabgestuft werden oder gar nicht erst ranken. Je nachdem, wie viel Prozent des Traffics über die Google-Suchergebnisse kommt, bedeutet das gleichzeitig einen Einbruch der Besuchszahlen.

Für internen Duplicate Content gilt, dass je nach Ausmaß die Seite entweder als Spam behandelt wird (wenn tatsächlich auf jeder Seite exakt alles identisch ist) oder aber sich die jeweiligen konkurrierenden Seiten zusammen aus den Rankings bzw. dem Index hebeln. Vorstellbar wäre für das Beispiel der royalen Website, dass noch ein kleiner Shop hinzugefügt wurde, in dem ein Imitat des britischen Königsmantels in zwei Ausführungen (rot mit Hermelin vs. blau mit Fuchs) erworben werden kann. Wenn sich die Texte auf den beiden Produktseiten nicht signifikant unterscheiden, ist zumindest für eine Version davon auszugehen, dass diese entweder gar nicht auf den ersten 100 Plätzen von Google landet oder aber zu Schwankungen der Rankings führt (mehr Infos hier). Ist das Schreiben eigener Texte nicht möglich, empfiehlt sich die Lösung, ein Produkt als Hauptprodukt zu definieren und die anderen Produkte einen Canonical zu ersterem beinhalten zu lassen. Diese und weitere Lösungsansätze werden im zweiten Teil dieses Artikels erläutert.

Im Fall von externem duplicate Content platziert eine Suchmaschine den Inhalt eher weiter oben, der „wertvoller“ für die Suchenden erscheint, oder die die Suchmaschine als Originalquelle ansieht. Signale für diese Wertigkeit sind das Alter der Inhalte, umfassender/qualitativ hochwertiger Text, Relevanz des Inhaltes für die Suchphrase und noch viele weitere Faktoren. Wenn nun zwei oder mehr Webseiten die gleichen Inhalte haben, orientieren sich die Suchmaschinen an genau diesen Signalen, um schließlich die beste und vertrauenswürdigste Seite höher für ein Keyword ranken zu lassen. Für die anderen bedeutet dies ein niedriges bis gar kein Ranking.

Das folgende Bild zeigt, wie Google mit weniger relevanten Seiten verfährt:

Google-Screenshot: Diese Zeilen erscheinen, wenn andere Suchergebnisse als weniger relevant identifiziert werden.
Screenshot "Ergebnis übersprungen" bei Google

Fazit zum ersten Teil des Duplicate Content Checks

Die vorigen Zeilen haben gezeigt, dass Duplicate Content nach wie vor ein großes SEO-Problem für die meisten Websites ist. Oft werden gute Rankings so unbewusst verhindert und der gewünschte Traffic bleibt aus.

Der zweite Teil dieser Artikelreihe thematisiert noch etwas tiefer, ab wann Duplicate Content wirklich problematisch wird und zeigt praktische Tools und Tricks, mit denen Sie herausfinden, ob es doppelte Inhalte auf Ihrer Website gibt.


Tags zum Thema: seo

Sabine Langmann

Sabine Langmann ist Teil des Online-Marketing-Teams bei der mindshape GmbH. Sie liebt die Dynamik im SEO-Umfeld und die Herausforderungen, die sich damit stellen. Die Onpage-Optimierung sowie das Content-Marketing sind ihre Lieblingsthemen. In ihrer Freizeit ist Sabine wie im Job gern aktiv unterwegs und lernt neue Plätze in Köln und weit darüber hinaus kennen. 
Alle Beiträge

Kommentieren