Duplicate Content Check Teil 3

In den vorangegangenen Teilen wurde Duplicate Content bereits definiert und erklärt, wie Sie ihn auf Ihrer Website mittels kostenlosen Tools feststellen können.  In diesem Beitrag nun erfahren Sie, wie Sie die häufigsten Duplicate Content Quellen finden können, und wie Sie diese auf Ihren eigenen Projekten eindämmen oder besser noch im Vorhinein verhindern.

1. Option „diese Seite Drucken“

Bei Informationsportalen, Dienstleitungen und Shops ist es durchaus sinnvoll, alle Daten auch in einer geordneten Übersicht zum Ausdrucken bereitzustellen. Die Textinhalte sind dabei zu 100% identisch mit der Web-Version, aber auf einer anderen URL.

Lösung: Für solche identischen Inhalte bietet sich die Einrichtung eines Canonical-Tags an. Für die Druck-Seite würde dafür folgende Zeile in den Header eingefügt (natürlich entsprechend angepasst):

                <link rel="canonical" href="http://www.domain.de/richtige-url.html">

2. Anzeige der vollständigen Artikel in der Übersicht bei Wordpress

Das More-Tag bei Wordpress "in Aktion"
Duplicate Content finden: Durch das More-Tag bei Wordpress Duplicate Content verringern

Wordpress ist aufgrund der einfachen Installation und Bedienung ein sehr beliebtes Content Management System. Bei Nutzern, die sich nicht mit Duplicate Content auseinandersetzen, finden sich daher meist alle Beiträge komplett auf der Startseite – und dann noch einmal als eigener Beitrag.

Lösung: Wordpress bietet von Haus aus den Code <!--more--> an, um Beiträge auf der Startseite und in anderen Übersichten (Kategorien, Tags) abzukürzen. Dies eliminiert zwar nicht den kompletten Duplicate Content, aber reduziert ihn schon einmal deutlich.

3. Verwenden derselben Beschreibung auf eBay, Amazon oder in Produktvergleichs-Portalen

Vor dem eigenen Shop auf der eigenen Domain steht meist eine Beteiligung bei eBay, Amazon Marketplace und ähnlichen Portalen. Zudem arbeiten zahlreiche Shops mit Produkt- und Preisvergleichsseiten zusammen, denen sie neue Daten über einen Feed zukommen lassen. Vielfach sind diese Inhalte identisch auf der eigenen Domain zu finden.

Lösung: In diesem Fall gibt es leider keine andere Lösung, als auf der eigenen Domain individuellen Inhalt zu erstellen. Gerade, wenn der Text zuerst auf dem großen Portal war, sind Ihre Chancen (zusätzlich zum Schaden durch Duplicate Content) extrem gering, mit dem identischen Text Rankings zu erhalten.

4. Texte im Footer & Seitenleiste

In der Seitenleiste und/oder im Footer findet sich unserer Erfahrung nach häufig Duplicate Content in Form von allgemeinen Informationen wie Produktqualität, Versandbedingungen oder einer allgemeinen Seitenbeschreibung. Da die Seitenleiste und der Footer auf jeder URL angezeigt werden, befindet sich Duplicate Content auf jeder URL.

Lösung: Selten sind Inhalte so wichtig, dass sie in Prosa-Form auf jeder Seite vorhanden sein müssen. Viel häufiger ist es so, dass solche Texte den Besucher von der eigentlich gewünschten Aktion (dem Kauf) ablenken. Infos in der Seitenleiste sollten möglichst knapp (Stichworte!) sein, oftmals bringen hier schön gestaltete Grafiken sogar Mehrwert. Für alle ausführlichen Infos sollte eine Unterseite speziell für das Thema bereitstehen, auf die im Footer oder der Seitenleiste verlinkt wird.

5. Filter-Einstellungen & Sortierungen

Durch Filterungen und Sortier- und Darstellungsoptionen entstehen URLs, die Parameter (Beispiel: ?sort=highest, ?mode=list) beinhalten. Auch dies ist Duplicate Content, wenn er von Google gefunden und indexiert werden kann.

Lösung: Je nach Domain kann sich hier die genaue Behandlung des gefundenen Duplicate Contents unterscheiden. Zumeist werden die parametrisierten URLs aber mit einem Canonical (siehe 1.) oder mit einem „noindex“-Zusatz im Header des Dokuments behandelt. 

6. Erreichbarkeit mit und ohne www.

Je nach Einstellung kann es sein, dass die Domain mit www.coseed.de und als coseed.de erreichbar ist.

Lösung: Über die .htaccess-Datei lässt sich einstellen, dass die eine Version auf die identische URL der anderen URL weiterleitet. Die Weiterleitung sieht dann folgendermaßen aus, um von coseed.de auf www.coseed.de per Statuscode 301 weiterzuleiten:

RewriteEngine On

Options +SymLinksIfOwnerMatch

RewriteCond %{HTTP_HOST} ^coseed.de

RewriteRule (.*) www.coseed.de/$1 [R=301,L]

7. Inhalte auf mehreren Domains

Eventuell besitzen Sie zwei verschiedene Domains, die identische Inhalte anbieten. Während die Gründe hierfür unterschiedlich sein können, findet sich so oder so immer derselbe Duplicate Content.

Lösung: Die einfachste Lösung ist es, die Inhalte nur auf einer Domain verfügbar zu machen, und alle anderen Domains per Statuscode 301 auf diese weiterzuleiten. Wenn andere Gründe hiergegen sprechen, darf trotzdem nur eine Version für Suchmaschinen erreichbar sein. Alle anderen Domains müssen Domainweit das folgende Tag im Header tragen:

                     <meta name="robots" content="noindex, nofollow">

Die einzige Ausnahme hierzu stellen länderspezifische Domains dar (siehe nachfolgender Punkt).

8. Länderspezifische Domains

Aufgrund unterschiedlicher Portokosten und Steuersätze ist es für Shops teilweise sinnvoll, eigene Domains oder Verzeichnisse für unterschiedliche Länder zu unterhalten. Hierbei findet sich Duplicate Content, sobald mehrere Länder mit derselben Landessprache eingerichtet werden, wie beispielsweise die Schweiz, Deutschland und Österreich.

Lösung: Google selbst empfiehlt in dieser Situation, die Inhalte für jede Version mit dem Tag „hreflang“ auszuzeichnen. Wenn es neben der deutschen Version noch eine für die Schweiz gibt, erhält die schweizer Version folgendes Tag im Header:

<link rel="alternate" hreflang="de" href="http://www. domain.de/de/" />

9. Test-Domain erreichbar

Bei Relaunchs und für Tests wird oft auf einer anderen (Sub-Domain) eine Kopie der kompletten Domain erstellt. Ist diese für Crawler erreichbar, werden Inhalte doppelt indexiert. Fatalerweise beinhaltet die Testdomain häufig neue Inhalte zuerst – ein Zeichen für Google, die Testdomain und nicht die richtige Version ranken zu lassen!

Lösung: Eine Testdomain sollte niemals für Außenstehende erreichbar sein! Stellen Sie einen Passwortschutz über die .htaccess ein.

10. Gleiche Produkte unter unterschiedlichen URLs

Die folgende Art von Duplicate Content lässt sich vornehmlich in Shops finden: Ein Artikel passt zu mehreren Kategorien. Daher ist er in jeder Kategorie auffindbar, und hat dementsprechend verschiedene URLs.

Lösung: Bestimmen Sie, auf welcher URL das Produkt bei Google gefunden werden soll. Alle anderen Versionen erhalten das Canonical (siehe Punkt 1), um auf das „Original-Produkt“ zu verweisen.

Sie sehen: Duplicate Content zu finden ist nicht schwer - in den meisten Fällen lässt er sich zudem auch noch recht einfach verhindern oder beheben. Haben Sie noch andere Fälle von Duplicate Content bemerkt? Wir freuen uns auf Kommentare!


Tags zum Thema: seo

Martina Kölsch

Martina ist als Online Marketing Managerin bei der mindshape GmbH für verschiedene Bereiche des vielseitigen Themas zuständig. SEO, SEA, Tracking und Conversion Optimierung sind nur ein Teil ihres Alltags, gerne schaut sie sich auch neue und (noch) nicht bekannte Bereiche an. Auch in Ihrer Freizeit testet sie schon einmal an eigenen Projekten, was in der Internetwelt möglich ist. 
Alle Beiträge

Kommentieren