Canonical Tag Bedeutung und Best practices

29. August 2018 12. Oktober 2024

Das Canonical Tag ist ein HTML-Tag, um Duplicate Content auf einer Seite zu vermeiden. Durch einen kanonischen Link werden Suchmaschinen informiert, welche Adresse in den Suchergebnissen bevorzugt werden soll.

Inhaltsverzeichnis

Welche Seite bevorzugt Google?
Anwendungsfälle zur Kanonisierung
Canonical Tags sind nicht immer die beste Methode
Methoden für die Kanonisierung
Kanonische URL prüfen
Kombination aus Canonical Tag und noindex
Canonical Tag und Paginierung
Canonical Tag mit Selbstverweis
Duplicate Content Checker
Best practices für Canonical Tags

Welche Seite bevorzugt Google?

Auf großen Websites kann es passieren, dass mehrere URLs das selbe Thema behandeln oder sich Themen überschneiden. Googlebot bevorzugt die Seite, die am umfangreichsten und nützlichsten zu sein scheint und kennzeichnet sie als kanonisch. Um das Crawlbudget der Website bestmöglich auszuschöpfen, verarbeitet Google kanonische URLs häufiger, als andere. Neben dem Canonical Tag nutzt Google auch weitere Faktoren, um die kanonische URL zu ermitteln:

Wird die Seite über HTTP oder HTTPS bereitgestellt?
Wie lautet die bevorzugte Domain des Nutzers?
Welche Qualität besitzt die Seite?
Wird die URL in einer Sitemap aufgeführt?
usw.

Anwendungsfälle zur Kanonisierung

Für folgende Anwendungsfälle bietet es sich an, bevorzugte URLs zu ermitteln und festzulegen, zum Beispiel:

Zur Unterstützung mehrerer Gerätetypen, wenn das Layout nicht responsiv ist:

https://mobil.example.com
https://www.example.come

Bei URLs mit Suchparameter oder Sitzungs-IDs.
Bei der Bereitstellung einer HTML-Druckversion.
Bei exakten Inhalten einer HTML-Seite und PDF-Datei.
Wenn ein Produkt in einem Shop mehreren Kategorien zugeordnet wird.

Canonical Tags sind nicht immer die beste Methode

Canonical Tags sind häufig eine gute Lösung zur Vermeidung von Duplicate Content. Doch sie sind nicht immer die beste Methode. Drei Beispiele dazu:

Beispiel 1: Mehrfach exakt gleiche Inhalte

URLs mit exakt gleichem Inhalt sollten durch Redirects zur bevorzugten Adresse weiterleiten. Wie Google mitteilt, besitzen Weiterleitungen einen stärkeren Einfluss auf die Kanonisierung, als das rel=“canonical“-Link-Attribut und Sitemaps:

Beispiel 2: HTTP und HTTPS

Sind Seiten auf einer Website durch HTTP und HTTPS erreichbar, ist eine globale Redirect Regel die technisch beste Lösung. Sie kann in der .htaccess-Datei (Apache-Server) hinterlegt werden. Diese Regel leitet von HTTP automatisch auf HTTPS mit einem 301-Statuscode weiter. Hierfür ist ein SSL-Zertifikat (Let’s encrypt) erforderlich.

RewriteEngine on

RewriteCond %{HTTPS} !=on

RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Beispiel 3: Parameter-URLs

Viele Shops verwenden Filter, um Seiteninhalte nach gewünschten Kriterien einzuschränken. Diese Filterergebnisse generieren häufig eine eigenständige URL mit Parameter. Parameter-URLs bieten sich zum indexieren an, wenn für das individuelle Filterergebnis ein geeignetes Suchvolumen vorhanden ist, etwa „braune Damenstiefel“. URLs mit mehreren Parametern sind in der Regel zum indexieren nicht geeignet, weil das Filterergebnis zu spezifisch ist, wie „adidas Sneaker weiß Größe 43“. Google empfiehlt URLs, die auf keinen Fall gecrawlt werden sollen, durch robots.txt-Anweisungen zu blockieren. Besonders in großen Shops wirkt sich das positiv auf die Crawlability aus, weil es wenig Sinn macht tausende Parameter-URLs für Filterergebnisse zu crawlen, die nicht indexiert werden sollen.

Methoden für die Kanonisierung

Methode 1: Canonical Tag im HTML-Code

Die für die meisten einfachste Methode ist die Verwendung vom rel=“canonical“-Link-Attribut Mit href wird die kanonische URL (absolut angeben) festgelegt, die Googlebot bevorzugen soll. rel=“canonical“ wird im <head>-Bereich einer Seite angegeben.

<html>

<head>

(…)

</head>

<body>Sichtbarer Bereich einer Webseite</body>

</html>

Wer Shopify oder WordPress verwendet, dem empfehle ich das Yoast SEO Plugin mit dem die Indexierbarkeit und die Verwendung von Canonical Tags individuell festgelegt werden kann, ohne im Quellcode Anpassungen vornehmen zu müssen.

Methode 2: Canonical Tag im HTTP-Header

Google unterstützt diese Methode derzeit nur für Websuchergebnisse.

Ist der Server konfigurierbar, kann die kanonische URL mithilfe des HTTP-Headers rel=“canonical“ angegeben werden. Das funktioniert für ein von der Google Suche unterstütztes Dokument, einschließlich Nicht-HTML-Dokumenten, wie PDF-Dateien.

1	Link: <https://www.example.com/page>; rel="canonical"

Methode 3: Kanonische URLs in der Sitemap

Alle Seiten, die in einer XML Sitemap notiert sind, werden als kanonisch vorgeschlagen. Google entscheidet dann basierend auf der Ähnlichkeit der Inhalte, welche Seiten als (potenziell) dupliziert gelten.

Durch die Angabe der bevorzugten kanonischen URLs in der Sitemap kann man auf einfache Weise kanonische URLs für eine große Website definieren. Sitemaps sind nützlich, weil sie Google mitteilen, welche Seiten einer Website am wichtigsten sind.

Methode 4: Weiterleitungen

Die Methode eignet sich, um vorhandene duplizierte Seiten zu entfernen.

Alle Weiterleitungsmethoden (301- und 302-Weiterleitungen, meta-refresh sowie JavaScript-Weiterleitungen) haben die gleichen Auswirkungen auf die Google Suche, wobei 3xx-HTTP-Weiterleitungen die schnellste Wirkung erzielen.

Methode 5: Anweisung in der .htaccess

Alternativ zu den ersten beiden Methoden kann eine kanonische URL auch mittels .htaccess-Eintrag erfolgen. Diese Methode bietet sich auch für PDF-Dateien an.

Zur Konfiguration einer kanonischen URL in der .htaccess-Datei wird das Apache Modul mod_headers verwendet. Hierfür wird eine Anweisung nach dem folgenden Schema in der .htaccess-Datei hinzugefügt:

Header append Link "<https://www.example.com/page>; rel=\"canonical\""

</Files>

</IfModule>

Die Seite (https://www.example.com/page) soll gegenüber der PDF-Datei (canonical-tag.pdf) bevorzugt werden.

Nachteil Der Nachteil dieser Methode ist das Aufblähen der .htaccess-Datei. Je größer diese Datei wird, desto schlechter können die Ladezeiten ausfallen.

Warum erzeugen PDF-Dateien Duplicate Content?

Duplicate Content liegt auch vor, wenn eine HTML Seite und eine maschinenlesbare PDF Datei exakte oder sehr ähnliche Inhalte besitzen. Manchmal brechen Keyword-Rankings in den Suchmaschinen Ergebnissen ein oder schwanken stark.

Das folgende Beispiel zeigt eine Keyword-Kannibalisierung von einer HTML Seite (rot) und einer PDF Datei (blau) mit exakt gleichen Inhalten für das selbe Keyword einer Website. Das ist aus SEO-Sicht ungünstig und sollte durch Kanonisierung behoben werden.

Keyword-Kannibalisierung durch PDF-Datei // SISTRIX Toolbox

Kanonische URL prüfen

Mit dem Bericht URL-Prüfung (Indexabdeckung) der Google Search Console kann für eine URL ermittelt werden, ob Google eine kanonische URL erkannt hat und welche URL Google als kanonisch bestimmt hat.

URL-Prüfung - Indexabdeckung // Google Search Console

Alternativ bietet sich das kostenfreie Online-Tool Canonical Tag URL Location Checker zur schnellen Validierung an. Ich verwende die Chrome Erweiterung Detailed SEO Extension, die Informationen zur Indexierung und kanonischen URL liefert.

Kombination aus Canonical Tag und noindex

Laut John Müller von Google kann es in bestimmten Fällen sinnvoll sein, einen Canonical-Link und noindex auf derselben Seite zu kombinieren. Zum Beispiel bei unterschiedlichen Seiten mit syndizierten Inhalten. Darüber hinaus kann es auch bei einer eindeutigen Bewertung sinnvoll sein, ein noindex zu verwenden und gegebenenfalls mit einem Canonical-Link zu kombinieren. Diese Kombination ist immer dann empfehlenswert, wenn es stärker um die Indexierung geht und weniger um die Auswahl der Canonical URL.

John Müller (Google) auf X zur Verwendung von Canonical Tag und noindex

Canonical Tag und Paginierung

Durch die Attribute rel=“next“ und rel=“prev“ kann man mehrere Unterseiten paginieren und so auf eine logische Sequenz hinweisen. Zum Beispiel bei mehreren Seiten einer Shop-Kategorie. Doch Google verarbeitet diese Attribute nicht mehr, wie John Müller bereits 2019 auf Twitter mitteilte. Besser ist es, wenn jede paginierte Seite einer logischer Sequenz per Canonical-Tag auf sich selbst verweist und das Meta Robots Tag index,follow liefert.

John Müller (Google) auf X zur Verwendung von rel next/prev

Canonical Tag mit Selbstverweis

Viele Content-Management- und Shop-Systeme sind so konfiguriert, dass indexierbare Seiten automatisch ein Canonical Link im HTML-Head setzen, deren URL auf sich selbst verweist. So soll den Suchmaschinen mitgeteilt werden, dass es sich um das Original handelt. Diese Methode ist vollkommen in Ordnung. Allerdings ist es ratsam, die Website zu crawlen und zu bewerten, dass technisch erzeugte Duplikate nicht kanonisch sind, wie Filter-Parameter.

Duplicate Content Checker

Ein Duplicate Content Checker ist hilfreich, um identische Inhalte auf einer Website zu ermitteln. Durch das Scannen vom Quellcode oder von Textinhalten können Duplikate relativ einfach erkannt werden.

Suchmaschinen erkennen doppelte Inhalte und können sie als wertlos deklarieren. Um dies zu vermeiden, sollte man eine kanonische URL angeben und so die Suchmaschine auf die bevorzugte Seite lenken.

Best practices für Canonical Tags

Es ist wichtig, dass für dieselbe Seite nicht verschiedene kanonische URLs angegeben werden, unabhängig von den angewendeten Kanonisierungsmethoden.
Bei der Verwendung von hreflang-Elemente muss beachtet werden, eine kanonische Seite in derselben Sprache oder, wenn keine kanonische Seite für dieselbe Sprache vorhanden ist, in der bestmöglichen Ersatzsprache anzugeben.
Innerhalb einer Website sollten kanonische URL bevorzugt werden. So kann Google die Präferenzen besser erkennen. Auf Duplikate zu verlinken, ist aus SEO-Sicht ungünstig.
Die Methoden für die Kanonisierung können kombiniert werden, etwa die Verwendung vom rel=“canonical“-Link-Attribut und die Angabe aller kanonischen URLs in einer Sitemap.

Weiterführende Literatur

Google Search Central: Kanonische Seite mit rel=“canonical“ und anderen Methoden angeben

Canonical Tag

Welche Seite bevorzugt Google?

Anwendungsfälle zur Kanonisierung

Canonical Tags sind nicht immer die beste Methode