PDF-Dateien sind aus SEO-Sicht wie nasse Schwämme. Sie speichern für das Ranking wichtigen Linkjuice (Pagerank) und leiten diesen nicht durch abgehenden Links an themenrelevante Seiten der Website weiter. Aus SEO-Sicht is das schlecht. Hier stelle ich Praxiserprobte Lösungen für die optimale Einbindung von PDF-Dateien in eine Website vor.
PDF-Dateien sind oft unterschätzte Rankingkiller. Falsch eingesetzt – also in der Regel nicht Suchmaschinenoptimiert verlinkt – saugen sie den Linkjuice auf wie ein Schwamm und verschwenden ihn. So wie ein löchriger Eimer Wasser verliert.
Zwei Probleme, mit denen man häufig konfrontiert wird, sind:
- Der Linkjuice wird durch ein fehlendes Canonical Tag nicht zurückgeführt.
- Die Ausstiege werden durch fehlende href-Links (PDF-Datei) unnötig erhöht.
Google verarbeitet und indexiert PDF-Dateien. Sie bieten eine interessante Option, um zusätzliche Treffer in den Suchmaschinen Ergebnissen zu platzieren.
Google Ingenieur Matt Cutts empfiehlt Inhalte in einem Web-ursprünglichen Format bereitzustellen, wie HTML. Das ist besser, als PDF-Dokumente oder FLASH-Inhalte. Web-basierte Formate sind etwas nützlicher zu handhaben. (Quelle).
Auch Webmaster Trends Analyst John Mueller äußerte sich in einem Google Webmasters Hangout zum Thema: Nur ordnungsgemäß mit HTML-Anker-Tags (href) versehene Links in Dateien geben Linkjuice weiter.
PDF-Dateien richtig verlinken
Option 1: Die PDF-Datei ist ein Duplikat
Häufig stellen Webmaster den Seiteninhalt zusätzlich zum Download als PDF-Datei bereit. Wenn beide Versionen indexierbar sind, führt das oft zu einer Keyword Kannibalisierung. Um das zu vermeiden, empfehle ich diese einfache Lösung:
- Jede PDF-Datei besitzt einen href-Link zur kanonischen Ressource (Webseite).
- Damit der Linkjuice zur bevorzugten Ressource weitergeleitet werden kann, erstellst Du in der .htaccess-Datei ein Canonical Tag, das auf die bevorzugte Ressource (Webseite) verweist. Beispiel
123<Files "meinepdf.pdf">Header add Link '<https://example.com/dokumente/bevorzugte-seite.html>; rel="canonical"'</Files>
Diese Methode funktioniert übrigens auch für Bilder:
123<Files "meinbild.webp">Header add Link '<https://example.com/dokumente/bevorzugte-seite.html>; rel="canonical"'</Files> -
Alternativ kann die Anweisung auch im PHP Header erfolgen:
123header('Content-Type: application/pdf');header('Link <https://example.com/dokumente/bevorzugte-seite.html>; rel="canonical"');readfile('meinepdf.pdf');
Option 2: Die PDF-Datei ist kein Duplikat
Viele Websites aus der Industrie und Wirtschaft stellen PDF-Dateien bereit, zum Beispiel für technische Zeichnungen oder wissenschaftliche Artikel. Diese PDF-Dateien haben ihre Berechtigung aber sollten aus SEO-Sicht optimiert werden:
- Jede PDF-Datei besitzt einen href-Link zu einer themenrelevanten Webseite auf der Website.
- Soll die PDF-Datei von Suchmaschinen indexiert werden, musst Du sicherstellen, dass sie nicht von der Indexierung ausgeschlossen (robots.txt Datei) und nicht durch einen Canonical Tag entwertet wird.
- Soll die PDF-Datei nicht indexiert werden, empfehle ich sie in der robots.txt Datei von der Indexierung auszuschließen, zum Beispiel:
12User-agent: *Disallow: /dokumente/meinepdf.pdf
Kommentar verfassen