Noindex Tag

16 Mrz, 2023

Suchmaschinenoptimierung

Noindex-Tag

Ein Noindex-Tag ist eine On-Page Anweisung, die Suchmaschinen anweist, die Seite nicht zu indexieren. Es ist eine der Methoden, um das Indexieren auf einer Website zu blockieren.

Was ist ein Noindex-Tag?

Ein Noindex-Tag teilt Suchmaschinen mit, die Seite nicht in den Suchergebnissen zu berücksichtigen. Die gängigste Methode, um eine Seite zu «noindexen», besteht darin, ein Tag im Head-Bereich des HTML oder in den Antwort-Headern hinzuzufügen. Damit Suchmaschinen diese Information sehen können, darf die Seite nicht bereits in einer robots.txt-Datei blockiert (disallowed) sein.

Wenn die Seite über Ihre robots.txt-Datei blockiert wird, wird Google das Noindex-Tag nie sehen und die Seite könnte trotzdem in den Suchergebnissen erscheinen.

Um Suchmaschinen mitzuteilen, dass Ihre Seite nicht indexiert werden soll, fügen Sie einfach folgendes zum <head>-Bereich hinzu:

<meta name=”robots” content=”noindex”>

Alternativ kann das Noindex-Tag in einem X-Robots-Tag im HTTP-Header verwendet werden:

X-Robots-Tag: noindex

Praktiken zur Verwendung von Noindex

Wenn Sie sich entschieden haben, einige Seiten mit Noindex zu kennzeichnen, gibt es hier einige bewährte Praktiken.

1. Stellen Sie sicher, dass die Seite nicht in der robots.txt-Datei
blockiert ist

Seiten, die in der robots.txt-Datei blockiert sind, können immer noch in den Suchmaschinenindex gelangen. Manchmal können die Seiten indexiert werden, ohne ihren Inhalt zu crawlen.

Und wenn Sie einer Seite einen Noindex-Tag hinzufügen, muss Google die Seite erneut crawlen, um diese Anweisung zu lesen. Stellen Sie also sicher, dass die Seite für den Crawler zugänglich ist.

2. Langfristiges Noindex führt zu «Nofollow»

Sie sollten beachten, dass Seiten mit dem Noindex-Tag langfristig keine Link-Equity an andere Seiten weitergeben werden.

John Mueller von Google erklärte, dass, wenn Google Noindex für eine lange Zeit sieht, werden die Seiten vollständig aus dem Index entfernt, und die Links auf ihnen werden nicht mehr gecrawlt.

Auch wenn die Seite «noindex, follow» ist, unterscheidet sie sich für Google langfristig nicht von «noindex, nofollow». Was «langfristig» hier bedeutet, ist jedoch nicht offensichtlich und hängt von mehreren Faktoren ab.

3. Verwenden Sie Noindex nicht für doppelten Content

Die Verwendung des Noindex-Tags ist nicht der beste Weg, um doppelten Content auf Ihrer Webseite zu behandeln.

Um doppelte Seiten auf Ihrer Website zu konsolidieren, verwenden Sie kanonische Tags. Eine ordnungsgemässe Kanonisierung weist Suchmaschinen an, nur die Hauptversion (kanonische Version) der Seite zu indexieren.

Aber die Link-Signale von allen nicht-kanonischen Versionen einer Seite werden konsolidiert, was der kanonischen Version einen Schub gibt.

4. Überwachen Sie regelmässig Ihre Website auf SEO-Probleme

Die Überwachung Ihrer Website auf SEO-Probleme kann Sie vor Traffic-Verlusten im Zusammenhang mit der Indexierbarkeit bewahren. Zum Beispiel können Seiten oder ganze Website-Bereiche aus Versehen «Noindexed» werden.

Sie können das Site-Audit-Tool von Ahrefs verwenden, um die SEO-Healthy Ihrer Website im Auge zu behalten.

Bedeutung von Noindex-Tag für SEO

In Bezug auf die Suchmaschinenoptimierung bietet das Noindex-Meta-Tag eine elegante Möglichkeit, doppelten Inhalt zu vermeiden. Insbesondere in Anbetracht der Tatsache, dass Google und andere Suchmaschinen Seiten mit doppeltem Inhalt bestrafen können, ist die Beeinflussung der Indexierung von Webseiten sehr wichtig.

Durch das Hinzufügen von «follow» im Tag bleibt die Option bestehen, alle Links auf der nicht indexierten Seite trotzdem zu verfolgen.

Viele Content-Management-Systeme (CMS) erstellen automatisch eine Vielzahl von Archivseiten, die schnell indiziert werden können. In einem extremen Fall kann eine solche «Flutung» von Indizes als Spamming angesehen werden. Noindex kann verwendet werden, um solche Risiken zu vermeiden.

Noindex kann auch beim Relaunch einer Website oder beim Start einer neuen Version einer Seite nützlich sein. Alle am Projekt Beteiligten können die Funktionalität der neuen Seite «live» testen, ohne dass einige Bereiche von einer Suchmaschine indexiert werden.

Es ist wichtig, dass das Noindex nach dem Start der Website aus dem Quellcode entfernt wird. Nur dann können der Googlebot oder Bingbot die Seite indexieren. Nur indexierbare URLs können eine Platzierung im Ranking erreichen.

Wann sollte man den Noindex-Tag verwenden?

Sie sollten das Noindex-Tag verwenden, um zu verhindern, dass Seiten von Google indexiert werden.

Es ist entscheidend, weniger wichtige Seiten nicht indexierbar zu machen, da Google nicht genügend Ressourcen hat, um jede Seite im Web zu crawlen und zu indexieren. Gleichzeitig müssen Sie Ihre wertvollen Seiten identifizieren, die indexiert werden sollten, und deren Optimierung priorisieren.

Lassen Sie uns sehen, auf welche Arten von Seiten Sie den Noindex-Tag setzen sollten, um sie nicht indexierbar zu machen.

Setzen Sie den Noindex-Tag auf:

  • Seiten für Produkte, die nicht mehr auf Lager sind und nicht mehr verfügbar sein werden.
  • Seiten, die in Suchergebnissen nicht zugänglich sein sollten, z.B. Staging-Umgebungen oder passwortgeschützte Seiten.
  • Seiten, die für Suchmaschinen wertvoll sind, aber nicht für Benutzende – wie Seiten, die Links enthalten, die den Bots helfen, andere Seiten zu entdecken.
  • Seiten mit doppeltem Inhalt, die oft auf E-Commerce-Websites dominant sind. Es wird auch empfohlen, kanonische Tags zu verwenden, um Suchmaschinen auf die primären Versionen Ihrer Seiten zu verweisen und Probleme mit doppeltem Inhalt zu vermeiden.

Seiten, die nicht indexiert werden sollten

Es gibt wiederum viele Gründe, warum Seiten, die nicht indexiert werden sollten, indexiert werden. Aber warum?

Noindex-Direktive

Noindex bedeutet, dass eine Webseite nicht indexiert werden sollte. Eine Seite mit dieser Direktive wird gecrawlt, aber nicht indexiert.

Stellen Sie sicher, dass in Ihrer robots.txt-Datei Folgendes vorhanden ist:

  • Es gibt nicht mehr als einen «User-Agent»-Block.
  • Die «Disallow»-Zeile folgt nicht sofort auf die «User-Agent»-Zeile.
  • Unsichtbare Unicode-Zeichen werden entfernt. Dies kann durch das Durchlaufen Ihrer robots.txt-Datei durch einen Texteditor erfolgen, der die Codierungen konvertiert.

Seiten werden von anderen Websites verlinkt

Seiten, die von anderen Websites verlinkt werden, können indexiert werden, auch wenn sie in der robots.txt-Datei ausgeschlossen sind. Wenn dies geschieht, werden nur der Anker-Text und die URL in den Suchmaschinenergebnissen angezeigt.

Hier ist ein Screenshot, wie diese URLs auf der SERP erscheinen: Bildquelle Webmasters StackExchange. Dieses Problem (Robots.txt-Blockierung) kann behoben werden durch:

  • Den Passwortschutz der Datei(en) auf Ihrem Server.
  • Das Löschen der Seiten aus der robots.txt-Datei oder das Hinzufügen des folgenden Meta-Tags, um sie zu blockieren: <meta name=»robots» content=»noindex»>

Alte URLs

Angenommen, Sie haben eine neue Website oder sogar neuen Inhalt erstellt und eine Noindex-Regel in der robots.txt hinzugefügt, um eine Indexierung zu verhindern. Oder Sie haben sich kürzlich für GSC angemeldet.

Es gibt Möglichkeiten, das Problem «von robots.txt blockiert» zu beheben:

  • Geben Sie Google Zeit, um die alten URLs irgendwann aus seinem Index zu entfernen. Normalerweise entfernt Google URLs, wenn sie weiterhin 404-Fehler zurückgeben. Es wird nicht empfohlen, Plugins zu verwenden, um Ihre 404er umzuleiten, da dies Probleme verursachen kann, die dazu führen können, dass GSC Ihnen die Benachrichtigung «von robots.txt blockiert» sendet.
  • Leiten Sie die alten URLs mit einem 301-Redirect zu den aktuellen URLs weiter.

Überprüfen Sie, ob Sie eine robots.txt-Datei haben

Es ist auch möglich, dass GSC Ihnen diese Benachrichtigungen sendet, auch wenn Sie keine robots.txt-Datei haben. CMS wie WordPress haben möglicherweise bereits eine robots.txt-Datei erstellt, und Plugins können auch robots.txt-Dateien erstellen.

Wenn Sie die virtuellen robots.txt-Dateien mit eigenen robots.txt-Dateien überschreiben, kann dies zu Komplikationen in GSC führen.

Werkzeuge, die Sie zur Implementierung von Noindex-Tags verwenden können

Es gibt mehrere Werkzeuge, die Sie verwenden können, um Noindex Tags auf Ihrer Website zu implementieren:

  • Google Search Console

    Die Google Search Console ermöglicht es Ihnen, zu kontrollieren, wie Ihre Website in den Google-Suchergebnissen erscheint, indem Sie Noindex-Tags direkt in den HTML-Code Ihrer Website einfügen.

  • Yoast SEO-Plugin (für WordPress)

    Wenn Ihre Website mit WordPress erstellt wurde, können Sie das Yoast SEO-Plugin verwenden, um Noindex-Tags zu bestimmten Seiten oder Abschnitten Ihrer Webseite hinzuzufügen.

  • Robots.txt-Datei

    Sie können auch die robots.txt-Datei Ihrer Website verwenden, um die Indexierung Ihrer Seiten durch Suchmaschinen zu steuern. Um einen Noindex-Tag hinzuzufügen, fügen Sie einfach die folgende Zeile zu Ihrer robots.txt-Datei hinzu: «Disallow: /».

  • HTTP-Header

    Eine weitere Möglichkeit, einen Noindex-Tag hinzuzufügen, besteht darin, den HTTP-Header zu verwenden. Dies kann durch Hinzufügen des folgenden Codes zum Header der Seite erfolgen, die Sie davon abhalten möchten, indexiert zu werden: «X-Robots-Tag: noindex».

Unabhängig von dem von Ihnen gewählten Werkzeug ist es wichtig zu beachten, dass Noindex-Tags nur verhindern, dass Suchmaschinen eine Seite indexieren. Sie garantieren nicht, dass die Seite nicht gecrawlt oder in den Suchergebnissen angezeigt wird.

Ähnliche Artikel:

Newsletter Abonnieren

Abonnieren Sie noch heute, damit Sie keine der neuesten Beiträge verpassen!

    Steigere Deinen Traffic!

    Jetzt Webseite analysieren ➜

    Switzerland Flag