Wichtig
Wer AI Crawler blockiert, wird von ChatGPT, Claude und Perplexity nicht als Quelle zitiert. Wer sie erlaubt, erhöht seine AI-Sichtbarkeit. Die Steuerung erfolgt über robots.txt — genau wie beim Googlebot.
Die wichtigsten AI Crawler im Überblick
GPTBot (OpenAI / ChatGPT)
- User-Agent:
GPTBot - Betreiber: OpenAI (ChatGPT, DALL-E, API)
- Zweck: Crawlt Webseiten für ChatGPTs Websuche und zum Training zukünftiger Modelle
- IP-Bereiche: Von OpenAI dokumentiert und veröffentlicht
- Relevanz: ChatGPT hat über 400 Millionen monatliche Nutzer — GPTBot-Zugang bedeutet potenzielle Sichtbarkeit in ChatGPT-Antworten
ClaudeBot (Anthropic / Claude)
- User-Agent:
ClaudeBot - Betreiber: Anthropic (Claude, Claude API)
- Zweck: Crawlt Webseiten für Claudes Wissensbasis
- Relevanz: Claude wird zunehmend in Unternehmensanwendungen eingesetzt — wachsende Bedeutung für B2B-Sichtbarkeit
PerplexityBot (Perplexity)
- User-Agent:
PerplexityBot - Betreiber: Perplexity AI
- Zweck: Eigenständiges Web-Crawling für Perplexitys quellenbasierte AI-Suche
- Relevanz: Perplexity zitiert Quellen mit direkten Links — eines der transparentesten AI-Suchsysteme
Google-Agent (Google)
- User-Agent:
Google-Agent - Betreiber: Google
- Zweck: Nutzerseitig ausgelöste AI-Aktionen — crawlt im Auftrag von echten Nutzern
- Unterschied: Nicht zu verwechseln mit dem klassischen Googlebot — Google-Agent agiert im direkten Auftrag eines Menschen
Weitere AI Crawler
- Bytespider (ByteDance/TikTok): Crawler für ByteDances AI-Produkte — viele Websites blockieren diesen Bot
- CCBot (Common Crawl): Open-Source-Crawler, dessen Daten von vielen LLMs für das Training genutzt werden
- Applebot-Extended (Apple): Apples Crawler für AI-Features in Siri und Apple Intelligence
- Meta-ExternalAgent (Meta): Metas Crawler für AI-Training
AI Crawler in robots.txt steuern
AI Crawler erlauben (empfohlen)
<code>User-Agent: GPTBot<br>Allow: /<br><br>User-Agent: ClaudeBot<br>Allow: /<br><br>User-Agent: PerplexityBot<br>Allow: /</code>
AI Crawler blockieren
Falls Sie bestimmte AI Crawler blockieren möchten (z.B. um Training auf Ihren Daten zu verhindern):
<code>User-Agent: GPTBot<br>Disallow: /<br><br>User-Agent: Bytespider<br>Disallow: /</code>
Teilweiser Zugang
Sie können auch nur bestimmte Bereiche blockieren — z.B. den Admin-Bereich oder sensible Seiten:
<code>User-Agent: GPTBot<br>Allow: /<br>Disallow: /admin/<br>Disallow: /api/</code>
AI Crawler vs. Googlebot: Die Unterschiede
- Googlebot crawlt für den Suchindex → Ihre Seiten erscheinen in der Google-Linkliste
- GPTBot crawlt für ChatGPTs Websuche und Training → Ihre Inhalte können in ChatGPT-Antworten zitiert werden
- ClaudeBot crawlt für Claudes Wissensbasis → Ihre Inhalte fliessen in Claudes Antworten ein
- PerplexityBot crawlt für Echtzeit-Suche → Ihre Seiten werden mit direktem Link zitiert
- Google-Agent crawlt im Auftrag eines Nutzers → Ihre Website wird für eine konkrete Nutzeranfrage besucht
Sollten Sie AI Crawler erlauben oder blockieren?
Warum erlauben?
- Ihre Inhalte können in AI-Antworten zitiert werden → mehr AI-Sichtbarkeit
- AI-Zitierungen stärken Ihre Entität und Markenbekanntheit
- Blockierung bedeutet Unsichtbarkeit — in einer Welt, in der immer mehr Menschen AI-Suche nutzen
Wann blockieren?
- Bezahlte Inhalte: Wenn Ihr Geschäftsmodell auf kostenpflichtigem Content basiert (Paywall-Inhalte)
- Sensible Daten: Interne Dokumente, Kundenbereiche, vertrauliche Informationen
- Training verhindern: Wenn Sie nicht möchten, dass Ihre Inhalte für das Training von AI-Modellen verwendet werden
- Bestimmte Bots: Bytespider (ByteDance) wird häufig blockiert, da der Nutzen für die eigene Sichtbarkeit gering ist
Google bietet neu Blocking-Controls in der Search Console an, mit denen Sie Ihre Inhalte aus AI Overviews und AI Mode ausschliessen können — ohne Einfluss auf klassische Rankings. Aktuell nur in UK verfügbar.
AI Crawler in der Praxis: So ist mikgroup.ch konfiguriert
Unsere eigene Website erlaubt die wichtigsten AI Crawler und blockiert nur Bots mit geringem Nutzen:
<code>User-Agent: GPTBot<br>Allow: /<br><br>User-Agent: ClaudeBot<br>Allow: /<br><br>User-Agent: PerplexityBot<br>Allow: /<br><br>User-Agent: Bytespider<br>Disallow: /</code>
AI Crawler überwachen
GPTBot/1.0— OpenAIClaudeBot/1.0— AnthropicPerplexityBot/1.0— PerplexityGoogle-Agent— Google AI AgentBytespider— ByteDance
So sehen Sie, welche AI-Systeme Ihre Inhalte crawlen — und können Ihre Strategie entsprechend anpassen.
Fazit

CEO, MIK Group
Maxi Maxhuni ist CEO der MIK Group und Experte für Suchmaschinenoptimierung und digitale Wachstumsstrategien. Mit über 10 Jahren Erfahrung im Online-Marketing hilft er Schweizer KMU, ihre digitale Sichtbarkeit nachhaltig zu steigern.