Crawl Budget

Definition

Das Crawl Budget bezeichnet die Anzahl der URLs, die Googlebot oder ein anderer Suchmaschinen-Crawler innerhalb eines bestimmten Zeitraums auf einer Website crawlt und indexiert. Es ergibt sich aus dem Crawl-Bedarf (wie viele Seiten Google crawlen möchte) und der Crawl-Kapazität (wie viele Anfragen der Server verarbeiten kann), ohne die Serverperformance zu beeinträchtigen.

Wer große Websites betreibt oder technische SEO-Probleme lösen möchte, kommt am Begriff Crawl Budget nicht vorbei. Es bestimmt, welche Seiten Googlebot überhaupt besucht – und damit, welche Inhalte überhaupt eine Chance auf Indexierung und Ranking haben. HEEY erklärt, wie das Crawl Budget funktioniert, warum es auch für mittelgroße Websites relevant ist und mit welchen Maßnahmen Sie es gezielt optimieren.

Wie das Crawl Budget funktioniert

Google stellt jedem Crawler-Besuch begrenzte Ressourcen zur Verfügung. Das Crawl Budget setzt sich aus zwei Komponenten zusammen: der Crawl-Kapazität und dem Crawl-Bedarf. Die Crawl-Kapazität beschreibt, wie viele parallele Anfragen Googlebot pro Sekunde an einen Server stellen darf, ohne ihn zu überlasten – sie wird durch die Serverantwortzeiten und die eingestellten Crawl-Rate-Limits beeinflusst. Der Crawl-Bedarf hingegen spiegelt wider, wie stark Google eine Domain für crawlenswert hält: Seiten mit hoher Linkpopularität, frischen Inhalten und starker Nutzernachfrage werden bevorzugt gecrawlt.

Beide Faktoren zusammen ergeben das tatsächlich verfügbare Crawl Budget. Wenn Googlebot mehr URLs vorfindet als er innerhalb des Budgets abarbeiten kann, werden manche Seiten seltener oder gar nicht gecrawlt. Das bedeutet: Neue oder aktualisierte Inhalte gelangen langsamer in den Index – oder bleiben ganz draußen.

Wann ist das Crawl Budget wirklich relevant?

Für kleine Websites mit einigen Dutzend Seiten ist das Crawl Budget in der Regel kein kritischer Faktor – Googlebot crawlt diese Domains ohnehin vollständig. Relevant wird das Thema bei Websites ab einigen tausend URLs, bei E-Commerce-Shops mit facettierten Navigationssystemen, bei Nachrichtenportalen mit hohem Publikationsvolumen oder bei Websites nach einem Relaunch.

Auch technisch fehlerhafte Setups können das Budget künstlich aufblähen: Endlos-Kombinationen aus URL-Parametern, Sitzungs-IDs in URLs oder duplizierte Inhalte durch fehlende Canonical Tags zwingen Googlebot, Ressourcen auf wertlose URLs zu verschwenden. Wer sein Crawl Budget nicht im Blick hat, riskiert, dass wichtige Seiten seltener gecrawlt und damit schlechter oder gar nicht gerankt werden.

Abgrenzung: Crawl Budget vs. Indexierung vs. Ranking

Das Crawl Budget wird häufig mit Indexierung oder Ranking gleichgesetzt – das ist ungenau. Gecrawlt bedeutet nicht automatisch indexiert: Googlebot kann eine Seite besuchen und trotzdem entscheiden, sie nicht in den Index aufzunehmen, etwa wegen dünner Inhalte, eines Noindex-Tags oder mangelnder Qualität. Umgekehrt kann eine Seite im Index verbleiben, auch wenn sie seit Längerem nicht mehr gecrawlt wurde.

Das Ranking wiederum ist eine dritte Ebene: Es setzt Indexierung voraus, hängt aber von Dutzenden weiteren Faktoren ab. Das Crawl Budget ist damit eine notwendige, aber keine hinreichende Bedingung für gutes Ranking. Wer technische SEO-Probleme diagnostiziert, sollte diese drei Ebenen sauber trennen und in der Google Search Console getrennt analysieren.

Einflussfaktoren auf das Crawl Budget

Servergeschwindigkeit und -stabilität: Langsame oder fehlerhafte Server reduzieren die Crawl-Kapazität direkt, weil Googlebot die Anfragerate drosselt, um den Server nicht zu überlasten.
Interne Verlinkungsstruktur: Schlecht verlinkte oder verwaiste Seiten werden seltener entdeckt und gecrawlt.
URL-Parameter und Facetten-Navigation: Unkontrollierte Parameter erzeugen tausende Duplikat-URLs und verschwenden Budget.
Duplicate Content und fehlende Canonical Tags: Ohne klare Kanonisierung crawlt Googlebot dieselben Inhalte mehrfach.
Soft-404-Seiten: Seiten, die inhaltlich leer sind, aber HTTP 200 zurückgeben, belasten das Budget ohne Mehrwert.
Robots.txt und Noindex: Falsch konfigurierte Sperren können wichtige Seiten vom Crawling ausschließen oder unwichtige Seiten weiterhin crawlen lassen.
Linkpopularität und PageRank: Seiten mit vielen hochwertigen eingehenden Links erhalten mehr Crawl-Aufmerksamkeit.

Diese Faktoren lassen sich im technischen SEO-Audit systematisch identifizieren und priorisieren. HEEY empfiehlt, das Crawl-Verhalten regelmäßig in der Google Search Console unter „Crawl-Statistiken“ zu analysieren.

Konkrete Maßnahmen zur Crawl-Budget-Optimierung

Die effektivste Maßnahme ist die Reduzierung von URL-Duplikaten. URL-Parameter sollten in der Google Search Console konfiguriert oder per Canonical Tag konsolidiert werden. Facettierte Navigation in Shop-Systemen lässt sich durch Noindex-Tags oder robots.txt-Regeln für unwichtige Filterkombinationen bereinigen. Interne 301-Weiterleitungen sollten direkt auf das Ziel zeigen – Redirect-Ketten verschwenden Budget.

Sitemap aktuell halten: Nur indexierbare, kanonische URLs einbinden – keine 301-Weiterleitungen, keine Noindex-Seiten.
Crawl-Statistiken in der Google Search Console regelmäßig auswerten: Auffällige Spitzen oder Rückgänge frühzeitig erkennen.
Verwaiste Seiten intern verlinken oder konsolidieren, um Crawl-Aufmerksamkeit gezielt zu lenken.
Serverantwortzeiten optimieren: Ziel sind stabile Antwortzeiten unter 200 ms für Crawler-Anfragen.
Fetch as Google (heute „URL-Prüftool“) nutzen, um einzelne URLs manuell zur Indexierung anzumelden.
Alte, nicht mehr benötigte URLs mit 410 Gone aus dem Index entfernen, statt sie als Soft-404 stehen zu lassen.

Crawl Budget und Local SEO im Rhein-Main-Gebiet

Für lokale Unternehmen in Wiesbaden, Frankfurt, Mainz oder dem gesamten Rhein-Main-Gebiet ist das Crawl Budget auf den ersten Blick kein zentrales Thema – die meisten lokalen Websites sind klein genug, um vollständig gecrawlt zu werden. Relevant wird es jedoch, sobald ein Unternehmen mehrere Standorte betreibt und dafür geo-optimierung/regionale-landingpages/" class="text-magenta font-semibold hover:underline">regionale Landingpages erstellt. Werden diese Seiten nicht sauber kanonisiert oder intern verlinkt, riskiert man, dass Googlebot sie nicht auffindbar crawlt und sie damit für lokale Suchanfragen unsichtbar bleiben.

Auch bei lokalen E-Commerce-Anbietern, Immobilienportalen oder Veranstaltungswebsites aus der Region entstehen schnell hunderte dynamisch generierter URLs, die das Budget belasten. HEEY analysiert im Rahmen technischer SEO-Audits gezielt, ob das Crawl Budget für lokale Websites effizient eingesetzt wird – und entwickelt Maßnahmen, die sicherstellen, dass genau die standortrelevanten Seiten gecrawlt und indexiert werden, auf die es ankommt.

Typische Fehler und Best Practices im Überblick

Ein häufiger Fehler ist das Blockieren wichtiger Ressourcen per robots.txt – etwa JavaScript- oder CSS-Dateien, die Googlebot für das Rendering benötigt. Wer diese Dateien sperrt, verhindert, dass der Crawler die Seite korrekt darstellt und bewertet. Ebenso problematisch ist die umgekehrte Situation: Eine zu permissive robots.txt erlaubt das Crawlen von Staging-Umgebungen, Admin-Bereichen oder internen Suchergebnisseiten und verschwendet wertvolles Budget.

Best Practice ist ein regelmäßiges Crawl-Audit, das mindestens einmal pro Quartal durchgeführt wird – bei großen Websites häufiger. Dabei sollten Crawling-Daten aus der Google Search Console mit den Ergebnissen eines Screaming-Frog- oder Sitebulb-Crawls abgeglichen werden, um Diskrepanzen zwischen gecrawlten und indexierten URLs zu identifizieren. Wer sein Crawl Budget konsequent optimiert, schafft die technische Grundlage dafür, dass neue und aktualisierte Inhalte schnell und zuverlässig in den Index gelangen.

Passend dazu: Technical SEO Agentur von HEEY

Mehr erfahren →

Häufige Fragen

Was ist das Crawl Budget und warum ist es für SEO wichtig?

Das Crawl Budget beschreibt, wie viele URLs Googlebot innerhalb eines bestimmten Zeitraums auf einer Website crawlt. Es ist für SEO relevant, weil nur gecrawlte Seiten indexiert werden können – und nur indexierte Seiten ranken. Wer sein Crawl Budget ineffizient einsetzt, riskiert, dass wichtige Seiten von Google übersehen werden.

Wie kann ich mein Crawl Budget in der Google Search Console überprüfen?

In der Google Search Console finden Sie unter „Einstellungen“ den Bereich „Crawl-Statistiken“. Dort sehen Sie, wie viele Seiten Googlebot täglich crawlt, welche Antwortcodes er erhält und welche Dateitypen besonders häufig angefragt werden. Auffällige Muster – etwa ein plötzlicher Anstieg gecrawlter URLs oder viele 404-Fehler – deuten auf technische Probleme hin.

Wann lohnt es sich, das Crawl Budget aktiv zu optimieren?

Eine gezielte Optimierung lohnt sich ab etwa 1.000 bis 2.000 indexierbaren URLs, bei E-Commerce-Shops mit Facetten-Navigation, nach einem Relaunch oder wenn neue Inhalte trotz guter Qualität nur langsam in den Index gelangen. Kleinere Websites profitieren eher indirekt, etwa durch schnellere Serverantwortzeiten und eine saubere interne Verlinkung.

Wie unterscheidet sich das Crawl Budget vom Indexierungsbudget?

Das Crawl Budget bezieht sich auf die Anzahl der URLs, die Googlebot besucht. Das Indexierungsbudget – ein inoffizieller Begriff – beschreibt, wie viele Seiten Google tatsächlich in seinen Index aufnimmt. Eine gecrawlte Seite wird nicht automatisch indexiert: Google bewertet nach dem Crawl die Qualität und Einzigartigkeit des Inhalts und entscheidet erst dann über die Aufnahme in den Index.

Welche Rolle spielen Weiterleitungen beim Crawl Budget?

Jede Weiterleitung kostet Crawl-Budget, weil Googlebot zunächst die Ausgangs-URL und dann die Ziel-URL abruft. Redirect-Ketten – also mehrere aufeinanderfolgende Weiterleitungen – multiplizieren diesen Aufwand. Best Practice ist es, direkte 301-Weiterleitungen einzusetzen und Redirect-Ketten auf maximal eine Stufe zu reduzieren.

Warum verschwenden URL-Parameter so viel Crawl Budget?

URL-Parameter wie Sortierungen, Filterwerte oder Session-IDs erzeugen technisch unterschiedliche URLs mit identischem oder sehr ähnlichem Inhalt. Googlebot crawlt diese Varianten als eigenständige Seiten und verbraucht dabei Budget, ohne neue Informationen zu gewinnen. Abhilfe schaffen Canonical Tags, die Konfiguration von Parametern in der Search Console oder das Blockieren per robots.txt.

Mehr lokale Sichtbarkeit?

Wir helfen Ihnen, in Google und Maps nach vorne zu kommen.

Kostenlose Analyse