SEO Glossar

Soft 404

Definition

Ein Soft 404 bezeichnet eine Webseite, die inhaltlich nicht existiert oder keinen relevanten Inhalt liefert, dem Nutzer und dem Crawler jedoch einen HTTP-200-Statuscode zurückgibt – also technisch als „gefunden“ gilt, obwohl sie faktisch leer, gelöscht oder bedeutungslos ist. Google erkennt und behandelt solche Seiten intern wie echte Fehlerseiten.

Wer technisches SEO ernstnimmt, stößt früher oder später auf Soft 404 – einen der häufigsten und gleichzeitig am meisten unterschätzten Fehlertypen im Crawling-Prozess. Anders als ein klassischer 404-Fehler sendet eine Soft-404-Seite keinen Fehlerstatuscode an den Browser oder Crawler, obwohl sie keinen nutzbaren Inhalt bereithält.

Für Suchmaschinen wie Google ist das eine Ressourcenverschwendung: Crawl-Budget wird für wertlose Seiten aufgebraucht, und im schlimmsten Fall verlieren relevante Seiten an Sichtbarkeit. HEEY erklärt, was hinter dem Begriff steckt, wie man Soft 404 zuverlässig identifiziert und welche Maßnahmen wirklich helfen.

Was ist ein Soft 404 – und wie entsteht er?

Ein Soft 404 tritt auf, wenn ein Server den HTTP-Statuscode 200 (OK) zurückgibt, die aufgerufene Seite aber keinen oder kaum nutzbaren Inhalt enthält. Typische Beispiele sind leere Kategorieseiten in Onlineshops, Suchergebnisseiten ohne Treffer, Produktseiten ausverkaufter Artikel ohne Alternativinhalt oder Seiten, die nach einer Migration technisch erreichbar sind, aber nur noch einen kurzen Hinweis wie „Seite nicht gefunden“ anzeigen – ohne den korrekten 404-Code zu senden.

Google erkennt solche Seiten durch eine Kombination aus Signalen: geringe Textmenge, fehlende strukturierte Informationen, hohe Absprungrate und das Fehlen eingehender Links. Googlebot markiert sie in der Google Search Console unter „Seiten“ als „Soft 404“ und schließt sie in der Regel aus dem Index aus oder bewertet sie sehr niedrig. Entscheidend ist: Der Fehler liegt nicht auf Protokollebene, sondern auf inhaltlicher Ebene – was die Diagnose erschwert.

Häufige technische Ursachen sind fehlerhafte CMS-Konfigurationen, schlecht programmierte Weiterleitungslogiken, dynamische Seiten mit leeren Datenbankabfragen und Facettennavigationen, die Tausende von URL-Kombinationen ohne echten Inhalt erzeugen.

Soft 404 vs. echter 404-Fehler: Die entscheidenden Unterschiede

Ein klassischer 404-Fehler sendet den HTTP-Statuscode 404 (Not Found) an Browser und Crawler. Google versteht dieses Signal eindeutig: Die Seite existiert nicht, sie wird nicht indexiert, und Crawl-Budget wird nach einer gewissen Zeit nicht mehr dafür aufgewendet. Ein Soft 404 hingegen täuscht Existenz vor – der Server antwortet mit 200, obwohl die Seite wertlos ist. Das ist für Suchmaschinen deutlich schädlicher, weil sie die Seite zunächst als potenziell relevant behandeln und ressourcenintensiv crawlen.

Ebenfalls abzugrenzen ist der Soft 404 vom Duplicate Content: Doppelter Inhalt existiert auf mehreren URLs mit echtem Inhalt, während eine Soft-404-Seite überhaupt keinen oder marginalen Inhalt aufweist. Auch die Verwechslung mit dem Noindex-Tag ist verbreitet: Noindex verhindert aktiv die Indexierung einer Seite, löst aber das zugrundeliegende Problem einer inhaltslosen Seite nicht. Und ein Redirect – etwa ein 301 – leitet Nutzer und Crawler aktiv auf eine andere URL weiter, was bei Soft 404 nicht geschieht.

Relevanz für SEO: Crawl-Budget, Indexierung und Rankings

Soft 404 sind ein direktes Problem für das Crawl-Budget. Google stellt jedem Domain einen begrenzten Crawling-Aufwand zur Verfügung. Enthält eine Website Hunderte oder Tausende von Soft-404-Seiten – was bei großen Onlineshops, Nachrichtenportalen oder Websites mit Facettennavigation schnell passiert –, wird dieses Budget für wertlose URLs verbraucht. Relevante Seiten werden seltener oder gar nicht gecrawlt, was zu Indexierungsverzögerungen und Sichtbarkeitsverlusten führt.

Darüber hinaus beeinflusst eine hohe Anzahl an Soft-404-Seiten die wahrgenommene Qualität einer Domain. Google bewertet die Gesamtqualität eines Webauftritts, und eine Vielzahl inhaltlich leerer Seiten sendet negative Signale. Im Kontext des Helpful Content Updates ist das besonders relevant: Seiten ohne echten Mehrwert für Nutzer werden systematisch schlechter bewertet.

Für lokale Unternehmen im Rhein-Main-Gebiet – etwa Dienstleister in Wiesbaden, Frankfurt oder Mainz – kann ein Soft 404 auf einer wichtigen Standort- oder Leistungsseite dazu führen, dass genau diese Seite nicht im Index erscheint und damit im Local Pack oder in den organischen Ergebnissen fehlt.

Soft 404 und Local SEO: Besondere Risiken für regionale Unternehmen

Lokale Unternehmen betreiben häufig mehrere standortbezogene Landingpages – für verschiedene Stadtteile, Filialen oder Servicebereiche. Werden diese Seiten mit identischem oder minimalem Inhalt befüllt, erkennt Google sie als Soft 404 und schließt sie aus dem Index aus. Das untergräbt gezielt die Local-SEO-Strategie, weil genau jene Seiten fehlen, die für regionale Suchanfragen ranken sollen.

Ein weiteres Risiko entsteht bei Umstrukturierungen: Wenn ein Unternehmen im Rhein-Main-Gebiet seine Website neu aufstellt, alte Servicebereiche streicht oder Filialen schließt, bleiben die dazugehörigen URLs oft erreichbar – aber ohne Inhalt. Ohne korrekte Weiterleitung oder 410-Statuscode (Gone) entsteht automatisch ein Soft 404, der Crawl-Budget bindet und das Linkprofil schwächt, weil eingehende Links auf wertlose Seiten zeigen.

HEEY empfiehlt lokalen Unternehmen, bei jedem Relaunch oder jeder Inhaltsaktualisierung explizit zu prüfen, ob Seiten mit regionalem Bezug noch ausreichend Inhalt und Relevanz aufweisen – oder ob sie konsolidiert, weitergeleitet oder mit einem korrekten Statuscode versehen werden müssen.

Soft 404 erkennen: Tools und Diagnosemethoden

Der erste Anlaufpunkt für die Diagnose ist die Google Search Console: Unter „Indexierung“ → „Seiten“ listet Google explizit Seiten auf, die als Soft 404 klassifiziert wurden. Diese Liste sollte regelmäßig ausgewertet werden. Zusätzlich liefern Crawling-Tools wie Screaming Frog oder Sitebulb Hinweise auf Seiten mit sehr geringem Textvolumen, fehlenden Überschriften oder leeren Inhaltscontainern.

Folgende Indikatoren deuten auf Soft 404 hin:

  • HTTP-200-Antwort bei Seiten mit weniger als 200 Wörtern nutzbarem Text
  • Seiten, die in der Google Search Console als „Soft 404“ oder „gecrawlt, aber nicht indexiert“ erscheinen
  • Dynamische Seiten mit Fehlermeldungen wie „Keine Produkte gefunden“ oder „Kein Ergebnis“
  • Leere Kategorieseiten nach Produktlöschungen im Onlineshop
  • Seiten mit ausschließlich boilerplate-Inhalt (Navigation, Footer, kein unique Content)
  • URLs aus Facettennavigationen ohne eindeutigen Informationsgehalt

Ergänzend empfiehlt sich ein Abgleich mit dem Server-Log: Seiten, die Googlebot häufig crawlt, aber nie in den Index aufnimmt, sind starke Soft-404-Kandidaten.

Soft 404 beheben: Konkrete Maßnahmen und Best Practices

Die richtige Lösung hängt vom Einzelfall ab. Generell gilt: Eine Soft-404-Seite sollte entweder mit echtem, nützlichem Inhalt gefüllt, korrekt weitergeleitet oder mit dem passenden HTTP-Statuscode versehen werden. Folgende Maßnahmen haben sich in der Praxis bewährt:

  • Inhalt ergänzen: Leere Kategorieseiten mit redaktionellem Text, verwandten Produkten oder Alternativvorschlägen anreichern, sodass die Seite echten Mehrwert bietet.
  • 301-Redirect setzen: Seiten, die dauerhaft nicht mehr benötigt werden, per 301 auf thematisch passende, inhaltlich starke URLs weiterleiten – insbesondere wenn eingehende Links vorhanden sind.
  • 410-Statuscode verwenden: Wenn eine Seite endgültig entfernt wird und keine sinnvolle Weiterleitungsziel existiert, signalisiert 410 (Gone) Google, dass die Seite bewusst gelöscht wurde.
  • Noindex temporär einsetzen: Als Übergangslösung kann ein Noindex-Tag verhindern, dass Google eine noch im Umbau befindliche Seite indexiert – kein dauerhafter Ersatz.
  • Facettennavigation kontrollieren: Über die robots.txt, Canonical Tags oder URL-Parameter-Einstellungen in der Google Search Console dafür sorgen, dass kombinatorisch erzeugte URLs nicht gecrawlt werden.
  • Regelmäßige Audits einplanen: Soft 404 entstehen kontinuierlich, besonders in dynamischen Systemen. Monatliche Prüfungen der Google Search Console und quartalsweise Crawls sind empfehlenswert.

Wichtig: Niemals eine Soft-404-Seite einfach mit einem Noindex-Tag versehen und dabei belassen. Das löst das Crawl-Budget-Problem nicht, weil Googlebot die Seite weiterhin crawlt – er indexiert sie nur nicht. Der Crawl-Aufwand bleibt bestehen.

Häufige Fehler im Umgang mit Soft 404

Ein verbreiteter Fehler ist die Verwechslung von „gecrawlt, aber nicht indexiert“ mit Soft 404. Nicht jede nicht indexierte Seite ist ein Soft 404 – Google kann Seiten auch aus anderen Gründen aus dem Index ausschließen, etwa wegen Duplicate Content oder eines Noindex-Tags. Die genaue Ursache muss in der Google Search Console geprüft werden.

Ein weiterer Fehler: Soft-404-Seiten werden als echte 404-Fehler behandelt und einfach gelöscht, ohne Weiterleitungen zu setzen. Wenn auf diese Seiten externe Backlinks zeigen, geht damit wertvoller Linkjuice verloren. Stattdessen sollte immer geprüft werden, ob eine Weiterleitung auf eine thematisch verwandte Seite sinnvoll ist.

Schließlich unterschätzen viele Website-Betreiber den kumulativen Effekt: Einzelne Soft-404-Seiten sind selten ein Problem. Aber in großen Systemen mit Tausenden von URLs – typisch für Onlineshops oder Nachrichtenportale – können sie die Crawling-Effizienz erheblich beeinträchtigen und damit mittelbar alle Rankings schwächen. Wer Technical SEO professionell betreiben will, muss Soft 404 systematisch im Blick behalten.

Passend dazu: Technical SEO Agentur von HEEY
Mehr erfahren →

Häufige Fragen

Was ist der Unterschied zwischen einem Soft 404 und einem echten 404-Fehler?

Ein echter 404-Fehler sendet den HTTP-Statuscode 404 an Browser und Crawler und signalisiert eindeutig, dass eine Seite nicht existiert. Ein Soft 404 hingegen liefert den Statuscode 200 (OK), obwohl die Seite keinen nutzbaren Inhalt enthält. Google muss den Soft 404 also inhaltlich erkennen, während ein echter 404 auf Protokollebene eindeutig ist. Das macht Soft 404 schwerer zu diagnostizieren und potenziell schädlicher für das Crawl-Budget.

Wie erkenne ich Soft 404 auf meiner Website?

Der direkteste Weg führt über die Google Search Console: Unter „Indexierung“ → „Seiten“ weist Google explizit auf Soft-404-Seiten hin. Ergänzend helfen Crawling-Tools wie Screaming Frog, die Seiten mit sehr geringem Textvolumen identifizieren. Auch Server-Logs liefern Hinweise: Seiten, die Googlebot regelmäßig crawlt, aber nie indexiert, sind häufig Soft-404-Kandidaten.

Warum sind Soft 404 für SEO schädlich?

Soft 404 binden Crawl-Budget, das Google für wertlose Seiten aufwendet, anstatt relevante Inhalte zu crawlen und zu indexieren. In großen Websites kann das dazu führen, dass wichtige Seiten seltener gecrawlt und damit schlechter oder gar nicht indexiert werden. Zusätzlich sendet eine hohe Anzahl inhaltlich leerer Seiten negative Qualitätssignale an Google, was sich auf die Gesamtbewertung der Domain auswirken kann.

Wie behebt man einen Soft 404 am besten?

Die optimale Lösung hängt vom Einzelfall ab: Seiten mit Zukunftspotenzial sollten mit echtem, nützlichem Inhalt gefüllt werden. Dauerhaft nicht mehr benötigte Seiten erhalten einen 301-Redirect auf eine thematisch passende URL oder den HTTP-Statuscode 410, wenn kein sinnvolles Weiterleitungsziel existiert. Ein Noindex-Tag allein ist keine vollständige Lösung, da Googlebot die Seite weiterhin crawlt.

Wann entstehen Soft 404 besonders häufig?

Soft 404 entstehen typischerweise nach Website-Relaunches, bei denen alte Seiten erreichbar bleiben, aber keinen Inhalt mehr aufweisen. Onlineshops produzieren sie systematisch bei ausverkauften oder gelöschten Produkten ohne Alternativinhalt. Auch Facettennavigationen, leere Suchergebnisseiten und schlecht gepflegte Landingpages – etwa nach dem Schließen einer Filiale – sind häufige Quellen.

Kann ein Soft 404 auch regionale Landingpages betreffen?

Ja, und das ist für lokale Unternehmen besonders problematisch. Werden standortbezogene Seiten – etwa für verschiedene Stadtteile oder Filialen – mit minimalem oder identischem Inhalt befüllt, klassifiziert Google sie als Soft 404 und schließt sie aus dem Index aus. Damit fehlen genau jene Seiten in den Suchergebnissen, die für regionale Suchanfragen ranken sollen. Ausreichend einzigartiger, lokal relevanter Inhalt ist daher unerlässlich.

Mehr lokale Sichtbarkeit?

Wir helfen Ihnen, in Google und Maps nach vorne zu kommen.

Kostenlose Analyse
← Zurück zum Glossar